Was beeinflusst die Qualität einer KI-Transkription? Tipps für optimale Ergebnisse
KIs wie OmasTagebuch können erstaunlich gut alte Handschriften entziffern. Doch was viele nicht wissen: Die Qualität der Transkription hängt mindestens so stark vom Bild ab wie von der KI selbst. Pixelige Fotos, Schatten auf dem Papier oder starke Karomuster können die Ergebnisse deutlich verschlechtern. Dieser Artikel erklärt, welche Faktoren die Transkriptionsqualität tatsächlich beeinflussen und wie der optimale Scan aussieht.
Warum die Bildqualität so entscheidend ist
Eine KI „liest" nicht wie ein Mensch. Sie analysiert Pixel für Pixel und versucht, Muster zu erkennen: Buchstabenformen, Abstände, Linienverläufe. Alles, was diese Muster stört oder überlagert, kann dazu führen, dass die KI Buchstaben verwechselt, Wörter falsch zusammensetzt oder Passagen überspringt. Ein Mensch kann über einen Schatten hinwegsehen oder ein Karo im Hintergrund ignorieren. Eine KI wird davon stärker beeinflusst, als man denkt.
Die häufigsten Störfaktoren und wie Sie sie vermeiden
Zu niedrige Auflösung und Pixeligkeit
Wenn ein Bild zu klein oder zu stark komprimiert ist, verschwimmen feine Striche und dünne Buchstabenteile. Gerade bei Kurrent und Sütterlin, wo sich Buchstaben wie „e", „n" und „u" nur durch kleine Details unterscheiden, kann eine pixelige Vorlage den Unterschied zwischen einer brauchbaren und einer unbrauchbaren Transkription ausmachen. Für die KI sind diese feinen Details der einzige Hinweis, den sie hat.
Empfehlung: Scannen Sie mit mindestens 300 dpi. Bei sehr feiner oder verblasster Schrift sind 400 bis 600 dpi besser. Smartphone-Fotos sind in Ordnung, solange die Schrift im Bild scharf und groß genug dargestellt ist.
Schatten und ungleichmäßige Beleuchtung
Schatten sind einer der häufigsten Qualitätskiller. Wenn Sie ein Dokument neben einer Lampe fotografieren, kann ein Teil der Seite hell und gut lesbar sein, während der andere im Schatten verschwindet. Die KI hat dann für die dunklen Bereiche zu wenig Kontrast zwischen Tinte und Papier und rät unsicher oder falsch.
Empfehlung: Nutzen Sie gleichmäßiges, diffuses Licht, am besten bei Tageslicht ohne direkte Sonne. Vermeiden Sie Lampen, die von einer Seite strahlen. Beim Scanner entsteht dieses Problem kaum, weil die Beleuchtung eingebaut und gleichmäßig ist.
Schiefe Seiten und Verzerrungen
Wenn das Dokument schräg im Bild liegt oder das Foto aus einem Winkel aufgenommen wurde, verzerren sich die Buchstaben. Zeilen verlaufen dann nicht mehr horizontal, Abstände stimmen nicht, und die KI kann Buchstaben schlechter den richtigen Zeilen zuordnen. Bereits eine Neigung von über 15 Grad kann die Erkennungsrate deutlich senken.
Empfehlung: Halten Sie die Kamera möglichst senkrecht über das Dokument. Beim Scanner das Blatt gerade einlegen. Eine leicht schiefe Seite ist kein Problem, aber stark gekippte oder perspektivisch verzerrte Aufnahmen sollten Sie vermeiden.
Karomuster, Linien und Hintergrundmuster
Kariertes oder liniertes Papier ist bei Tagebüchern und Briefen sehr verbreitet. Für das menschliche Auge sind die Karos kein Problem, für eine KI können sie es durchaus sein. Starke Karos oder Linien im Hintergrund überlagern die Schrift und verwirren die Mustererkennung: Die KI kann Teile der Karos mit Buchstabenstrichen verwechseln oder die Schrift schlechter vom Hintergrund trennen. Je kräftiger das Muster im Verhältnis zur Tinte, desto stärker die Störung.
Empfehlung: Sie können das Papier natürlich nicht ändern. Aber ein kontrastreiches Bild hilft, weil die dunkle Tinte sich besser von den helleren Karos abhebt. Vermeiden Sie es, Kontrast oder Helligkeit so einzustellen, dass die Karos stärker hervortreten. Manche Scanner-Apps bieten einen „Dokument"-Modus, der den Hintergrund aufhellt und die Schrift betont. Das kann hier sehr hilfreich sein.
Verblasste Tinte und vergilbtes Papier
Bei alten Dokumenten ist die Tinte oft verblasst und das Papier vergilbt oder fleckig. Das reduziert den Kontrast zwischen Schrift und Hintergrund, und genau dieser Kontrast ist das, worauf die KI am stärksten angewiesen ist. Bei extremem Kontrastverlust kann es passieren, dass ganze Wörter übersehen werden.
Empfehlung: Scannen Sie verblasste Dokumente in Farbe statt in Schwarzweiß, damit die KI alle verfügbaren Bildinformationen nutzen kann. Erhöhen Sie gegebenenfalls leicht den Kontrast in einer Bildbearbeitungs-App, aber übertreiben Sie es nicht. Zu starke Nachbearbeitung kann Details zerstören.
Dateiformat und Kompression
Auch das Dateiformat spielt eine Rolle. JPEG-Dateien verwenden eine verlustbehaftete Kompression: Bei jedem Speichern gehen feine Details verloren. Um Buchstaben herum entstehen sogenannte Kompressionsartefakte, also unscharfe Ränder und leichte Farbblöcke, die feine Striche verschlucken können. PNG dagegen komprimiert verlustfrei und erhält jedes Detail.
Empfehlung: Speichern Sie Scans wenn möglich als PNG oder als PDF in hoher Qualität. Wenn Sie JPEG verwenden, wählen Sie die höchste Qualitätsstufe. Vermeiden Sie es, ein Bild mehrfach als JPEG zu speichern, denn jedes erneute Speichern verschlechtert die Qualität weiter.
So sieht der optimale Scan aus
Zusammengefasst erfüllt der ideale Scan für eine KI-Transkription bei OmasTagebuch folgende Kriterien: Die Auflösung beträgt mindestens 300 dpi, bei feiner Schrift 400 bis 600 dpi. Die Beleuchtung ist gleichmäßig, ohne Schatten oder Reflexe. Die Seite liegt gerade im Bild, nicht schräg oder perspektivisch verzerrt. Der Kontrast zwischen Tinte und Papier ist deutlich erkennbar. Das Dateiformat ist PNG oder PDF in hoher Qualität, bei JPEG die höchste Qualitätsstufe. Die Seite füllt den Bildausschnitt möglichst aus, mit wenig Rand drumherum. Und bei alten, vergilbten Dokumenten wird in Farbe gescannt statt in Schwarzweiß.
Was tun, wenn die Vorlage nicht perfekt ist?
Nicht jedes Dokument lässt sich unter Idealbedingungen scannen. Zerknitterte Seiten, stark verblasste Tinte oder fest gebundene Bücher machen es manchmal unmöglich, einen perfekten Scan zu bekommen. Die gute Nachricht: KIs wie OmasTagebuch sind darauf trainiert, auch mit schwierigeren Vorlagen umzugehen. Ein nicht perfektes Bild bedeutet nicht automatisch ein schlechtes Ergebnis. Aber je besser die Vorlage, desto besser die Transkription.
Im Zweifel: Einfach ausprobieren. Die ersten Seiten auf OmasTagebuch sind kostenlos, so sehen Sie sofort, ob das Ergebnis für Ihre Zwecke ausreicht. Und wenn Sie wissen möchten, wie Sie Ihre Dokumente am besten digitalisieren, finden Sie im Artikel Alte Handschriften digitalisieren weitere praktische Tipps.