Warum KI nicht immer dasselbe antwortet – und was das für Transkriptionen bedeutet
Wer zum ersten Mal eine KI-Transkription ausprobiert, erlebt manchmal eine Überraschung: Man lädt dasselbe Bild ein zweites Mal hoch – und bekommt einen leicht anderen Text zurück. Einzelne Wörter sind anders geschrieben, ein Satzzeichen fehlt oder steht an anderer Stelle, eine unsichere Passage wird plötzlich anders gelesen. Ist die KI unzuverlässig? Nein – sie ist nicht deterministisch. Und das ist ein grundlegendes Merkmal moderner Sprachmodelle, kein Fehler. Dieser Artikel erklärt, was dahintersteckt, woher diese Eigenschaft kommt und was sie für die Transkription alter Handschriften bedeutet.
Was bedeutet „nicht deterministisch"?
In der Informatik heißt ein System deterministisch, wenn es bei gleicher Eingabe immer exakt dasselbe Ergebnis liefert. Ein Taschenrechner ist deterministisch: 3 + 7 ergibt immer 10, zu jeder Tageszeit, bei jedem Versuch. Moderne KI-Sprachmodelle – sogenannte Large Language Models (LLMs) wie Claude, GPT oder Gemini – funktionieren anders. Sie erzeugen ihre Antwort Wort für Wort, und bei jedem Schritt wählen sie aus einer Vielzahl möglicher Fortsetzungen. Diese Auswahl enthält ein bewusstes Zufallselement. Deshalb kann dieselbe Frage bei zwei Durchläufen zu leicht unterschiedlichen Antworten führen.
Woher kommt der Zufall?
Um zu verstehen, warum KI nicht deterministisch ist, hilft ein Blick darauf, wie ein Sprachmodell Text erzeugt. Im Kern berechnet das Modell für jedes nächste Wort eine Wahrscheinlichkeitsverteilung: Es ordnet allen möglichen Wörtern eine Wahrscheinlichkeit zu, wie gut sie an dieser Stelle passen. Das wahrscheinlichste Wort ist oft das richtige – aber nicht immer.
Bei der Textgenerierung wird nun nicht immer stur das wahrscheinlichste Wort gewählt. Stattdessen wird mit einem Parameter namens Temperatur gesteuert, wie viel Zufall in die Auswahl einfließt. Bei einer niedrigen Temperatur (nahe 0) wählt das Modell fast immer das wahrscheinlichste Wort – die Ergebnisse werden vorhersagbarer, aber auch starrer. Bei einer höheren Temperatur werden auch weniger wahrscheinliche Wörter häufiger gewählt – die Ergebnisse werden vielfältiger, aber auch unberechenbarer.
Dazu kommt ein weiterer Faktor: Sogenanntes Top-k- und Top-p-Sampling. Dabei wird die Auswahl auf eine Teilmenge der wahrscheinlichsten Wörter beschränkt, und innerhalb dieser Teilmenge wird zufällig gewählt. Auch die Reihenfolge, in der Anfragen auf den Servern verarbeitet werden, kann durch technische Details wie Parallelverarbeitung minimale Unterschiede verursachen – selbst bei identischen Einstellungen.
Was heißt das konkret für Transkriptionen?
Wenn eine KI eine alte Handschrift transkribiert, analysiert sie das Bild und erzeugt den Text Wort für Wort. Bei eindeutigen Stellen – klare Buchstaben, guter Kontrast, bekannte Wörter – ist die Wahrscheinlichkeitsverteilung sehr eindeutig: Das richtige Wort hat 99 % Wahrscheinlichkeit, und auch mit Zufallselement wird es fast immer gewählt. Das Ergebnis ist bei jedem Durchlauf praktisch identisch.
Bei unsicheren Stellen sieht es anders aus: Ein verblasster Buchstabe, eine ungewöhnliche Schreibweise, ein seltener Eigenname. Hier liegt die Wahrscheinlichkeit vielleicht bei 60 % für eine Lesart und 35 % für eine andere. Je nach Zufallsauswahl kann die KI beim einen Mal „Müller" lesen und beim anderen Mal „Müller" mit Umlautpunkten weglassen, oder „Mütler" schreiben. Beide Varianten sind aus Sicht der KI plausibel – sie hat schlicht nicht genug Information, um sicher zu entscheiden.
Ist das ein Problem?
Das kommt ganz auf den Zweck an. Für viele Anwendungsfälle ist die Nicht-Determiniertheit kein praktisches Problem:
Tagebücher und Briefe: Wenn Sie Omas Tagebuch transkribieren lassen, um den Inhalt zu lesen und in der Familie zu teilen, sind kleine Variationen an unsicheren Stellen kaum relevant. Der Sinn der Sätze bleibt gleich, die Geschichten werden lesbar, die Erinnerungen zugänglich. Ob ein unleserlicher Ortsname als „Langensalza" oder „Langensalzen" gelesen wird, ändert nichts am Wert des Textes für Ihre Familie.
Familienforschung und Nachlass-Sichtung: Wer einen großen Nachlass erstmals durchgehen und verstehen möchte, braucht einen guten Überblick. Dafür ist eine KI-Transkription ideal: schnell, günstig und inhaltlich zuverlässig genug. Einzelne unsichere Wörter stören den Gesamteindruck nicht.
Wo die Grenzen liegen: Rechtlich relevante Dokumente
Anders sieht es bei Dokumenten aus, bei denen jedes einzelne Wort zählt: Testamente, notarielle Urkunden, Grundbucheinträge, Verträge oder Gerichtsprotokolle. Hier kann ein falsch gelesenes Wort rechtliche Konsequenzen haben. Wenn die KI bei einem Testament einmal „mein Haus an Karl" liest und ein anderes Mal „mein Haus an Carl", mag das harmlos klingen. Aber was, wenn sie „Haus" und „Hof" verwechselt, oder einen Betrag anders interpretiert?
Das Problem ist nicht nur die Variabilität – es ist die Kombination aus Variabilität und fehlendem Bewusstsein für die eigene Unsicherheit. Ein menschlicher Experte würde an einer unsicheren Stelle innehalten, die Stelle kennzeichnen und nachfragen. Eine KI gibt auch bei unsicheren Stellen eine glatt klingende Antwort aus. Dieses Phänomen wird manchmal als „Halluzination" bezeichnet: Die KI erzeugt Text, der plausibel klingt, aber nicht zwingend dem Original entspricht.
Für rechtlich relevante Dokumente gilt daher: Eine KI-Transkription kann ein hilfreicher erster Schritt sein, ersetzt aber nicht die Prüfung durch einen erfahrenen Paläographen oder Rechtsexperten. Wo es auf buchstabengetreue Genauigkeit ankommt, brauchen Sie einen Menschen, der bei Unsicherheiten nachfragt, Kontext berücksichtigt und Verantwortung für die Richtigkeit übernimmt.
Ein Vergleich: KI-Transkription wie eine Übersetzung betrachten
Es hilft, die KI-Transkription wie eine Übersetzung zu betrachten. Wenn Sie einen Roman von einem guten Übersetzer ins Deutsche übertragen lassen, erwarten Sie keinen wortwörtlichen Text – Sie erwarten eine sinngetreue, gut lesbare Fassung. Kleine Formulierungsunterschiede zwischen zwei Übersetzern sind normal und kein Qualitätsmangel. Genau so verhält es sich mit einer KI-Transkription von Omas Tagebuch: Der Inhalt wird treu wiedergegeben, aber es gibt einen gewissen Interpretationsspielraum bei schwer lesbaren Stellen.
Eine juristische Übersetzung eines Vertrags dagegen muss exakt sein. Hier würden Sie sich nie auf einen einzelnen Übersetzer verlassen, sondern auf geprüfte Fachübersetzer und Vier-Augen-Prinzip bestehen. Dasselbe Prinzip gilt für die Transkription rechtlich relevanter Handschriften.
Tipps für den Umgang mit KI-Transkriptionen
Für Tagebücher, Briefe und Familienforschung: Vertrauen Sie der KI-Transkription ruhig. Sie gibt den Inhalt zuverlässig wieder, auch wenn einzelne unsichere Wörter bei erneutem Versuch leicht anders ausfallen können. Wenn eine Stelle besonders wichtig ist, können Sie das Original danebenlegen und gezielt vergleichen.
Für rechtliche oder wissenschaftliche Dokumente: Nutzen Sie die KI-Transkription als Arbeitshilfe und ersten Entwurf, aber lassen Sie den Text von einem Fachmann gegenlesen. Mehr dazu finden Sie in unserem Artikel KI oder Experte: Wann lohnt sich welche Übersetzung?.
Bildqualität verbessern: Je besser das Bild, desto eindeutiger die Wahrscheinlichkeitsverteilung und desto weniger Spielraum für Variationen. Ein guter Scan reduziert die Unsicherheit und macht die Ergebnisse stabiler. Tipps dazu finden Sie im Artikel Was beeinflusst die Qualität einer KI-Transkription?.
Zusammenfassung
Dass eine KI nicht deterministisch ist, gehört zum Grundprinzip moderner Sprachmodelle. Es ist kein Fehler, sondern ein Merkmal. Für die Transkription von Tagebüchern, Briefen und persönlichen Dokumenten ist das unkritisch – der Inhalt wird zuverlässig erfasst, und kleine Schwankungen an unsicheren Stellen ändern nichts am Wert des Textes. Für rechtlich verbindliche oder wissenschaftlich zitierfähige Dokumente dagegen sollte immer ein menschlicher Experte das letzte Wort haben.
Sie möchten Omas Tagebuch oder Briefe transkribieren lassen? Auf OmasTagebuch können Sie kostenlos die ersten Seiten hochladen und das Ergebnis sofort ansehen – schnell, unkompliziert und ohne Risiko.