SpeechCorrect
Die Weltneuheit SpeechCorrect ist ein Verfahren, mit dem Anwender der Spracherkennung Voice Pro 12 ganz leicht beibringen können, Homophone zu unterscheiden.
Homophone sind Wörter, die gleich klingen, aber je nach Kontext verschieden geschrieben werden. Sie sind eine der großen Hürden, die jeder Schüler aus dem Diktat kennt. Verschiedene Schreibweisen haben auch verschiedene Bedeutungen, so dass die Varianten nur aus dem Kontext erschlossen werden können. So ist die verschiedene Schreibung von „Schmerzen im Leib“ und „ein Laib Brot“ aus dem Kontext klar zu erkennen, obwohl „Leib“ und „Laib“ absolut gleich klingen.
Der Großteil solcher Homophone kann aus der umfangreichen Erweiterung der Sprachmodelle in Voice Pro 12 abgefangen werden; das zur Entwicklung genutzte Linguatec-Korpus umfasst immerhin nicht weniger als 700 Millionen Wortformen! Die Kontextprüfung basiert auf einem statistischen Verfahren, das beim Diktieren im Hintergrund ihre Berechnungen durchführt, welche Schreibweise die am ehesten zu erwartenden ist. Dabei findet die sogenannte Bi- und Trigrammstatistik Anwendung. Ist eine diktierte Zweier- (Bigramm) oder Dreierwortverbindung (Trigramm) im System hinterlegt oder wurde vom Sprecher schon einmal zuvor diktiert, so ist dies entscheidend für die korrekte Wortauswahl.
Dennoch kann es immer wieder Situationen geben, in denen die Sprachmodelle mit ihren statistischen Berechnungen nicht greifen. So hat es beispielsweise der Name „Maier“ in sich: Er ist einer der häufigsten Namen in Deutschland und erfreut sich einer enormen Vielfalt von Schreibweisen. Sie kennen (oder heißen?) Walter Meier, Conrad Meyer, Cordula Maier? Welche Variante die richtige ist, kann das Sprachmodell nicht von Haus aus wissen. Daher können Anwender in Voice Pro 12 über ein praktisches und intuitives Formular festlegen, dass nach „Walter“ nur die Schreibung „Meier“ in Frage kommt. Und im Falle eines Falles können Sie so auch bekanntere Kombinationen wie das Fußball-Urgestein „Sepp Maier“ und „Meyers Lexikon“ klar unterscheiden.
Auch anspruchsvolle Sätze wie „Nach Lektüre des Logischen Empirismus von Friedrich Waismann weiß man wirklich mehr.“ sind mit Hilfe von SpeechCorrect kein Problem für die korrekte Erkennung mehr.
Besonders wichtig war es Linguatec, dass diese anwenderspezifischen Regeln sehr einfach und ohne linguistische Vorkenntnisse erstellt werden können.






