Translation Memorys (TM) vs Maschinelles Übersetzen

Seit Jahrzehnten wird schon an der maschinellen, sprich automatischen Übersetzung von Texten durch Computerprogramme, geforscht. Die maschinelle Übersetzung wird hierbei nicht der Sprachwissenschaft, sondern einer Mischdisziplin aus Linguistik und Informatik, der Computerlinguistik, zugeordnet.

Die maschinelle Übersetzung konnte sich im Laufe der Jahre durch Verwendung neuer Technologien wie künstlicher Intelligenz oder maschinellem Lernen kontinuierlich verbessern und ermöglicht heute in bestimmten Sprachkombinationen eine durchaus ansehnliche Vorübersetzung, die einen guten Eindruck über den Inhalt eines vorliegenden Textes vermittelt.

Die aktuellste Errungenschaft im Bereich der maschinellen Übersetzung ist die Verwendung von neuronalen Netzen. Diese basieren ähnlich wie statistikbasierte Algorithmen auf Lernmaterial, also auf einer Vielzahl von Sätzen, mit denen sie gefüttert werden. Bei den statistikbasierten Algorithmen sind bestimmte Wortgruppen, die als 'N-Gramme' bezeichnet werden, von großer Bedeutung, Diese N-Gramme werden vom System gebildet und es analysiert, welche Wortgruppen in Ausgangs- und Zielsprache mit welcher Häufigkeit auftreten.

Im Grunde genommen wird anders als bei den ersten Maschinen, die Wort für Wort übersetzten, auch der Kontext berücksichtigt, was für eine wesentlich höhere Genauigkeit sorgt. Beispiel: Treten die Wörter 'Hahn' und 'füttern' zusammen auf, weiß das System aufgrund gelernter Sätze und dem vorhandenen Kontext, dass mit 'Hahn' das Tier gemeint ist. Bei den Wörtern 'Hahn' und 'zudrehen' erkennt es wiederum, dass es sich um eine Absperrarmatur für Flüssigkeiten oder Gase handelt. Das Homonym 'Hahn' führt sozusagen nicht mehr zu einem verwirrenden Satz wie 'Close the rooster'.

Neuronale Netze wiederum sind nicht mehr abhängig von der Analyse der N-Gramme, da sie selber bestimmen, was sie über die vorhandenen Daten, d.h. die vorhandenen Texte lernen. Dieser Lernprozess wird als 'Deep Learning' bezeichnet.

Grundsätzlich lässt sich festhalten, dass die maschinelle Übersetzung mit neuronalen Netzen derzeit zwar die fortschrittlichste auf dem Markt ist. Bei Kombinationen aus ähnlichen Sprachen wie Deutsch-Englisch bzw. Sprachen, für die eine Vielzahl an Vergleichstexten vorliegt, klingen die übersetzten Texte auch bereits natürlich. Für simple Texte wie interne Kommunikation ist die Verwendung solcher Programme je nach Sprachkombination sicherlich auch ausreichend und kostengünstig.

Aber keinesfalls ist die Technologie in der Lage, ohne Nachkorrektur durch einen menschlichen Übersetzer rechtssichere oder technisch korrekte Texte herzustellen. Einen maschinell übersetzten Text ohne Post-Editing, also die Nachbearbeitung durch einen ausgebildeten Übersetzer zu veröffentlichen, wäre derzeit grob fahrlässig.

Grundsätzlich lässt sich festhalten, dass die maschinelle Übersetzung mit neuronalen Netzen momentan maximal eine eingeschränkt verwendbare Methode für Übersetzer ist, eine Vorübersetzung zu erstellen, oder intern verwendete Texte in einer anderen Sprache abzubilden.

Bei Kombinationen von verwandten Sprachen wie Deutsch-Englisch bzw. Sprachen, für die eine Vielzahl an Vergleichstexten vorliegen, sind die übersetzten Texte durchaus als Vorübersetzung und für eine reine interne Verwendung denkbar.

Das bedeutet jedoch nicht, dass die Maschinen in der Lage sind, ohne Nachkorrektur von Formulierungen oder Terminologie durch einen menschlichen Übersetzer rechtssichere oder technische Texte zu übersetzen. Insbesondere gilt dies auch für kreativ verfasste Texte wie Werbung oder Literatur.

Nicht vernachlässigen darf man in diesem Zusammenhang auch nicht die Verwendung von unternehmensbezogener Terminologie (Markenkonsistenz und technische Terminologie). Hier ist die Verwendung klassischer Translation Memory Systeme und Terminologie Datenbanken immer noch die vorteilhafteste Methode. In Verbindung mit maschineller Übersetzung kann es, je nach Text, Sprachkombination, Textbedeutung und Qualitätserfordernissen, durchaus schon zu Synergien und Kosten-/ Zeitvorteilen kommen.

Es bleibt spannend!

Weitere Informationen finden Sie auf den Seiten von SDL TRADOS Maschinelles Übersetzen