Maschinelle Übersetzung: Was ist der Stand der Technik?
6. November 2019Maschinelle Übersetzung: Was ist der Stand der Technik?
Eine neue Reihe von Tools für maschinelle Übersetzung (Machine Translation = MT), die von der Künstlichen Intelligenz angetrieben werden, übersetzt bereits Dutzende Millionen von Nachrichten pro Tag. Proprietäre ML-Übersetzungslösungen (ML= Machine Learning) von Google, Microsoft und Amazon sind im täglichen Einsatz. Facebook geht seinen Weg mit Open-Source-Ansätzen. Was funktioniert am besten bei der Übersetzung von Software, Dokumentation und natürlichsprachigen Inhalten? Und wo liegt die Automatisierung von KI-gesteuerten neuronalen Netzwerken?
William Mamane, Head of Digital Marketing bei Tomedes, einem professionellen Sprachdienstleister, war ein Skeptiker der maschinellen Übersetzung. Seine Position heute: „Unser Unternehmen gibt es seit 12 Jahren, mit mehr als 50.000 Geschäftskunden. Wir haben uns für den Wert der „menschlichen Übersetzung“ eingesetzt und tun es immer noch. Wir haben jedoch einen stetigen Anstieg der Qualität der maschinellen Übersetzung festgestellt. Derzeit konkurriert die maschinelle Übersetzung nicht mit einem guten muttersprachlichen Linguisten.“
Darum drängt sich die Frage auf, mit welchen Mitteln die KI- Übersetzer arbeiten. Erstens: Auf einer grundlegenden Ebene verwendet MT Algorithmen, um Wörter in einer Sprache durch Wörter in einer anderen zu ersetzen. Das erweist sich als unzureichend. Das Verständnis ganzer Phrasen ist sowohl für die Ausgangs- als auch für die Zielsprache erforderlich.
Zweitens: Sie benutzt Statistiken , um die beste Übersetzung für eine bestimmte Phrase oder einen Satz auszuwählen. Einige wenden strukturierte Regeln an, um die wahrscheinlichste Bedeutung auszuwählen. Aber in komplexen Sprachformen wie Fiktion oder anderen Arten von Literatur klingen selbst die besten maschinellen Übersetzungsmaschinen nicht natürlich.
Maschinen sind gut, wo sie auf strukturierte Sprache treffen. Dazu gehören Wetterberichte, Finanzberichte, Regierungsprotokolle, rechtliche Dokumente, Sportergebnisse. Sprache und Redewendungen sind in diesen Fällen begrenzt. Es gibt formelhafte linguistische Strukturen und Formate.
Die neuronale maschinelle Übersetzung (NMT) verwendet ein künstlich erzeugtes neuronales Netzwerk. Diese Technik des tiefen Lernens betrachtet beim Übersetzen ganze Sätze, nicht nur einzelne Wörter. Neuronale Netze benötigen einen Bruchteil des Speichers, der für statistische Methoden benötigt wird. Sie arbeiten viel schneller.
Deep Learning oder Anwendungen der Künstlichen Intelligenz für die Übersetzung erschienen erstmals in den 90er Jahren in der Spracherkennung. Die erste wissenschaftliche Arbeit über die Nutzung neuronaler Netze in der maschinellen Übersetzung erschien 2014. Dem Artikel folgten schnell viele Fortschritte auf diesem Gebiet. Im Jahr 2015 erschien erstmals ein NMT-System in Open MT, einem Wettbewerb für maschinelle Übersetzung. Seitdem werden Wettbewerbe fast ausschließlich mit NMT-Werkzeugen durchgeführt.
Die neuesten NMT-Ansätze verwenden ein so genanntes bidirektionales, wiederkehrendes neuronales Netzwerk, kurz RNN. Microsoft setzt auf RNN in Microsoft Translator und Skype Translator. Beide zielen darauf ab, den lang gehegten Traum der Simultanübersetzung zu verwirklichen, den die Harvard NLP-Gruppe kürzlich mit OpenNMT, einem neuronalen maschinellen Übersetzungssystem mit Open-Source-Technologie, veröffentlicht hat. Facebook ist an umfangreichen Experimenten mit Open-Source-NMT beteiligt und lernt aus der Sprache seiner Nutzer.
Google Translate ist ein kostenloser maschineller Übersetzungsdienst, der von Google entwickelt wurde, um Text zu übersetzen. Es bietet eine Website-Schnittstelle, mobile Apps für Android und iOS. Google Translate unterstützt über 100 Sprachen. Obwohl das Tool nicht so perfekt ist wie eine professionelle menschliche Übersetzung, rückt es immer näher. In einer Studie aus dem Jahr 2018 bat Google Muttersprachler jeder Sprache, die Übersetzung von Google Translate auf einer Skala von 0 und 6 zu bewerten: Sie erreichte durchschnittlich 5,43. Die Leistung variiert je nach Sprache. So wurde beispielsweise Google Translate auf seine beste Leistung getestet, wenn Englisch die Zielsprache ist und die Quelle europäisch.