Zwei Dokumente bieten eine neuartige Methode an, die gezeigt hat, dass einige Programme der künstlichen Intelligenz imstande sind – ohne Wörterbuch oder menschliche Hilfe – eine neue Sprache zu sprechen.
In diesem Artikel werden wir nicht auf das mühsame Kauderwelsch von Google Translation eingehen. Das Programm wurde im vergangenen Jahr sogar vom Unternehmen verworfen und durch ein hocheffizientes neuronales Netzwerk ersetzt. Dies kann dank des überwachten automatisierten Lernens ganze Sätze unter Berücksichtigung ihres Kontextes übersetzen. In jüngster Zeit haben jedoch zwei Programme der Künstlichen Intelligenz (KI) ganze Textkörper erfolgreich übersetzt, ohne auf ein integriertes Wörterbuch angewiesen zu sein.
Zwei Forscherteams – ein französisches und ein spanisches -, die unabhängig voneinander an zwei getrennten Projekten arbeiten, ohne dass sie auch nur das geringste Wissen über die Bemühungen des anderen Teams besitzen, haben es geschafft, Programme zu entwickeln, die in der Lage sind, selbstständig Sprachen zu lernen. Dazu nutzten sie die bedeutenden mehrsprachigen Datenbanken des Europäischen Parlaments und der UNO.
Die erste Studie wurde von Mikel Artetxe, Informatiker an der University of the Basque Country (UPV), geleitet. Die zweite wurde von Guillaume Lample betreut, einem französischen Ingenieur, der für die Abteilung für künstliche Intelligenz bei Facebook arbeitet. Beide Teams haben eine unbeaufsichtigte Methodik des maschinellen Lernens entwickelt. Sie basiert auf Wortanalogie und ermȍglicht es ihre KIs zu übersetzen. Beide setzen auf eine ganz ähnliche Herangehensweise.
„Stellen Sie sich vor, jemandem eine Menge verschiedener chinesischer und arabischer Bücher zu geben“, erklärt Mikel Artetxe. „Diese Person muss lernen, ohne Querverweise in beide Sprachen zu übersetzen.“ Um das Potenzial dieser neuen Systeme zu verstehen, ist es hilfreich zu wissen, wie die aktuelle maschinelle Übersetzung funktioniert. Ein vom Menschen überwachtes neuronales Netzwerk vergleicht Bücher und Artikel, die zuvor von Menschen übersetzt wurden. Durch den Vergleich extrem großer Mengen dieser parallelen Texte können sie Äquivalenzen zwischen zwei beliebigen Sprachen lernen.
Die neuen Systeme bilden eine Karte mit allen Verbindungen, die sie zwischen den Wörtern der Sprachen finden, die sie zu übersetzen versuchen. Die Technik ist die gleiche wie bei einem digitalen Straßenatlas. Da Sprachen Wörter auf ähnliche Weise gruppieren, raten die Systeme, was die Wortäquivalenzen sind, und bauen Übersetzungswörterbücher mit diesen Informationen auf.
Eines der beiden Systeme überprüft das Endergebnis, indem es den Satz zurück in die Ausgangssprache übersetzt. Dann vergleicht er ihn mit dem originalen Text, um seine Arbeit zu korrigieren. Der andere fügt dem originalen Text Wörter hinzu oder nimmt sie weg und vergleicht die Ergebnisse. Bislang sind jedoch beide Leistungen der KI noch verbesserungsfähig – und im Vergleich zu menschlicher Arbeit lässt es noch zu wȕnschen ȕbrig. Dennoch zeigen die beiden neuen Dokumente, dass es möglich ist, ein System zu entwickeln, das nicht auf parallele Texte angewiesen ist.
This post is also available in: EN (EN)FR (FR)