Yandex.Translate

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
Yandex.Translate
translate.yandex.com
Beschreibung Maschinelle Übersetzung
Registrierung Yandex-Konto (optional)
Sprachen 94
Eigentümer Yandex
Erschienen März 2011
Status online

Yandex.Translate (auch Yandex.Perevod[1]) ist ein Onlinedienst von Yandex, der Wörter, Texte und ganze Webseiten maschinell übersetzen kann.

Geschichte[Bearbeiten | Quelltext bearbeiten]

Der Dienst wurde 2011 gestartet und deckte zunächst nur die Sprachen Englisch, Ukrainisch und Russisch ab.[2] Mittlerweile werden 94 Sprachen angeboten.[3] Yandex betont, auch seltene Sprachen abdecken zu wollen — dazu werden unter anderem auch Baschkirisch, Papiamentu oder Sindarin gezählt.[4] Im Jahr 2017 wurde für die Sprachkombination Englisch-Russisch ein Korpus von einer Million Sätzen angegeben, was rund der Hälfte des entsprechenden Bestands im TraMOOC Project entsprach.[5]

Für Android und iOS sind seit 2012 mobile Apps einschließlich Offline-Funktion erhältlich.[6]

Funktionsweise[Bearbeiten | Quelltext bearbeiten]

Die Maschinenübersetzung von Yandex basierte zunächst auf statistischen Methoden. Im September 2017 kündigte Yandex an, für seine Maschinenübersetzung ein hybrides System einzuführen, das statistische und neuronale Funktionen kombiniert.[7][8]

Der Dienst besteht für jede Sprache aus drei internen Hauptkomponenten: Übersetzungsmodell, Sprachmodell und Decoder.

Das Übersetzungsmodell ist durch die Auswahl der parallelen Dokumente sowie die anschließende Auswahl von Satzpaaren und von Wortpaaren bzw. Wortkombinationspaaren entstanden, ist also eine Tabelle mit allen Wörtern und Phrasen des Systems und deren mögliche Übersetzungsvarianten in die andere Sprache einschließlich der Wahrscheinlichkeit dieser Varianten. Es werden also nicht nur einzelne Wörter verglichen, sondern ebenso Kombinationen mehrerer aufeinander folgender Wörter. Das Übersetzungsmodell umfasst für jedes Sprachpaar einhundert Millionen Wort- und Wortkombinationspaare.[1]

Für das Sprachmodell untersucht das System Hunderttausende verschiedener Texte der gewünschten Sprache und erstellt eine Liste aller darin verwendeten Wörter und Wortkombinationen mit Angabe ihrer Häufigkeit. Das ist das Systemwissen zu der Sprache, in die übersetzt werden soll.

Der Decoder fungiert als Übersetzer an sich. Er wählt für jeden Satz des eingegebenen Textes alle Übersetzungsvarianten aus, indem er die Phrasen aus dem Übersetzungsmodell kombiniert und nach absteigender Wahrscheinlichkeit sortiert.

Der Decoder schätzt alle Varianten der Ausgabekombinationen mithilfe des Sprachmodells. Er wählt den Satz somit mit der besten Kombination aus Wahrscheinlichkeit (Übersetzungsmodell) und Häufigkeit der Nutzung (Sprachmodell) aus.[9]

Der Dienst kann versuchen, die Ausgangssprache eines Textes automatisch zu erkennen. Er ist aber nicht in der Lage, benachbarte Sätze als Kontext einzubeziehen.[10]

Yandex.Translate bietet eine Programmierschnittstelle (REST API) an, um Übersetzungen in eigene Webseiten- und Angebote zu übernehmen.[11] Für Python existiert eine leicht benutzbare Implementierung.[12]

Rezeption und Bewertung[Bearbeiten | Quelltext bearbeiten]

In einem kleinen Praxisversuch im Mai 2014 spielte Yandex.Translate unter Studierenden der Übersetzungswissenschaften an der Universität Zielona Góra nur eine sehr marginale Rolle, verglichen mit zahlreichen anderen Anbietern.[13] Beim einem Vergleich mit Google Übersetzer erreichte Yandex.Translate 2015 in der Kombination Russisch-Kroatisch bessere Ergebnisse.[14]

Yandex.Translate wurde 2018 zusammen mit Google Übersetzer zu den besten verfügbaren Maschinenübersetzungsanbietern gezählt, erstellte aber weniger flüssige Übersetzungen als sein Wettbewerber.[10] Es bietet außerdem zusammen mit Google Übersetzer das größte Angebot für slawische Sprachen, muss sich seinem Konkurrenten aber letztendlich geschlagen geben.[15]

Weblinks[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. a b E.I. Gimazitdinov, D.A. Morel Morel: Machine Translation Technologies used in Online Translation Industry. In: dspace.bsu.edu.ru. Online
  2. Yandex History — 2011. In: yandex.com. Abgerufen am 16. Mai 2019 (englisch).
  3. List of supported languages - Yandex.Translate. Help. In: yandex.com. Abgerufen am 16. Mai 2019 (englisch).
  4. Was Google nicht kann: Russische Suchmaschine rettet aussterbende Sprachen. In: de.sputniknews.com. 19. April 2017, abgerufen am 17. Mai 2019.
  5. Sheila Castilho, Joss Moorkens, Federico Gaspari, Rico Sennrich, Andy Way. Panayota Georgakopoulou: Evaluating MT for massive open online courses. A multifaceted comparison between PBSMT and NMT systems. In: Machine Translation. Band 32, 2018, S. 255–278, doi:10.1007/s10590-018-9221-y.
  6. Yandex History — 2012. In: yandex.com. Abgerufen am 16. Mai 2019 (englisch).
  7. One model is better than two. Yandex.Translate launches a hybrid machine translation system. In: yandex.com. 14. September 2017, abgerufen am 16. Mai 2019 (englisch).
  8. Yandex — Technologies — Machine Translation. Abgerufen am 15. Februar 2019 (englisch).
  9. T.A. Tohmetov, A. O. Ushakov, I.S. Vanushin: The Problems of Machine Translation. In: earchive.tpu.ru. Online
  10. a b Nikolay Arefyev, Pavel Ermolaev, Alexander Panchenko: How much does a word weigh? Weighting word embeddings for word sense induction. In: Proceedings of the 24rd International Conference on Computational Linguistics and Intellectual Technologies. 23. Mai 2018, arxiv:1805.09209 [abs].
  11. Maarten van Hees, Paulina Kozłowska, Nana Tian: Web-based automatic translation: the Yandex.Translate API. In: mediatechnology.leiden.edu. Online.
  12. James Axl: yandex-translater: Python API for Yandex Translate. In: PyPI. Abgerufen am 19. Mai 2019 (englisch).
  13. Agnieszka Kałużna: Machine translation tools in the students’ translation training. In: Łukasz Grabowski, Tadeusz Piotrowski (Hrsg.): The Translator and the Computer 2. Proceedings of a Conference held in Wrocław, October 25–26, 2014. Wrocław 2015, S. 39–50. (Online)
  14. S. Seljan, I. Dunđer: Machine Translation and Automatic Evaluation of English/Russian-Croatian. In: Proceedings of Corpus Linguistics. 2015. Online.
  15. Lana Soglasnova: Dealing with False Friends to Avoid Errors in Subject Analysis in Slavic Cataloging: An Overview of Resources and Strategies. In: Cataloging & Classification Quarterly. Band 56, Nr. 5-6, 2018, S. 404–421, doi:10.1080/01639374.2018.1438551.