Tatoeba

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Tatoeba
tatoeba.org
Beschreibung Sammlung von Beispielsätzen
Registrierung nicht zur Benutzung, nur zur Mitarbeit erforderlich
Sprachen 180 (Stand: Januar 2015)
Erschienen 2006
Mitglieder über 24.000 (Stand: Januar 2015)
Artikel über 3,6 Millionen (Stand: Januar 2015)
Status aktiv

Tatoeba ist ein Projekt, dessen Name aus dem Japanischen stammt und „zum Beispiel“ bedeutet.

Tatoeba besteht aus einem großen Bestand exemplarischer Sätze, die in verschiedene Sprachen übersetzt sind. Es funktioniert als vielsprachiges Übersetzungs-Wörterbuch, in dem man nicht nur die Übersetzung eines Wortes findet, sondern vollständige Sätze in authentischer Landessprache, in denen das gesuchte Wort vorkommt. Die Satzeinträge werden nach und nach durch Tondateien ergänzt.

Die Textsammlung von Tatoeba basiert auf dem Korpus Tanaka, einer großen Sammlung von parallelen Sätzen in Japanisch und Englisch. Seit 2006 wurden unter Leitung von Trang Ho viele andere Sprachen hinzugefügt. Darunter befinden sich auch Plattdeutsch, Latein und Plansprachen wie Esperanto, Toki Pona oder Klingonisch.

Struktur[Bearbeiten]

Grafische Struktur Jeder Knoten repräsentiert einen Satz, jeder Pfeil repräsentiert die Verbindung zwischen zwei Sätzen. Wenn zwei Sätze direkt verbunden sind, haben sie die gleiche Bedeutung.

Die Sätzesammlung ist wie ein Graph mit Knoten und Pfeilen strukturiert: Jeder Knoten repräsentiert einen Satz, und jeder Pfeil repräsentiert die Verbindung zwischen zwei Sätzen. Wenn zwei Sätze direkt verbunden sind, haben sie die gleiche Bedeutung.

Netzwerk[Bearbeiten]

Das Netzwerk bietet eine Reihe von Möglichkeiten, Sätze zu suchen und zu bearbeiten. Jeder angemeldete Nutzer kann neue Sätze hinzufügen, übersetzen, kommentieren, mit Stichworten versehen und, wenn nötig, nachträglich bearbeiten. Die Beispielsätze werden in allen jeweils verfügbaren Sprachen untereinander angeordnet dargestellt.

Ende Januar 2015 waren 180 Sprachen vertreten. Von insgesamt über 3,6 Mio Sätzen waren rund 496 000 auf Englisch, 361 000 auf Esperanto und 297 000 auf Deutsch verfasst. Die Ränge 4 und 5 belegten Italienisch mit fast 293 000 und Französisch mit mehr als 250 000 Einträgen.

Die aktuelle Statistik aller Sprachen findet man unter [1]

Link zum Wörterbuch[Bearbeiten]