SAMPA

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

SAMPA oder SAM-PA [ˈsæmpə] (Abk. für Speech Assessment Methods Phonetic Alphabet [spiːtʃ əˈsɛsmənt ˌmɛθədz fəˈnɛtɪk ˈælfəbɛt]) ist die Kurzbezeichnung für ein ASCII-basiertes phonetisches Alphabet.

SAMPA wurde ursprünglich 1987–1989 im Rahmen des europäischen ESPRIT-Projekts 1541 SAM (Speech Assessment Methods) entwickelt, damit man phonemische Transkriptionen der offiziellen Sprachen der damaligen Europäischen Gemeinschaft (1989 waren das Dänisch, Englisch, Französisch, Deutsch, Italienisch und Niederländisch) elektronisch übermitteln und verarbeiten konnte. Später kamen Norwegisch und Schwedisch (1992) sowie Griechisch, Portugiesisch und Spanisch (1993) hinzu. SAMPA hat den britischen Phonetiker John C. Wells zum Vater, der in Abstimmung mit führenden Phonetikern und Ingenieuren der beteiligten Länder handelte. In der Phonetik und bei der Entwicklung sprachtechnologischer Systeme ist SAMPA seitdem weit verbreitet.

SAMPA ist kein eigenständiges phonetisches Alphabet, sondern codiert nur eine Teilmenge des IPA maschinenlesbar und tastaturfreundlich in ASCII. Diese Teilmenge umfasst die Phonemsymbole der oben genannten Sprachen, soweit sie in Lexika benötigt werden, nicht jedoch, wie IPA, Symbole für weitere Aussprachedetails. Dazu ordnet SAMPA den einschlägigen Symbolen des IPA passende 7-Bit-ASCII-Codes zu. Man achtete auf Ähnlichkeiten zu IPA-Symbolen, damit außer Maschinen auch Menschen Texte in SAMPA leicht würden lesen können. Die SAMPA-Transkribierungscodes sind international für die oben genannten Sprachen standardisiert.

Im Gegensatz zu SAMPA, auf das man sich verständigte, um es in Phonetik und Sprachtechnologie wissenschaftlich und zur technologischen Entwicklung zu benutzen, zielt die Unicode-Kodierung des IPA vor allem auf die Reproduktion in Druckerzeugnissen.

Die Unicode-IPA-Kodierung ist derzeit in Wissenschaft und Sprachtechnologie aus verschiedenen Gründen nur schwer zu verwenden. Zum einen sind die IPA-Symbole über mehrere Unicode-Tabellen verstreut, zum anderen mangelt es an ergonomisch sinnvollen Eingabehilfen.

Um das IPA vollständig zu kodieren, entwickelte Wells 1995 X-SAMPA, eXtended SAMPA.

Beispiel[Bearbeiten]

Text: Du hast mir den Atem geraubt, und ich will ihn wiederhaben.

SAMPA: ['du: 'hast 'mi:6 'de:n '?a:-t@m g@-'RaUpt '?Unt '?IC 'vIl '?i:n 'vi:-d6 'ha:-b@n] oder [D_dU: h'AsT_t m-?'I6= D_d@n-? "a-T_t@m: G_g@-r"(au)B_bT_t]

Literatur[Bearbeiten]

Vollständige Definitionen und Anwendungsbeispiele von SAMPA bzw. X-SAMPA sind in folgenden Handbüchern zu finden:

  • Dafydd Gibbon, Roger Moore, Richard Winski (Hrsg.): Handbook of Standards and Resources for Spoken Language Systems. Mouton de Gruyter, Berlin u. a. 1997, ISBN 3-11-015366-1.
  • Dafydd Gibbon, Inge Mertins, Roger Moore (Hrsg): Handbook of Multimodal and Spoken Language Systems. Resources, Terminology and Product Evaluation. Kluwer Academic Publishers, Boston MA u. a. 2000, ISBN 0-7923-7904-7 (Kluwer international Series in Engineering and Computer Science 565).

Weblinks[Bearbeiten]

Siehe auch[Bearbeiten]

  • Kyrillisches Alphabet (Tabelle der SAMPA-Werte der weißrussischen kyrillischen Buchstaben)
  • IPA (in Wörterbüchern verwendete Lautschrift für alle Sprachen der Welt)