Kontextsensitive Grammatik

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Die kontextsensitiven Grammatiken (kurz CSG, von engl. context-sensitive grammar) sind eine Klasse formaler Grammatiken und identisch mit den Typ-1-Grammatiken der Chomsky-Hierarchie. Sie zeichnen sich dadurch aus, dass einzelne Nichtterminalsymbole nur in einem vorgegebenen Kontext ersetzt werden dürfen.

Definition[Bearbeiten]

Eine kontextsensitive Grammatik ist eine formale Grammatik G=(N,T,P,S) mit

  • Nichtterminalsymbolen N
  • Terminalsymbolen T
  • Startsymbol S \in N
  • Produktionsregeln P der Form \alpha X\beta \rightarrow \alpha\gamma\beta oder der Form S \rightarrow \varepsilon, wenn gilt:
    • \alpha, \beta \in (N \cup T)^*
    • X \in N
    • \gamma \in (N \cup T)^+
    • S kommt auf keiner rechten Seite einer Produktionsregel vor

Beschreibung[Bearbeiten]

Bis auf eine Ausnahme hat jede Produktionsregel der Definition nach die Form \alpha X \beta \rightarrow \alpha\gamma\beta und \gamma \neq \varepsilon.

Das bedeutet, dass das Nichtterminalsymbol X im Kontext der Zeichenketten \alpha und \beta durch \gamma ersetzt wird. Aber während \gamma aus mindestens einem Symbol (Terminal- oder Nichtterminalsymbol) bestehen muss, kann sowohl \alpha als auch \beta leer sein. Folgende Sonderfälle sind daher gemäß der Definition möglich:

  • \alpha X \rightarrow \alpha\gamma
  • X\beta \rightarrow \gamma\beta
  • X \rightarrow \gamma

Um das leere Wort \varepsilon erzeugen zu können, erlaubt man die Regel S \rightarrow \varepsilon, sofern S auf keiner rechten Seite einer Produktionsregel vorhanden ist.

Kontextsensitive und monotone Grammatiken[Bearbeiten]

Die Produktionsregeln kontextsensitiver Grammatiken verkürzen die linke Seite nicht. Bis auf die Regel S\rightarrow\varepsilon erfüllen also alle Regeln w_1\rightarrow w_2 die Bedingung \left|w_1\right| \leq \left|w_2\right|. Eine kontextsensitive Grammatik ist deshalb immer auch eine monotone Grammatik. Kontextsensitive und monotone Grammatiken erzeugen aber die gleiche Sprachklasse.

Einige Autoren definieren kontextsensitive Grammatiken im Sinne monotoner Grammatiken[1]. Die Produktionsregeln der Form \alpha X\beta \rightarrow \alpha\gamma\beta werden gelegentlich nur als typische oder kanonische Form kontextsensitiver Regeln betrachtet[2].

Normalformen[Bearbeiten]

Zu jeder kontextsensitiven Grammatik existiert eine Grammatik in Kuroda-Normalform mit Produktionsregeln der Form

  • A \rightarrow a
  • A \rightarrow B
  • A \rightarrow BC
  • AB \rightarrow CD

Eine Grammatik in Kuroda-Normalform ist im Allgemeinen zwar monoton aber nicht mehr kontextsensitiv.

Eine kontextsensitive Normalform ist die einseitige Normalform mit Regeln der Art:

  • A \rightarrow a
  • A \rightarrow BC
  • AB \rightarrow AC

Zu jeder kontextsensitiven Grammatik gibt es eine Grammatik in einseitiger Normalform[3].

Alternative Notation[Bearbeiten]

Im Bereich der Sprachwissenschaften findet man eine alternative Notation der Produktionsregeln[4]. Man gibt die Ersetzungsregeln ähnlich zu kontextfreien Regeln an und nennt den Kontext, in dem die Regel angewendet werden darf, am rechten Ende der Regel: X \rightarrow \gamma \; / \alpha\_\!\_\!\_\!\_\beta /

Von kontextsensitiven Grammatiken erzeugte Sprachen[Bearbeiten]

Mit Hilfe kontextsensitiver Grammatiken lassen sich genau die kontextsensitiven Sprachen erzeugen. Das heißt: Jede kontextsensitive Grammatik erzeugt eine kontextsensitive Sprache und zu jeder kontextsensitiven Sprache existiert eine kontextsensitive Grammatik, die diese Sprache erzeugt.

Die kontextsensitiven Sprachen sind genau die Sprachen, die von einer nichtdeterministischen, linear beschränkten Turingmaschine erkannt werden können; d.h. von einer nichtdeterministischen Turing-Maschine, deren Band linear durch die Länge der Eingabe beschränkt ist (d.h. es gibt eine konstante Zahl a so dass das Band der Turing-Maschine höchstens a \cdot x Felder besitzt, wobei x die Länge des Eingabewortes ist).

Darum ist auch das Wortproblem (die Frage, ob x \in L gilt) für kontextsensitive Sprachen L entscheidbar.

Einzelnachweise[Bearbeiten]

  1. zum Beispiel  Uwe Schöning: Theoretische Informatik – kurz gefasst. 5. Auflage. Spektrum Akademischer Verlag, 2008, ISBN 9783827418241, Abschnitt 1.1.2, S. 9.
  2.  Klaus W. Wagner: Theoretische Informatik: Eine kompakte Einführung. Springer, 2003, ISBN 9783540013136, Kapitel 6, S. 187 (eingeschränkte Vorschau in der Google-Buchsuche).
  3. siehe Rozenberg und Salomaa, Handbook of Formal Languages, S.190
  4.  Daniel Jurafsky, James H. Martin: Speech and Language Processing: An Introduction to Natural Languagae Processing, Computational Linguistics, and Speech Recognition. Prentice Hall, 2009, ISBN 9780131873216, Kapitel 16, S. 531 (eingeschränkte Vorschau in der Google-Buchsuche).

Literatur[Bearbeiten]