Kontextsensitive Grammatik

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Die kontextsensitiven Grammatiken (kurz CSG, von engl. context-sensitive grammar) sind eine Klasse formaler Grammatiken und identisch mit den Typ-1-Grammatiken der Chomsky-Hierarchie. Sie zeichnen sich dadurch aus, dass einzelne Nichtterminalsymbole nur in einem vorgegebenen Kontext ersetzt werden dürfen.

Definition[Bearbeiten | Quelltext bearbeiten]

Eine kontextsensitive Grammatik ist eine formale Grammatik G=(N,T,P,S) mit

  • Nichtterminalsymbolen N
  • Terminalsymbolen T
  • Startsymbol S \in N
  • Produktionsregeln P der Form \alpha X\beta \rightarrow \alpha\gamma\beta oder der Form S \rightarrow \varepsilon, wenn gilt:
    • \alpha, \beta \in (N \cup T)^*
    • X \in N
    • \gamma \in (N \cup T)^+
    • S kommt auf keiner rechten Seite einer Produktionsregel vor

Beschreibung[Bearbeiten | Quelltext bearbeiten]

Bis auf eine Ausnahme hat jede Produktionsregel der Definition nach die Form \alpha X \beta \rightarrow \alpha\gamma\beta und \gamma \neq \varepsilon.

Das bedeutet, dass das Nichtterminalsymbol X im Kontext der Zeichenketten \alpha und \beta durch \gamma ersetzt wird. Aber während \gamma aus mindestens einem Symbol (Terminal- oder Nichtterminalsymbol) bestehen muss, kann sowohl \alpha als auch \beta leer sein. Folgende Sonderfälle sind daher gemäß der Definition möglich:

  • \alpha X \rightarrow \alpha\gamma
  • X\beta \rightarrow \gamma\beta
  • X \rightarrow \gamma

Um das leere Wort \varepsilon erzeugen zu können, erlaubt man die Regel S \rightarrow \varepsilon, sofern S auf keiner rechten Seite einer Produktionsregel vorhanden ist.

Kontextsensitive und monotone Grammatiken[Bearbeiten | Quelltext bearbeiten]

Die Produktionsregeln kontextsensitiver Grammatiken verkürzen die linke Seite nicht. Bis auf die Regel S\rightarrow\varepsilon erfüllen also alle Regeln w_1\rightarrow w_2 die Bedingung \left|w_1\right| \leq \left|w_2\right|. Eine kontextsensitive Grammatik ist deshalb immer auch eine monotone Grammatik. Kontextsensitive und monotone Grammatiken erzeugen aber die gleiche Sprachklasse.

Einige Autoren definieren kontextsensitive Grammatiken im Sinne monotoner Grammatiken[1]. Die Produktionsregeln der Form \alpha X\beta \rightarrow \alpha\gamma\beta werden gelegentlich nur als typische oder kanonische Form kontextsensitiver Regeln betrachtet[2].

Normalformen[Bearbeiten | Quelltext bearbeiten]

Zu jeder kontextsensitiven Grammatik existiert eine Grammatik in Kuroda-Normalform mit Produktionsregeln der Form

  • A \rightarrow a
  • A \rightarrow B
  • A \rightarrow BC
  • AB \rightarrow CD

Eine Grammatik in Kuroda-Normalform ist im Allgemeinen zwar monoton aber nicht mehr kontextsensitiv.

Eine kontextsensitive Normalform ist die einseitige Normalform mit Regeln der Art:

  • A \rightarrow a
  • A \rightarrow BC
  • AB \rightarrow AC

Zu jeder kontextsensitiven Grammatik gibt es eine Grammatik in einseitiger Normalform[3][4].

Alternative Notation[Bearbeiten | Quelltext bearbeiten]

Im Bereich der Sprachwissenschaften findet man eine alternative Notation der Produktionsregeln[5]. Man gibt die Ersetzungsregeln ähnlich wie bei kontextfreien Regeln an und nennt den Kontext, in dem die Regel angewendet werden darf, am rechten Ende der Regel: X \rightarrow \gamma \; / \alpha\_\!\_\!\_\!\_\beta /

Von kontextsensitiven Grammatiken erzeugte Sprachen[Bearbeiten | Quelltext bearbeiten]

Mit Hilfe kontextsensitiver Grammatiken lassen sich genau die kontextsensitiven Sprachen erzeugen. Das heißt: Jede kontextsensitive Grammatik erzeugt eine kontextsensitive Sprache und zu jeder kontextsensitiven Sprache existiert eine kontextsensitive Grammatik, die diese Sprache erzeugt.

Die kontextsensitiven Sprachen sind genau die Sprachen, die von einer nichtdeterministischen, linear beschränkten Turingmaschine erkannt werden können; d.h. von einer nichtdeterministischen Turing-Maschine, deren Band linear durch die Länge der Eingabe beschränkt ist (d.h. es gibt eine konstante Zahl a so dass das Band der Turing-Maschine höchstens a \cdot x Felder besitzt, wobei x die Länge des Eingabewortes ist).

Darum ist auch das Wortproblem (die Frage, ob x \in L gilt) für kontextsensitive Sprachen L entscheidbar.

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. zum Beispiel Uwe Schöning: Theoretische Informatik – kurz gefasst. 5. Aufl. Spektrum Akademischer Verlag, 2008, ISBN 978-3-8274-1824-1, Abschnitt 1.1.2, S. 9.
  2. Klaus W. Wagner: Theoretische Informatik: Eine kompakte Einführung. Springer, 2003, ISBN 978-3-540-01313-6, Kapitel 6, S. 187 (eingeschränkte Vorschau in der Google-Buchsuche).
  3. M. Penttonen, One-Sided and Two-Sided Context in Formal Grammars, Information and Control, 25 (1974), 371-392
  4. siehe auch Rozenberg und Salomaa, Handbook of Formal Languages, S.190
  5. Daniel Jurafsky, James H. Martin: Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Prentice Hall, 2009, ISBN 978-0-13-187321-6, Kapitel 16, S. 531 (eingeschränkte Vorschau in der Google-Buchsuche).

Literatur[Bearbeiten | Quelltext bearbeiten]

  • Grzegorz Rozenberg, Arto Salomaa: Handbook of Formal Languages. Volume 1: Word, Language, Grammar. Springer, Berlin u. a. 1997, ISBN 3-540-60420-0,(?!) (eingeschränkte Vorschau in der Google-Buchsuche).
  • Katrin Erk, Lutz Priese: Theoretische Informatik: Eine umfassende Einführung. 3. erweiterte Aufl. Springer, Berlin u. a. 2008, ISBN 978-3-540-76319-2,(?!) (eingeschränkte Vorschau in der Google-Buchsuche).