Markow-Algorithmus

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
QS-Informatik
Beteilige dich an der Diskussion!
Dieser Artikel wurde wegen inhaltlicher Mängel auf der Qualitätssicherungsseite der Redaktion Informatik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Informatik auf ein akzeptables Niveau zu bringen. Hilf mit, die inhaltlichen Mängel dieses Artikels zu beseitigen, und beteilige dich an der Diskussion! (+)

Der vom russischen Mathematiker Andrei Markow entwickelte Konzept des Markow-Algorithmus stellt einen wichtigen Ansatz zur Formalisierung des Algorithmusbegriffs dar. Formal handelt es sich bei einem Markow-Algorithmus um ein spezielles Semi-Thue-System.

Besonders Aufgaben der symbolischen Datenverarbeitung, beispielsweise die Konjugation und Deklination natürlicher Sprachen, lassen sich mit seiner Hilfe sehr effizient lösen.

Definition[Bearbeiten | Quelltext bearbeiten]

Informelle Beschreibung[Bearbeiten | Quelltext bearbeiten]

Der Markow-Algorithmus betrachtet die Eingabedaten eines Algorithmus als Wörter oder Sätze, aus denen durch Übersetzung ein Ergebnis ermittelt werden kann. Das Lösungsprinzip beruht also ausschließlich auf der Substitution von Zeichenketten. Weitere Operationen stehen nicht zur Verfügung. Analog zur Turingmaschine wird eine Symbolkette als grundlegende Datenstruktur verwendet. Obwohl Produktivsysteme meist eine nichtdeterministische Verarbeitung solcher Symbolketten vornehmen, lässt sich durch spezielle Einschränkungen ein deterministisches Verhalten erreichen:

  • Können mehrere Regeln angewendet werden, muss die Anwendungsreihenfolge immer eindeutig festgelegt sein.
  • Ist eine Regelanwendung an mehreren Positionen des Ausgangsworts möglich, muss stets eine Priorität definiert sein.

Der Markow-Algorithmus erfüllt die Anforderungen an einen solchen deterministischen Wortkalkül. Mit Mitteln der Berechenbarkeitstheorie kann man beweisen, dass Markow-Algorithmen genauso mächtig sind wie beliebige andere Algorithmen, Turingmaschinen oder µ-rekursive Funktionen.

Formale Definition[Bearbeiten | Quelltext bearbeiten]

Markow-Algorithmus und natürlicher Algorithmus stellen Semi-Thue-Systeme dar,[1] deren Regeln eine geordnete Menge bilden, die wiederum in folgende disjunkte Teilmengen zerfällt:

  • terminierende Regeln
  • nicht terminierende Regeln

Unter folgenden Voraussetzungen ist bei einem Markow-Algorithmus das Wort Q aus dem Wort P durch eine Regel R direkt ableitbar:

  • P wurde durch eine nicht terminierende Regel erzeugt
  • R ist die erste auf P anwendbare Regel
  • Q wird durch Anwendung von R auf das am weitesten links zu findende Teilwort von R in P erzeugt

Die Arbeit des Markow-Algorithmus bricht bei dem Wort ab, das durch eine terminierende Regel erzeugt wurde oder auf das keine weitere Regel anwendbar ist. Im Unterschied zum Post-Kalkül wird stets nur auf den passenden Teilen des Wortes operiert. Die Substitution eines Wortpaares (P, Q) bildet die Grundlage des Markow-Algorithmus:

  • Ein gegebenes Ausgangswort wird auf das erste Enthaltensein des Wortes P durchsucht
  • Kann P gefunden werden, wird es durch das Wort Q ersetzt

Es existieren folgende Spezialfälle der Substitution:

  • ε ⇒ Q
    Das leere Wort wird durch ein Wort Q ersetzt.
  • P ⇒ ε
    Ein Wort P wird durch das leere Wort ersetzt.
  • ε ⇒ ε
    Das leere Wort wird durch sich selbst ersetzt.

Die zu verarbeitenden Wörter werden aus einem Alphabet A gebildet. Linke und rechte Teile der Regeln eines Markow-Algorithmus stellen Wörter des Alphabets A dar. Folgende Metazeichen dürfen nicht im Alphabet enthalten sein:

  •   wird als Substitutionsoperator verwendet
  • .   kennzeichnet terminierende Regeln

Arbeitsweise[Bearbeiten | Quelltext bearbeiten]

Flussdiagramm[Bearbeiten | Quelltext bearbeiten]

Markow-Algorithmus als Flussdiagramm
Markow-Algorithmus als Flussdiagramm

Auf dem zu verarbeitenden Eingangswort findet eine Suche über das linke Wort der ersten Regel statt. Ist dieses im Eingangswort enthalten, wird eine der Regel entsprechende Substitution ausgelöst. Das Eingangswort wird von links nach rechts durchsucht. Somit wird bei einem Mehrfachvorkommen des linken Wortes der Regel stets das am weitesten links stehende Vorkommen substituiert.

Ist die oben beschriebene Suche erfolglos, wird zur nächsten Regel übergegangen. Kann unter Einbeziehung aller weiteren Regeln keine Substitution vorgenommen werden, so ist der Algorithmus beendet. Auch die Anwendung einer terminierenden Regel führt zu dessen Beendigung. Wurde mittels einer nicht terminierenden Regel substituiert, so beginnt der gesamte Ablauf unter Berücksichtigung des geänderten Wortes erneut.

Einfaches Fallbeispiel[Bearbeiten | Quelltext bearbeiten]

Zu den Erläuterungen zum Flussdiagramm noch ein simples Fallbeispiel zur Erklärung der Arbeitsweise; besonders die Reihenfolge der Regelanwendung und die daraus resultierenden Ergebnisse werden im Folgenden gut verdeutlicht.

Das im Beispiel verwendete Eingabewort lautet:

   A_I_I_I_

Darüber hinaus seien folgende Regeln definiert:

 01 I->A
 02 _->B
 03 AB->_B
 04 BBBBBBBB->.I_I_I_I_

Es ergeben sich folgende Substitutionen (die Nummer der angewendeten Regel wurde vorangestellt):

   1.   A_I_I_I_
   1.   A_A_I_I_
   1.   A_A_A_I_
   1.   A_A_A_A_
   2.   ABA_A_A_
   2.   ABABA_A_
   2.   ABABABA_
   2.   ABABABAB
   3.   _BABABAB
   2.   BBABABAB
   3.   BB_BABAB
   2.   BBBBABAB
   3.   BBBB_BAB
   2.   BBBBBBAB
   3.   BBBBBB_B
   2.   BBBBBBBB
   4.   I_I_I_I_

Hier terminiert die Berechnung wegen des Punktes (.) in der Definition der Regel 4.

Anwendungsbeispiele[Bearbeiten | Quelltext bearbeiten]

Inkrementation und Addition[Bearbeiten | Quelltext bearbeiten]

Die Zahlendarstellung im Dezimalsystem ist für die Lösung des Problems nicht optimal. Verwendet man jedoch einen einfachen Unärcode, so besteht der Algorithmus zur Inkrementation bzw. Addition jeweils aus nur einer einzigen Regel.

Darstellung:

  • die Kodierung der Zahlen erfolgt in Form von   1 = I, 2 = II, 3 = III   etc.
  • die Addition   1 + 0 + 2 + 4   wird beispielsweise als   I++II+IIII   kodiert

Es ergibt sich folgende Lösung:

  • ε ⇒ .I
    Inkrementation
  • + ⇒ ε
    Addition

Erkennung korrekter Klammerausdrücke[Bearbeiten | Quelltext bearbeiten]

Der Schlüssel zur Lösung dieses Problems liegt im Auffinden und Streichen zusammengehöriger Klammerpaare. Gestrichene Klammern verschwinden und ihr Platz wird von den angrenzenden Zeichen eingenommen. Nun sind die Klammern der folgenden Paare direkt benachbart und können wiederum leicht aufgefunden werden. Für unser Beispiel wird angenommen, dass der Klammerausdruck beidseitig durch das Zeichen '$' eingegrenzt ist.

Es ergibt sich folgende Lösung:

  • () ⇒ ε
    Löschen eines Klammerpaares
  • $$ ⇒ $.1$
    Alle Paare gelöscht, Ergebnis ist 1
  • ( ⇒ 0
    ) ⇒ 0
    Löschen der Restklammern
  • 00 ⇒ 0
    Löschen aller überzähligen Nullen

Die aufgezeigte Form zur Lösung der Aufgabe ist denkbar einfach und verständlich. Der Markow-Algorithmus bietet hier ein der Problemstellung gut angepasstes Lösungsprinzip.

Weblinks[Bearbeiten | Quelltext bearbeiten]

Fußnoten[Bearbeiten | Quelltext bearbeiten]

  1. Guido Walz (Editor). Lexikon der Mathematik: Band 3. Springer Berlin, Heidelberg 2016. Seite 356.