Cantorsche Paarungsfunktion

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Die Cantorsche Paarungsfunktion (manchmal auch Nummerierungsfunktion) ist eine unter anderem in der theoretischen Informatik verwendete Abbildung, die auf dem Diagonalargument von Cantor basiert.

Mit ihr kann man ein beliebiges Paar (x,y) natürlicher Zahlen durch eine einzige natürliche Zahl n darstellen. Man nummeriert damit alle Zahlenpaare. Diese Nummerierung ist sogar eindeutig umkehrbar. Das heißt, man kann aus der Zahl n das ursprüngliche Zahlenpaar (x,y) wieder ermitteln. Mathematisch gesprochen heißt das: Die Cantorsche Paarungsfunktion ist eine bijektive totale Funktion \pi\colon \N^2 \to \N.

Die Idee der diagonalen Abzählung der Menge aller Paare natürlicher Zahlen geht auf Georg Cantor zurück. Die Verallgemeinerung der Cantorschen Paarungsfunktion von Paaren auf Tupel wird als Cantorsche Tupelfunktion bezeichnet.

Motivation[Bearbeiten]

In der theoretischen Informatik wird die Cantorsche Paarungsfunktion bzw. Tupelfunktion benutzt, um Funktionen, die mehr als einen Parameter haben, auf Funktionen zurückführen, die nur genau einen Parameter haben, was viele Beweise deutlich erleichtert.

Die Zurückführung eines Problems auf ein (evtl. einfacheres) bereits bekanntes Problem ist eine bewährte Beweistechnik, die man als Reduktion bezeichnet.

Mit der Cantorschen Paarungsfunktion bzw. Tupelfunktion lässt sich die Berechenbarkeit von k-stelligen Zahlenfunktionen auf die Berechenbarkeit von einstelligen Zahlenfunktionen reduzieren. Das heißt, man kann sich bei der Untersuchung der Berechenbarkeit von Zahlenfunktionen auf die Untersuchung von einstelligen beschränken und weiß, dass die gewonnenen Ergebnisse für alle (also auch für die mehrstelligen) Zahlenfunktionen gelten.

Grundsätzliches[Bearbeiten]

Es ist vielleicht nicht unmittelbar einsichtig, dass es möglich ist, alle beliebigen Kombinationen von zwei Zahlen durch eine Zahl zu kodieren: Die Menge aller Zahlenpaare \mathbb{N}^2 = \mathbb{N}\times\mathbb{N} scheint viel größer zu sein als die Menge aller Zahlen \mathbb{N}.

  ^
  | . . . . . . . . . . . .
  x x x x x x x x x x x x .
  x x x x x x x x x x x x .
  x x x x x x x x x x x x .    ~
 -x-x-x-x-x-x-x-x-x-x-x-x-->    =   -x-x-x-x-x-x-x-x-x-x-x-x->
  |                                 0
 \mathbb{N} x \mathbb{N} als zweidimensionales     \mathbb{N} als Menge von Punkten
 Gitter                            auf dem Zahlenstrahl  1

Die Cantorsche Paarungsfunktion zeigt jedoch, dass beide Mengen gleich groß sind, denn sie stellt eine 1:1-Beziehung her, sie ist eine Bijektion.

Eine Menge, die man bijektiv auf die natürlichen Zahlen abbilden kann, nennt man abzählbar unendlich; insbesondere haben die natürlichen Zahlen selbst diese Eigenschaft. Die Cantorsche Paarungsfunktion zeigt dann, dass auch die Menge der Paare natürlicher Zahlen abzählbar unendlich ist.

Definition[Bearbeiten]

Die Cantorsche Paarungsfunktion definiert man als

\pi : \mathbb{N} \times \mathbb{N} \to \mathbb{N}, ~ (x,y) \mapsto
      \pi(x, y) := y + \sum_{i=0}^{x+y} i = y+\frac{1}{2} (x + y) (x + y + 1),

wobei man die natürlichen Zahlen bei 0 beginnen lässt.

Kurzschreibweise:

\langle x, y \rangle = \pi(x,y) = n

n kodiert das Paar (x,y)

Hier ist eine Skizze der Diagonal-Abzählung:

Pairing-function.svg

Auf den Achsen sind die beiden Werte aufgetragen, wie in einer Entfernungstabelle schlägt man den Wert der Cantorschen Paarungsfunktion im Schnittpunkt nach, zum Beispiel \langle 1, 2\rangle = 8.

Die Nummerierung ist denkbar einfach: Man zählt diagonal mit Null beginnend die Paare ab: (0,0), (1,0), (0,1), (2,0), (1,1), (0,2) usw.

Man kann das obige Bildungsgesetz direkt ablesen, wenn man sich die Summation jeweils über eine Spalte verdeutlicht.

Erweiterung auf k-Tupel[Bearbeiten]

Durch mehrfache Anwendung lassen sich auch k-Tupel eindeutig nummerieren. Man definiert induktiv für k = 1,2,3,\ldots die Funktionen

\pi^{(k)} : \mathbb{N}^k \to \mathbb{N}

mit Hilfe der Paarungsfunktion \pi durch:

\pi^{(1)}(x) = x

und

\pi^{(k+1)}(x_1, \ldots, x_{k+1}) = \pi(\pi^{(k)}(x_1, \ldots, x_{k}), x_{k+1})

Die Funktionen \pi^{(k)} bezeichnet man als Cantorsche Tupelfunktionen.

Kurzschreibweise:

\langle x_1, x_2, \ldots, x_k\rangle  := \pi^{(k)}(x_1, x_2, \ldots, x_k)

Umkehrfunktion[Bearbeiten]

Die Cantorsche Paarungsfunktion ist umkehrbar. Die Umkehrung ist eindeutig und berechenbar. Letzteres ist für die Anwendung in der theoretischen Informatik wichtig, da die Berechenbarkeit der Funktion und der Umkehrfunktion Bedingung ist, um ohne Probleme alle berechenbaren Funktionen durch einstellige Funktionen darzustellen.

Umkehrbar heißt, man kann aus einer Zahl n auf die beiden Zahlen x und y schließen, für die \pi(x,y)=n gilt. Die Umkehrfunktion setzt sich aus zwei Hilfsfunktionen f und q zusammen:

Formale Definition[Bearbeiten]

Man schreibt ihre Inverse \left(\pi^{(k)}\right)^{-1}:\mathbb{N} \to \mathbb{N}^k komponentenweise als \pi^{(k)}_i:\mathbb{N} \to \mathbb{N}, wobei gilt:

\pi^{(k)}_i = \mbox{pr}^{(k)}_i \circ \left(\pi^{(k)}\right)^{-1}

vermöge der Projektion

\mbox{pr}^{(k)}_i(x_1, \ldots, x_k) = x_i,

welche die i-te Komponente aus einem Tupel der Länge k auswählt.

Bei Paaren (der Fall k = 2) schreibt man kurz \pi^{(2)}_1 = \pi_1 und \pi^{(2)}_2 = \pi_2, so dass man die Inverse der Paarungsfunktion als \pi^{-1} = (\pi_1,\  \pi_2) schreiben kann.

Mit den Hilfsfunktionen (Dreieckszahl)

f(w) = \sum_{i=0}^w i = \frac{w(w+1)}{2}

und

q(z) = \max\{v | f(v) \le z\}

oder (abgerundete Dreieckswurzel)

 q(z) = \left\lfloor \frac{\sqrt{8z + 1} - 1}{2} \right\rfloor

kann man \pi_1 und \pi_2 wie folgt für z berechnen:

\pi_2(z) = z - f(q(z))

und

\pi_1(z) = q(z) - \pi_2(z).

Beispiel[Bearbeiten]

Welches Zahlenpaar repräsentiert die Zahl 17?

Dazu bestimmt man zunächst die größte natürliche Zahl w, für die f(w) \le 17 gilt. Das lässt sich entweder durch Ausprobieren ermitteln (dabei hilft die Wertetabelle von f(w)):

 j      0    1    2    3    4    5    6
 f(j)   0    1    3    6   10   15   21

oder über die abgerundete Formel der Dreieckswurzel:

 q(17) = \left\lfloor \frac{\sqrt{8\cdot 17 + 1} - 1}{2} \right\rfloor = 5

Nun kann man einsetzen:

\pi_2(17)=17-f(5)=17-\frac{5(5+1)}{2}=17-15=2
\pi_1(17)=5-2=3

Also ist <3,2> = 17. Das lässt sich einfach anhand der Skizze oben verifizieren.

Computerimplementierungen[Bearbeiten]

Implementierung der Berechnungen in Java[Bearbeiten]

Bei großen Werten von z steigt der Zeitbedarf durch die WHILE-Schleife enorm, daher wurde darauf verzichtet Schleifen zu verwenden und stattdessen die Variante mit der Dreieckswurzel implementiert:

  public class Cantor {
    public static long compute(long x, long y) {
      return (x+y)*(x+y+1)/2 + y;
    }
    public static long computeX(long z) {
      long j  = (long) Math.floor(Math.sqrt(0.25 + 2*z) - 0.5);
      return j - (z - j*(j+1)/2);
    }
    public static long computeY(long z) {
      long j  = (long) Math.floor(Math.sqrt(0.25 + 2*z) - 0.5);
      return z - j*(j+1)/2;
    }
  }

Die Methode compute berechnet die dem übergebenen Zahlenpaar (x y) zugeordnete Zahl, computeX und computeY sind die Umkehrfunktionen von compute.

Pascal-Programm zur Berechnung der Umkehrung[Bearbeiten]

Das folgende Pascal-Programm berechnet die Umkehrfunktion \pi^{-1}:

 procedure CantorPair(I : Integer; Var X,Y : Integer);
 { Gibt das i-te Paar (X,Y) in Diagonalabzaehlung zurueck }
 var
    J : Integer;
 
    function F(Z : Integer) : Integer;
    begin
       F := (Z * (Z + 1)) div 2
    end;
 
    function Q(Z : Integer) : Integer;
    var
       V : Integer;
    begin
       V := 0;
       while F(V) <= Z do
          V := V + 1;
       Q := V - 1
    end;
 
 begin
    J := Q(I);
    Y := I - F(J);
    X := J - Y;
 end;

Hinweis: Wird das Pascal-Programm auf realen Rechnern übersetzt, muss es mit den Einschränkungen realer Rechner leben. Das heißt, dass bei großen Werten von z Integer-Überläufe das Ergebnis verfälschen. Für die Anschauung ist ein Pascal-Programm jedoch verständlicher als eine Registermaschine.

Berechenbarkeit[Bearbeiten]

Die Cantorsche Paarungsfunktion ist eine totale, bijektive, berechenbare (sogar primitiv rekursive) Funktion, daher ist auch ihre Umkehrung berechenbar.

Beweis der Berechenbarkeit der Cantorschen Paarungsfunktion[Bearbeiten]

Eine Methode zu beweisen, dass eine Funktion berechenbar ist, ist eine Registermaschine anzugeben, welche die Funktion berechnet.

Dieser Maschine muss man im Register R1 den Funktionsparameter x und im Register R2 y übergeben. Man erhält dann im Ausgaberegister R0 den Wert von \pi an der Stelle (x,y).

Die folgende zweistellige Maschine berechnet die Cantorsche Paarungsfunktion \pi(x,y) = \frac{1}{2} (x + y) (x + y + 1) + y:

R4 = R1 + R2;
R5 = R4 + 1;
R4 = R4 * R5;
R4 = R4 / 2;
R0 = R4 + R2;

Auf einen formalen Beweis, dass die Registermaschine tatsächlich die Funktion berechnet, wird verzichtet: Das ist offensichtlich erkennbar, wenn man die Funktionsvorschrift zur Berechnung der Cantorschen Paarungsfunktion mit der Maschine vergleicht.

Diese Registermaschine nutzt jedoch Befehle, die die einfache Registermaschine nicht kennt. Die einfache Registermaschine kennt nur die Operationen R+1, R-1 und den einfachen Test.

Durch Verfeinerung lässt sich diese Registermaschine aber auf eine einfache Registermaschine zurückführen.

Damit gibt es eine Registermaschine, die die Cantorsche Paarungsfunktion berechnet. Somit ist die Cantorsche Paarungsfunktion berechenbar.

Beweis der Berechenbarkeit der Umkehrfunktion[Bearbeiten]

Für den Beweis der Umkehrfunktion bietet es sich an, eine andere Definition der Berechenbarkeit zu nutzen:

Eine Funktion ist genau dann berechenbar, wenn ein WHILE-Programm existiert, das diese Funktion berechnet.

Das oben angegebene Pascal-Programm lässt sich zu einem WHILE-Programm verfeinern. Also gibt es ein WHILE-Programm, das die Umkehrfunktion berechnet. Somit ist auch die Umkehrung berechenbar.

Anwendung der Berechenbarkeit[Bearbeiten]

Aus der Berechenbarkeit der Cantorsche Paarungsfunktion und ihrer Umkehrung folgt, dass es für die Theorie der Berechenbarkeit ausreichend ist, sich mit einstelligen Funktionen von \mathbb{N} \to \mathbb{N} zu befassen. Für Funktionen von \mathbb{N}^n \to \mathbb{N}^n folgt die Berechenbarkeit dann durch die Anwendung der Cantorschen Paarungsfunktion und ihrer Umkehrfunktion:

 f : \mathbb{N}^n \to \mathbb{N}^m berechenbar, genau dann wenn es eine Funktion g gibt, mit
 g : \mathbb{N} \to \mathbb{N},
 \forall n \in \mathbb{N}^n gilt f (n) := \pi_m^{-1} ( g ( \pi_n (n) ) )
 und g ist berechenbar.

Man kann zum Beispiel zeigen, dass sich alle rationalen Zahlen durch ein geordnetes Tripel (i,j,k) darstellen lassen. Damit kann man die Berechenbarkeit leicht von den natürlichen Zahlen auf die Menge der rationalen Zahlen erweitern.

Herkunft[Bearbeiten]

Die Idee stammt aus der Mengenlehre von Georg Cantor. Er hatte die Idee, die Größe einer Menge (Mächtigkeit, Kardinalität) mit der Größe einer anderen Menge zu vergleichen, indem man versucht, eine 1:1 Abbildung (Bijektion) der Elemente dieser Menge mit den Elementen der anderen Menge zu finden. Jedem Element der ersten Menge soll genau ein Element der zweiten Menge zugeordnet werden und umgekehrt. Das erscheint kompliziert, findet aber seine Berechtigung, wenn es um Mengen mit unendlich vielen Elementen geht. Siehe auch Galileis Paradoxon.

Mit einer Diagonal-Abzählung (wie oben angedeutet) zeigt man leicht, dass bei einer abzählbaren Menge M das kartesische Produkt M \times M = M^2 = \{ (a, b) | a,b \in M \} gleichmächtig ist zu M, was vielleicht gegen die Intuition spricht, da hier Tupel verschiedener Dimension auftreten.

Alternativen[Bearbeiten]

Es gibt viele andere Möglichkeiten, Paare natürlicher Zahlen bijektiv durch eine natürliche Zahl zu kodieren, z. B. kann man ein wenig anders abzählen:

   | 0   1   2   3   4    y
 --+----------------------->
 0 | 0   2   3   9  10   .
 1 | 1   4   8  11   .
 2 | 5   7  12   .
 3 | 6  13  .
 4 |14   .
   | .
 x v

Auch die einfache Formel 2^x\cdot(2y+1) liefert eine Bijektion zwischen {\mathbb N}\times
{\mathbb N} und {\mathbb N} \setminus \{0\}:

   | 0   1   2   3   4    y
 --+----------------------->
 0 | 1   3   5   7   9   .
 1 | 2   6  10  14  18   .
 2 | 4  12  20  28  36   .       z=2^x\cdot(2y+1)
 3 | 8  24  40  56  72   .
 4 |16  48  80 112 144   .
   | .
 x v

Beweis der Umkehrbarkeit: x ist die größte natürliche Zahl, sodass 2x ein Teiler von z ist, also die Anzahl der Faktoren 2 in der Primfaktorzerlegung von z. Sei R= z/2x. Dann ist y=(R-1)/2.

Die Primfaktorzerlegung gibt eine Möglichkeit an, beliebige endliche Tupel natürlicher Zahlen durch natürliche Zahlen zu kodieren:

\langle i_1, i_2, i_3, i_4, i_5, \ldots \rangle  = 2^{i_1} 3^{i_2} 5^{i_3} 7^{i_4} 11^{i_5} \cdots

Beispiel:

\langle 2, 1, 0, 1, 0, 0\rangle = 2^2 3^1 5^0 7^1 11^0 13^0 =  4\cdot 3 \cdot 7 = 84

Literatur[Bearbeiten]

  • Klaus Weihrauch: Computability. Springer, Berlin u. a. 1987, ISBN 3-540-13721-1, (EATCS monographs on theoretical computer science 9).
  • Eric W. Weisstein: Pairing Function. In: MathWorld (englisch).
  • Katrin Erk, Lutz Priese: Theoretische Informatik. Eine umfassende Einführung. 2. erweiterte Auflage. Springer, Berlin u. a. 2002, ISBN 3-540-42624-8, (Springer-Lehrbuch), S. 263f.
  • Uwe Schöning: Theoretische Informatik - kurzgefasst. 4. Auflage. Korrigierter Nachdruck. Spektrum, Heidelberg u. a. 2003, ISBN 3-8274-1099-1, (Hochschultaschenbuch), S. 111f.