Dixons Faktorisierungsmethode

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Dixons Faktorisierungsmethode, auch Dixons Zufallsquadrate-Methode[1] ist ein Faktorisierungsverfahren, d. h. ein Algorithmus zur Berechnung der Primfaktorzerlegung einer gegebenen zusammengesetzten natürlichen Zahl.

Die Methode wurde vom Mathematiker John D. Dixon an der Carleton University entwickelt und im Jahr 1981 publiziert.[2] Der Zweck war die theoretische Untersuchung von Faktorbasis-Verfahren und nicht die praktische Anwendung, denn es gab zu dieser Zeit bereits die Kettenbruchmethode als effizienteren Vertreter dieser Klasse von Faktorisierungsverfahren.

Funktionsprinzip[Bearbeiten]

Sei N die zu faktorisierende Zahl. Die Methode von Dixon beruht darauf, eine Kongruenz von Quadratzahlen

 x^2 \equiv y^2 \;\; (\bmod \, N) (1)
\text{mit} \;\; x \not\equiv y, \, x \not\equiv -y  \;\; (\bmod N) (2)

zu ermitteln. Dann sind die größten gemeinsamen Teiler  \operatorname{ggT}(x+y,N) und  \operatorname{ggT}(x-y,N) echte Teiler von N. Wegen (1) ist N Teiler von  x^2 - y^2 = (x+y)(x-y), aber wegen (2) weder von x+y noch von x-y, so dass sich die Primfaktoren von N auf x+y und x-y aufteilen.

Es wäre uneffizient, nach einer Kongruenz (1) direkt zu suchen. Stattdessen wählt man zunächst eine Faktorbasis, die aus allen Primzahlen p_1 = 2 bis p_k besteht. Dann bestimmt man Kongruenzen

 x_i^2 \equiv a_i \;\; (\bmod \, N), (3)

deren a_i keinen Primfaktor größer als p_k enthalten. Man nennt solche Zahlen p_k-glatt. Anschließend multipliziert man eine geeignete nicht leere Auswahl M, um eine Kongruenz von Quadraten zu erhalten (denn es gilt a \equiv b, c\equiv d \, \Rightarrow \, ac \equiv bd):

 x^2 = \prod_{i \in M} x_i^2 \, \equiv \, y^2 = \prod_{i \in M} a_i \;\; (\bmod \, N). (4)

Indem man sich auf p_k-glatte a_i beschränkt, braucht man nur eine überschaubare Anzahl von Kongruenzen (3), nämlich etwa k, damit eine Auswahl M von a_i existiert, deren Produkt eine Quadratzahl ist. Außerdem sind dadurch die a_i genügend schnell faktorisierbar, z. B. durch Probedivision. Ist deren Primfaktorzerlegung

a_i = \prod_{j=1}^k p_j^{e_{ij}}

bekannt, kann man eine Auswahl M effizient bestimmen. Damit das Produkt der gewählten a_i ein Quadrat ist, muss die Vielfachheit all seiner Primfaktoren gerade sein. Man verwendet dafür Methoden der linearen Algebra modulo 2 auf der Matrix der Vielfachheiten (e_{ij}).

Man kann zeigen: wenn N mindestens zwei verschiedene Primfaktoren enthält, also keine Potenz einer Primzahl ist, dann erfüllt mindestens die Hälfte der Kongruenzen von Quadratzahlen  x^2 \equiv y^2 \; (\bmod \, N) mit x,y teilerfremd zu N die Bedingung x \not\equiv \pm y \; (\bmod \, N).

Vorgehen[Bearbeiten]

Man wählt eine Zahl k und bestimmt die Faktorbasis \{2,3,5,\ldots,p_k\} mit den k kleinsten Primzahlen. Es wird empfohlen, die Primzahlen bis zu einer Schranke in der Größenordnung von p_k \approx \exp(\tfrac{1}{2} \sqrt{\ln N \ln \ln N}) in die Faktorbasis aufzunehmen.

Dann erzeugt man x_i im Bereich \left\lceil \sqrt N \right\rceil \le x_i < N und versucht, a_i = x_i^2 \bmod N zu faktorisieren. Dixons Methode sieht vor, dass (Pseudo-)Zufallszahlen als x_i verwendet werden, aber das ist nicht zwingend; man kann z. B. auch die Glieder einer regelmäßigen Folge wie etwa x_{i+1} = x_i + 1 nehmen.

Die Paare (x_i,a_i) mit p_k-glatten a_i werden aufbewahrt, zusammen mit der Faktorisierung der a_i in Form der Vielfachheiten e_{ij}. Wenn man eine ausreichend erscheinende Zahl davon zur Verfügung hat (am besten ein wenig mehr als k), versucht man eine Auswahl M dieser Paare zu bestimmen, die miteinander multipliziert eine Kongruenz von Quadratzahlen entsprechend (4) ergeben.

Das kann z. B. mit der Gauß-Elimination geschehen: man bildet eine binäre Matrix, die für jedes der gefundenen Paare (x_i,a_i) eine Zeile und für jeden Faktor der Faktorbasis eine Spalte enthält. In einem Matrixelement ist eine 1 eingetragen, wenn der betreffende Faktor mit ungerader Vielfachheit in dem a_i dieser Zeile enthalten ist, und ansonsten eine 0. Man bringt die Matrix mit den Operationen „Spalten vertauschen“ und „eine Spalte zu einer anderen modulo 2 addieren (also XOR-Verknüpfen)“ in eine Dreiecksform, an der man ablesen kann, welche (nicht leere) Auswahl der Zeilen den Nullvektor ergibt. Dann enthält das Produkt der a_i dieser Zeilen jeden Faktor mit gerader Vielfachheit und ist ein Quadrat.

Hat man eine solche Auswahl gefunden, berechnet man

x = \prod_{i \in M} x_i \, \bmod N; \quad y = \sqrt{\prod_{i \in M} a_i} \, \bmod N = \prod_{j=1}^k p_j^{\tfrac{1}{2} \sum_{i \in M} e_{ij}} \, \bmod N.

Wenn nun \operatorname{ggT}(x-y,N) keinen echten Teiler von N liefert, dann ist offenbar  x \equiv \pm y \; (\bmod \, N), und man muss eine andere Kombination der (x_i,a_i) probieren, ggfs. muss man weitere solcher Paare sammeln.

Eigenschaften[Bearbeiten]

Dixons Methode besitzt bei optimaler Wahl der Größe der Faktorbasis eine Zeitkomplexität in \operatorname{O}\left( \exp \left(2\sqrt{2\ln N \ln \ln N} \right) \right) (siehe Landau-Symbole). Es ist das einzige Faktorbasis-Verfahren, für das man eine Zeitkomplexitäts-Schranke kennt, die nicht von Annahmen über die Glattheits-Eigenschaften der Werte bestimmter Polynome abhängt.

Es ist ein allgemeines Faktorisierungsverfahren, d. h. es kann auf (nahezu) alle zusammengesetzten N angewandt werden. Nur wenn N eine Primpotenz ist, also von der Form N = p^m, versagt das Verfahren. Dieser Fall kann aber leicht vorab geprüft werden, wodurch man auch den Primfaktor p findet und N somit faktorisiert hat.

Die Zeit zum Faktorisieren eines bestimmten N hängt im Wesentlichen nur von der Größe von N ab, und nicht von der Größe der enthaltenen Primfaktoren. Zum Auffinden kleiner Faktoren gibt es viel effizientere Verfahren, z. B. die Probedivision oder die Pollard-Rho-Methode. Diese sollten zunächst versucht werden, wenn N auch kleine Faktoren enthält oder enthalten könnte, um dann evtl. ein Faktorbasisverfahren wie Dixons Methode auf den unfaktorisierten Teil von N anzuwenden.

Verbesserungen[Bearbeiten]

Man kann die a_i auch zu a_i = x_i^2 - N berechnen. Das ist etwas effizienter, weil die Subtraktion in der Regel schneller ist als die Modulo-Division. Wichtiger ist aber, dass man dann die Primzahlen p, für die N kein quadratischer Rest \bmod \, p ist, nicht in die Faktorbasis aufnehmen muss. Nur wenn es ein x gibt mit x^2 \equiv N \; (\bmod \, p), kann a_i durch p teilbar sein. Außerdem ist es günstig, sich auf x_i in der Nähe von \sqrt N zu beschränken, die ein a_i mit relativ kleinem Betrag liefern, das mit höherer Wahrscheinlichkeit über der Faktorbasis vollständig zerfällt. Es können auch x_i < \sqrt N verwendet werden, wenn der Faktor -1 in die Faktorbasis aufgenommen wird, um die negativen a_i darzustellen. Auch der Exponent von -1 muss dann gerade sein, damit ein positives Produkt der a_i entsteht, d. h. der Faktor -1 kann beim Ermitteln der Auswahl M genauso wie die Primfaktoren behandelt werden.

Die a_i können auch dann verwendet werden, wenn sie glatt sind bis auf einen einzigen Primfaktor größer p_k. Wenn nach dem Abdividieren der Faktoren p_1 bis p_k der verbleibende Teil kleiner als p_{k+1}^2 ist, muss er prim sein, und a_i wurde vollständig faktorisiert. Man erhält dadurch wesentlich mehr Kongruenzen, die man gemäß (4) kombinieren kann, bei unverändertem Aufwand für die Zerlegung der a_i. Die Bestimmung der Auswahl M wird dann allerdings komplizierter, denn es müssen auch die Zusatzfaktoren größer p_k im Produkt der a_i eine gerade Vielfachheit haben.

Eine weitere Möglichkeit ist es, von den a_i zunächst nur die kleinsten Primfaktoren 2, \dotsc, p_r abzudividieren und dann diejenigen, deren unfaktorisierter Rest größer als eine geeignet gewählte Grenze ist, zu verwerfen, denn diese sind nur mit geringer Wahrscheinlichkeit p_k-glatt. Nur die übrigen werden anschließend auch durch p_{r+1}, \dotsc, p_k dividiert.

Es gibt auch effizientere Verfahren zur Bestimmung der Auswahl M, z. B. das Block-Lanczos-Verfahren, das die dünne Besetzung der Matrix (e_{ij}) nutzt. Dadurch vermeidet man die kubische Komplexität (in k) der Gauß-Elimination.

Das Prinzip, Kongruenzen (3) zu sammeln und zu einer Lösung für (1) zu kombinieren, wird auch von anderen, effizienteren Faktorbasis-Verfahren genutzt, wie dem Quadratische Sieb, der Kettenbruchmethode und dem Zahlkörpersieb. Diese unterscheiden sich im Wesentlichen nur in der Methode, wie sie Kongruenzen finden, die dann zu einer Kongruenz von Quadraten kombiniert werden. Einige der genannten Verbesserungen können bei diesen Verfahren ebenfalls angewandt werden. Dixons Methode könnte man hinsichtlich der Funktionsweise als Prototyp dieser Verfahren ansehen, auch wenn die Kettenbruchmethode als erste entwickelt wurde.

Referenzen[Bearbeiten]

  1. Thorsten Kleinjung et al., "Factorization of a 768-bit RSA modulus", version 1.3 (January 24, 2010), p. 3
  2. John D. Dixon, "Asymptotically fast factorization of integers", Mathematics of Computation 36 (1981), pp. 255–260.