Prime95

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Prime95/MPrime
Prime95.PNG
Prime95 bei der Probedivision
Basisdaten
Entwickler George Woltman
Aktuelle Version 27.9[1]
(12. Dezember 2012)
Betriebssystem Windows (Prime95), Mac OS X (Prime95), Linux (MPrime), FreeBSD
Kategorie Primzahltester, besonders für Mersenne-Primzahlen; Benchmark
Lizenz Freeware, aber Kopplung an PrimeNet falls Suche nach Mersenne-Primzahlen
Deutschsprachig nein
http://www.mersenne.org/

Prime95 [praɪmˈnaɪntifaɪv][2] (prime95.exe) ist ein Programm für Windows und Mac OS X zum Testen der Primalität einer Mersenne-Zahl mithilfe des sogenannten Lucas-Lehmer-Tests. Es wird von GIMPS angeboten und von George Woltman als Software für Verteiltes Rechnen (distributed computing) entwickelt. Die Softwareversionen für GNU/Linux und FreeBSD werden MPrime [empraɪm][2] genannt und besitzen im Gegensatz zu Prime95 keine grafische Benutzeroberfläche.

Das Programm verfügt über eine der schnellsten bekannten Implementierungen für Multiplikationen, in dem es hochoptimierten Prozessor-Code zur Durchführung von schnellen Fourier-Transformationen verwendet. Die zugehörigen Routinen stehen als gwnum-Bibliothek in der Programmiersprache C zur Verfügung und werden von einigen anderen Programmen eingesetzt. Die gwnum ist frei nutzbar, jedoch müssen bei der Suche nach Mersenne-Primzahlen die Projektbedingungen (Software End User License Agreements "EULA")[3] eingehalten werden.

Der Code für die Generierung von Prüfsummen ist aus Sicherheitsgründen nicht öffentlich vorhanden.[4]

Einsatzzwecke[Bearbeiten]

Verteiltes Rechnen[Bearbeiten]

Das Programm kann als Software-Client für das verteilte Rechnen (distributed computing) mit PrimeNet, einer von GIMPS betriebenen zentralen Datenbank für Mersenne-Primzahlen, betrieben werden. Es verbindet sich dann in regelmäßigen Abständen mit dem PrimeNet-Server, um neue Arbeit anzufordern und fertige Ergebnisse abzuliefern. Die Berechnung erfolgt auf der CPU, während diese ungenutzt ist. Eine offizielle Unterstützung für GPUs existiert noch nicht. Mit CUDALucas (Lucas-Lehmer-Test) und mfaktc (Probedivision) existieren allerdings zwei CUDA-fähige Programme, deren Ergebnisse vom Server ebenfalls akzeptiert werden. Das PrimeNet verfügt Mitte 2011 über rund 62 Teraflops Rechenleistung.[5]

Stresstest[Bearbeiten]

Von PC-Enthusiasten wird Prime95 gerne beim CPU-Übertakten als Stabilitätstest eingesetzt, da das Programm die CPU relativ stark[6] auslastet, woraus eine starke Wärmebelastung resultiert, die oft den kritischen Faktor darstellt. Programminterne Plausibilitätsprüfungen der Rechenergebnisse liefern eine Qualitätskontrolle, die hardwarebedingte Rechenfehler des übertakteten Computersystems offenbaren.

Rechenleistung[Bearbeiten]

Das Programm kann als Benchmark verwendet werden. Die Ergebnisse können der Öffentlichkeit automatisch durch den PrimeNet-Server[7][8] zum Vergleich dargestellt werden.

Vergleich der CPU-Rechenleistung mit Hilfe des Prime95 und MPrime v26.6 Benchmarks[7][8]
Plattform/CPU-Modell Frequenz
(pro Kern)
in MHz
Kerne Prime95 FFT
(mit 2048k-Länge)
in ms
Prime95 FFT
(mit 4096k-Länge)
in ms
Prime95 Probedivision
(65 Bit Faktorlänge)
in ms
TDP in Watt rel. Durchsatz[9] pro Kern & Tag[10] Durchsatz[9] pro Kern & Tag bei 1GHz[10] Durchsatz[9] pro Watt & Kern & Tag bei 1GHz[10][11]
Intel Atom D510 1664 2 585,91 1954,40 25,65 13[12] 0,23 0,14 0,0215
AMD Fusion E-350 1596 2 222,03 491,02 15,18 18[13] 0,40[14] 0,25 0,0278
Intel Pentium III 1151 1 438,10 922,58 50,59 30[15] 0,31 0,27 0,0090
AMD Athlon 1054 1 457,40 774,49 56,08 60[16] 0,36 0,34 0,0057
AMD Athlon XP 2000+ 1640 1 201,21 448,28 32,80 70[17] 0,41 0,25 0,0036
Intel Pentium 4 3078 1 72,40 162,02 14,91 82[18] 1,50 0,49 0,0060
AMD Phenom II X4 3414 4 34,86 76,27 4,59 125[19] 4,32 1,27 0,0406
Intel Core2 Duo E8600 3334 2 34,15 73,07 4,89 65[20] 4,17 1,25 0,0385
Sandy Bridge Pentium G620T 2159 2 41,09 72,53 4,99 35[21] 3,54 1,64 0,0937
AMD Phenom II X6 1100T 3310 6 32,68 69,54 3,85 125[22] 4,03 1,22 0,0586
Intel Core i5-2500K 3330 4 23,94 53,24 3,49 95[23] 5,90 1,77 0,0745
Intel Core i7-2600K 3463 4 21,75 45,35 3,67 95[24] 6,17 1,78 0,0749

Faktorisierungsmethoden und Primzahltest[Bearbeiten]

Poststempel mit der 23. Mersenne-Primzahl
1 \cdot 2^{11213} - 1

Prime95 kann zur Faktorisierung von Zahlen der Form a \cdot b^{c} + d benutzt werden. Im Normalfall sucht es jedoch nur nach Mersenne-Primzahlen, für die a = 1, b = 2 und d = −1 gilt, mit Exponent c prim.

Das Programm unterstützt die Faktorisierungsmethoden:

  1. Probedivision
  2. Pollard-p-1-Methode − P-1-Test
  3. Lucas-Lehmer-Test − LL-Test
  4. Elliptic Curve Method − ECM-Test
Probedivision[25]
Exponent bis zu Obergrenze CPU GPU [25]
3.960.000 260
5.160.000 261
6.515.000 262
8.250.000 263
13.380.000 264
23.390.000 265
29.690.000 266
38.300.000 267
48.800.000 268 273
60.940.000 269 274
77.910.000 270 275
96.830.000 271 276
120.000.000 272 277
153.400.000 273 278
199.500.000 274 279
253.500.000 275 280
322.100.000 276 281
408.400.000 277 282
516.800.000 278

Probedivision[Bearbeiten]

Bezüglich der Menge aller zu testenden Zahlen, wird die Faktorisierungsmethode Probedivision dem eigentlichen Lucas-Lehmer-Primzahltest vorgeschaltet, um vergleichsweise schnell kleine Faktoren q in einzelnen Zahlen zu finden. Die Faktorisierungsmethode Probedivision zeigt Zahlen auf, die zusammengesetzt sind und deshalb keine Mersenne-Primzahlen sind. Diese Zahlen werden mit Hilfe des PrimeNet-Servers administriert. Auf sie kann der ECM-Test angewendet werden, der mögliche weitere Faktoren mit einer Länge bis etwa 60 Dezimalstellen effektiv findet. Hiernach wird mit jenen Zahlen, welche diesen ECM-Test durchlaufen, bei Bedarf zum Zahlkörpersieb übergegangen, das vom BOINC-Projekt NFS@Home angeboten wird.

Probedivision mit Grafikkarten[Bearbeiten]

Seit den Anfängen der programmierbaren Grafikprozessoren im Jahr 2000 besteht die Möglichkeit, die Rechenleistung von Grafikkarten zur Berechnung von parallelisierbaren Rechenoperationen zu nutzen (GPGPU). In Zusammenarbeit der Firmen AMD, IBM, Intel und Nvidia wurde der erste Entwurf für OpenCL, eine Programmierschnittstelle u.a. für Grafikprozessoren, ausgearbeitet und schließlich bei der Khronos Group eingereicht.[26][27]

Durch den derzeitigen Überschuss an GIMPS-Rechenkapazität im Bereich Probedivision durch GPGPU-Unterstützung leistungsfähiger Grafikkarten mittels der mfaktc Software und OpenCL, werden seit August 2011 höhere Obergrenzen verwendet .[28] Da der Aufwand der Probedivision bei mfaktc proportional zur Faktorgröße ist, d.h. nur von der Größe des Faktors abhängt, wird diese Software für größere Faktoren zunehmend ungeeignet. Es wird im Vergleich zu den beiden anderen Faktorisierungsmethoden Probedivision und P1 Test jedoch kaum Arbeitsspeicher benötigt, d.h geeignete Grafikkarten mit vergleichsweise geringem Grafikarbeitsspeicher reichen aus.

P-1-Test[Bearbeiten]

Bezüglich der Menge aller zu testenden Zahlen, wird der P-1-Test dem eigentlichen Lucas-Lehmer-Primzahltest vorgeschaltet, um effektiv mittelgroße Faktoren q in einzelnen Zahlen zu finden. Er erfolgt im Anschluss an die Probedivision und findet Faktoren, die stark zusammengesetzt sind. Man weiß, dass mögliche Faktoren q von 2^p-1 den Aufbau q=2*k*p+1 haben müssen.[29] Der Teil k ist hierbei meist selbst zusammengesetzt. Das Verfahren findet den Faktor q, solange alle Faktoren von k kleiner als die sogenannte B1-Grenze sind (Stufe 1) oder alle bis auf einen kleiner als B1 und der verbleibende letzte Teilfaktor von k kleiner als die sogenannte B2-Grenze ist (Stufe 2, mit B2 ≈ 30*B1). In seltenen Fällen können durch die sogenannte Brent-Suyama-Erweiterung aber auch Faktoren gefunden werden, die das B2-Kriterium eigentlich nicht erfüllen.[30] Der Berechnungsaufwand ist abhängig von der Größe des Exponenten sowie der Wahl von B1 und B2. Stufe B2 benötigt viel Arbeitsspeicher.

LL-Test[Bearbeiten]

Der rechenaufwändige Lucas-Lehmer-Primzahltest wird dann nur noch auf die Untermenge alle Zahlen angewendet, für die obige Faktorisierungsmethode ergebnislos blieben. Im Normalfall erfolgt die Zuweisung von zu testenden Zahlen automatisch durch PrimeNet. Die Grenze, bis zu der Faktoren im Rahmen der Probedivision gesucht werden, ist abhängig von der zu testenden Zahl und steigt mit ihrer Größe an. Die aufwandsoptimalen Obergrenzen sind in der Tabelle Probedivision genannt. Sie werden empirisch ermittelt.

ECM-Test[Bearbeiten]

Die „Elliptic Curve Method“ (ECM) wird auf Zahlen angewendet, die vom PrimeNet-Server zugewiesen werden. Der ECM-Test findet große Faktoren q mit einer Länge bis etwa 60 Dezimalstellen effektiv. Die Exponenten aus der automatischen ECM-Zuweisung des PrimeNet-Servers sind derzeit siebenstellig. Eine Zuweisung erfolgt nur nach entsprechender Einstellung in Prime95 oder manueller Anforderung über die Projekt-Webseite. Es verfügt ebenfalls über eine B1- und B2-Grenze (B2 = 100*B1). Auch hier benötigt Stufe B2 viel Arbeitsspeicher.

Programmoptionen[Bearbeiten]

Arbeitstypen unter Worker Windows
Abkürzung Bedeutung
GIMPS was sinnvoll ist (Serverwahl, Standardeinstellung)
TF Probedivision
TF-LMH Probediv. LMH(Lone Mersenne Hunters), kleine Faktoren
PM1-L Faktorisierung P-1, große Expon. (vor Lucas-Lehmer)
PM1-S Faktorisierung P-1, kleine Exponenten (zukünftig)
LL LL-Ersttest
LL-WR LL-Test, Weltrekordgröße
LL-10M LL-Test, mehr als 10 Millionen Stellen
LL-100M LL-Test, mehr als 100 Millionen Stellen
LL-NF LL-Test ohne vorherige Faktorisierung
D LL-Zweittest
ECM Faktorisierung per ECM, kleine Exponenten
ECM-F Faktorisierung per ECM von Fermatzahlen
Ergebnistypen
Abkürzung Bedeutung
F faktorisiert durch Probedivision
F-PM1 faktorisiert durch P-1
F-ECM faktorisiert durch ECM
NF kein Faktor durch Probedivision
NF-PM1 kein Faktor durch P-1
NF-ECM kein Faktor durch ECM
C LL-Test zusammengesetzt
P LL-Test prim

Auf der Projekt-Webseite kann in den Worker Windows (Prime95) bzw. Workers (MPrime) festgelegt werden, welche Art von Arbeit man erhalten möchte, zum Beispiel ein Faktorisierungsverfahren oder den Lucas-Lehmer-Test. Dies kann auch im Programm selbst vergenommen werden. Unter Status sieht man die Arbeiten, die man erhalten hat, sowie die erwarteten Vervollständigungsdaten. Die Arbeiten werden in der Datei worktodo.txt gespeichert. Bei Unreserve Exponent kann man einen Exponenten freigeben. Die Prozentzahl einer erledigten Arbeit wird automatisch an GIMPS weitergeleitet, man kann sie jedoch auch im Programm bei Manual PrimeNet Communication (Advanced → Manual Communication...) manuell zur Website schicken, indem man ein Häkchen bei Send new expected completion dates to server setzt. Dabei werden die neuen Vervollständigungsdaten zum Server geschickt.

Man kann mit dem Programm anonym oder mit einem GIMPS-Nutzerkonto arbeiten. Das Nutzerkonto sowie der Computername müssen im Fenster Configure PrimeNet (Test → PrimeNet...) eingegeben werden. Will man anonym arbeiten, muss man die Felder leer lassen. Die Ergebnisse sind in der Datei results.txt ersichtlich, die Erneuerungen in Versionen in der Datei whatsnew.txt.

Versionen[Bearbeiten]

Prime95 v26.3 beim Start
  • Version 27 (aktuell), letzte Version 27.9, 12. Dezember 2012, mit AVX-Unterstützung (~30 % Beschleunigung ab Intel-Sandy-Bridge-Mikroarchitektur (Core 2xxx / Core 3xxx) im Vergleich zu Version 26)[31]
  • Version 26, letzte Version 26.6, 4. April 2011 (~20 % Beschleunigung für Core-i-Generation im Vergleich zu Version 25)
  • Version 25, letzte Version 25.11, 13. Juli 2009 (PrimeNet 5.0 Protokoll)
  • Version 24, letzte Version 24.14, Februar 2006 (PrimeNet 4.0 Protokoll)

Siehe auch[Bearbeiten]

Weblinks[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1. [1]
  2. a b Oxford Advanced Learner's Dictionary: prime, ninety, five und M
  3. GIMPS: Software End User License Agreement ("EULA") [2]
  4. http://mersenneforum.org/showpost.php?p=47191&postcount=16
  5. GIMPS: PrimeNet Activity Summary PrimeNet Aggregate Computing Power 06-2011
  6. Christof Windeck: Hitzewelle, c't 15/2010 vom 5. Juli 2010, Seite 174ff
  7. a b Prime95 Benchmarks
  8. a b MPrime CPU Benchmarks und Durchsatz
  9. a b c FFT throughput, FFTsize 1024K, Avg Exp M20,950,000, siehe [3].
  10. a b c Gemessen in GHz-days per day per W, siehe GIMPS CPU Throughput calculator; leichte Abweichungen bei anderen FFT-Faktorlängen, abweichende Leistungsbilder bei MPrime-Probedivision.
  11. Die Werte verschlechtern sich bei übertakteten Maschinen exponentiell
  12. [4]
  13. [5]
  14. geschätzt
  15. [6]
  16. [7]
  17. [8]
  18. [9]
  19. [10]
  20. [11]
  21. [12]
  22. [13]
  23. [14]
  24. [15]
  25. a b MersenneForum.org: New breakeven points for Version 26 [16]
  26. Khronos OpenCL API Registry (englisch) – Spezifikation und Headerdateien
  27. "(..) verkündete die Khronos Group am 9. Dezember 2008 die Veröffentlichung der OpenCL 1.0-Spezifikation (..) Unmittelbar nach der Freigabe der OpenCL 1.0-Spezifikation kündigte AMD die beabsichtigte schnelle Übernahme des OpenCL 1.0-Programmierstandards sowie die Integration eines kompatiblen Compilers und einer kompatiblen Laufzeitumgebung in sein kostenloses ATI Stream SDK an (..) Durch die enge Kooperation mit OpenCL-Content- und Softwareentwicklern konnte AMD eine Entwicklerversion des ATI Stream SDKs mit OpenCL 1.0-Unterstützung erstellen. Das offiziell freigegebene ATI Stream SDK v2.0 mit OpenCL 1.0-Unterstützung ist seit der zweiten Jahreshälfte 2009 verfügbar." AMD - Die Geschichte des GPGPU-Computings in aller Kürze; Webzugriff am 2. Mai 2012
  28. MersenneForum.org: Factoring bit depth? [17]
  29. GIMPS: The Math [18]
  30. MersenneForum.net: [19]
  31. Prime95 version 27 released! Faster on Intel's newer CPUs!. Mersenne Research, Inc.. Abgerufen am 6. Juli 2012.