x64

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

In der Informatik wird die auf dem x86-Befehlssatz (bzw. Befehlssatzarchitektur, englisch Instruction Set Architecture, kurz: ISA) basierende 64-Bit-Architektur als x64, alternativ auch als x86-64 (auch in der Schreibweise „x86_64“) und AMD64 (auch in Kleinschreibung: „amd64“), bezeichnet. Die Befehlssatzerweiterung ergänzt die Intel Architecture 32-Bit, kurz IA-32, um einen 64-Bit-Betriebsmodus.

Implementierungen[Bearbeiten | Quelltext bearbeiten]

Die Befehlssatzerweiterung wird sowohl durch AMD als auch durch Intel implementiert:

Die Implementierungen von AMD und Intel weisen im Detail Unterschiede auf, die jedoch in der Praxis kaum Auswirkungen haben. Nicht nur die Bezeichnung „x64“ (wie z. B. von Windows genutzt), sondern auch „amd64“ (wie z. B. von Linux genutzt, aber teilweise auch von Windows[2]) und „x86-64“ (der Entwicklungsname von AMD64) stehen somit für beide Implementierungen gleichermaßen.[3]

Geschichte[Bearbeiten | Quelltext bearbeiten]

Die x86-64-Architektur wurde als Gegenentwurf zur Itanium-Architektur „IA-64“ von Intel und Hewlett Packard entworfen – während Intel eine ganz neue 64-Bit-Architektur erschuf, die mit der damals und auch danach in PCs meistverwendeten IA-32-Architektur nur wenig gemeinsam hatte, wählte AMD einen weit weniger radikalen Ansatz: Als Erweiterung des bestehenden Befehlssatzes ist ein 64-Bit-x86-Prozessor ebenfalls ein vollwertiger 32-Bit-Prozessor, nur mit zusätzlichen Befehlen und Modi, die im hinzugekommenen Betriebsmodus verbreiterte Register zur Verfügung stellen. Dadurch bleibt die Befehlssatzarchitektur und die Kompatibität zu bestehender Software erhalten.

Intel stellte die ersten IA-64-Prozessoren (IA-64 entspricht Itanium) am 4. Oktober 1999 vor.[4] Tags darauf kündigte AMD seinen Gegenentwurf an[5] und veröffentlichte die „x86-64“-Spezifikation im August 2000.[6] Intel brachte die erste Generation des Itanium im Juni 2001 heraus und schob noch 2002 die zweite Generation hinterher. Bei AMD dauerte es bis zum April 2003 bis die ersten Opteron mit der nun „AMD64“ getauften 64-Bit-Erweiterung verfügbar wurden. Sie wurden so gut vom Markt angenommen, dass Intel ab Juni 2004 begann, die ersten Xeon-Prozessoren („Nocona“) mit der kompatiblen „EM64T“-64-Bit-Erweiterung auszustatten.

Nun stattete AMD alle Modellreihen mit der AMD64-Erweiterung aus, während Intel bei 64-Bit noch auf die Itanium-Reihe setzte – erst im Juli 2006 wurden die ersten Desktop- und Mobilprozessoren der „Core 2“-Reihe mit der nun „Intel 64“ getauften Architektur verkauft. Alle Folgegenerationen der IA-32-kompatiblen Prozessoren von AMD und Intel sind seither als 64-Bit-Architektur ausgelegt, zuletzt die Atom-Prozessoren von Intel ab 2008. Andere Hersteller folgten der Marktentwicklung, der 64-Bit-VIA-Nano etwa wurde ab Januar 2008 verfügbar.

Bezeichnungen[Bearbeiten | Quelltext bearbeiten]

Geschichtlich wurde die 64-Bit-Befehlssatzerweiterung für die bestehende x86-Architektur, die von Intel IA-32 genannt wird, ab 1999 von AMD unter dem Namen „x86-64“ entwickelt. Auf einigen Systemen wurde sie auch x86_64 genannt, weil ein Bindestrich in einigen Situationen als Trennzeichen interpretiert wird. Dies ist z. B. beim Linux-Kernel der Fall, weshalb auch uname -m die Schreibweise mit Unterstrich ausgibt. Als die ersten Opteron-Prozessoren von AMD 2003 mit der 64-Bit-Erweiterung vorgestellt wurden, änderte AMD den Namen dafür in „AMD64.“[3] Die meisten Linux-Distributionen nutzen daher die Bezeichnung amd64 zur Kennzeichnung von 64-Bit-x86. Für 32-Bit-x86 unterscheidet Linux indes bereits nach den Befehlssatzerweiterungen, die nach dem „i386“ (die erste 32-Bit-Architektur von Intel, ohne Erweiterungen) kamen, etwa „i586“ (i386 mit den Erweiterungen des Pentium) oder „i686“ (die Erweiterungen des Pentium Pro bzw. Pentium II, auch P6-Generation genannt, d. h. mit zumindest MMX und SSE) oder sogar „i686-pae“ (i686, zusätzlich mit der PAE-Erweiterung). Bei „amd64“ ist auf jeden Fall die SSE2-Erweiterung des Prozessors nutzbar.

Die Bezeichnung x64 (für 64-Bit) wurde, angelehnt an „x86,“ von Microsoft und Sun eingeführt. Teilweise wurde die 32-Bit-x86-Architektur daraufhin auch als „x32“ (für 32-Bit) bezeichnet, da beide technisch gesehen x86-Befehlssätze darstellen. Da Intel die x86-ISA („Instruction Set Architecture“) später als IA-32 benannte und mit IA-64 (Itanium) eine neue, aber inkompatible 64-Bit-Architektur einwickelte, entsteht oft Verwirrung zwischen den Begriffen „x64“ und „IA-64.“ Als Befehlssatzerweiterung ist x64 Teil von IA-32 bzw. x86. IA-64 („Intel Architecture 64-Bit“) hingegen wird auch als die Itanium-Architektur bezeichnet und hat mit x64 nichts zu tun.

Betriebssystem-Unterstützung[Bearbeiten | Quelltext bearbeiten]

Das erste Betriebssystem, das eine funktionierende Unterstützung für den 64-Bit-Modus der AMD64-Prozessoren bot, war Linux (offizielle Einführung in den Linux-Kernel 1. März 2002).[7] Von Microsoft war seit April 2005 die Windows XP Professional x64 Edition für AMD64 verfügbar, die allerdings nur eine Zwischenlösung bot, bis Windows Vista im Januar 2007 auf den Markt kam.

Die x64-Edition von Windows XP wurde von Microsoft nur sehr zurückhaltend als OEM- und Systembuilder-Version vermarktet, um den „Support“-Aufwand in Grenzen zu halten und die zukünftigen Vista-Verkäufe nicht zu gefährden. Es gibt keine Home-Variante, keine Schachtel-Version für den Einzelhandel und keine vollständige Lokalisierung für Sprachen außer Englisch. Allerdings ist es möglich, diese Version mit MUI-(Multi User Interface)-Packs zu „übersetzen“.

Mac OS X (seit 2016 „macOS“) unterstützt die x64-Architektur seit Beginn der Umstellung seiner Plattform von PowerPC zu Intel-Prozessoren im Jahr 2006.

Auch die drei wichtigsten BSD-Derivate unterstützen die AMD64-Architektur: FreeBSD, NetBSD sowie OpenBSD (ab Version 3.5).

Architektur[Bearbeiten | Quelltext bearbeiten]

Alle Register haben bei AMD64 eine Breite von 64 Bit. Wenn der Prozessor im 32-Bit-Kompatibilitätsmodus läuft, werden die obersten 32 Bit jedes Registers auf 0 gesetzt. Im 64-Bit-Modus bietet der Prozessor außerdem je 8 zusätzliche Integer- und SSE-Register, die im 32-Bit-Modus aus Kompatibilitätsgründen nicht verfügbar sind.

Die AMD64-Architektur besitzt folgende Anwendungsregister, die in normalen Anwendungsprogrammen zur Verfügung stehen:

Allgemeine Register (je 64 Bit)
Name (ursprüngliche) Bedeutung
RAX Akkumulator
RBX Base Register
RCX Counter
RDX Data Register
RBP Base-Pointer
RSI Source-Index
RDI Destination-Index
RSP Stack-Pointer
R8…R15 Register 8 bis 15
64-Bit-Media-/80-Bit-Gleitkommaregister
Name Bedeutung Hinweis
FPR0 … FPR7 FPU-Register 0 … 7 werden
geshared
MMX0 … MMX7 MMX-Register 0 … 7
64-Bit-Media-/80-Bit-Gleitkommaregister
Name Bedeutung
XMM0 … XMM7 SSE-Register 0 … 7
XMM8 … XMM15 SSE-Register 8 … 15
Sonstige Register
Name Bedeutung
RIP 64-Bit-Instruction-Pointer (Befehlszeiger)
RFLAGS 64-Bit-Flagregister (Statusregister)
FSW FPU state word
FCW FPU control word
FTW FPU tag word

Die gelb hinterlegten Register R8–R15 und XMM8–XMM15 stehen ausschließlich im 64-Bit-Modus zur Verfügung. Die Register RAX–RSP sowie RFLAGS und RIP sind im 32-Bit-Modus nur 32 Bit groß und heißen dort EAX–ESP, EFLAGS und EIP, wie schon beim 80386. Der Zugriff auf die 64-Bit-Register erfolgt über neu eingeführte Befehlspräfixe. Hierfür werden Opcodes verwendet, welche im 32-Bit-Modus bereits für andere Befehle stehen. Aus diesem Grund sind die 64-Bit-Register – anders als die 32-Bit-Präfixe, die auch im 16-Bit-Modus zur Verfügung stehen – nur im 64-Bit-Modus verfügbar.

Für Gleitkommaoperationen ist zwar aus Kompatibilitätsgründen eine x87-FPU auf dem Prozessor vorhanden. Der Hersteller empfiehlt jedoch, für Gleitkommaberechnungen generell nur noch die performantere und problemärmere SSE-Einheit zu benutzen. Problematisch ist hierbei allerdings, dass die SSE-Einheit bis heute keine transzendenten Funktionen (Sinus, Cosinus, Arcustangens, Logarithmus) beherrscht; diese müssen weiterhin über die x87-FPU berechnet oder per Software emuliert werden. Außerdem beherrscht die SSE-Einheit nur 64-Bit-Gleitkommaarithmetik, während die x87-FPU-Einheit intern mit 80-Bit-Gleitkommaarithmetik arbeitet.

Da im 64-Bit-Modus keine Speichersegmentierung mehr unterstützt wird, können Systemaufrufe stark beschleunigt werden, da keine Segmentierungsinformationen mehr gespeichert und wiederhergestellt werden müssen. AMD trug dem durch Einführung eines neuen SYSCALL-Maschinenbefehls Rechnung. Obwohl man theoretisch auch im 64-Bit-Modus wie bisher über Interrupts oder den SYSENTER-Befehl einen Systemaufruf durchführen könnte, ist SYSCALL schneller.

Maximaler Arbeitsspeicher[Bearbeiten | Quelltext bearbeiten]

Einer der Hauptgründe, AMD64 der x86-Architektur vorzuziehen, ist die Möglichkeit, mehr Arbeitsspeicher zu verwenden. Übersteigt der installierte Arbeitsspeicher den maximalen Adressraum einer CPU, dann bleibt der Arbeitsspeicher, der jenseits des Adressraums liegt, ungenutzt. Die Speichergrößengrenzen der x86-Prozessoren:

CPU physischer Adressraum linearer logischer Adressraum
virtueller Adressraum
ab 8086 1 MByte 64 KByte
ab 80286 16 MByte 64 KByte
80386SX 16 MByte 4 GByte
ab 80386DX 4 GByte 4 GByte
Pentium Pro/AMD Athlon 64 GByte 4 GByte

Bei AMD64 ist die Breite einer virtuellen Adresse 48 Bit. Das heißt, ein Prozess kann 256 TiB adressieren. Während die bei der Einführung von AMD64 üblichen AMD-Prozessoren der Generation K8 noch 40 Adresspins besaßen, und damit physisch nur 1 TiB Speicher adressieren konnten, hat die Prozessoren-Generation K10 die vollen 48 Adresspins, womit nun auch physisch 256 TiB Speicher adressierbar sind.

Registererweiterung[Bearbeiten | Quelltext bearbeiten]

Die Verdoppelung der Registerzahl des allgemeinen Rechenwerks ist im Befehlssatz unabhängig vom 64-Bit-Transfer vorhanden. Die Implementierung der AMD64-Erweiterung in den CPUs beinhaltet diese Erweiterung jedoch immer. Moderne Compiler können so häufiger Zwischenwerte von Berechnungen in CPU-Registern ablegen, statt in den Hauptspeicher auszulagern. Komplexe Berechnungen werden dadurch beschleunigt, so dass rechenintensive Programme davon profitieren.

Gleichzeitig wurde mit AMD64 eine neue Aufrufkonvention[8] für Programmfunktionen (ABI) eingeführt. Bei dieser Aufrufkonvention werden Funktionsparameter nicht mehr überwiegend über den Programmstack transferiert, wie bei den klassischen x86-32-Aufrufkonventionen, sondern in der Regel in Registern übergeben. Dieses registerorientierte ABI, welches bei anderen Prozessorfamilien (wie PowerPC) schon länger üblich ist, wurde durch die Registererweiterung möglich und kann zu einer Beschleunigung rechenintensiver Programme führen.

Betriebsmodi[Bearbeiten | Quelltext bearbeiten]

Es lassen sich zwei grundsätzliche Betriebsmodi unterscheiden:

  • Legacy Mode: Hierunter fallen alle „alten“ Betriebsmodi der x86-Architektur, also Real Mode, Protected Mode und System Management Mode.
  • Long Mode (AMD64) oder IA-32e Mode (Intel 64): Dieser Betriebsmodus besteht aus zwei Submodi:
    • 64-Bit Mode: Der „echte“ 64-Bit-Mode für 64-bittige Anwendungen auf einem 64-Bit-Betriebssystem.
    • Compatibility Mode: Dieser Mode dient dazu, 32-bittige Anwendungen auch auf einem 64-Bit-Betriebssystem ausführen zu können. Die Anwendung „sieht“ dabei eine Umgebung, die dem Protected Mode zu entsprechen scheint. In Wahrheit werden aber dennoch Mechanismen der AMD64-Architektur benutzt, wie etwa eine vierstufige Seitentabellen-Hierarchie. Ebenso werden 16-Bit-Protected-Mode-Programme im Compatibility Mode unterstützt, nicht jedoch Real-Mode-Programme, die im Legacy Mode in einer Virtual-8086-Mode-Umgebung ausgeführt werden. Der Compatibility Mode muss explizit vom Betriebssystem unterstützt werden und kann dann für ein einzelnes Codesegment aktiviert werden.

Beim Systemstart befindet sich jeder x86-Prozessor zunächst im 16-Bit-Modus Real Mode, was der Kompatibilität zum 8086 von Intel geschuldet ist. Verwendet ein PC ein BIOS so bleibt der Prozessor zunächst im Real Mode bis das Betriebssystem startet. Daher sind alle BIOS-Bootloader 16-Bit-Programme und erst das Betriebssystem, bzw. dessen Kernel, schaltet in den 32-Bit- oder 64-Bit-Modus. UEFI andererseits schaltet entweder in den 32-Bit-Modus Protected Mode um ein 32-Bit-EFI-Programm zu starten, oder in den 64-Bit-Modus Long Mode um ein 64-Bit-EFI-Programm zu starten. Dieses EFI-Programm ist z. B. der Bootloader für das Betriebssystem. Das ist der Grund, warum ein 32-Bit-UEFI normalerweise kein 64-Bit-Betriebssystem starten kann. Bei einigen Betriebssystemversionen gibt es deshalb einen Cross-Bit-Depth-Bootprozess, der aus einem 32-Bit-EFI heraus ein 64-Bit-Betriebssystem starten kann, jedoch muss dabei sowohl der 32-Bit-EFI-Loader als auch der 64-Bit-Betriebssystem-Kernel passend konfiguriert sein.[9]

Nutzen der 64-Bit-Erweiterung[Bearbeiten | Quelltext bearbeiten]

Nachteil – Speicherverbrauch
Alle Adresswerte sind 64 Bit statt 32 Bit breit. Ihre Speicherung verbraucht daher im RAM und in den Caches doppelt so viel Platz und bei Bewegungen zwischen RAM und CPU müssen somit doppelt so viele Bytes bewegt werden. Sichtbar wird dieses in den erzeugten Programmdateien, die im Vergleich zum 32-Bit-Programm etwa 25 bis 30 Prozent größer sind. Allerdings wurde im 64-Bit-Modus eine IP-relative Adressierung mit vorzeichenbehafteten 32-Bit-Offsets eingeführt. Damit wird eine Zunahme der Befehlslänge verhindert.
Für Linux wurde aus diesem Grund die X32-ABI geschaffen, welche nur 32 Bit breite Adressen verwendet, aber trotzdem in Genuss der anderen Vorteile von AMD64 (wie z. B. mehr Register) kommt.
Neutral – Vektoroperation
Die SSE-Einheit übernimmt den weitaus größten Teil der Berechnungen für Multimedia und Mathematik, sowohl für Gleitkommawerte als auch für ganzzahlige gepackte Zahlen mit mehreren Werten, darunter vor allem Vektoren und Matrizen. Die Erweiterung der ALU-Register auf 64 Bit tangiert diese Einheit gar nicht, da die SSE-Register schon immer 128 Bit breit waren, so dass SSE-Berechnungen unverändert ablaufen. Die nachfolgend genannte Verdoppelung der Registerzahl betrifft jedoch auch die SSE-Mediaregister.
Vorteil – mehr Speicher pro Prozess
Die Grenze der klassischen IA-32-Architektur von 2 (bzw. 4) GiB adressierbarem Hauptspeicher pro Prozess („linearer Adressraum“) entfällt.
Vorteil – Registeranzahl
Zusätzlich zur 64-Bit-Aufweitung weist die AMD64-Architektur eine doppelte Zahl an allgemeinen Registern auf. Das ist vorteilhaft bei vielen Zwischenwerten in einer Prozedur, die nicht mehr zeitweise auf den Aufrufstapel im Hauptspeicher ausgelagert werden müssen. Da die althergebrachten acht Register schon immer knapp waren, setzt man hier 25 bis 30 Prozent[10] Geschwindigkeitsvorteil bei 64-Bit-Programmen an. Zusätzlich ist eine neue Funktionsaufruf-Konvention eingeführt worden, die die zusätzlichen Register zur Übergabe von Funktionsparametern vorschreibt. Diese Art der Parameterübergabe ist deutlich schneller als die herkömmliche Parameterübergabe auf dem Stapelspeicher.
Vorteil – Adressbreite
Wenn Datenmengen im Gigabyte-Bereich verarbeitet werden, entfallen aufwendige Zugriffsberechnungen mit 32-Bit-Differenzen zu Basisadressen. Insbesondere beherrschen alle modernen Betriebssysteme das Einblenden von Dateien auf der Festplatte in den Hauptspeicher (virtual file mapping): Statt stückweiser Abarbeitung kann nun im Prinzip die gesamte Festplatte für den Direktzugriff in einem Stück eingeblendet werden. Hilfsfunktionen mit Dateizeigern entfallen und degenerieren zu einfachen ALU-Operationen.
Vorteil – Vektoreinheiten
Sollen 32-Bit-Programme auch auf älteren Prozessoren laufen, können diese Programme keine SSE-Einheit voraussetzen und werden meistens ohne SSE-Unterstützung kompiliert. Alle AMD64-fähigen Prozessoren verfügen hingegen mindestens über SSE2, das somit bei 64-Bit-Software immer zur Verfügung steht.
Vorteil – 64-Bit-Register für Integerarithmetik
Anwendungen, die auf Integerarithmetik angewiesen sind, profitieren sehr davon, dass Multiplikationen mit ganzen Zahlen größer als 32 Bit erheblich schneller verarbeitet werden. Beispielsweise wird für die Verarbeitung von 64-Bit-Ganzzahlen auf 32-Bit-Systemen etwa das 2,5 Fache an Rechenzeit benötigt.[11] Dies kann zum Beispiel Kryptographie und Audio- beziehungsweise Videoencodingsoftware betreffen.

Der letztgenannte Vorteil betrifft vor allem Datenbanken und die Videobearbeitung, die von der Aufweitung von Adressen auf 64 Bit erheblich profitiert. Die SSE-Einheit bestimmt weitgehend die Abarbeitung von Spielen und mathematischen Programmen – soweit sie komplexe Teilberechnungen auf wenigen Speicherobjekten beinhalten, profitieren diese stärker von den Vorteilen. Das betrifft vor allem Bereiche der 3D-Modellierung.

Grundsätzlich ist der Nutzen stark spezifisch für jede Anwendung und die eingesetzten Algorithmen: Viele alte Programme verwenden auf 32 Bit optimierte Algorithmen, die erst nach Anpassung durch Programmierer von der 64-Bit-Erweiterung profitieren können. Das betrifft sowohl mathematische Hilfsfunktionen (auch Multimedia und Spiele) als auch die Speicherverwaltung. Viele Programme aus dem Unix-Bereich haben hierbei einen Vorsprung, da dort 64-Bit-Architekturen schon lange üblich sind.

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Weblinks[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Chris Lomont: Introduction to x64 Assembly. In: Intel Developer Zone. Intel, 19. März 2012, abgerufen am 20. November 2016 (englisch): „x64 is a generic name for the 64-bit extensions to Intel's and AMD's 32-bit x86 instruction set architecture (ISA). AMD introduced the first version of x64, initially called x86-64 and later renamed AMD64. Intel named their implementation IA-32e and then EMT64. There are some slight incompatibilities between the two versions, but most code works fine on both versions;“
  2. BeemerBiker: Q: WAIK-Difference of x86, amd64 and ia64? In: Microsoft Community. Microsoft, 25. Februar 2011, abgerufen am 6. Januar 2018 (Forum, englisch): „I installed Windows Automated Installation Kit and got three directories named x86, IA64 and AMD64. I expected to see x64.“
  3. a b Christof Windeck: 64-Bit-Namen. In: Heise online. 28. April 2008. Abgerufen am 19. November 2016; Zitat: „In Bezug auf x86-Prozessoren mit 64-Bit-Erweiterung meinen x86-64, AMD64, EM64T, Intel 64 und x64 praktisch dasselbe.“
  4. Michael Kanellos: Intel Names Merced Chip Itanium. In: CNET News.com. 4. Oktober 1999, abgerufen am 7. August 2013 (englisch).
  5. AMD Discloses New Technologies at Microprocessor Forum. In: press release. AMD, 5. Oktober 1999, abgerufen am 9. November 2010 (englisch).
  6. AMD Releases x86-64 Architectural Specification; Enables Market Driven Migration to 64-Bit Computing. In: press release. AMD, 10. August 2000, abgerufen am 9. November 2010 (englisch).
  7. Herbert Schmid: 64-Bit-Linux für AMDs Hammer offiziell. In: Heise online. 1. März 2002. Abgerufen am 6. Januar 2018.
  8. Michael Matz, Jan Hubicka, Andreas Jaeger, and Mark Mitchell: System V Application Binary Interface AMD64 Architecture Processor Supplement (PDF; 552 kB) 13. Januar 2010. Abgerufen am 7. August 2013.
  9. Rod Smith: Boot 32bit UEFI from file. Antwort auf die gestellte Frage. In: superuser.com. Stack Exchange, 31. Januar 2016, abgerufen am 20. Januar 2018 (Q&A, englisch, Roderick W. Smith ist Herausgeber des Bootloaders rEFInd).
  10. x86-64 Machine-Level Programming (PDF; 230 kB) S. 5–6, 3.2 Assembly Code Example.
  11. Myth and Facts About 64-bit Linux. (PDF; 233 kB; englisch) – verschiedene Performancevergleiche von AMD64 und IA32, auf Seite 27 werden ganzzahlige Additionen auf 32- und 64-Bit-Systemen verglichen