Fugaku (Supercomputer)

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Fugaku oder Fuji ist der Name eines im Mai 2020 neu installierten Supercomputers am RIKEN Center for Computational Science im japanischen Kōbe.[1] Dieser Rechner ist der Nachfolger des K computer Superrechners und wie dieser von der Firma Fujitsu entwickelt und hergestellt, er wurde während seiner Entwicklung deshalb auch Post K Computer genannt. Die Firma Fujitsu beschritt mit dieser Entwicklung in vieler Hinsicht Neuland: Zunächst wurde das Herz des Rechners, die CPU's mit einem anderen Befehlssatz, einem ARMv8-64 Bit Befehlssatz, der um eine neue SIMD-Einheit erweitert wurde, genannt Scalable Vector Extensions – SVE entwickelt, der A64FX-Prozessor. Die Konzeption des Rechners mit System-on-a-Chip-Nodes führt dazu, dass die Recheneffizienz sehr hoch ist, im Bereich von spezialisierten Rechenbeschleunigern. Die SIMD- oder Vektor-Einheit kann mehrere Datenformate (Double Precision FP 64 bit, Single Precision FP 32bit, Half Precision FP 16 bit, INT8) parallel verarbeiten und ist damit auch für KI-Anwendungen sehr gut geeignet. Fujitsu hat eigene Compiler entwickelt, die die Vektor-Einheit ohne speziellen Code nutzen können, für die Software-Entwickler sind also keine besonderen Bibliotheken oder Frameworks wie CUDA erforderlich, um die SIMD-Vorteile zu erhalten. Die integrierte Wasserkühlung erlaubt die Nutzung der Abwärme und erhöht damit die Systemeffizienz weiter.

Ein Node des Fugaku-Supercomputers

A64FX[Bearbeiten | Quelltext bearbeiten]

Der A64FX-Prozessor wird von TSMC in einem 7-nm-Prozess hergestellt und ist als Cluster on a Chip bestehend aus 4 Clustern zu je 12 ARM-Kernen und jeweils einem HBM 2-Stapel mit 8 GByte aufgebaut. Die vier Cluster sind per Ring-Bus verbunden, auf dem Chip befindet sich auch noch die Eingabe-Ausgabe-Einheit, 16 Kanäle PCIe Gen3 und der Netzwerk-Switch, bestehend aus insgesamt 10 TOFU 3 Kanäle mit je 28 Gbps. Damit kann man den Prozessor als System-on-a-Chip (SOC) bezeichnen, da sich alle für einen kompletten Rechner ("Node") notwendigen Komponenten integriert sind. Die ausschließliche Verwendung von HBM-Stapeln als Arbeitsspeicher sorgt für eine sehr hohe Speicherbandbreite. Der Chip kommt insgesamt auf 48 ARM-Kerne mit 32 GByte RAM.

Aufbau des Systems[Bearbeiten | Quelltext bearbeiten]

Herzstück ist die Verschaltung des Superrechners als Fehlertolerantes TOFU-Netzwerk: jeweils 8 Nodes werden mit jeweils 4 Kanälen verschaltet, 6 weitere Kanäle dienen zur globalen und fehlertoleranten Verschaltung. Fujitsu nennt dies ein 6-dimensionales Torus Netzwerk.

  • Fujitsu integriert jeweils 2 CPU's mit Netzwerk, Strom und Wasserkühlungsanschlüsse auf einer Compute-Memory-Unit (CMU), sozusagen ein Blade-Server mit 2 Nodes.
  • In einem Rack werden 8 Shelves (Gehäuse) mit jeweils 24 CMU-Einschüben verbaut
  • zusammen befinden sich also 192 CMUs oder 384 CPUs / Nodes oder 18432 Kerne in einem Rack
  • am 13. Mai 2020 wurde die Installation von mehr als 400 Racks abgeschlossen.

Der Rechner verfügt derzeit über 158976 Nodes mit mehr als 7 Millionen CPU-Kernen.[2]

Fugaku wird voraussichtlich die nächste Ausgabe (im Juni 2020) der TOP500 und der Green500-Supercomputerlisten mit Werten von 537 Peta-FLOPS (Linpack)[3] anführen. Bereits die Green500-Liste vom November 2019 wurde vom Fugaku-Prototyp-System mit 16,9 GigaFLOPS/Watt angeführt.[4]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. With Fugaku Supercomputer Installed, RIKEN Takes On Coronavirus. In: The Next Platform. 18. Mai 2020, abgerufen am 18. Mai 2020 (englisch).
  2. Delivery of the Supercomputer Fugaku has been Completed. In: RIKEN Centre for Computational Science. 13. Mai 2020, abgerufen am 18. Mai 2020 (englisch).
  3. Satoshi Matsuoka. In: Twitter.com. 15. Mai 2020, abgerufen am 15. Mai 2020 (englisch).
  4. A64FX prototype - Fujitsu A64FX. In: www.top500.org. Abgerufen am 18. Mai 2020 (englisch).