Supercomputer El Capitan (Bild: US-Energieministerium)

Das US-amerikanische Energieministerium arbeitet an einem AMD-basierten Supercomputer, der nach der Inbetriebnahme 2023 im kalifornischen Livermore mit einer theoretischen Verarbeitungsgeschwindigkeit von über 2 Exaflops (zwei Trillionen Gleitkommaoperationen pro Sekunde) der schnellste Rechner der Welt sein soll. Das Monster heisst El Capitan und wurde nach einem markanten Felsvorsprung im Yosemite-Nationalpark im US-Bundesstaat Kalifornien benannt.

Die Exascale-Anlage nutzt AMDs nächste Epyc-CPU-Generation und künftige Radeon-Instinct-Beschleuniger. Mit einem Energieverbrauch von 30 bis 40 Megawatt soll der Rechner zudem effizient werden. Zum Vergleich: Der bisher schnellste Supercomputer - der Summit - benötigt für 200 Petaflops, also ein Zehntel von 2 Exaflops, rund 10 Megawatt. Exascale-Supercomputer sind etwa fünfmal schneller als der heute schnellste Supercomputer Summit. El Capitan käme auf die sechzehnfache Leistung der zweit- und drittplatzierten der Top500-Liste der weltschnellsten Computer, Sierra (USA) und Sunway Taihulight (China).

In den Vereinigten Staaten arbeiten die Forschungseinrichtungen Oak Ridge, Argonne und Lawrence Livermore National Labs (Coral) mit Hardware-Herstellern seit Jahren an neuen Grossrechnern, um die Grenze von 1 Exaflops bei doppelt genauen wissenschaftlichen Berechnungen zu knacken. Nun hätte sich die Gelegenheit ergeben, so die Betreiber, den bereits im letzten Jahr angekündigten El Capitan von den ursprünglich projizierten 1,5 auf über 2 EFlops zu beschleunigen – dabei handle es sich nicht um eine neue Vorgabe seitens des U.S. Department of Energy (DOE, auch für das atomare Arsenal der USA zuständig). Der Kostenrahmen bleibe bei den ursprünglich kalkulierten 600 Millionen US-Dollar.

Als Partner des Projekts agiert die HPE-Tochter Cray. Daher besteht der Supercomputer aus warmwassergekühlten Shasta-Nodes, welche mit dem Slingshot-Interconnect verknüpft werden. In den Nodes des Supercomputers werden unter anderem Clusterstor-E1000-Systeme verwendet, die Prozessoren und Beschleuniger stammen von AMD: Konkret wird die übernächste Generation an Epy-CPUs eingesetzt, die als Genoa bezeichneten Chips basieren auf der Zen-4-Architektur und unterstützen DDR5-Speicher sowie PCIe-Gen5-Lanes. Weil die kommende Milan-Generation weiter 64 Kerne aufweist, könnte Genoa mehr Cores integrieren. Die Prozessoren werden mit einer unbekannten Menge an Radeon Instinct kombiniert. Diese Beschleunigerkarten sind zugunsten einer hohen Bandbreite mit HBM-Stapelspeicher bestückt und sollen typische Gleitkomma- und Ganzzahl-Berechnungen wie FP64 und INT8 beherrschen. Die Kommunikation zwischen CPUs und GPUs übernimmt Infinity Fabric Gen3, es ist Cache-kohärent und unterstützt einen gemeinsamen Speicherzugriff (Unified Memory).

Eines der wesentlichen Merkmale von El Capitan soll nicht nur die hohe Double-Precision-Rechenleistung sein, sondern auch die Flexibilität, mit Mixed-Precision Big Data-Analysen durchführen zu können, sodass eine Vielzahl von Aufgaben auf demselben (Super)Computer laufen könnten, für die man zuvor eigene, spezialisierte Anlagen genutzt habe. Denn klassisches High-Performance-Computing und Machine Intelligence hätten neben hohen Anforderungen an die Rechenleistung durchaus auch Parallelen in Sachen Speicher- und Storage-Anforderungen, heisst es.