Nvidias ARM-Serverprozessor „Vera“ mit selbst entwickelten ARM-Kernen soll in den Revieren von AMD Epyc und Intel Xeon räubern. Denn Nvidia kombiniert Vera nicht nur mit dem KI-Beschleuniger „Rubin“, sondern baut auch reine CPU-Systeme damit.
Auf der Hausmesse GTC hat Nvidia für das zweite Halbjahr 2026 auch ein „Vera CPU Rack“ angekündigt. In die wassergekühlte Ausführung passen Einschübe mit insgesamt 256 Vera-Prozessoren, die jeweils 88 Kerne haben. Insgesamt laufen in einem Rack dann 22.528 CPU-Kerne mit 45.056 Threads. Denn jeder der zu ARMv9.2 kompatiblen „Olympus“-Kerne verarbeitet zwei Threads gleichzeitig.
Mehr Kerne bei x86
Wenn es um die reine Anzahl von CPU-Kernen pro Rack geht, bieten AMD und Intel mehr. Beispielsweise Supermicro verkauft „Twin“-Server, die pro Höheneinheit (HE) zwei einzelne Server mit je zwei CPU-Fassungen enthalten. Damit lassen sich auf 40 HE insgesamt 160 physische Prozessoren unterbringen. In den wassergekühlten Versionen darf jeder bis zu 500 Watt verheizen, also 75 kW reine CPU-Leistungsaufnahme pro Rack.
Bestückt mit 160 AMD Epyc 9965 mit je 192 Zen-5c-Kernen ergibt diese Konfiguration 30.720 CPU-Kerne und 61.440 Threads pro Rack. Schon mit dem 144-Kerner Intel Xeon 6780E wären 23.040 Kerne möglich, allerdings ohne Simultaneous Multithreading, weil das Intels E-Kerne nicht beherrschen. Dafür kommt der Xeon 6780E mit 330 Watt aus, die Version 6766E sogar mit 250 Watt. Vorzugskunden bekommen von Intel auch einen Xeon 6 mit bis zu 288 E-Kernen, also bis zu 46.080 pro Rack.
Modul mit zwei Nvidia-Vera-Prozessoren und je acht SOCAMM2.
(Bild: Nvidia)
Vera-Vorzüge
Nvidia führt mehrere Vorteile von Vera im Vergleich zur Konkurrenz ins Feld und hat auch bereits Kunden: Unter anderem Meta will Vera einsetzen, aber auch Alibaba, Cloudflare, Nebius und Oracle Cloud Infrastructure (OCI).
Nvidia verspricht besonders hohe Effizienz der ARM-Kerne. Außerdem bindet Vera keine Registered DIMMs mit DDR5-SDRAM an, sondern acht SOCAMM2-Module mit sparsamerem LPDDR5X-Speicher. Damit erzielt jede Vera-CPU eine Datentransferrate von rund 1,2 TByte/s und steuert bis zu 1,5 TByte Arbeitsspeicher an.
Vera gehört auch zu den ersten Prozessoren, die PCI Express 6.0 beherrschen. In der zweiten Jahreshälfte soll das allerdings auch bei AMD Venice kommen.
Aufbau der Nvidia-CPU Vera mit 88 ARMv9.2-Kernen.
(Bild: Nvidia)
Hohe Singlethreading-Performance
Ohne bisher konkrete Benchmark-Ergebnisse zu veröffentlichen, verspricht Nvidia eine besonders hohe Singlethreading-Performance für die einzelnen Olympus-Kerne. Das soll für bestimmte Rechenaufgaben von KI-Workflows Vorteile bringen.
Auch Simultaneous Multithreading (SMT) setzen die Olympus-Kerne anders um als die x86-Kerne von AMD oder Intel. Nvidia spricht von Spatial Multithreading. Das soll die konkurrierenden Threads stärker voneinander isolieren und die Performance soll weniger stark schwanken als bei anderen SMT-Umsetzungen.
Nvidia kombiniert die Vera-Prozessoren in den eigenen Servern mit eigenen ConnectX-Netzwerkadaptern oder SmartNICs vom Typ BlueField-4. Dadurch lassen sich die Vera-Racks leicht mit KI-Beschleunigern von Nvidia kombinieren, für die Nvidia auch die Switches verkauft.
Auch andere Hersteller wollen Vera-Server verkaufen, etwa Dell, HPE, Lenovo und Supermicro. Sie verwenden das modulare System Nvidia MGX. Es sind auch luftgekühlte Vera-Server und welche mit nur einem Prozessor (Single Socket) geplant.
(ciw)









English (US) ·