Nvidia hat heute die GeForce-RTX-40-Serie-GPUs vorgestellt, die eine revolutionäre Leistung für Gamer und Kreative bietet. Allen voran bietet das neue Flaggschiff RTX 4090 laut Hardwarehersteller eine bis zu vierfach höhere Leistung im Vergleich zu seinem Vorgänger.

Als weltweit erste GPU auf Basis der neuen Nvidia-Ada-Lovelace-Architektur bietet die RTX-40-Serie einen bedeutenden Generationswechsel in Sachen Leistung und Effizienz. Dabei steht die Serie für eine neue Ära des Echtzeit-Raytracing und des neuralen Renderings, das KI zur Erzeugung von Pixeln nutzt.

DLSS 3: Ganze Frames für schnelles Gameplay

“Das Zeitalter von RTX-Raytracing und Neural Rendering ist in vollem Gange und unsere neue Ada-Lovelace-Architektur bringt es auf die nächste Stufe”, sagt Jensen Huang, Nvidias Gründer und CEO, im GeForce Beyond: Special Broadcast auf der GTC. “Ada bietet einen Quantensprung für Gamer und ebnet für Entwickler den Weg vollständig simulierter Welten. Mit einer bis zu vierfachen Leistung im Vergleich zur vorherigen Generation setzt Ada einen neuen Standard für die Branche”, sagt er.

Huang kündigte außerdem Nvidia DLSS 3 an – die nächste Revolution in der unternehmenseigenen neural-grafischen Technologie “Deep Learning Super Sampling” für Spiele und kreative Anwendungen. Die KI-gestützte Technologie kann ganze Frames generieren, um das Gameplay massiv zu beschleunigen. Sie kann CPU-bedingte Leistungsbeschränkungen in Spielen überwinden, indem sie es der GPU ermöglicht, ganze Frames unabhängig zu generieren.

Die Technologie wird in die weltweit beliebtesten Game-Engines wie Unity und Unreal Engine integriert. Viele weltweit führende Spieleentwickler unterstützen sie. In Kürze erscheinen mehr als 35 Spiele und Apps, darunter:

  • A Plague Tale: Requiem
  • Atomic Heart
  • Black Myth: Wukong
  • Bright Memory: Infinite 
  • Chernobylite
  • Conqueror’s Blade
  • Cyberpunk 2077
  • Dakar Rally
  • Deliver Us Mars
  • Destroy All Humans! 2 – Reprobed
  • Dying Light 2 Stay Human
  • F1® 22
  • I.S.T.: Forged In Shadow Torch
  • Frostbite Engine
  • HITMAN 3
  • Hogwarts Legacy 
  • ICARUS
  • Jurassic World Evolution 2
  • Justice
  • Loopmancer 
  • Marauders
  • Microsoft Flight Simulator
  • Midnight Ghost Hunt
  • Mount & Blade II: Bannerlord
  • Naraka Bladepoint
  • NVIDIA Omniverse™
  • NVIDIA Racer RTX
  • PERISH
  • Portal With RTX
  • Ripout
  • T.A.L.K.E.R 2: Heart of Chornobyl
  • Scathe
  • Sword and Fairy 7
  • SYNCED
  • The Lord of the Rings: Gollum
  • The Witcher 3: Wild Hunt
  • THRONE AND LIBERTY
  • Tower of Fantasy
  • Unity 
  • Unreal Engine 4 & 5
  • Warhammer 40,000: Darktide

Zwei Nvidia Encoder (NVENC) verkürzen die Exportzeiten um bis zu 50 Prozent und bieten AV1-Unterstützung. Die NVENC AV1-Kodierung wird von OBS, Blackmagic Design DaVinci Resolve, Discord und vielen anderen eingesetzt.

“DLSS ist eine unserer besten Erfindungen, die Echtzeit-Raytracing möglich gemacht hat, wobei DLSS 3 ein weiterer Quantensprung für Gamer und Kreative ist.”, sagt Jensen Huang, Gründer und CEO von NVIDIA. “Unsere Pionierarbeit bei RTX Neural Rendering hat ein ganzes Universum an Möglichkeiten eröffnet, in dem Künstliche Intelligenz eine zentrale Rolle bei der Erschaffung von virtuellen Welten spielt.”

Die Kombination aus Raytracing- und KI-Technologien hat Videospiele revolutioniert, indem sie gleichzeitig dramatische Verbesserungen der Bildqualität und massive Leistungssteigerungen ermöglicht. Ein Kunststück, das vor GeForce RTX nicht möglich war.

Angetrieben von neuen Tensor-Kernen der vierten Generation und einem neuen “Optical-Flow-Accelerator” der GeForce-RTX-40-Serie-GPUs ist DLSS 3 die neueste Version der von der Kritik gefeierten Deep-Learning-Super-Sampling-Technologie von NVIDIA und führt eine neue Funktion namens “Optical Multi Frame Generation” ein.

Optical Multi Frame Generation erzeugt völlig neue Bilder und nicht nur Pixel, was zu erstaunlicher Leistungssteigerung führt. Der neue Optical Flow Accelerator, der in die NVIDIA-Ada-Lovelace-Architektur integriert ist, analysiert zwei aufeinanderfolgende Bilder im Spiel und berechnet Bewegungs-Vektordaten für Objekte und Elemente, die im Bild erscheinen, aber nicht durch herkömmliche Bewegungsvektoren der Spiele-Engine modelliert sind. Dadurch werden visuelle Anomalien beim KI-Rendering von Elementen wie Partikeln, Reflexionen, Schatten und Beleuchtung deutlich reduziert.

Paare von Super Resolution Frames aus dem Spiel werden zusammen mit Engine- und optischen Flow-Motion-Vektoren in ein neuronales Netzwerk eingespeist, das die Daten analysiert und automatisch ein zusätzliches Bild für jedes vom Spiel gerenderte Bild generiert – ein Novum beim Echtzeit-Rendering von Spielen. Die Kombination der DLSS-generierten Bilder mit den DLSS-Super-Resolution-Frames ermöglicht es DLSS 3, sieben Achtel der angezeigten Pixel mit KI zu rekonstruieren, was die Frameraten um das Vierfache im Vergleich zu einem Spiel ohne DLSS steigert.

Darüber hinaus bieten die GPUs der RTX-40-Serie neue technologische Features, darunter:

  • Streaming-Multiprozessoren mit einer Shader-Leistung von bis zu 83 Teraflops – mehr als das Doppelte der vorherigen Generation
  • RT-Kerne der dritten Generation mit bis zu 191 Teraflops für effektives Raytracing – 2,8-mal mehr als bei der vorherigen Generation
  • Tensor-Kerne der vierten Generation mit bis zu 1,32 Tensor-Petaflops – 5 mal mehr als bei der vorherigen Generation mit FP8-Beschleunigung
  • Shader Execution Reordering (SER) verbessert die Effizienz der Ausführung, indem Shading-Workloads im laufenden Betrieb neu geplant werden. Dadurch werden die Ressourcen der GPU besser genutzt. SER ist eine ebenso bedeutende Innovation wie die Out-of-Order-Ausführung für CPUs und verbessert die Raytracing-Leistung um das Dreifache und die Frameraten in Spielen um bis zu 25 Prozent
  • Ada Optical Flow Accelerator mit zweimal höherer Leistung ermöglicht DLSS 3 die Vorhersage von Bewegungen in einer Szene, sodass das neurale Netzwerk die Bildrate bei gleichbleibender Bildqualität steigern kann
  • Architektur-Verbesserungen, die eng mit der kundenspezifischen TSMC-4N-Prozesstechnologie gekoppelt sind, führen zu einer bis zu 2-fachen Verbesserung der Energieeffizienz

Da die DLSS-Frame-Generierung als Post-Processing auf der GPU ausgeführt wird, kann sie die Frameraten auch dann steigern, wenn das Spiel durch die CPU limitiert wird. Bei Spielen mit CPU-Beschränkung, z.B. solchen mit hohem Physics-Anteil oder sehr großen Spielewelten, ermöglicht DLSS 3 den GeForce-RTX-40-Serie-GPUs das Spiel mit einer bis zu doppelt so hohen Framerate zu rendern, als die CPU in der Lage ist.

Die DLSS-3-Integrationen umfassen auch NVIDIA Reflex, das die GPU und die CPU synchronisiert und so eine optimale Reaktionszeit und geringe Systemlatenz gewährleistet. Da DLSS 3 auf den DLSS 2-Integrationen basiert, können Spieleentwickler die Lösung problemlos in bestehende Titel integrieren, die bereits DLSS 2 oder NVIDIA Streamline unterstützen. DLSS 3 wird von GeForce-RTX-40-Serie-GPUs unterstützt und am 12. Oktober mit den GeForce-RTX-4090-GPUs eingeführt. 

Neue Raytracing-Technologie 

GeForce RTX 4090 Beispiel

Die neuen Geforce-Grafikkarten sollen deutlich höhere Leistung bringen als ihre Vorgänger. Bild: Nvidia

Seit Jahrzehnten gilt das Rendering von Raytracing-Szenen mit physikalisch korrekter Beleuchtung in Echtzeit als der heilige Gral der Grafik. Gleichzeitig hat die geometrische Komplexität von Umgebungen und Objekten weiter zugenommen, da 3D-Spiele und -Grafiken danach streben, die reale Welt so genau wie möglich abzubilden.

Physikalisch korrekte Grafiken erfordern eine enorme Rechenleistung. Moderne Raytracing-Spiele wie Cyberpunk 2077 führen über 600 Raytracing-Berechnungen für jedes Pixel durch, nur um die Beleuchtung zu bestimmen – eine 16-fache Steigerung gegenüber den ersten Raytracing-Spielen, die vor vier Jahren eingeführt wurden.

Die neuen RT-Kerne der dritten Generation wurden verbessert, um doppelt so schnelle Ray-Triangle-Intersection-Tests zu ermöglichen und enthalten zwei wichtige neue Hardwareeinheiten. Eine “Opacity Micromap Engine” beschleunigt das Raytracing von Alpha-Test-Geometrien um das Zweifache, und eine “Micro-Mesh Engine” erzeugt Micro-Meshes im laufenden Betrieb, um zusätzliche Geometrie zu generieren. Die Micro-Mesh Engine bietet die Vorteile einer erhöhten geometrischen Komplexität, ohne die traditionellen Leistungs- und Speicherkosten komplexer Geometrien.

Die GPUs der RTX-40-Serie und DLSS 3 bieten neue Möglichkeiten für Nvidia-Studio-Entwickler. 3D-Künstler können vollständig mit Raytracing erzeugte Umgebungen mit präziser Physik und realistischen Materialien rendern und die Änderungen in Echtzeit und ohne Proxys anzeigen.

Videobearbeitung und Live-Streaming profitieren ebenfalls von der verbesserten GPU-Leistung und den neuen dualen AV1-Encodern der achten Generation. Für das Nvidia Broadcast Software Development Kit gibt es drei Updates, die jetzt für Partner verfügbar sind. Darunter sind Face Expression Estimation, Eye Contact und Qualitätsverbesserungen für den virtuellen Hintergrund.

Nvidia Omniverse, Bestandteil der Nvidia Studio Software-Suite, wird in Kürze um Nvidia RTX Remix erweitert, eine Modding-Plattform zur Erstellung beeindruckender RTX-Remaster von Spieleklassikern. Mit RTX Remix können Modder Spiele-Assets einfach erfassen, Materialien automatisch mit leistungsstarken KI-Tools verbessern und RTX mit Raytracing und DLSS schnell aktivieren.

Die GeForce RTX 4090 und 4080: Neu GPUs

Remix RTX wurde von Nvidia Lightspeed Studios verwendet, um das kultige Videospiel Portal von Valve, das als eines der besten Videospiele aller Zeiten gilt, neu zu gestalten. Fortschrittliche Grafikfunktionen wie vollständiges Raytracing und DLSS 3 verleihen dem Spiel ein beeindruckendes neues Aussehen und Spielgefühl. Portal mit RTX wird als kostenloser, offizieller Download-Inhalt für den klassischen Plattformer mit RTX-Grafik im November veröffentlicht, gerade rechtzeitig zum 15-jährigen Bestehen von Portal.

Die RTX 4090 ist die schnellste Gaming-GPU der Welt mit erstaunlichen Leistungs-, Akustik- und Temperatureigenschaften. In komplett per Raytracing berechneten Spielen ist die RTX 4090 mit DLSS 3 bis zu 4 mal schneller als die RTX 3090 Ti der letzten Generation mit DLSS 2. Außerdem ist sie in aktuellen Spielen bis zu 2 mal schneller bei gleichbleibendem 450W-Stromverbrauch. Sie verfügt über 76 Milliarden Transistoren, 16.384 CUDA Cores und 24 GB Hochgeschwindigkeits-GDDR6X-Speicher von Micron und liefert konstant über 100 Bilder pro Sekunde bei Spielen in 4K-Auflösung. Die RTX 4090 wird ab dem 12. Oktober zu einem Preis ab 1.599 US-Dollar erhältlich sein.

Das Unternehmen kündigte auch die RTX 4080 an, die in zwei Konfigurationen erhältlich sein wird. Die RTX 4080 16 GB hat 9.728 CUDA-Cores und 16 GB Hochgeschwindigkeits-GDDR6X-Speicher von Micron und mit DLSS 3 ist sie in aktuellen Spielen doppelt so schnell wie die GeForce RTX 3080 Ti und leistungsfähiger als die GeForce RTX 3090 Ti bei geringerem Stromverbrauch. Die RTX 4080 12GB verfügt über 7.680 CUDA-Cores und 12 GB Micron GDDR6X-Speicher und mit DLSS 3 ist sie schneller als die RTX 3090 Ti, das Flaggschiff der vorherigen Generation der GPU.

Beide RTX 4080-Konfigurationen werden im November zu Preisen ab 1.199 US-Dollar bzw. 899 US-Dollar erhältlich sein.

GeForce RTX 40: Wo kann man sie kaufen?

Die GeForce RTX 4090 und 4080 GPUs werden als Custom Boards mit Standardtakt und als ab Werk übertaktete Modelle von Top-Add-In-Partnern wie ASUS, Colorful, Gainward, Galaxy, GIGABYTE, Innovision 3D, MSI, Palit, PNY und Zotac erhältlich sein.

Die RTX 4090 und RTX 4080 (16GB) werden auch direkt von Nvidia in limitierten Founders Editions für Fans des Nvidia-eigenen Designs produziert.

Die GeForce-RTX-40-Serie-GPUs werden in Gaming-Systemen von Acer, Alienware, ASUS, Dell, HP, Lenovo und MSI, führenden Systemherstellern weltweit, und vielen anderen Herstellern zu finden sein.

Autor

Letzte Aktualisierung am 5.10.2022 / Affiliate Links / Bilder von der Amazon Product Advertising API. * = Affiliate Links. Bilder von Amazon PA-API