PNY GeForce RTX 5060 Overclocked Dual Fan - Test/Review
Der Launch der neuen GeForce RTX 5060 wurde durch fehlende Testberichte überschattet, da NVIDIA keinen (Beta-)Treiber vor dem offiziellen Verkaufsstart zu Verfügung stellte.
Die Blackwell-Grafikarchitektur läutet NVIDIAs 4. RTX-Generation ein. Mit Blackwell trägt NVIDIA dazu bei, eine weitere Dimension hinzuzufügen, nämlich neuronales Rendering, also die Fähigkeit der GPU, eine generative KI zu nutzen, um Teile eines Frames zu erstellen. Dies unterscheidet sich von DLSS, wo ein KI-Modell verwendet wird, um Details in einem hochskalierten Frame basierend auf seinem Trainingsdatum, zeitlichen Frames und Bewegungsvektoren zu rekonstruieren. Das Herzstück der GeForce RTX 5060 Grafikkarte ist das neue 5-nm-GB206. Der Grafikchip misst 181 mm² Die-Fläche und verfügt über 21.9 Milliarden Transistoren.
Das GB206-Silizium ist im Wesentlichen in der gleichen Komponentenhierarchie aufgebaut wie frühere Generationen von NVIDIA-GPUs, jedoch mit einigen bemerkenswerten Änderungen. Die GPU verfügt über eine PCI-Express 5.0 x16-Hostschnittstelle. PCIe Gen 5 gibt es seit Intels 12. Generation Core „Alder Lake“ und AMDs Ryzen 7000 „Zen 4“. Die GPU ist selbstverständlich mit älteren PCIe-Generationen kompatibel. Der GB206 verfügt außerdem über die neue GDDR7-Speicherschnittstelle, die mit dieser Generation ihr Debüt feiert. Der Chip verfügt über einen 128 Bit breiten Speicherbus. NVIDIA nutzt diesen, um 8 GB Speicher mit 28 Gbit/s Geschwindigkeit anzutreiben, was eine Speicherbandbreite von 448 GB/s ergibt.
Die GigaThread Engine ist die Hauptlogik für die Zuweisung von Grafik-Rendering-Arbeitslasten auf dem GB206, aber es gibt eine neue Ergänzung, einen dedizierten seriellen Prozessor zur Verwaltung aller KI-Beschleunigungsressourcen auf der GPU, NVIDIA nennt diesen AMP (AI Management Processor). Weitere Komponenten auf globaler Ebene sind der Optical Flow Processor, eine Komponente, die an älteren Versionen der DLSS-Frame-Generierung und für die Videokodierung beteiligt ist; und eine aktualisierte Medienbeschleunigungs-Engine, bestehend aus zwei NVENC-Kodierungsbeschleunigern und zwei NVDEC-Dekodierungsbeschleunigern. Die neuen NVENC-Videokodierungsbeschleuniger der 9. Generation verfügen über 4:2:2 AV1- und HEVC-Kodierungsunterstützung.
Beim GPU-Ausbau positioniert sich die GeForce RTX 5060 mit 30 SMs im Rahmen der Blackwell-Architektur etwas über der GeForce RTX 4060 (24 SMs) und der GeForce RTX 3060 (28 SMs). Zusammen mit den Verbesserungen in der Mikroarchitektur dürfte dies eine Rohleistungssteigerung von rund 20 Prozent ermöglichen. Dank höherer Taktraten könnte sich die Gesamtperformance sogar auf ein Plus von etwa 25 Prozent belaufen.
Der neue Tensor-Kern der 5. Generation bietet Unterstützung für das FP4-Datenformat (1/8 Präzision) für sich schnell bewegende atomare Arbeitslasten und bietet den 32-fachen Durchsatz des allerersten Tensor-Kerns, der mit der Volta-Architektur eingeführt wurde. Im Laufe der Generationen nutzten KI-Modelle Datenformate mit geringerer Präzision und Sparsity, um die Leistung zu verbessern. Der AI Management Processor (AMP) ermöglicht gleichzeitige KI- und Grafik-Workloads auf den höchsten Ebenen der GPU, sodass er gleichzeitig Echtzeitgrafiken für ein Spiel rendern kann, während ein LLM ausgeführt wird, ohne die Leistung des anderen zu beeinträchtigen. AMP ist ein spezialisierter Hardware-Scheduler für alle KI-Beschleunigungsressourcen auf dem Silizium. Dies spielt eine entscheidende Rolle für das Funktionieren der DLSS 4-Multiframe-Generierung.
Der GB206 und der Rest der GeForce-Blackwell-GPU-Familie basieren auf genau demselben TSMC-Foundry-Knoten „NVIDIA 4N“, der tatsächlich 5 nm groß ist, wie die Ada der vorherigen Generation. Daher konzentrierte sich NVIDIA darauf, innovative neue Wege zur Verwaltung von Strom und Thermik zu finden. Dies geschieht durch eine neu gestaltete Power-Management-Engine, die auf Clock-Gating, Power-Gating und Rail-Gating der einzelnen GPCs und anderer Komponenten der obersten Ebene basiert. NVIDIA hat auch an der Geschwindigkeit gearbeitet, mit der die GPU leistungsbezogene Entscheidungen trifft.
Kommentar schreiben