Die GA104-GPU wurde im 8-Nanometer-Verfahren (Turing: 12 nm) produziert und umfasst 17,4 Mrd. Transistoren (RTX 3080: 28 Mrd. Transistoren). Sie besteht aus drei Bereichen: der Streaming-Prozessor (CUDA) für die „normalen“ und häufig anfallenden Rechenoperationen im Grafiksektor, die RT-Kerne für die Hardware-beschleunigte Berechnung von Raytracing in Echtzeit sowie die Tensor-Kerne, die vor allem bei KI-Anwendungen auf Basis von neuronalen Netzwerken zum Einsatz kommen sollen.
Nvidias „Deep Learning Super Sampling“ (DLSS) nutzt z.B. diese Tensor-Kerne: Das ist eine wirklich beeindruckende, KI-gestützte Methode zur Hochskalierung von Grafiken mit einem beträchtlichen Zugewinn bei der Bildwiederholrate ohne große optische Abstriche. Stellenweise schafft es DLSS sogar, die Schärfe und die Qualität der Grafik paradoxerweise zu erhöhen, obwohl die Grafik ja im eigentlichen Sinne hochskaliert und mit KI nachgeschärft wird. DLSS unterstützen z.B. Minecraft RTX, Death Stranding, Watch Dogs Legion, War Thunder, Control, Metro Exodus, Battlefield 5, MechWarrior 5, Wolfenstein: Youngblood etc. Oftmals ist DLSS in Kombination mit dem Raytracing-Einsatz dringend erforderlich, um den notwendigen Performance-Schub zu erhalten, da Raytracing für gewöhnlich sehr viel Rechenleistung trotz dedizierter Raytracing-Kerne kostet. In den Bereichen KI-Nutzung zur Bildoptimierung (DLSS) und Raytracing liegt Nvidia weiterhin deutlich vor AMD. Obgleich AMD an einer „eigenen Super-Sampling-Variante“ arbeitet, die aber ohne Deep Learning daherkommen soll.
Nvidia will im Vergleich zu Turing die Anzahl der normalen Berechnungen (programmierbare Shader) um den Faktor Zwei gesteigert haben, gerade im Bereich der 32-Bit-Fließkommaoperationen, die vor allem beim Raytracing-Rendering und bei aufwändigen Shadern erforderlich sind (RTX 2060 Super FE: 7,2 Shader TFLOPS; RTX 3060 Ti FE: 16,2 Shader TFLOPS; RTX 3070: 20,3 Shader TFLOPS). Die zweite Generation der RT-Kerne sollen die mehrstufigen Raytracing-Operationen 1,7 Mal so schnell wie beim Vorgänger berechnen können (RTX 2070 Super FE: 21,7 RT TFLOPS; RTX 3060 Ti FE: 31,6 RT TFLOPS; RTX 3070: 39,7 RT TFLOPS). Die dritte Generation des Tensor-Cores verspricht ebenfalls eine Leistungssteigerung um mehr als das Zweifache, da automatisch weniger wichtiger Elemente entfernt und „Sparse Networks“ schneller berechnet werden können (RTX 2070 Super FE: 57,4 Tensor-TFLOPS; RTX 3060 Ti FE: 129,6 Shader Tensor-TFLOPS; RTX 3070: 162,6 Shader Tensor-TFLOPS; bei „Sparse Networks“).
!function(){„use strict“;window.addEventListener(„message“,(function(a){if(void 0!==a.data[„datawrapper-height“])for(var e in a.data[„datawrapper-height“]){var t=document.getElementById(„datawrapper-chart-„+e)||document.querySelector(„iframe[src*='“+e+“‚]“);t&&(t.style.height=a.data[„datawrapper-height“][e]+“px“)}}))}();
RTX I/O-Zukunft
Die RTX 3060 Ti wird „in Zukunft“ RTX I/O unterstützen – eine Technologie, die das Laden bzw. Nachladen von neuen Daten enorm beschleunigen soll. Für diejenigen, die eine NVMe-SSD mit einer RTX-3000er-Karte nutzen, dürfte RTX I/O auch dafür sorgen, dass der Videospeicher kein so stark limitierender Faktor für die Leistung sein wird – allerdings muss zunächst die Software-Schnittstelle (DirectStorage) die entsprechenden Technologien unterstützen und das kann noch bis zu ein Jahr dauern.
Nvidia Reflex, Studio und Broadcast
Zu den Neuerungen, die mit der 3000er-Reihe eingeführt werden, gehört ebenfalls Nvidia Reflex zur Senkung der Systemlatenz in kompetitiven eSports-Titeln, sofern die Spiele den Low-Latency-Modus nutzen (Apex Legends, Call of Duty: Warzone, Call of Duty: Black Ops Cold War, Destiny 2, Fortnite und Valorant). Reflex soll die Systemlatenz durch die GPU und spezielle Spieleoptimierungen verbessern und dadurch die Latenzzeiten senken, was der Genauigkeit und und der Reaktionsschnelligkeit zugutekommen soll (Details). Laut Hersteller wird die Latenz um bis zu 50 Prozent reduziert, dieser Aspekt soll an dieser Stelle nur erwähnt werden. Getestet haben wir Nvidia Reflex nicht, auch mangels vergleichbaren Messmethoden.
Des Weiteren verspricht die RTX-30-Serie eine Zeitersparnis bei Multi-App-Workflows, 8K-HDR-Videobearbeitung und der Arbeit mit großen 3D-Modellen – sowie bei der Anwendung von Raytracing. Live-Streamer sollen von Nvidia Broadcast profitieren, z.B. von der automatischen Entfernung von Störgeräuschen, Hintergrundeffekte und einen virtuellen Kameramann. Nvidia Broadcast läuft übrigens auf jeder RTX-GPU.
Nvidia GeForce RTX (Hardware) – GeForce RTX 3060 Ti
Am 2. Dezember wird Nvidia die vierte Grafikkarte auf Basis der Ampere-Architektur ins Rennen schicken. Die Nvidia RTX 3060 Ti soll für 399 Euro die Leistung einer GeForce RTX 2080 Super (699 Euro) erreichen und den Vorgänger (RTX 2060 Super) deutlich übertreffen. Wir haben die RTX 3060 Ti Founders Edition vor allem in Relation zu den anderen Ampere-Karten getestet.
Bezogen auf die 3060 aber wirklich kurios mit dem Arbeitsspeicher. Bei der 3080 war es noch etwas schwieriger zu beurteilen weil es das ominöse GDDR6X war statt des regulären Arbeitsspeichers (wobei ich hier auch Zweifel habe wie effektiv das genutzt wird da die Konsolen auf AMD setzen), aber das fällt hier ja weg.
Ich hatte Glück und hab nach viel Refresh direkt bei Asus ne 3070 für 600€ bekommen, aber ja ist immer noch ziemlich nervig.
Da die 3080 aktuell 10GB hat, würde die ja eher bei 20GB landen oder sie ändern die Speicheranbindung noch mal komplett für 16GB.
Ich hätte die 3060 bei 8, die 3060TI bei 10, die 3070 bei 12 und ab 3080 dann 16+ erwartet, aber so isses nun. Mal sehen wie ich mit den 8GB der 3070 hinkomme.
Die 3080Ti wird demnach auch nicht mehr lange auf sich warten lassen und bei der sind 12Gb schon eher angebracht, oder besser noch aufschließen zu AMD und 16 verbauen, aber das werden sie nicht machen.
Derzeit bekommt man ja irgendwie sowieso nur entweder die 3090 oder die 3070 zu völlig überzogenen Preisen. Bin gespannt wann sich das mal wieder entspannt.
Nvidia hat gerade die RTX 3060 vorgestellt. Mit 12GB Vram. Die 3060 Ti und 3070 haben "nur" 8GB.