AMD RDNA 5 / UDNA 1 (Mitte 2027)

Oder aber AMD scheut den Entwicklungsaufwand weil man das Personal dringender an anderer Stelle benötigt, typischer Weise professinelle AI Anwendungen

Für Vulkan mache ich mir keine Sorgen solange Valve die Steam-Machine noch bringen will

Aber auch an fehlendem offiziellen Vulkan-Support sieht man, AMD ist hauptsächlich daran Prioritäten zu setzen weil man zu wenig Personal für diese Dinge hat.
:(Jetzt mach ich mir noch mehr sorgen als vorher.
Ich finde das sollte unabhängig von Valve kommen, gibt ja genug Vulkan Spiele.
FSR 4 ist schon über 1 Jahr draußen, und nächstes Jahr mit RDNA 5 kommt evtl dieses FSR Diamond.
Ich verliere immer mehr die Hoffnung auf den Vulkan Support.
Was blöd ist.
CIG sagte schon im Sommer 2025, das sie FSR 4 damals schon Implementieren wollten, aber auf AMD,s Vulkan SDK Support warten müssen.
Ist halt ein MMO, mit Easy Anti Cheat, da kann man nichts mit Optiscaler basteln wie in Offline Games.
(AMD hat sogar scheinbar mit CIG zusammen gearbeitet, bei RX9000 Release wurde Star Citizen als Werbung für die RX9070XT genutzt)

Jetzt gibts in dem Spiel schon DLSS 4.5 aber FSR ist immer noch auf FSR 2.0
Das ist sehr ärgerlich, der abstand wird immer größer. Ich hoffe das bleibt nicht so.
Wäre so Tragisch wenn wir 2027 DLSS 5 für das Spiel haben und FSR immer noch auf Version 2.0 ist weil Vulkan Support fehlt.
 
Zuletzt bearbeitet:
FSR1+2 wurde teils komplett anders und individueller implementiert als FSR3 bzw. FSR3.1. Das ist Entwicklungsaufwand wenn man das eher ähnlich zu DLSS als FSR3/4 auch noch implementieren will. Besonders wenn man DLSS auch schon nicht selbst implementiert hat sondern das abgestellte Nvidia-Entwickler waren.

FSR Diamond ist vergleichbar mit Redstone oder Amethyst. Man hat ein Marketing-Codewort für eine Familie von Techniken für eine bestimmte GPU zur bestimmten Zeit.

Das Besondere an RDNA5 scheint doch zu sein, dass AMD einerseits nur eine halbe RDNA4 Serie heraus gebracht hat - andererseits wichtigste Grosskunden mit Xbox Helix und PS6 neben den eigenen dGPU-Ambitionen durch Entwickler bedienen muss und gleichzeitig dem Umbruch in Richtung AI-Features fürs Gaming hinbekommen soll wo Nvidia schon länger herumposaunt. Man ist förmlich gezwungen Prioritäten zu setzen. Dennoch wird früher Linux-Support gepushed, das geht letztlich auch nur mit Vulkan und dem offenen Treiber mit AMD-Support.

Von AMD würde man eigentlich erwarten, dass die ihre FSR Software auf Github freigeben und dann die Derivate für einzelne Anwendungsfälle von dort "ge-forked" werden können. Microsoft DirectSR würde es von der Grundidee sogar erlauben, dass Dritte ihre Forks direkt sauber einklinken, etwa für ältere GPUs. Es ist nur ewig noch immer nicht aus dem Preview-Status herausgekommen. Da gibt es offensichtlich abweichende Interessen.

Man möchte meinen, so fantastisch wie KI beim Programmieren unterstützen können soll müsste ein FSR4 oder FSR Diamond in abgespeckter Form per KI auch für ältere RDNA-Generationen portiert werden können. In anderen KI-Bereichen gibt es für viele Hardwarevarianten speziell angepasste NNs, damit die möglichst performant Inferencing erledigen (z.B. Hybrid-NNs für NPU und RDNA auf APUs). Offensichtlich ist man da heute für Echtzeitgrafik noch nicht angekommen.

Ich denke aber es geht auch um die Marketing-Codewörter und das Management der Erwartungshaltung. Die Leistungssprünge in den TOPS sind einfach zu gross, zumindest wenn man die Ankündigungen zur PS6 mit Amethyst glauben soll.
Es wäre eine mögliche Erklärung warum man die aktuelle Xbox so früh "aufgegeben" hat und Sony mehr Exclusiv-Titel für die nächste Gen in Aussicht stellt. Ältere Hardware könnte nicht mehr in der Lage sein RDNA5 optimierte Spiele überhaupt zum Laufen zu bringen. Sowohl XSX als auch PS5 haben echte System-Seller vermisst, da könnte mit dem technologischen Umbruch durchaus eine Besinnung auf frühere Marktlogik beabsichtigt sein. Dann wäre Luftanhalten und alles auf die nächste Gen setzen eine denkbare Strategie.
 
Bisher bewegen sich viele RDNA5 Gerüchte um den AT2 und Varianten davon. Physisch maximal 70CU.

AT2 - 68CU - Magnus Ultra / XboX-N
AT2 - 64CU - Desktop-PC / RX 10070 XT
AT2 - 52CU - Orion Pax / PS6-iGPU
AT2 - 48CU - Desktop-PC / RX 10070 GRE
(AT3 - 48CU - Mobile / Portable)
AT2 - 44CU - Desktop-PC / RX 10060 XT

Nimmt ja schon einiges von der TSMC 3nm Kapazität in Anspruch, um die CUs für die Mittelklasse in Betrieb zu nehmen.

Allerdings auch die große Lücke am Desktop-PC:
AT0 - 184CU - AI/ML
AT0 - 154CU - RX 10090 XT 36GB - 380W
AT0 - 138CU - AI/ML
.
.
.
AT2 - 80CU - RX 10070 XT 18GB?
.
AT2 - 64CU - RX 10070 XT 18GB - 275W
AT2 - 48CU - RX 10070 GRE 15GB - 235W
AT2 - 44CU - RX 10060 XT 12GB - 210W

Wenig bis gar keine Gerüchte um den AT1 bisher.
Zwei große Fragen am Desktop-PC: Wo landet die RX 10070 XT (64CU? 80CU?) Wie stark ist die RX 10090 XT mit 154CU?

AMD könnte auch auf den AT1 verzichten und stattdessen zwei AT2 zusammen setzen. Dan käme man auf 128CU und deckt damit die Oberklasse ab. Auch die AT2-Salvages mit 48CU hätten Verwendung in AT2X XL mit 96CU dann.

AT0 XL - 154CU - RX 10090 XT 36GB - 380W
AT2X XT - 128CU - RX 10080 XT 36GB - 320W
AT2X XL - 96CU - RX 10080 XL 24GB - 300W
AT2 XT - 64CU - RX 10070 XT 18GB - 275W
AT2 XL - 48CU - RX 10070 GRE 15GB - 235W
 
AT2 - 64CU - Desktop-PC / RX 10070 XT
Ich kann nur hoffen das die GPU entweder mehr CU,s haben wird oder aber RX 10060 XT heißen wird, ansonsten wirds ein PR Desaster für Radeon.
Die RX9070XT wird ja als Gleichwertig zur RTX 5070ti empfunden.
Die RX7700XT wurde aber nie als gleichwertig zur RTX 4070ti empfunden.

Hier mal die Spekulationen zur Rubin RTX 6070ti
6070ti (RB103): 84 SM, 3.2ghz+ for 70TFLOPS, 192 bit bus 36gbps GDDR7 (18GB VRAM) for 864GB/s perf. roughly 5% faster than 4090
 
Sofern die Tabelle von MLID gültig bleibt denke ich die 70er Klasse wird der AT2 in diversen Binnings während Xbox-Helix die "guten" low power 68 CU in Target GHz bekommt. Dann müsste auch ein 70CU XT+ möglich sein.
Spiele skalieren eher schlecht mit mehr CUs wenn nicht gleichzeitig die Auflösung hochgeschraubt wird. Vieles hängt da auch am Cache und SI. Wenn 64 CUs für 4k mit dem neuen Cache-Konzept genügen, wovon wir ausgehen müssen, wird es nur noch für Edge-Cases (e.g. DLSS 5) und Benchmark-Siege mehr teure CUs benötigen. Wenn man ehrlich ist braucht es die Wiederholung der 5080er Klasse von Nvidia in der nächsten Gen nicht wirklich. Ein Fazit von Valve auf der 2026er GDC war "Optimizing for lower spec machines expands your audience", ich erwarte dass das Highend-Rennen in PC-Gaming sich langsam tot läuft, die Hersteller würden das auch bemerkt haben. Es gibt dann noch einen Markt für WUHD und DualUHD Monitore zu befeuern -> salvage AT0, aber das wars dann auch im Volumengeschäft. An teures 5k und 8k glaube ich nicht, erst wenn es zum aktuellen Preisniveau oder darunter möglich gemacht wird. Nvidia kämpft darum via DLSS sein Marketing-Code in die Games zu prügeln, AMD versucht es über Partnerschaft bei Xbox und Playstation, bedingt auch via Steam Deck/Machine, sicherlich via Linux Support. Mit ML wird eine künftige 70er Klasse in 4k für den Durchschnittskunden optisch eher vergleichbar sein, es kommt dann viel mehr auf Preis und Treiber als heute schon an. AMD muss das Nvidia-Mindset umbiegen, bei deren aktuellen Treiberproblemen genügt vermutlich ein gutes Mainstreamportfolio und ein günstiges AT0-Halo Produkt. Auch Nvidia wird weiterhin zuerst die AI-Grosskunden bedienen müssen. 80er/90er Klasse bleibt dort sicherlich auch ein Marketing-Tiger wie heute schon, ganz anders als noch 1080ti neben der Titan-Ära.
 
@Night<eye>
192bit SI, 36GBps GDDR7 und 864GB/s, 18GB VRAM sind gleichen Spekulationen des AMD RDNA5 AT2 64CU bisher.
64CU ~3,3Ghz mit Luft, ~54 Tflops.
Die 275W sind vielleicht bei Custom 10070 XT nach oben etwas dehnbar und höherer Takt schon machbar. ~3,5Ghz möglich mit hohen TBP 360W, dann sind es ~57 Tflops fp32.

@Topic
Die neuen RDNA5 "dual issue" CUs bringen schon gut IPC Schätze ich, +20% bis +50%. Bei er ersten Iteration brachte es +17% im Durchschnitt.
Zweite Iteration wird sicherlich Frame-Generation Shader sein, was von Dual-Issue CUs profitiert. Dann spezielle Verbesserungen beim ML-Upscaling via NCNN und Quarks über die iNPU.

+20% in 4K native raster (ggü. 9070XT)
+50% in 1440p native ray-tracing (ggü 9070XT)
Bei gleicher CU-Anzahl von 64CU (AT2 = N48).

Beim ML-Upscaling geht es Richtung 720p Rendering für 4K Darstellung. Hauptsache das Modell ist 16MB bis 24MB groß.

Es entstehen neue AI-based Benchmarks per Upscaling und Frame Generation. Kann man bei RDNA4 (32CU) vs GB205 (36SM) schon sehen.

304 fps (9060 XT) vs 182 fps (5060Ti)
439 fps (9070 XT) vs 245 fps (5070Ti)

1_o43QWweuLMrk-nJd67LvrA (1).webp

Hier in CoD sieht Blackwell ziemlich alt aus.

Auch in CP2077 inkl RT sieht Blackwell nicht so gut aus :

1_h1bLr_W0PiVI9hyyVMzmwQ.webp

150 fps (9060XT) vs 128 fps (5060Ti).
250 fps (9070XT) vs 206 fps (5070Ti).

RDNA5 AT2 könnte bei Upscaling und Frame Generation noch sehr gut zulegen ggü. RDNA4 N48 / N44 durch besseres Dual-Issue.
 
Wenn 64 CUs für 4k mit dem neuen Cache-Konzept genügen, wovon wir ausgehen müssen, wird es nur noch für Edge-Cases (e.g. DLSS 5) und Benchmark-Siege mehr teure CUs benötigen. Wenn man ehrlich ist braucht es die Wiederholung der 5080er Klasse von Nvidia in der nächsten Gen nicht wirklich.
Dem widersprechen die vielen RTX 5090er auf Steam, welche in Masse sehr viel mehr verbreitet sind als RX9070er.
Und ich würde sagen, das eine RX9070XT auch nicht für die meisten Modernen Titel für 4k genug FPS bringt. (Ich sehe 60FPS nicht mehr als genug heutzutage)
 
Wenn in der Statistik RDNA4 überhaupt nicht vorkommt können wir an dieser Stelle ja dann die Diskussion über RDNA5 beenden *lol*
Ob jetzt 0.25% der Steam-Nutzer eine überteuerte Karte auch mal fürs Gaming einsetzen ist relativ egal, es sind dort aber nur 23% mit englischem OS und 56% mit Simplified Chinese OS unterwegs, der Rest der Welt zählt nicht wirklich in deren krummen Statistiken hinein. Mir ist ehrlich gesagt relativ egal was in China passiert, ich spiele keine Spiele auf Chinesisch.

Der Punkt ist, dass die kommenden "4k jetzt aber richtig mit RT" Konsolen auf teils deutlich unter 70CUs RDNA5 setzen. Mehr wird es fürs Gaming bei fast identischem Chip auch auf PC in 2028/2029 nicht brauchen. Etwas mehr VRAM, etwas mehr Takt bei viel höherer TBP, und sobald die kommenden Konsolen ausoptimiert werden eine Nachfolgegeneration in der Chipklasse nochmal für PC. Das ist offensichtlich wofür RDNA5 optimiert werden wird.

Die AT0 Strategie die Architektur in teuren Modellen vor allem für Virtualisierung und ML-Workstations so deutlich zu positionieren wäre auf jeden Fall neu, das Pro-Segment soll dort gemäss Leak-Tabelle deutlich gehoben werden. Entweder man rechnet dort mit ungewöhnlich miserablen Yield, oder aber die meisten AT0 Chips sollen dem Preis und CU-Anzahl nach an Pro-User gehen, nicht an Gamer. Nach der Tabelle gab es da noch nichtmal einen anvisierte Produktionsstart was einen viel späterem Start erwarten lässt. D.h. man testet erst mal AT2 auch für ML-Workstations aus und schiebt dann AT0 womöglich mit Korrekturen nach.
 
Zuletzt bearbeitet:
Der Schlüssel zum Erfolg neuer GPUs dürfte darin liegen, inwiefern diese extreme Datenkompression beherrschen, um damit GDDR7-Speicher zu sparen. Ich bin hier zwar nicht auf dem Laufenden, aber was ich diesbezüglich in vergangener Zeit gelesen hatte, wollte AMD solche Daten-Kompression ursprünglich für eine schnellere und vor allem Energie-effizientere Daten-Kommunikation mit dem Ram implementieren: bevor die Daten auf den Bus gehen, werden sie stark komprimiert, damit weniger Daten über den Bus zum Ram geschickt werden müssen: spart Bandbreite und vor allem Energie, da der Datentransport und das ein- und ausspeichern inbesondere bei GPUs wegen der vielen Datentransporte viel Energie verbraucht. Mit Beginn dieser Technologie dachte man wohl kaum daran, dass es irgendwann extrem steigende Ram-Preise geben wird...und jetzt dürfte das über den Erfolg entscheiden: wer weniger Ram braucht, kann deutlich günstigere Grakas anbieten.
 
@BavarianRealist
Wenn es AMD darum gehen würde, auf GDDR7 zu verzichten, und zb noch günstigeren GDDR6 zu verbauen, wäre es da nicht Sinnvoller den Infinite Cache zu behalten ? (Vor allem angesichts der Ram Preise durch Mangel zz)
 
... um damit GDDR7-Speicher zu sparen .... wer weniger Ram braucht, kann deutlich günstigere Grakas anbieten.
Die Frage stellt sich nicht, die Tabelle ist noch immer der beste nicht wiederlegte Leak zu RDNA5

Die Komprimierung hilft das Interface schmäler zu machen und vermutlich sogar den Cache besser nutzten zu können. Wegen KI muss aber der sonst eingesparte VRAM im Gegenzug wieder grösser werden. Gemacht wird was in die akzeptablen Preislagen passt. Wenn GDDR7 teuer bleibt gibts nur 16GB wenn es normal teuer wird bekommen wir wie in der Tabelle 20-24GB in der Mittelklasse.
 
Hab für euch das Benchmarkbild mal sortiert nach den neuen AI-Benchmarks, also nicht native, sondern mit:
* FSR/Dlss-Performance (50%)
* Ray-Tracing
* Frame Generation
Cyberpunk 2077 1440p:

· RX 9070 XT Gaming OC 16GB – 250,8 fps
· RX 9070 TUF 16GB – 217,5 fps
· RTX 5070 Ti Ventus 16GB – 206,1 fps
· RTX 4070 Ti Super 16GB – 182,3 fps
· RTX 4070 Ti 12GB – 172 fps
· RTX 5070 FE 12GB – 166,9 fps
· RTX 4070 Super 12GB – 158,3 fps
· RX 7900 Gre 16GB – 151,6 fps
· RX 9600 XT 16GB – 150,7 fps
· RTX 4070 12GB – 137,6 fps
· RX 7800 XT 16GB – 135,4 fps
· NVIDIA RTX 5060 Ti 16GB – 128,6 fps

Dieser Vergleich wird relevanter sein für Leute, die 1440p@120-240hz Monitore betreiben wollen.

Die Verbesserung durch "Dual-Issue" fp32-Operationen beim nativen rendering schlagen sicher noch stärker durch wenn man ML-Upscaling und AI-based Frame Generation verwendet.

Nun zur 4K Diskussion. Die wird man in der Mittelklasse (RX 9070XT / RX 10070 XT) mit 30-40fps natives Rendering niemandem beeindrucken können. Da braucht es Upscaling, Denoising und Frame Generation:

2160p-upscaling-cyberpunk2077-rx-9070-xt-tous-les-tests-gpu-overclocking.jpg

Für euch sortiert :
* FSR/Dlss-Performance (50%)
* Ray-Tracing
* Frame Generation
Cyberpunk 2077 2160p:

· RTX 5090 32GB – 215,7 fps
· RX 10070 XT 18GB – 207 fps?
· RTX 4090 24GB – 160,7 fps
· RTX 5080 16GB – 147,4 fps
· RX 9070 XT 16GB – 138 fps
· RTX 5070Ti 16GB – 128,3 fps
· RTX 4080/S 16GB – 124,9 fps
· RX 9070 TUF 16GB – 116,2 fps
· RX 7900 XTX 24GB – 111,4 fps
· RX 7900 XT 20GB – 96,6 fps


Bei diesem Szenario erwarte ich +50% für RDNA5 ggü. RDNA4 bei gleicher CU-Anzahl (64CU RDNA4 vs 64CU RDNA5). Die RX 10070 XT könnte ~207 fps oder mehr erreichen und wäre damit auf dem Gaming-Level der RTX 5090, nicht unbedingt native rendering, aber mit Upscaling und Frame Generation schon.

Man braucht für diese Leistung keine teuren 750mm^2 Siliziumscheiben. Das geht auch günstiger mit ~241mm^2 (64CU RDNA5).
 

Anhänge

  • 2160p-upscaling-cyberpunk2077-rx-9070-xt-tous-les-tests-gpu-overclocking.jpg
    2160p-upscaling-cyberpunk2077-rx-9070-xt-tous-les-tests-gpu-overclocking.jpg
    49,9 KB · Aufrufe: 1
Zurück
Oben Unten