AMD RDNA 4 - uArch - Technologie

Zuletzt bearbeitet:

AMD Fokus auf 9070XT 16GB statt der 9070 16GB, weil die 9070XT mit vollen 64CU am meisten Leistung bringt für die (gleichen) 16GB V-RAM wie bei der 9070.

Spekulationen um den höheren VRAM Bedarf für die Radeon Pro AI R9700 32GB / W7900 48GB / W7800 48GB / W7800 32GB sind gegeben.

AMD bedient ja RDNA4 und RDNA3 Gaming Markt und den Workstation Markt mit GDDR6.

Wird die 9070 16GB Gaming dGPU vom Markt langsam verschwinden? Zugunsten einer Radeon Pro AI R9600 32GB?

Die Preise für die Radeon Pro AI R9700 32GB sind ja rasch gestiegen auf über 1500€ pro Karte.
 
Wird die 9070 16GB Gaming dGPU vom Markt langsam verschwinden? Zugunsten einer Radeon Pro AI R9600 32GB?
Wohl kaum
Eine R9600 wäre bereits von der Namensgebung her Unsinn, die 9060 basiert auf einem anderen Chip (Navi 44) und die 9070 dürfte weiterhin für die Resteverwertung der Navi 48 Produktion benötigt werden, es sei denn das im OEM Markt genug GREs mit besserer Marge verkauft werden könnten.....was zu bezweifeln wäre.

Edit:
Lt. Wikipedia war die 9070 GRE für den chinesischen Markt und die 9060 ging nur an die OEMs.
 
Zuletzt bearbeitet:
Es geht aber um das volle SI von 256bit von N48 XT, was halt auch 32GB VRAM erlaubt. Das erlaube auch auch schon bei RDNA3 mit dem Salvage N31 höherpreisig zu verkaufen (Radeon Pro W7800 48GB 384bit SI).

Das wäre mit N48XL aka 9070 GRE 12GB gar nicht möglich mit 192bit SI, abgesehen von den beschnittenen CUs auf 48CU. Da käme sie maximal auf 24GB VRAM.

Wegen dem Mangel and RAM wäre eine Radeon RX 9070 GRE 12GB im Retail für die User sogar ideal um das Budged nicht zu sprengen.
 
Es geht aber um das volle SI von 256bit von N48 XT, was halt auch 32GB VRAM erlaubt.
Eben, was soll dann eine "Radeon Pro AI R9600 32GB" sein?
Das passt weder zum Namensschema, noch wäre das eine nennenswerte Veränderung zur bereits existierenden "Radeon Pro AI R9700".
Der höhere Preis der Radeon Pro W7800 wird übrigens weniger vom größeren VRAM als vielmehr durch die Software und Supportleistungen erzielt. Die bedient eben ein ganz anderes Marktsegment.
 
Die Radeon Pro W7800 48GB ist aber Navi31, also der größte Chip, wenn auch salvaged. Die W7900 48GB ist erst der Vollausbau. Der volle Chip hat die zweite Nummer höher gelabelt.l

Navi 31 XTX = W7900 48GB
Navi 31 XL = W7800 48GB
Navi 48 XTX = R9700 32GB
Navi 48 XT = R9600 32GB?

Für AI, egal ob Local oder Hosting, braucht man V-RAM (und Rechenleistung) in rauen Mengen.
 
Nichts für ungut aber du saugst dir nur noch irgendetwas aus den Fingern weil es dir einfach nur geraden so in den Kragen passt.
Produktplanung macht man vor deren Veröffentlichung und nicht häppchenweise danach. Hätte AMD so etwas vorgesehen hätten sie bereits das erste Modell anders benennen können damit ein weiteres dazu passt.
Ich sehe für AMD kaum nennenswerte Vorteile für ein Produkt so wie du es dir vorstellst.

Das Einzige was darauf hinweisen könnte ist ein Eintrag in die Datenbank von techpowerup allerdings kann ich nicht sagen ob es sich dabei um ein reales Produkt handelt. Wenn dann wäre es mangels aktiver Kühlung ein reines Server Produkt das von der GPU Leistung her offenbar auf das Niveau einer 9060XT beschnitten wurde. So herum ergibt die Namensgebung wiederum durchaus Sinn.
Das Teil würde zudem auf eine Variante des Navi 48 XL basieren welcher in der 9070 GRE steckt aber offenbar deutlich auf sparsamkeit getrimmt wurde. (150W vs. 220W)


Eine entsprechende R9700 Variante ist dort übrigens ebenfalls vorhanden und für den Vergleich verlinke ich die normale R9700 gleich mit.

Der Unterschied liegt dort im Buchstaben am Ende den offenbar nur die Server Produkte bekommen hätten, welche wiederum für gewöhnlich keine Bildschirmanschlüsse besitzen und auf Zwangsbeatmung durch die Systembelüftung angewiesen sind.
 
Screenshot_20260127_141433_com.android.chrome_edit_99212397318193.jpg

GFX1250 und GFX1251 zeigen unter LLVM als RDNA4 uArch und als APUs. Wave64 ist gestrichen bei den RDNA4 APUs.

Die dGPUs haben weiterhin wave64 Modus, sowohl RDNA4 als auch RDNA5.

Quellenangabe :

Ne geile APU mit RDNA4 uArch ist schon sehr interessant. Mal schauen wie viele RDNA4.5 CUs reingepackt werden können.
 
Gfx1250 / Gfx1251 "Memory Model"
Quelle: LLVM

Screenshot_20260202_225618.jpg

Wie es aussieht, ist Gfx125X wohl eine andere WGP Struktur und andere Anordnung als Gfx1200. Bei Gfx1250 / Gfx1251 sind je WGP jeweils 4 SIMD32 zugeordnet (zwei Paare SIMD32). Es gibt bei Gfx125X keine "CUs" mehr, sondern nur wird unter LLVM nur noch als WGP verstanden.
Auch gibt es Veränderungen wie den WGP$, also WGP Cache. Der WGP$ besteht aus LDS (Local data share) und Vector L0 memory.
Es wird von L0 / L1 und L2 gesprochen.

Im Gegensatz zu Gfx1200 (N48, N44) unterstützen Gfx1250 / Gfx1251 keine Datentypen >= 32bit.
 
GFX1250 ist voraussichtlich CDNA und kein RDNA Nachfolger.
Das erklärt auch die extremen Unterschiede zu GFX1200 (RDNA4) und 1300 (RDNA5).
 
Gfx12xx deutet aber auf RDNA4 an nach LLVM Dokumenten. Also eine APU mit RDNA4.5 iGPU, allerdings sehr Compute lastig mit doppelter Parallellisierung bei den "Dual SIMD32" als WGP-Einheit inkl. WGP$.
Wahrscheinlich spezialisiert für quantisierte LLMs, welche nach extremer Parallellisierung fragen bei den vielen Milliarden Parametern (fp8-CNN, Transformer).

Pro WGP sind dann gleichzeitig vier parallele 32bit-instructions gleichzeitig möglich. Die Flexibilität beim neuen WGP müsste auch vier 16bit-instructions und parallel dazu zwei 32bit-instructions erlauben.
Oder vier fp8-instructions (SIMD32 1) und zwei fp16-instructions (SIMD32 2) und zwei fp32-instructions (SIMD32 3,4) gleichzeitig in einem WGP.

Vorher war diese Flexibilität nicht möglich gewesen, weil man vorher die CUs ansprechen musste. 64bit (fp64) fällt komplett weg, ist also keine CDNA uArch, die bisher immer reichlich fp64 anbieten konnten.
 

Sonys neue PSSR (int8) auf der PS5 Pro ist erschienen für Re-Engine.

*Das heute veröffentlichte Resident Evil Requiem ist der erste Titel, der diese fortschrittlichere PSSR nutzt."

Bei Resident Evil Requiem haben wir uns darauf konzentriert, die Darstellungsqualität des Protagonisten durch eine aktualisierte Version der RE Engine zu verbessern, damit der Spieler den Horror noch intensiver erlebt. Beispielsweise wird jede einzelne Haarsträhne und jedes Barthaar als Polygon gerendert, sodass sie sich in Reaktion auf Körperbewegungen und Wind realistischer bewegen. Die Art, wie das Licht durch seine Haare fällt, ändert sich auch je nachdem, wie seine Haarsträhnen übereinanderliegen. Diese genaue Darstellung von Texturen ist eines der vielen Details, bei denen wir uns ganz besonders darauf freuen, dass unsere Fans sie sehen.

Die aktualisierte PSSR hat es uns ermöglicht, unsere Ausdrucksstärke zu verbessern, indem diese Details und strukturellen Besonderheiten erfolgreich verarbeitet werden. Üblicherweise sind sie wegen ihrer Komplexität schwer hochzuskalieren. Wir hoffen, dass ihr dieses beispiellose Level an Horror und visueller Wiedergabetreue und das damit einhergehende Gameplay-Feeling erleben werdet.“


– Masaru Ijuin, Senior Manager Engine Development Support Section R&D Foundational Technology Department, Capcom


Die neue Version der PSSR (aus Project Amethyst) nutzt eine Art "int8-Rendering" für die Haare, Licht, Texturen und Bewegungen. Das entlastet die PS5 Pro CUs für fp32-Rendering und Ray-tracing.
 
Zuletzt bearbeitet:
Zurück
Oben Unten