AMD RDNA 3 - Chiplet NAVI - NAVI 3X

5% Performanceverlußt
Ganz ehrlich - das waere eine ganze Menge IMHO.

Im Benchmarkgewitter und in der Marktposition waeren die 7900XT und XTX doch besser gelitten (z.B. die 4080 mehr auf Abstand gehalten wie Du selbst schreibst). AMD ist besser als die 4080 klingt besser als wenn sie es nur manchmal ist.

Bin gespannt ob und wenn ja wo der Hase im Pfeffer vergraben ist - oder ob das Design einfach nicht so toll ist.

Wenn das hier stimmt:
1671201572349.png
Muss man sich schon fragen - was oder wer AMD da geritten hat... und das so rauskommt?
Why that rush!? Oder wirklich die Buchstaben bei Twitter nicht wert?

Ergaenzung - zumindest im Tweet dazu wird darauf hingewiesen, dass mit A0 nicht der Chip gemeint ist sondern das Board (und dass das so ueblich sei mit A0 Board in den Launch zugehen). Also hat AMD hier nicht gleich den ersten Wurf unter die Leute gebracht - oder!?

Gruss,

TNT
 
Zuletzt bearbeitet:
Vielleicht in Benchmarks aber in der Praxis merkt das niemand.
Zudem würde ich davon ausgehen das man bei einem kleineren TDP Bereich für die XT ca. auf dem gleichen Niveau geblieben wäre, nur halt etwas effizienter.
 
Vielleicht in Benchmarks aber in der Praxis merkt das niemand.
Das mag schon sein - wie bei vielen Benchmarks (160 FPS oder 190FPS - wer merkt es!? Ich vermutlich nie).

Aber um die Praxis geht es beim Launch und Benchmarks nicht - im Ranking zaehlt der Balken, ob man es nun mag oder nicht.
Das Ranking bestimmt die Marktpos. und den moeglichen Preis und Einordnung - also wichtig.

TNT
 
Schlechtes Beispiel, 5% mehr von 160 FPS wären 168 FPS.
Den will ich sehen der das im Blindtest ernsthaft unterscheiden kann.
 
Ergaenzung - zumindest im Tweet dazu wird darauf hingewiesen, dass mit A0 nicht der Chip gemeint ist sondern das Board (und dass das so ueblich sei mit A0 Board in den Launch zugehen). Also hat AMD hier nicht gleich den ersten Wurf unter die Leute gebracht - oder!?

Macht eigentlich keinen Sinn. Es steht in den Github Codes eindeutig die GFX Kennung. Er schreibt doch A0-Silicon, aber daran merkt man auch, dass das auf Twitter nur Spekulationen sind, ist das Code für ein Stepping das nicht im Markt ist oder ist das A0 bei so einem Projekt tatsächlich schon in die Bulk-Produktion gegangen? Eventuell gibt es Unklarheit mit dem Chiplet vs. dem Interposer vs. dem MCD. Aber der Prefetcher ist eine Einheit im Die.
Die Ausführung, dass man im Code im Treiber ein Prefetching simulieren kann ist auch richtig. Ob nun das mit Treiber-Nacharbeiten etwas Leistung zurückholen kann muss man die nächsten Wochen abwarten, der Github Code scheint mir aber sehr eindeutig. Es fehlt so weit ich das sehen kann eine Bestätigung seitens AMD.

In dem anderen (von mir zuerst zitierten) Fall mit dem ungünstigen Code für die WGPs wird bis 17% geringere Leistung bzw. 5/6 der Leistung spekuliert wegen des WGP Designes und der neuen ISA. Also bewusste Designentscheidungen, die nicht die einfache Hochrechnung der FLOPS über Takt und Units erlauben würden, sondern bis zu 17% Abzug bedeuten könnten.
In einem Code-Bespiel von AMD für Raytracing macht das erst mal nur 4% aus, das soll doch aber nur ein Beweis sein, ist nicht zu verallgemeinern. Ich sehe die Aussage so, dass AMD da noch allgemein besseren Compiler-Code für die eigene ISA hinbekommen will.
 
ist das Code für ein Stepping das nicht im Markt ist oder ist das A0 bei so einem Projekt tatsächlich schon in die Bulk-Produktion gegangen?
Wenn keine Bugs vohanden/bekannt sind die eine Veröffentlichung verhindern dann kann man auch mit A0 starten.
ich bin mir nicht ganz sicher aber eines von beiden gab meiner Erinnerung nach eine Änderung auf der Transistorebene und das andere auf der Verdrahtungsebene des Chips wieder. Ich kann mich aber auch irren.
Es kann aber natürlich auch sein das jemand so glatt war die Verdrahtungsebene des Chips mit dem PCB der Karte gleichzusetzen.
 
Er schreibt doch A0-Silicon, aber daran merkt man auch, dass das auf Twitter nur Spekulationen sind, ist das Code für ein Stepping das nicht im Markt ist oder ist das A0 bei so einem Projekt tatsächlich schon in die Bulk-Produktion gegangen?
Die ersten rudern eh schon wieder zurück beim Thema A0.
 
Mhmhm...also, ist es nicht falsch, dass AMD A0 Silizium in den Retaikarten verbaut - was aber nicht unueblich ist.
Ist AMD gelungen beim ersten GPU Chiplet Design gleich im ersten Wurf Produktionsreife zu erlangen!? Und alles ist gut mit RDNA3 (bis auf Treiber?)

Also ist AMD zufrieden mit der Leistung - da sie wie erwartet/geplant ausfaellt!?
Und das ist alles nur der Anfang des Chiplet Designs bei GPUs und daher etwas 'rough' !?

Bin gespannt wie man in einem oder zwei Jahren das beurteilt.

Gruss,
TNT
 
Schlechtes Beispiel, 5% mehr von 160 FPS wären 168 FPS.
Den will ich sehen der das im Blindtest ernsthaft unterscheiden kann.
Wir sprechen von Benchmarkbalken und da kann so was entweder vor oder hinter einem anderen Produkt liegt. usw.
Ich wuesste nicht das Blindtests hier ein wesentlich Rolle spielen in Reviews.

TNT
 
Genau deshalb gibt es ja auch Variablen wie den Takt und die TDP welche man für entsprechendes Feintuning nutzen kann.
Das man nicht auf die gleiche RT Performance kommen wird dürfte wohl von Anfang an klar gewesen sein denn dafür hat nvidia ganz einfach die Software Entwicklung zu sehr auf seiner Seite und seitens der Raster Performance sehe ich AMD gut aufgestellt denn die 7900XTX hat beim Benchmark Durchschnitt die 4080 erreicht und die 7900XT nvidias altes Top Modell, die 3090Ti, wobei beide trotz nvidias vorherige Preissenkungen dennoch günstiger sind.
In sofern wundert es mich doch sehr was hier für ein riesen Fass aufgemacht wird.
 
Wobei meine VIIs auch mit WaKü Umbau eine ziemlich hohe Hotspot Temperatur hatten.
Da war das Problem vermutlich weniger das Kühlsystem als vielmehr die Temperaturverteilung im Chip selbst.
 
Spannende Werte:
Knapp 3,1 GHz sind aber noch nicht im Ansatz das Limit, das in der Navi 31-GPU steckt. Denn die manuell übertaktete Sapphire Radeon RX 7900 XTX Nitro+ arbeitet im Blender-Benchmark mit durchschnittlich 3.455 MHz – ein Takt, den andere GPUs, sei es auf Basis von RDNA 2 oder Ada Lovelace, zu keiner Zeit auch nur im Ansatz erreichen können. Navi 31 absolvierte mit diesem Takt völlig stabil einen mehrmaligen Durchlauf des Benchmarks. Der maximale Takt lag mit 3.482 MHz noch einmal etwas höher. Die Redaktion konnte der Grafikkarte einmal gar 3.548 MHz entlocken, jedoch lief die GPU mit diesem Takt nicht mehr stabil.

Für die 3.455 MHz benötigt die Radeon RX 7900 XTX 374 Watt. Das in Spielen limitiertende Power-Limit von 500 Watt wird demzufolge deutlich verfehlt. Gegenüber dem Referenzdesign steigt der Takt um 13 Prozent an und die Leistungsaufnahme um 21 Prozent.

Und mal wieder absurde Annahmen:
Die gesamte Architektur auf einen Takt auszulegen, der in Spielen und damit dem Haupteinsatzgebiet von RDNA 3 zu keiner Zeit auch nur im Ansatz erreicht wird, kann darüber hinaus nicht AMDs Ziel gewesen sein. Denn es darf nicht vergessen werden, dass ein hoher Takt nur mit einer entsprechend langen Pipeline möglich ist – und eine lange Pipeline kostet Latenzen und damit schlussendlich Rechenleistung pro Takt. Wenn die Radeon RX 7900 XTX in Spielen also wirklich nur mit durchschnittlich 2.554 MHz arbeiten sollte, hätte AMD die Pipeline verkürzen und damit die Rechenleistung pro Takt steigern können.
Mit absurdem Fazit:
Natürlich beweist der Test dies nicht, doch anders ist es kaum zu erklären, dass Navi 31 mit derart hohen Taktraten stabil laufen kann, in Spielen aber mal eben 500 MHz darunter bleibt. Da RDNA 2 (und Ada Lovelace) sich völlig anders verhält, liegt es einfach nahe, dass sich so auch RDNA 3 eigentlich nicht verhalten soll.
 
Bei entsprechenden Workloads welche die GPU unterirdisch nutzen arbeitet auch meine Vega64 Referenz bei 1,6 - 1,7 GHz und ist dabei weit vom Powerlimit entfernt. Entsprechend schlecht fällt dann aber auch deren Rechenleistung aus. Bei Spielen pendelt sich der Takt deutlich darunter ein weil die GPU ganz einfach erheblich besser genutzt wird und damit auch die Wärmeentwicklung entsprechend ausfällt.

Das mit dem Verkürzen der Pipeline ist natürlich quatsch da eine Architektur für gewöhnlich nicht nur für ein Produkt genutzt wird. Mit kleineren GPUs und besseren Fertigungsprozessen können solche Taktreserven dann durchaus ausgefahren und bei der Weiterentwicklung der Architektur kann darauf aufgebaut werden. Siehe die IGP des Cezanne die noch die Vega Architektur nutzt (GCN 5.1) und mit 2 GHz taktet. Deren große Geschwister bekamen solche Taktraten noch nicht.

Wenn die Taktraten bei Spielen trotzt Spielraum beim Powerlimit nicht erreicht werden kann das auch einen sehr einfachen Grund haben den wir so langsam mal kennen sollten, das Temperatur Limit wird wegen einer dafür unzureichender Wärmeverteilung/Kühlung erreicht und begrenzt damit die Taktfrequenz.
 

RDNA3 @ 3,7Ghz / 3,2Ghz
Taktmäßig ist Navi31 in einer ganz anderen Liga.
Mich wundert es, dass AMD das so nicht promotet hat sondern mit 2,5Ghz / 2,3Ghz so sehr in die Defensive gegangen ist.
 
Vermutlich weil sonst der Strombedarf explodiert wäre. Du lagst ja auch schon bei 460W. ;)
 
Ich hätte bei der Promotion die Watt-Anzeige einfach aus gemacht und stattdessen die FPS und Taktraten gezeigt. So hat AMD es leider verpasst die tolle Performance von RDNA3 in gewisse Nischen (Shooter, high-fps) zu bewerben. Shooter@1440p@360hz ist gewiss im Gaming eine tolle Sache.
 
Nun ja, aktuell scheint es ja eher nvidia die Firma zu sein die auf den Strombedarf pfeift allerdings sieht man angesichts der monströsen Kühlsysteme das man hier offenbar kurzfristig ebenfalls die Notbremse gezogen hatte. Da waren ja mal bei der 4090 von bis zu 600W die rede.
Ich kann mich dunkel daran erinnern das zuvor in der Gerüchteküche zu den Radeons von 3 GHz und mehr die Rede war und bei erscheinen der Zirkus losging dass das Endprodukt diese geschürten Erwartungen nicht erfüllt wurden.
Es ist einfach der falsche Zeitpunkt für solche Strommonster und Promotion ist wertlos wenn sie von den Specs nicht erfült werden kann. Die Nummer würde denen eher wegen nicht erfüllter Versprechungen um die Ohren fliegen.
 
2,7 GHz erreichen manche 7900 XT schon jetzt. Aber davon ab. Im Vergleich zu den technischen Daten ist Navi 3 ziemlich lahm. Ich hoffe neue Zreiber bringen da noch was.
 

Die Auslastung der doppelten Anzahl SIMD je WGP ist offensichtlich kaum mit aktuellem OpenCL-Code nutzbar, wodurch man in vielen der Benchmarks noch deutlich hinter Nvidias ADALovelace zurückliegt. Anders als der Author vermute ich dass es hierbei noch um RDNA2-optimierten Treiber-Code handelt und erst später bessere Treiber ein WGP von RDNA3 generell (nicht nur in Ausnahmen) deutlich besser abschneiden lassen als ein WGP von RNDA2.
OpenCL ist momentan nicht im Fokus für RDNA3, diese Schwierigkeiten hier könnten im Code für Games ähnliche Auslastungsprobleme aufzeigen, eventuell sogar solange diese nicht Titel für Titel gepatched werden. Für DX12 und Vulkan würde man doch annehmen dass es bereits optimiert ist, dann bliebe noch das optimieren/substituieren von individuellem Shader-Coder der Spieleentwickler.
 
Zuletzt bearbeitet:
Nvidia macht so weiter wie bisher. Im Windschatten ihrer 2000 €-Grafikkarten bringen sie demnächst Modelle wie die 3050 6 GB heraus, die mit 179 € zwar günstig klingt, was aber
"genau im Preisfeld der Radeon RX 6600 liegt, welche neben ihres Mehrspeichers vor allem auch nahezu doppelt (!) so schnell herauskommen sollte."
Zitat: 3D-Center

Das ist echt Wahnsinn. Man kann die Anfänger vor dieser Abzocke nur warnen und ihnen einschärfen, ihre verbohrte Einstellung zu überdenken ("Da muss Nvidia drauf stehen").
 
Zuletzt bearbeitet:
Zurück
Oben Unten