AMD - Zen 3 - 7 nm / 6 nm - Vermeer, Cezanne, Warhol, Rembrandt, Dragon Point

Erstaunlich ist für mich immer wieder, wie viel weniger Verbraucht AMD als Intel für die gleiche Leistung benötigt... Gut, andere Fertigung, aber trotzdem, das hat Intel halt selber verbockt, dass die da so weit zurückhängen.
 
Kann jemand mit dem Begriff Zero Bubble Branch Predictor was anfangen? Das einzige, was ich dazu gefunden hab, war dieses Dokument:

War schon bei Zen 2 so, wo sie den TAGE Predictor eingeführt hatten ohne je darauf einzugehen, was das genau ist und wo die Vorteile liegen.

Und "wider issue FPU and INT units"; also mehr Ausführungseinheiten? Schon Zen 2 hatte ja eine zusätzliche Address Generation Unit (AGU) erhalten, sodass nun insgesamt bis zu 7 (statt 6) Befehle gleichzeitig ausgeführt werden konnten. Bei Zen 3 also – wenn FP und INT davon profitieren sollen – noch mal 2 mehr?
 
und langsames Auslaufen von Zen2 wie es auch Zen+ beschieden war.
Ich denke das wird dieses mal noch etwas länger dauern. Vor allem, da es derzeit noch keinen Zen 3 Achtkerner mit 65W TDP gibt.
Der 3800X(T) und 3900X(T) sowie der 3950X dürften aber tatsächlich langsam auslaufen.
Kann jemand mit dem Begriff Zero Bubble Branch Predictor was anfangen? Das einzige, was ich dazu gefunden hab, war dieses Dokument:

War schon bei Zen 2 so, wo sie den TAGE Predictor eingeführt hatten ohne je darauf einzugehen, was das genau ist und wo die Vorteile liegen.

Und "wider issue FPU and INT units"; also mehr Ausführungseinheiten? Schon Zen 2 hatte ja eine zusätzliche Address Generation Unit (AGU) erhalten, sodass nun insgesamt bis zu 7 (statt 6) Befehle gleichzeitig ausgeführt werden konnten. Bei Zen 3 also – wenn FP und INT davon profitieren sollen – noch mal 2 mehr?
Dazu kann ich nur eins sagen:

:D

(sorry, keine Ahnung)
 
Kann jemand mit dem Begriff Zero Bubble Branch Predictor was anfangen?

Und "wider issue FPU and INT units"; also mehr Ausführungseinheiten? Schon Zen 2 hatte ja eine zusätzliche Address Generation Unit (AGU) erhalten, sodass nun insgesamt bis zu 7 (statt 6) Befehle gleichzeitig ausgeführt werden konnten. Bei Zen 3 also – wenn FP und INT davon profitieren sollen – noch mal 2 mehr?

Der CB-Artikel geht etwas mehr auf Details auf Basis eines Briefings durch Papermaster ein.
Den Zero Bubble Branch Predictor würde ich dann doch eher als ein geflügeltes Wort interpretieren, ich denke Papermaster wollte damit ausdrücken, dass die Vorhersagen längere Ausführungsschritte in der Pipeline nicht mehr zum platzen bringen.
Ob er mit "wider issue" mehr Ausführungseinheiten oder weniger gegenseitig blockierende bzw. Funktions-spezifische Ausführungen gemeint hat ist für mich auch eher offen.

Momentan stellt sich Zen3 für mich so dar, dass das Hauptziel der 8Core CCX mit einheitlichem L3 war. Für sich genommen schon ein ambitioniertes Projekt. Alles andere profitiert von den dadurch optimierten Latenzen und konnte selbst auch weiter in Latenzen optimiert werden. Im Windschatten dazu einige kleine Detail-Optimierungen um dem Rechnung zu tragen. In Summe eine Verbesserung in allen Bereichen. Der I/O Chiplet soll lt. CB Bericht im Grunde genommen der gleiche geblieben sein.

Wenn sich nur der Core-Chiplet ändert würde ich mir dann schon wünschen, dass auch bei der Kompatibilität mit bestehenden MBs sich nichts ändert. D.h. bis auf den Umstand, dass man nicht jedes SKU im Bios individuell berücksichtigen kann.

Wie war das nochmal mit dem L3 Victim Cache? Jeder Core kann die Victims bis zu 4MB hineinschreiben oder die ganzen 32MB? Dass er alles lesen kann ist ja klar....
 
Zuletzt bearbeitet:
Momentan stellt sich Zen3 für mich so dar, dass das Hauptziel der 8Core CCX mit einheitlichem L3 war. Für sich genommen schon ein ambitioniertes Projekt. Alles andere profitiert von den dadurch optimierten Latenzen und konnte selbst auch weiter in Latenzen optimiert werden. Im Windschatten dazu einige kleine Detail-Optimierungen um dem Rechnung zu tragen. In Summe eine Verbesserung in allen Bereichen. Der I/O Chiplet soll lt. CB Bericht im Grunde genommen der gleiche geblieben sein.

Weiß nicht mehr genau, wo ich das aufgeschnappt habe. Ich glaube es war von Ian Curtress.

Demnach stellen die Veränderungen bei Zen 3 eine neue Baseline / Ausgangslage da von der man weiter optimieren kann.
Die Chip Designer sprechen da ja gerne von "low hanging fruits" also kleinen und leichten Veränderungen im Chip, die aber dann entsprechende Auswirkungen bei der Performance haben.
Gleichzeitig hat man aber wohl auch größere Veränderungen alles auf Zen 4 geschoben, da dort ja Sockel /Speicher usw. geändert wird.

Das scheint dafür zu sprechen, dass der Zen 3 Refresh kommen wird.
 
Die Chip Designer sprechen da ja gerne von "low hanging fruits" also kleinen und leichten Veränderungen im Chip, die aber dann entsprechende Auswirkungen bei der Performance haben.
Gleichzeitig hat man aber wohl auch größere Veränderungen alles auf Zen 4 geschoben, da dort ja Sockel /Speicher usw. geändert wird.

Das scheint dafür zu sprechen, dass der Zen 3 Refresh kommen wird.

Ich denke auch, dass Vermeer jetzt nur die erste Version mit Zen3 ist, die sich von Matisse schlichweg nur darin unterscheidet, dass statt dem Zen2- das Zen3-Chiplet drin ist. Dieses erste Zen3-Core-Umsetzung ist vermutlich vor allem für Milan optimiert als auch für die Verwendung in Cezanne: hier ist vermutlich etwas Takt-Potenzial für die Effizienz-Steigerung geopfert worden.

Zudem vermisse ich bei Vermeer ein neues I/O-Chiplet, womit womöglich nochmal etwas Performance gewonnen werden kann. Warum sollte AMD von Vermeer relativ schnell eine weitere, auf Takt optimierte Version bringen, die dann aber mehr Energie verbraucht? Zen3+ für Gaming und spezielle HPC-Versionen von Milan. Und zuletzt vermisse ich eine AM4-Plattform mit USB4 und eben für erweiterte TDP für maximales Gaming. Gestern ging es ja nur um "wo Gaming beginnt". Ein überarbeitetes, auf höhere TDP und damit höhere Takte optimiertes I/O-Chiplet wäre hier die perfekte Ergänzung, um den Zen3+-Refresh nochmals ohne viel Aufwand durchwegs mehr Performance zu geben. Höherer Takt beim Infiniti-Fabrik als auch für die Ram-Anbindung sollte von erhöhter TDP ordentlich profitieren.

Das Ganze dürfte dann Warhol sein: mit Zen3+ mit dem neuen I/O-Chiplet und dann endlich 5Ghz? Der könnte dann Mitte 2021 zusammen mit der letzten AM4-Plattform mit USB4 kommen, um dann gegen Rocket-Lake anzutreten.

Wenn von Zen3 nun selbst die 65W-6-Kerner 4,6Ghz, und die Massen 8-Kerner 4,7Ghz (5800X) machen, warum sollte dann gerade bei 4,9Ghz Schluss sein, und das von Anfang an? Sicherlich hätte man jetzt auch 5,0Ghz präsentieren können. Aber wozu? Diese 5Ghz-Marke hat man sich womöglich gezielt für den Warhol mit dem Zen3+-Refresh aufgehoben, da man sie jetzt nicht wirklich braucht.
 
Zuletzt bearbeitet:
Bei deinem Zitat ist irgendwie etwas schief geganen....

Bei Zen3 würde ich einen Refresh als XT erwarten ohne grosse Sprünge. Ein I/O muss man nicht nochmal neu für den Sockel machen. Man kann sich getrost auf die Mamut-Aufgabe AM5 konzentrieren.

... es würde doch genügen den Zen3 Chiplet für Zen4 auf 5nm in "Tick" zu bringen und dafür den I/O im "Tock" mit viel mehr Bandbreite anzuhängen. Es wird noch von Stapelspeicher gemunkelt. Das sollte für sich schon ausreichend Gewinne in Durchsatz, Takt und Effizienz bringen, dazu noch GPU on Die, vermutlich im 7nm I/O.
 
Zuletzt bearbeitet:
Der I/O Chiplet soll lt. CB Bericht im Grunde genommen der gleiche geblieben sein.
"im Grunde genommen gleich" heißt aber nur, dass man nichts grundlegend verändert hat und das war auch nicht zu erwarten und widerspricht auch keiner anderen Aussage hier. ;)
Der IO Die wird aber nicht 100% identisch sein, sondern ein paar Verbesserungen wird es da schon gegeben haben.
Ich hoffe vor allem, dass der Verbrauch im Idle etwas niedriger sein wird, da war ja noch ordentlich Potential zu holen, wenn man sich Zen 2 anschaut.

Das große Update im IO Die kommt mit Zen 4, das war schon vorher klar. Da muss das ja auch, weil neuer Sockel, neuer Speicher etc.
 
Der IO Die wird aber nicht 100% identisch sein, sondern ein paar Verbesserungen wird es da schon gegeben haben.
Ich hoffe vor allem, dass der Verbrauch im Idle etwas niedriger sein wird, da war ja noch ordentlich Potential zu holen, wenn man sich Zen 2 anschaut

Das hat Ian Cutress in seinem Video angesprochen.
Imo sprach er von 13 bis 15 Watt.

AMD hat dazu aber wohl keine Aussagen getroffen, obwohl er Papermaster gelöchert hat.

Apropos die Top 2 Peinlichkeiten, die ich zum Zen 3 Launch gesehen habe:

1. der 8auer : Als Papermaster von Lisa Su angekündigt wurde, meinte er na hoffentlich gibt das keinen Paperlaunch.
2. Das Monty: Beim Cinebench Single Thread meint er doch glatt. Ja guter Score, aber AMD hat ja 2 Kerne mehr.

*glaubses**admin*
 
Zu viel Unsinn konsumieren ist nicht gut für die geistige und körperliche Entwickelung *rofl*

Besser berücksichtigen ;D

Ich weiß gar nicht warum ich überhaupt bei Monty reingeschaut habe.
Das ist irgendwie immer wie Selbstgeißelung.

Und der verdient auch noch Kohle damit. *admin*
 
Das hat Ian Cutress in seinem Video angesprochen.
Imo sprach er von 13 bis 15 Watt.
Das wäre schon enttäuschend. Auf dem Level ist Zen 2 ja auch in etwa.
2. Das Monty: Beim Cinebench Single Thread meint er doch glatt. Ja guter Score, aber AMD hat ja 2 Kerne mehr.
Triple-facepalm.jpeg
 
Das wäre schon enttäuschend. Auf dem Level ist Zen 2 ja auch in etwa.

Nene, er meinte ja Zen 2 und hat versucht wegen Verbesserungen bei Zen 3 nachzubohren und
AMD hat da noch nichts raus gelassen. Ich glaube richtige technische Daten bekommen wir erst wenn Milan launcht.
 
Hi,
aber es war zwar nur kurz aber es gab dazu ein bild wo sie die Verbesserung dargestellt haben .
Das hat ja schon Anhaltspunkte geliefert was sie verfeinert haben, dazu noch das die CCX alle 8 kerne auf die 32MB zugreifen
können und nicht 4 a 16Mb.
Das so wenig zu den Boards kam fand ich mMn.
ipc.JPG
 
Kann jemand mit dem Begriff Zero Bubble Branch Predictor was anfangen? Das einzige, was ich dazu gefunden hab, war dieses Dokument:

War schon bei Zen 2 so, wo sie den TAGE Predictor eingeführt hatten ohne je darauf einzugehen, was das genau ist und wo die Vorteile liegen.

So wie ich das in dem Dokument verstanden habe gibt es beim Auslesen der Information an welcher Addresse nun der nächste Befehl steht bei einem normalen BTB eine Verzögerung von 1-x Takten. Diese Verzögerung wird in dem Dokument als Bubble bezeichnet. Nun ist es AMD gelungen diese Verzögerung auf 0 Takte zu reduzieren und damit werden Sprungbefehle, die recht häufig vorkommen, schneller abgearbeitet.

Und "wider issue FPU and INT units"; also mehr Ausführungseinheiten? Schon Zen 2 hatte ja eine zusätzliche Address Generation Unit (AGU) erhalten, sodass nun insgesamt bis zu 7 (statt 6) Befehle gleichzeitig ausgeführt werden konnten. Bei Zen 3 also – wenn FP und INT davon profitieren sollen – noch mal 2 mehr?

Nachdem die Load/Store Einheit erweitert wurde, wird man wohl auch eine weitere AGU benötigen. Vielleicht hat man dann auch gleich noch eine weitere INT-/FPU-Pipeline hinzugefügt.
 
Hi
sagt mal was haltet ihr von der Vorstellung von Zen3 ich tu mich derzeit recht schwer die Vorteile zu meinem 3950x zu finden.
ich hatte den 1800x dann den 2700x und dann den 3950x und ich befürchte ich bin "verwöhnt" worden der Schritt zum 5900x oder 5950x
kommt mir bedeutend kleiner vor wie bei den anderen *noahnung* dazu müsste ich wenn ich nicht warten will auch nen neues Board holen und da bin
ich richtig verloren derzeit was ich holen würde.
lg
 
Nun ja da hast du ja auch bei einem Schritt die Kernzahl verdoppelt - das entfällt nun aber. Der Schritt von 3950X zu 5950X sollte aber größer sein als von 1800X zu 2700X.

19 % mehr IPC, ggf minus 100 Mhz bei Last auf allen Kernen. Deutlich mehr SC Leistung - aber wer einen 3950X hat muss da nicht upgraden.
Ich hoffe ich kriege meinen 3950X mal irgendwann heile zurück.
 
Hi
sagt mal was haltet ihr von der Vorstellung von Zen3 ich tu mich derzeit recht schwer die Vorteile zu meinem 3950x zu finden.
ich hatte den 1800x dann den 2700x und dann den 3950x und ich befürchte ich bin "verwöhnt" worden der Schritt zum 5900x oder 5950x
kommt mir bedeutend kleiner vor wie bei den anderen *noahnung* dazu müsste ich wenn ich nicht warten will auch nen neues Board holen und da bin
ich richtig verloren derzeit was ich holen würde.
lg

Hm,
schwierig. Die Frage ist, brauchst du die CPU? Ich würde erstmal abwarten, eventuell wenn du eh ein neues Board brauchst, dann auf Zen 4 mit dem Sockelwechsel warten, wird dann aber mit neuem Speicher dann auch richtig kostspielig.

Ich selbst krebse noch auf nem 1600 rum, da faellt das Aufrüsten leichter. ;)
 
Also ich hab gerade erst den 3950X geholt und sehe definitiv keinen Bedarf zu einer Aufrüstung wegen läppischer 20%.
Für mich galt quasi immer das Schema: alle ~3 Jahre Threadverdoppelung. Vorher waren es R7-1700, FX-8350, PhII-X4, AthlonX2, AthlonXP. Damit ergab sich jeweils ca. eine Verdoppelung bis Verdreifachung der Rechenleistung.
Da ich diesem Schema treu zu bleiben gedenke und mich die Monster-Sockel vom Threadripper nicht wirklich reizen, werde ich nun also vermutlich warten, bis 16 Kerne pro die und damit eine 32-Kern-CPU auf AM5 zu haben ist.
 
sagt mal was haltet ihr von der Vorstellung von Zen3 ich tu mich derzeit recht schwer die Vorteile zu meinem 3950x zu finden.
ich hatte den 1800x dann den 2700x und dann den 3950x und ich befürchte ich bin "verwöhnt" worden der Schritt zum 5900x oder 5950x
kommt mir bedeutend kleiner vor wie bei den anderen *noahnung* dazu müsste ich wenn ich nicht warten will auch nen neues Board holen und da bin
ich richtig verloren derzeit was ich holen würde.
Ich denke Zen 2 Nutzer sind da auch nicht unbedingt die Zielgruppe.
Klar wird es den einen oder anderen Benchmarkfetischisten geben der auf die paar zusätzliche fps wegen der Singlecore Performance aus ist, aber im Grunde muss man sagen, dass Zen 2 einfach ein verdammt gutes Produkt war und ist.

Wobei ich persönlich gerade am Überlegen bin das grottige ASUS X570 Board aus meinem Spiele-PC rauszuwerfen und durch ein vernünftiges B550 von einem Hersteller zu ersetzen der ein Board auch vernünftig designen kann.
Wenn ich da dann eh schon dran wäre, dann könnte ich auch gleich noch die CPU (ist ein 3800X) ersetzen. Wäre aber eigentlich nicht wirklich nötig …
Ich selbst krebse noch auf nem 1600 rum, da faellt das Aufrüsten leichter. ;)
Ein 1600? Was für ein Luxus.
Hier rödelt ein A10-7800 im Desktop rum.
der gleich mal wieder rust kompilieren muss. Letztes mal hat das 3h gedauert. Der Arme … *chatt*
 
Kernel compilieren mit 12 Kernen dauert unter 10 Minuten.

Ich sehe Zen3 als Zwischenschritt an, wenn man den Speichertakt und PCIe Gewschindigkeit erhöhen will. Da braucht man CPU Chiplet und GPU die das auch ausnutzen können. Vll mit L3 CPU <----> GPU mit Pufferspeicher muss dann auch der I/O abkönnen.

Oder auch generell ob man Berechnungen auf der CPU oder GPU ausführen lässt. Jenachdem was man an Trafic einspart. Wird interessant weil ja Intel jetzt auch ein GPU Sparte hat. Specs. müssen erfüllt werden aber was man darüberhinaus Hardwaretechnisch einbaut ist dann eben frei.
 
War schon bei Zen 2 so, wo sie den TAGE Predictor eingeführt hatten ohne je darauf einzugehen, was das genau ist und wo die Vorteile liegen.

Also TAGE ist der aktuelle state of the art BP. Den verwendet auch Intel. Er braucht weniger Transistoren und hat eine höhere Trefferwahrscheinlichkeit als Perceptron, das AMD mit Bulldozer und Zen1 verwendet hat.

Ziemlich sicher ist der "ZeroBubble" BP ebenfalls ein TAGE, nur mit den schon angesprochenen Optimierungen.
 
Hi
sagt mal was haltet ihr von der Vorstellung von Zen3 ich tu mich derzeit recht schwer die Vorteile zu meinem 3950x zu finden.
ich hatte den 1800x dann den 2700x und dann den 3950x und ich befürchte ich bin "verwöhnt" worden der Schritt zum 5900x oder 5950x
kommt mir bedeutend kleiner vor wie bei den anderen *noahnung* dazu müsste ich wenn ich nicht warten will auch nen neues Board holen und da bin
ich richtig verloren derzeit was ich holen würde.
lg
Also ich würde da generell erstmal Tests abwarten.
SC ist mir Latte, Spieleleistung brauch ich als non Gamer ohnehin nicht.
Encoding- und Rendering-Speed ist wichtig und da auch AVX.
Also möglichst hohe, lang anhaltende MC-Leistung.
Da muss man mal in realen Tests sehen was dabei rumkommt.
 
Zurück
Oben Unten