AMD Zen - 14nm, 8 Kerne, 95W TDP & DDR4?

@Opteron
Wenn du den von mir geposteten meinst, der ist ein Aprilscherz. Hab es auch jetzt rein editiert.
 
Da gab es doch schon die BenchLife-Leaks.

Ansonsten scheint Zen mit recht niedriger Spannung und damit höheren Strömen zu arbeiten u. hat dann wohl auch deshalb mehr Pins:
Danke für die Info, macht dann ja durchaus Sinn.

Wieso setzt man bei einer neuen Architektur nicht gleich auf 256 Bit FPUs ? 2x 256Bit oder auch 1x 512 Bit.
Nicht das die FPU Performance so schwach wie bei Bulldozer & K10 ausfällt.
Weil es "kostspielig" ist. Du musst für 256 oder gar 512 bit alle Datenpfade auf die entsprechende Breite bringen.
Da kann Intel teilweise tricksen, indem sie INT- und FP-Leitungen wechselweise nutzen, da sie in ihrem Design INT+FP an einem Scheduler hängen haben, aber beim Cache-Design erwischt es Dich dann. Da geht nichts mit Tricks, das muss so breit sein, nützt aber nur was für die breiten FP-Befehle, die INT-Befehle werden davon nicht schneller. Also viel Aufwand für relativ wenig Nutzen. Was man machen könnte wäre 4fach SMT und 4ports à 128 bit, statt 1x512bit, aber das ist auch wieder kompliziert.

AMD hat nun traditionell getrennte Scheduler, müsste also noch mehr Aufwand treiben und das Kerndesign aufblasen. Da macht es mehr Sinn sich auf kleinere Kerne mit 128bit zu konzentrieren und davon dann mehr zu verbauen.

So breite AVX-Einheiten machen auch nur bedingt Sinn. Für eine derartige Daten-Parallelität braucht man keine kompliziertes und stromfressendes OoO mehr außenrum, sowas kann man auch energiesparend auf einer strohdummen, aber noch breiteren GPU rechnen lassen.
Nur hat Intel sowas halt nicht, deswegen müssen sie den Aufwand mit breitem AVX treiben und versuchen das irgendwie in x86 hineinzupressen.

@Opteron
Wenn du den von mir geposteten meinst, der ist ein Aprilscherz. Hab es auch jetzt rein editiert.
Öh nö, das hab ich noch gar nicht gesehen (Edit: Ach den russ. Link von oben meintest Du, na ne, das sieht man doch auf einem Blick, dass da ein altes K10-Die-Foto Pate stand, das nahm ich von Anfang an nicht Ernst), das basiert schlicht auf dem Cern-Leak:
http://www.planet3dnow.de/cms/22501...kernen-vermutlich-aber-nicht-als-am4-version/
Ich zitier mich mal selbst:
Quad-Channel und 16 Kerne dürften aber für den Desktopmarkt auch 2017 zu viel sein. Intel hat selbiges erst im High-End-Bereich des Sockels 2011 im Programm. Falls AMD also nicht alle überraschen sollte, wird es mit einer ähnlichen Sockelstrategie wie Intel an den Start gehen. AM4 wäre damit der übliche Zwei-Kanal-Sockel, welcher ein eigenes, relativ kleines und damit günstig herzustellendes Die mit maximal acht Kernen bekäme. Darüber würde eine Art „AMD-Sockel 2011” für High-End-Desktops und Workstations mit vier DDR4-Kanälen und 16 Kernen residieren,
Im Moment siehts wie erwartet ganz danach aus.
 
Die Spekulationsgrundlage für solche Vermutungen ist dünner als die Pins.
 
Wieso setzt man bei einer neuen Architektur nicht gleich auf 256 Bit FPUs ? 2x 256Bit oder auch 1x 512 Bit.
Nicht das die FPU Performance so schwach wie bei Bulldozer & K10 ausfällt.

Weil die FPU Performance in diesen Tagen ziemlich irrelevant ist und immer irrelevanter wird, da du dafür ja einen Coprozessor im System hast -> die GPU.
 
Meines Erachtens überschätzt du da die Möglichkeiten von GPUs doch ein wenig. Manche Algorithmen laufen gut auf GPUs, andere nicht.
Wobei zur Zeit auch kaum amd64-Software existiert, die AVX-Vektoren effektiv einsetzt. Sofern SSE2 und SSE3 Befehle schnell ausgeführt werden, ist schon viel gewonnen.
 
Wieso setzt man bei einer neuen Architektur nicht gleich auf 256 Bit FPUs ? 2x 256Bit oder auch 1x 512 Bit.
Man hat doch einen theoretischen Durchsatz von 512 Bit, nur halt aufgeteilt auf 4x 128-bit.

Nicht das die FPU Performance so schwach wie bei Bulldozer & K10 ausfällt.
K10 hatte zu Lebzeiten keine schwache FPU Performance. Und Bulldozer auch nicht. Bulldozer hatte nur das Problem, dass das volle Potenzial erst mit FMA entfaltet werden konnte, bei Legacy Code die Hälfte davon aber quasi auf der Strecke blieb. Genau hier macht man ja eine 180° Kehrtwende mit Zen. Man legt wieder mehr Wert auf Legacy Code und nimmt Nachteile bei FMA in Kauf, um die Pipeline schlank und den Strombedarf hoffentlich in Grenzen zu halten. Intel wird im Moment jedenfalls ganz schön zur Stromschleuder bei 256-bit AVX/FMA Code. Mal schauen ob AMDs Ansatz sinnvoller ist.


[3DC]Payne;5081307 schrieb:
Weil die FPU Performance in diesen Tagen ziemlich irrelevant ist und immer irrelevanter wird, da du dafür ja einen Coprozessor im System hast -> die GPU.
Naja, ganz so ist es nicht. Die meisten Apps profitieren von guter Integer Performance. Und HPC setzt mittlerweile auf GPUs. Das ist schon richtig. In einigen Szenarien spielt die FPU aber schon noch eine gewichtige Rolle. Mal abseits von typischen Benchmarks, zB Cinebench, seien nur mal Spiele genannt.
 
Weil es "kostspielig" ist. Du musst für 256 oder gar 512 bit alle Datenpfade auf die entsprechende Breite bringen.
Da kann Intel teilweise tricksen, indem sie INT- und FP-Leitungen wechselweise nutzen, da sie in ihrem Design INT+FP an einem Scheduler hängen haben, aber beim Cache-Design erwischt es Dich dann. Da geht nichts mit Tricks, das muss so breit sein, nützt aber nur was für die breiten FP-Befehle, die INT-Befehle werden davon nicht schneller. Also viel Aufwand für relativ wenig Nutzen. Was man machen könnte wäre 4fach SMT und 4ports à 128 bit, statt 1x512bit, aber das ist auch wieder kompliziert.

AMD hat nun traditionell getrennte Scheduler, müsste also noch mehr Aufwand treiben und das Kerndesign aufblasen. Da macht es mehr Sinn sich auf kleinere Kerne mit 128bit zu konzentrieren und davon dann mehr zu verbauen.

So breite AVX-Einheiten machen auch nur bedingt Sinn. Für eine derartige Daten-Parallelität braucht man keine kompliziertes und stromfressendes OoO mehr außenrum, sowas kann man auch energiesparend auf einer strohdummen, aber noch breiteren GPU rechnen lassen.
Nur hat Intel sowas halt nicht, deswegen müssen sie den Aufwand mit breitem AVX treiben und versuchen das irgendwie in x86 hineinzupressen.

AMD muß einfach zusehen asap mit konkurenzfähigen Produkten am Markt zu sein. Ein Zen der früher am Markt ist weil die Vectorunit nicht so breit ist hat für AMD mehr Wert als ein Zen der später und mit breiterer Vectorunit kommt. Breites AVX hat im Moment auch keinen riesigen Markt. Und AMD hat mit HSA eine Technik für ähnliche Einsatzfelder.
 

Macht zumindest einen durchaus plausiblen Eindruck.
b636ebd3.png
 
Das sind die Aprilscherz-Bilder von BitsAndChips.it ...
 
Na denn ...
Trotzdem hat es sicher einen Grund, weswegen Intel auf 10 Cores + SMT beim Broadwell-E aufstockt. 8)

Sicher nicht, weil auf dem Wafer noch Platz war.
 
Zuletzt bearbeitet:
Erstmal hat der Windhund auf die Schnelle die Benchmarks durcheinander gebracht, denn bei CPU-Hash kommt der 3GHz-Zen bei ~17.000 MB/s raus.;)

Zum anderen hab ich mir mal die Mühe gemacht, ein paar Werte einiger CPU's aus dem "Leak" auf 1 GHz und 1 Kern (+HT) runterzubrechen. Keine Ahnung, ob man das einfach so machen und vergleichen kann. Auch weiß ich nicht, inwieweit der Turbo dort reinpfuschen täte.

Zen.PNG
 
Zuletzt bearbeitet:
Zen mit 95W also ein FX-8370E + 40% also ca. ein FX8370E mit 5040 MHz Takt ohne den Turbo zu berücksichtigen würde ich meinen, lohnenswert wohl dürfte mit OC Glück von ca, 30% also einen FX mit ca. 6552MHz Takt gleichkommen der sich wohl noch mit Luft kühlen lassen sollte.

Oder verstehe ich das nicht mit dem im Raum stehenden +40% gegenüber den FX Prozessoren nicht richtig?

Sollte das passen ist der Zen auf jeden Fall ein gutes Produkt ungeachtet des Preises, in meinen persönlichen Fall also eine lohnenswerte CPU so oder so da ich ja nur kleine FX Modelle habe.

Aber am Ende ist es auch wieder so das ich gut mit einer FX 8350 zurecht kommen würde, da mein Anspruch nicht so sonderlich hoch ist, und geht es Vielen so, dürfte wieder der Gebrauchtmarkt über Erfolg und nicht Erfolg entscheiden, also die Verfügbarkeit von alten FX BD Modellen auf den Gebrauchtmarkt.

Also zu Gunsten von AMD schmeißt nicht eure FX BD gleich auf den Markt, zu Gunsten an meine persönlichen Ansprüche, macht es doch :)
 
Oder verstehe ich das nicht mit dem im Raum stehenden +40% gegenüber den FX Prozessoren nicht richtig?

Wurde schon gesagt. Aber hier noch zur Untermauerung ein kleines Fazit aus dem Test von PCGH:

Update: Wir haben unsere Benchmarks und unseren Pro-MHz-Vergleich nun mit einem A10-6800K, basierend auf der zweiten Iteration der Bulldozer-Architektur "Piledriver", ergänzt. Im Vergleich zu jenem liegt Excavator zum Teil knapp 25 Prozent in Führung und das System arbeitet dabei noch sparsamer - die Effizienz steigt um knapp 39 Prozent! Bedenken Sie dabei, dass der 6800K über eine TDP von 100 Watt verfügt, während der X4 845 nur mit 65 Watt auskommen muss; real schlägt sich dies in einem Spiele-Durchschnittsverbrauch von 242 zu 195 Watt (ges. System) nieder. Der ebenfalls auf 65 Watt geregelte A10-7800 kommt auf 215 Watt.

Wenn die 40% von Excavator seitens AMD eingehalten würden, würde Zen auf einen FX8350 taktbereinigt 65% an purer Leistung drauflegen. Effizienztechnisch sollte da zusätzlich einiges drin sein, wenn man zwischen Piledriver und Excavator schon 39% misst.
 
Erstmal hat der Windhund auf die Schnelle die Benchmarks durcheinander gebracht, denn bei CPU-Hash kommt der 3GHz-Zen bei ~17.000 MB/s raus.;)

Zum anderen hab ich mir mal die Mühe gemacht, ein paar Werte einiger CPU's aus dem "Leak" auf 1 GHz und 1 Kern (+HT) runterzubrechen. Keine Ahnung, ob man das einfach so machen und vergleichen kann. Auch weiß ich nicht, inwieweit der Turbo dort reinpfuschen täte.

Anhang anzeigen 34211

Zumindest der Hash-Wert sieht so natürlich unwahrscheinlich aus. Irgendwo war auch der Hash-"Leak" in real zu sehen (auch hier? abload-Bilder werden vom Proxy gesperrt). Das war irgendein Vielkern-Xeon.
 
Oder verstehe ich das nicht mit dem im Raum stehenden +40% gegenüber den FX Prozessoren nicht richtig?

Da hast du etwas falsch verstanden, es sind 40% auf die letzte Bulldozer-Generation, also NICHT auf die alten FX.

Wenn die 40% von Excavator seitens AMD eingehalten würden, würde Zen auf einen FX8350 taktbereinigt 65% an purer Leistung drauflegen.

Leute, AMD hat nur +40% IPC gegenüber XV verlautbart, nicht +40% Performance!! IPC ist nur ein Teil der Gleichung, der Takt ist nach wie vor eine große Unbekannte! Spekulationen auf (z.B.) +40% Performance sind zwar nicht völlig utopisch, aber das AMD nie propagiert.
Ich erinnere z.B. an Kaveri, wo AMD ebenfalls +x% IPC versprochen hat. Viele haben das mit +x% mehr Performance gleichgesetzt, doch schlussendlich kamen durch die (soweit ich mich gerade erinnere) minus 400MHz (aus dem Kopf 3,7GHz beim A10-7850 vs. 4,1GHz bei Richland) deutlich weniger heraus.

LG
 
Ist aber offensichtlich nicht so :)
 
Nein ist es wirklich nicht, gibt genug Idioten, die IPC mit Spielen messen... Und wenn man Ihnen dann erklärt was IPC ist, kommt aber bei x GHz ist CPU A schneller als B mit y GHz. Und wenn man denen dann auch noch klar macht was das für ein Bullshit ist, kommt nur ein "Aber es weiß ja jeder was gemeint ist".
 
Zurück
Oben Unten