AMD Zen - 14nm, 8 Kerne, 95W TDP & DDR4?

Fullspeed ist nicht der Punkt, der L3 an sich ist der Punkt ^^
Die APUs haben bekanntlich keinen L3 .. die 1MB L2 sind alles, was den 2 Kernchen eines Carrizo-Moduls bleiben ...
Man hat also maximal 16kB L1 und 1MB L2 pro Modul / 2 Threads
Ein Intel i3-Kern hat dagegen maximal 32kb L1 / 256kB L2 / 2MB L3.
Single-Threaded steht also nur die Hälfte von Intels 2 MB zur Verfügung (und die haben noch nen schnellen, kleinen L2 zusätzlich). Das wird definitiv IPC kosten.
AMDs großer L2 mag lahm und nur auf L3-Speed von Intel sein, aber im Vergleich zu nem Speicherzugriff ist das immer noch ~10x schneller.

Sorry, aber waren es nich 2x16kb L1 pro Modul ?
 
Zuletzt bearbeitet:
Dann zieht Haswell seine Linpack-Rekorde wohl vor allem aus dem Fused-Multiply-Add Befehl?
Wenn es nur 256 Bit Vektoren sind, kann man das getrost wie beim Bulldozer und Jaguar mit zwei 128er Teiloperationen lösen. Nicht optimal, nur wird es eben auch selten gebraucht.
 
Dann zieht Haswell seine Linpack-Rekorde wohl vor allem aus dem Fused-Multiply-Add Befehl?
Nicht unbedingt. FMA kann Bulldozer ja auch. Haswell hat im Vergleich zu BD/SB/IB einfach einen doppelt so hohen theoretischen Durchsatz.

Bulldozer pro Modul (2 Threads): 1x 256-bit FMA
SB/IB pro Kern (2 Threads): 1x 256-bit MUL + 1x 256-bit ADD
Haswell pro Kern (2 Threads): 2x 256-bit FMA

Wenn es nur 256 Bit Vektoren sind, kann man das getrost wie beim Bulldozer und Jaguar mit zwei 128er Teiloperationen lösen. Nicht optimal, nur wird es eben auch selten gebraucht.
Selten gebraucht würde ich nicht sagen. Im Moment vielleicht schon. Früher oder später wird SSE aber von AVX abgelöst. So wie x87/MMX/3DNow! einst von SSE abgelöst wurde. AVX vereinfacht die Umstellung auch deutlich besser als das SSE konnte. Und dann sollte man eben auch eine optimale AVX Implementierung haben. Und das heisst, die FP Pipeline sollte nativ 256-bit verarbeiten können. Lediglich die Notwendig von 512-bit sehe ich im Moment nicht, da wir dann bereits über typischen 4-fach Vektoren mit doppelter Genauigkeit liegen, was bei typischen Client Apps selten gebraucht wird. Wenn so viel FP Performance notwendig ist, dann parallelisiert man es besser mittels GPU. Die kann das wesentlich besser. Intel hat die AVX Spezifikation ja auch nur aufgrund ihrer Tera Scale Architektur auf 512-bit erweitert (Larrabee -> Xeon Phi). Für Client Prozessoren erscheint mir das einfach überdimensioniert.
 
Zen ohne die AMD-eigenen Instruktionen (Sätze) TBM (Trailing Bit Manipulation), FMA4, XOP und LWP (LightWeight Profiling)? Überrascht mich doch etwas... Annäherung an Intel? Nach Wegfall von schon 3DNow! doch wieder einheitliche x86-Instruktions-Sätze? Schlecht wärs nicht.
 
Im Patchcode steht:
+ { "CPU_ZNVER1_FLAGS",
+ "Cpu186|Cpu286|Cpu386|Cpu486|Cpu586|Cpu686|CpuSYSCALL|CpuRdtscp|Cpu387|Cpu687|CpuFISTTP|CpuNop|CpuMMX|CpuSSE|CpuSSE2|CpuSSE3|CpuSSE4a|CpuABM|CpuLM|CpuFMA|CpuFMA4|CpuBMI|CpuF16C|CpuCX16|CpuClflush|CpuSSSE3|CpuSVME|CpuSSE4_1|CpuSSE4_2|CpuAES|CpuAVX|CpuPCLMUL|CpuLZCNT|CpuPRFCHW|CpuXsave|CpuXsaveopt|CpuFSGSBase|CpuAVX2|CpuMovbe|CpuBMI2|CpuRdRnd|CpuADX|CpuRdSeed|CpuSMAP|CpuSHA|CpuXSAVEC|CpuXSAVES|CpuClflushOpt|CpuCLZERO" },
Aber möglicherweise nur vergessen ... im Patchtext steht ja, dass es wegfällt.
AVX2 ist also auch dabei .. genauso wie SSE4a .. merkwürdig, dass sie das nicht auch streichen...

@Helle53:
Naja, was will AMD machen .. sie sind ein kleines Licht. Hat überhaupt irgendwer LWP benutzt?
 
Vielleicht auch ein Stück weit Resignation. Wozu Geld in etwas investieren was eh nicht genutzt wird, was ich eher als schlechtes Zeichen für den x86er Bereich ansehe.
 
Naja, das ist ein Stück weit Evolution - natürliche Auslese. Was da noch über ist, wir vielleicht noch bei Intel überlegt irgendwann doch zu unterstützen. Und man muss ja auch nicht immer das Rad neu erfinden - AMD64 war eine Spitzenleistung, und jetzt im Moment hat AMD die ganzen Low-Level-Grafik-APIs ins Rollen gebracht. Ich denke die täten wirklich gut daran, anstatt irgendwelcher Spielereien, einfach mal wieder eine Intel-Killer-CPU zu designen, mit starken ALUs und FPUs und einer Menge Kernen zum Beispiel ...
 
Sie täten gut daran ein Produkt zu designen, dass sich gut verkaufen lässt und einen guten Gewinn erwirtschaftet.
Dass das eine Intel-Killer-CPU sein wird, bezweifle ich.
Da ist der Markt für ein paar High End CPUs zu klein.
 
Ich denke die täten wirklich gut daran, anstatt irgendwelcher Spielereien, einfach mal wieder eine Intel-Killer-CPU zu designen, mit starken ALUs und FPUs und einer Menge Kernen zum Beispiel ...

Hilfreich wäre es, wenn die bestehenden Chips in halbwegs brauchbaren Produkten wiederzufinden wären.
 
Vielleicht auch ein Stück weit Resignation. Wozu Geld in etwas investieren was eh nicht genutzt wird, was ich eher als schlechtes Zeichen für den x86er Bereich ansehe.

Na ja, vieles geht ja in avx2 auf, wäre also redundant.
Macht schon Sinn das (Einzelfeature) dann zu Streichen, wenn man denn avx2 komplett unterstützt.
Man darf gespannt sein.
Sie müssen auf jeden Fall irgendwie in den Markt kommen, so wie jetzt geht das doch nicht weiter.
Kommt noch soweit, das man vorher bei Intel um Erlaubnis fragen muss, oder was?
Ist doch krank. :]
 
Nicht unbedingt. FMA kann Bulldozer ja auch. Haswell hat im Vergleich zu BD/SB/IB einfach einen doppelt so hohen theoretischen Durchsatz.

Bulldozer pro Modul (2 Threads): 1x 256-bit FMA
SB/IB pro Kern (2 Threads): 1x 256-bit MUL + 1x 256-bit ADD
Haswell pro Kern (2 Threads): 2x 256-bit FMA
Bezieht sich der Durchsatz nicht CPU intern, das würde zumindest erklären warum die meisten Benchmarks wenig Speicher nutzen und nur ein kurze Laufzeit haben. *buck*
 
Ich hoffe das der Zen ein neuer Athlon64 wird wie damals im Jahre 2000.
Aber immerhin schaut es daweil gut aus.
Was ich mir wünschen würde wäre eine APU mit ZEN also 10/20 und eine R9390Xm auf einem DIA :)
Da sollte sich die 300Watt ausgehen :)
Naja warten und hoffen das die neue Architektur eine Bombe wird.
 
Wird mal wieder Zeit für ein bischen Werbung:

 
Sehr nettes Video. Sowas gehört ins Fernsehen.
 
Ich hoffe das der Zen ein neuer Athlon64 wird wie damals im Jahre 2000.
Ich hoffe nicht, dass es so laufen wird wie beim Athlon 64! Im Jahr 2000 war der neue Kern (damals noch nur unter dem Codenamen "Hammer" bekannt) ein reiner Papiertiger. Angekündigt und hochgelobt, aber um Jahre verspätet. Erst 2003 (!!!) kam er dann endlich auf den Markt, mehr als 2 Jahre verspätet und trotzdem noch ein voller Erfolg. Nicht auszudenken, die der Hammer eingeschlagen hätte wenn er pünktlich gekommen wäre :o Insofern hoffe ich, dass Zen pünktlich kommt und es NICHT so macht, wie der Hammer.
 
Ich hoffe nicht, dass es so laufen wird wie beim Athlon 64! Im Jahr 2000 war der neue Kern (damals noch nur unter dem Codenamen "Hammer" bekannt) ein reiner Papiertiger. Angekündigt und hochgelobt, aber um Jahre verspätet.
Um ein Papiertiger zu sein, hätte die CPU für diese Zeit angekündigt sein müssen. Was angekündigt und veröffentlich wurde, war die Architektur.

Dass man so frühzeitig damit öffentlich ging, dürfte zum einem dem Marktdruck geschuldet gewesen sein. Sonst hätte man IA64 so lange das Feld überlassen. Und zum anderen ließ sich nur so die notwendige Infrastruktur dafür aufbauen. AMD war ja auf weitere Hardware-Entwickler ebenso angewiesen wie auf die nötige Software.
 
Mag so sein wie Du sagst. Ich bezog mich auf die Aussage Maksos, dass der Zen so gut werden solle, wie der Athlon64 im Jahr 2000 war. Und im Jahr 2000 gab's eben noch keinen Athlon64! Auch 2001 nicht, und 2002 nicht. Erst 2003 kam er mit reichlich Verspätung auf den Markt.

Ok, dann müsste die Aussage dahingehend geändert werden, dass die Zen-Architektur so gut wie die K8-Architektur 2000 werden soll. Die Fachpresse hatte sich damals ja mit Lob und Begeisterung kaum zurück gehalten. Dann muss nur noch die fertige Hardware vom Zen ebenso einschlagen. ;D
 
Ich denke die täten wirklich gut daran, anstatt irgendwelcher Spielereien, einfach mal wieder eine Intel-Killer-CPU zu designen, mit starken ALUs und FPUs und einer Menge Kernen zum Beispiel ...
So schlecht finde ich den Bulldozer und Konsorten gar nicht. Klar, es ist keine Killer-CPU. Aber mit der richtigen Fertigungstechnologie wären die bestimmt mehr als wettbewerbsfähig. Mit 32nm kann man halt schlecht gegen 22nm oder gar 14nm antreten.
 
Najam BD versagt schon gegen Sandy Bridge und die waren auch noch 32nm.
 
Najam BD versagt schon gegen Sandy Bridge und die waren auch noch 32nm.
Versagt wobei? Bei der Erektion? Dass sich heutzutage noch jemand an solchen Fanboy Beiträgen versucht...seltsam.
 
Zurück
Oben Unten