AMDs "Excavator" - 4. Modul Generation Spekulation

Im mobilen Bereich sollte die bessere Effizienz sich auch im mehr Performance um münzen lassen bei gleicher TDP. Die Spekulation das im Desktop nur noch 65 Watt kommen halte ich auch für wahrscheinlich aber wann soll genau HBM kommen weil dann macht eine größer IGPU Sinn. DDR4 steht ja auch erst später auf der Agenda wenn ich das richtig in Erinnerung habe?
 
amdfanuwe schrieb:
Würde mich nicht wundern, wenn Excavator kaum schneller, vielleicht sogar etwas langsamer als Kaveri/Richland wird, nur eben effizienter.
Meinst du nicht eher Carrizo? Der Vergleich ist sonst unpassend, finde ich.
 
Hhhmmmm, so'n 6 Modul 4Ghz FX auf Excavator Basis zum einplöppen in AM3+ wär schon was...
 
Die iGPU wird weiterhin 8 CUs haben. Zusätzliche Transistoren sind sicherlich in andere Verbesserungen geflossen.
Warum glaubst du das? Könnte es nicht sein, dass mehr CUs mit HBM kommen? Das würde auch einen kleineren L2 Cache nicht so gravierend machen.
 
Excavator sollte doch was schneller sein wie Steamroller bei gleichem Takt.

Das nicht nicht gesagt. Durch die HDL kann man auch das eine oder andere Pünkten verlieren aber normalerweise sollte das eben durch andere Vorteile (abseits der Performance) überkomensiert werden.
 
Die HDL sollte nichts an der IPC ändern. Sie erhöht nur die Packdichte auf dem Die.

Durch verwenden der HDL ändert sich ja nichts an den Pipelines, ...

Einzig die Taktbarkeit des Designs kann unter HDL leiden oder ggf. sogar verbessert werden.
 
Warum glaubst du das? Könnte es nicht sein, dass mehr CUs mit HBM kommen? Das würde auch einen kleineren L2 Cache nicht so gravierend machen.
Die 8 CUs sind doch bereits bestätigt. HBM hingegen ist bisher nur Spekulation.
 
Ein nur halb so großer, dafür jedoch schneller arbeitender L2-Cache wäre in gewisser Weise auch schon ein Gewinn. Damals beim K8 hat man den Unterschied zwischen 512 kB und 1 MB pro Kern eigentlich oft auch kaum gemerkt.
 
Sollen nicht nur max 65W Typen kommen? Kann also sein, dass die nur knapp über 3 GHz schaffen und darüber die Leistungsaufnahme überproportional steigt.
Also ich bin da diesmal optimistisch. Von Richland (32nm SOI) auf Kaveri (28nm Bulk) war die Fertigung eine Unbekannte. Da konnte man nicht unbedingt mit mehr Takt rechnen, weil SOI bei hohen Taktraten sehr hilfreich ist, um Leckströme im Zaun zu halten. Diesmal bleibt es bei der 28nm Bulk Fertigung. Und die wird sicherlich nicht schlechter als bei Kaveri ausfallen. Man wird eventuell auch da optimiert haben, um mehr Takt pro Watt herauszubekommen. Auch nach oben hin und nicht nur bei Modellen unter 20W. Ich wüsste also nicht, warum man nicht auch mindestens 3,7 (4) GHz erreichen sollte. Vielleicht geht sogar mehr. Das bleibt abzuwarten. Mit den Verbesserungen sollte es möglich sein, das ganze nun in 65W statt 95W zu verpacken. Mit 40% Einsparung bei 95W käme man theoretisch auf 57W. Da die APU allerdings nicht nur aus Excavator besteht, ist sicherlich nicht mit 40% Einsparung für den gesamten Prozessor zu rechnen. Allerdings gibt's diese 95W bei Kaveri sowieso nur für K-Modelle. 3,5 (3,9) GHz schafft man auch dort schon in 65W. 200 (100) MHz mehr wäre also eine vergleichbar kleine Hürde. Ich denke, wenn Carrizo (Excavator) wirklich solche signifikanten Verbesserungen mitbringt, dann sollten sogar 4 (4,4) GHz wie bei Richland möglich sein. Bei entsprechend zusätzlicher IPC sollten dann mindestens 20-30% mehr Performance rausspringen. Gut möglich, dass man allerdings auf einen offenen Multiplikator verzichtet, um innerhalb der 65W TDP zu bleiben.

Mal schauen, ob auch die GPU Taktraten wieder etwas anziehen. 720 MHz für Kaveri war im Vergleich zu den 900 MHz von Richland um einiges weniger. Da konnte man es noch kompensieren, weil GCN pro Takt deutlich leistungsfähiger als die alte VLIW Architektur ist. Diesmal wäre mehr Takt allerdings wichtig, um auch der GPU ein deutliches Update zu verschaffen. Mehr CUs kommen voraussichtlich nicht vor 20/14nm.

Die GPU wird doch der gleiche Typus wie bei Tonga? Ob der Mehrverbrauch an Fläche auch auf die Multitasking Fähigkeiten der GPU zurückzuführen ist?
Da wird sicherlich einiges an zusätzlichem Transistorbudget gegenüber Kaveri gebraucht, zB für das leistungsfähigere GPU Frontend. Carrizo soll als erster HSA fähiger Prozessor ja auch preemptives Multitasking unterstützen.
 
was würde AMD dann noch davon abhalten wieder server Versionen mit Excavator zu bauen ?
20-30% mehr performance pro takt oder watt ?
 
was würde AMD dann noch davon abhalten wieder server Versionen mit Excavator zu bauen ?
ARM/K12. AMD scheint die Serverentwicklungen voll darauf auszurichten. Ein Excavator Serverdesign noch dazwischen zu schieben, würde zu viele Ressourcen fressen. Die hat AMD im Moment einfach nicht.

20-30% mehr performance pro takt oder watt ?
Pro Topmodell. Da ich aber bei gleichen Taktraten verglichen habe, kannst du es ruhig als Performance pro Takt interpretieren. Die Verbesserung pro Watt sollte dann höher ausfallen.
 
Die HDL sollte nichts an der IPC ändern. Sie erhöht nur die Packdichte auf dem Die.
(...)
Einzig die Taktbarkeit des Designs kann unter HDL leiden oder ggf. sogar verbessert werden.

Stimmt, bzgl. IPC war dies falsch von mir ausgedrückt. Das liegt wohl daran, dass IPC ein zu großen Teilen akademischer Wert ist, der eben ohne Takt nur von theoretischem Interesse ist.
Wie schon richtig gesagt wurde: Evt. verliert man durch die HDL etwas Taktpotential, u.U. kann aber auch dies durch Prozessverbesserungen überkomensiert werden.
 
was würde AMD dann noch davon abhalten wieder server Versionen mit Excavator zu bauen ?
Werden bestimmt kommen. Von Kaveri gibt es doch auch eine Servervariante, Berlin, oder wurde die gestrichen?

--- Update ---

Pro Topmodell. Da ich aber bei gleichen Taktraten verglichen habe, kannst du es ruhig als Performance pro Takt interpretieren. Die Verbesserung pro Watt sollte dann höher ausfallen.
Vorsicht, das nächste Gerücht heißt dann, Carrizo wird super schnell und alle sind enttäuscht, wenns doch nicht viel schneller als Kaveri wird, der ja auch nicht schneller als Richland ist.
Ich bezweifle, dass der 28nm Prozess 4GHz hergibt. Ein weiteres Problem ist dann immer noch die Speicherbandbreite, auch wenn die GPU was zulegen kann durch bessere Kompression.
 
Hhhmmmm, so'n 6 Modul 4Ghz FX auf Excavator Basis zum einplöppen in AM3+ wär schon was...

Frag doch einfach mal bei AMD nach, wieviel sowas als Custom design kösten würde, dann starte eine Kickstarter Kampagne und ich würd auch mitbestellen :D


Mal schauen, ob auch die GPU Taktraten wieder etwas anziehen. 720 MHz für Kaveri war im Vergleich zu den 900 MHz von Richland um einiges weniger. Da konnte man es noch kompensieren, weil GCN pro Takt deutlich leistungsfähiger als die alte VLIW Architektur ist. Diesmal wäre mehr Takt allerdings wichtig, um auch der GPU ein deutliches Update zu verschaffen. Mehr CUs kommen voraussichtlich nicht vor 20/14nmHBM.

Hab das mal für dich korrigiert. Denn er knackpunkt bei den APUs ist leider die Speicherbandbreite und nicht der Fertigungsprozess.

In 28nm wäre theoretisch auch eine APU mit 6 Kernen > 3,5Ghz, 16CUs (HD7850), 2GB HBM + DDR3 und 150W TDP möglich. Zwar nicht billig, aber die würde dann auch bei den großen CPUs "mitspielen". Problem ist nur der Sockel, denn FM2+ ist leider auf 95W begrenzt... keine Ahnung, warum AMD bei den APUs mit der TDP immer weiter nach unten geht, klar Effizienz und so, aber die stärke der APUs liegt auch in der GPU und die braucht halt auch Strom...
 
Mit HBM wird aber zunächst die größte Bremse gelöst. Damit dürfte die Effizienz eine ganze Ecke steigen, ohne dass man die TDP sprengt.
 
Frag doch einfach mal bei AMD nach, wieviel sowas als Custom design kösten würde, dann starte eine Kickstarter Kampagne und ich würd auch mitbestellen :D
In irgendeinem Podiumsgespräche meinte mal einer von AMD, dass die Chip-Entwicklung für die 100% Maschinen-Layout Chips, also z.B. die Konsolen, so um die 30 Mio. kostet. Hand-Layout kostet das 10fache.

Ist jetzt die große Frage, ob man die XBAR samt L3 und Hypertransport per Hand auf 28nm portieren muss, oder es schon maschinell geht. Ich würde mal sagen ... eher ersteres.
Von daher würde es wohl schön teuer werden.

Probierts mal lieber mit nem 3-Moduler für FM2, oder so ;-) Der war ja schon mal geplant, ergo sollte es für ~30 Mio machbar sein... und dann kämen ja nur noch die Produktionskosten bei GF dazu ;D
 
Und wenn der Chip dann mal aus der Produktion kommt, ist er total veraltet, da AMD und Intel bis dahin wieder was neues haben.
Also wenn schon ein eigener Chip, dann bitte was mit Zukunft und nicht nur altes aufgebläht.
 
Ist jetzt die große Frage, ob man die XBAR samt L3 und Hypertransport per Hand auf 28nm portieren muss, oder es schon maschinell geht. Ich würde mal sagen ... eher ersteres.

Was wenn CCN-508 verwendet wird, und die Cluster dann aus K12, Zen Kernen/Modulen bestehen. Da dürfte sich da von ARM viel Automatisiert Layouten lassen, ARM schaut eigentlich das ihre IP auf den Prozessen der grossen Foundries verwendet werden kann, dann dürft sich der Aufwand doch minimieren, AMD will ja sowieso nicht mehr alles selbst machen.

Edit:Excavator CPU dann müsste AMd nur Ht portieren.
 
Zuletzt bearbeitet:
Was wenn CCN-508 verwendet wird, und die Cluster dann aus K12, Zen Kernen/Modulen bestehen. Da dürfte sich da von ARM viel Automatisiert Layouten lassen, ARM schaut eigentlich das ihre IP auf den Prozessen der grossen Fundries verwendet werden kann, dann dürft sich der Aufwand doch minimieren, AMD will ja sowieso nicht mehr alles selbst machen.

Jojo, aber es ging ja gerade um Excavator@AM3+.
 
Hab das mal für dich korrigiert. Denn er knackpunkt bei den APUs ist leider die Speicherbandbreite und nicht der Fertigungsprozess.
Nee, das war schon richtig so, wie ich es geschrieben habe. Beides ist entscheidend. In 28nm wirst du aber nicht mehr als 8 CUs aufs Die bekommen, ohne die Grösse zu sprengen. Egal ob HBM verfügbar ist oder nicht. Ich denke mit ~250 mm² liegt AMD schon an der Obergrenze des wirtschaftlich akzeptablen. Und wie du sagst, da FM2+ auf 95W begrenzt ist, macht viel mehr sowieso wenig Sinn. Ich denke im Moment ist es sinnvoller, mit Taktupdates und HBM erst mal mehr aus den vorhandenen Shadern herauszuholen. Die liegt immer noch einiges an Potenzial brach.
 
Überraschung: Carrizo-L wird nicht auf Excavator, sondern auf Puma+ Kerne setzen. (Quelle: AMD, via Computerbase)

AMD schrieb:
The flagship "Carrizo" processor will integrate the new x86 CPU core codenamed "Excavator" with next generation AMD Radeon™ graphics in the world's first Heterogeneous Systems Architecture (HSA) 1.0 compliant SoC. The "Carrizo-L" SoC integrates the CPU codenamed "Puma+" with AMD Radeon™ R-Series GCN GPUs and is intended for mainstream configurations. In addition, an AMD Secure Processor will be integrated into the "Carrizo" and "Carrizo-L" APUs, enabling ARM®

Warum nun Kaveri doch nicht HSA 1.0-fähig ist, wenn Carrizo der erste HSA 1.0 Prozessor ist???? Das wirkt ja langsam wie in einem bekannten Theaterstück von Samuel Beckett....."Warten auf HSA" oder so ähnlich
Damit hat Carrizo-L in diesem Thread erstmal nichts mehr zu suchen.
Aber die Entscheidung, im Lowend auf die Katzen zu setzen, erscheint angesichts der Leistungswerte der Bulldozer-Nachfolger im Mobilbereich wirklich mehr als überfällig. Wenn allerdings Carrizo-L ein eigenes Die bekommt, dann darf über dessen Specs in anderen Threads neu spekuliert werden. Möglicherweise ist Carrizo-L dann Nolan...?
 
Zuletzt bearbeitet:
...Aber die Entscheidung, im Lowend auf die Katzen zu setzen, erscheint angesichts der Leistungswerte der Bulldozer-Nachfolger im Mobilbereich wirklich mehr als überfällig. Wenn allerdings Carrizo-L ein eigenes Die bekommt, dann darf über dessen Specs in anderen Threads neu spekuliert werden. Möglicherweise ist Carrizo-L dann Nolan...?

Carrizo-L könnte eine Variante von Beema mit Dual-Channel-Ram werden, die das gleiche Pinout zu erhalten scheint, wie Carrizo. Womöglich erhält der Carrizo-L dann auch mehr GPU. Carrizo's Die ist mit 250mm² etwa 2,5mal so groß wie der aktuelle Beema. Das Ganze zeigt, dass Carrizo nur das "Highend" von AMDs APUs darstellt und die Puma-APUs langsam das gesamte Mainstream-Segment übernehmen. Kostenmäßig nur sinnvoll.

UND: Für Carrizo spricht AMD nur von "mobile". Echte Performance-CPUs dürfte es damit vermutlich bald nicht mehr von AMD geben. Carrizo dürfte weitgehend auf Energieeffizienz getrimmt sein; "hohe" Takte dürften der Vergangenheit angehören.
 
Zurück
Oben Unten