AMDs "Excavator" - 4. Modul Generation Spekulation

Wenn HBM dann bestimmt nicht im FM2+-Gehäuse sondern nur embedded ;D.
 
hmm, ist nicht gesagt. Es wird sicher nicht so wahnsinnig viel sein, über die normalen RAM-Steckplätze kann man dann noch was dazustecken, und insgesamt einfach mehr Bandbreite realisieren. Wenn es RAM on-die gibt, dann wird das sicher immer die gleiche Menge sein, bestenfalls gibt es zwei Varianten, aber damit deckt man natürlich nie alle Bedürfnisse ab. Manche brauchen wenig RAM und müssen unbedingt auf Kosten achten, andere wollen besonders viel RAM (und sei es nur als Verkaufsargument). Also wird es ganz sicher eine zweigleisige Lösung (d.h. mit zusätzlichen Steckmodulen) geben müssen. Technisch gibt es ja keinen Grund, warum das auf FM2+ nicht ginge. Kann aber sein, daß das im Zuge der Umstellung auf DDR4 kommt, was ja eh einen neuen Sockel erfordert.
 
HBM 1. Generation ist AFAIK nur 4 GB. Das reicht für embedded.
Und nein, man kann keinen RAM dazustecken, das ist kein Cache.
Carrizo embedded mit Stacked-RAM ist ein separates Die, muss ja auch so sein bei HBM. Es gibt also zwei oder drei Dies von Carrizo, nicht wie bei Kaveri nur eins - wenn das denn dann stimmt mit Carrizo @HBM.
 
Zuletzt bearbeitet:
Die Interfaces für HBM und DDR3/4 werden sich aber sehr deutlich unterscheiden, so dass ein Kombi-Interface kaum machbar ist. Also müsste man entweder beide dediziert verbauen oder zwei verschiedene Dies entwerfen.

Thema "Riegel dazustecken": Und wie wird der HBM dann in die Hierarchie eingebunden? Als L3/4-Cache?

Edit: zu spät.
 
Warum sollte es so unmöglich sein HBM als Grundspeicher und DDR3/4 als erweiterten Speicher mit unterschiedlichen Speichercontrollern parallel nutzbar zu machen?
Die interne GPU würde sich über die Bandbreite freuen und würde dem HSA Konzept sicherlich auch zugute kommen. Schon heute verhungert die interne GPU im Spielesektor an der mageren Speicherbandbreite und auch mit DDR4 Speicher ist vermutlich nicht allso viel mehr Spielraum drin. Die Limitierung wäre bei schnelleren GPUs absehbar und mehr Speicherkanäle benötigen mehr Platz und erzeugen höhere Kosten. Man säße aso wieder in einer Sackgasse.
 
Warum unterschiedliche Speichercontroller? HSA kann externen Speicher einbinden als hUMA.....wie das mit Servertechnologie machbar ist. Lokaler schneller Speicher kann für die GPU in hUMA bevorzugt angesprochen werden.

Edit: Dann machen vielleicht auch die diskreten GPUs in APU-Notebooks Sinn... ;)
 
Zuletzt bearbeitet:
Unterschiedliche Speichercontroller weil unterschiedliche Speichertypen. Das bedeutet ja noch lange nicht das man den Speicher nicht gemeinsam nutzen kann, wäre dies nicht der Fall dann würde auch Dualchannel und Co nicht funktionieren. Unter dem Strich ist das wohl nur eine Frage der Ansteuerungslogik.
 
HBM 1. Generation ist AFAIK nur 4 GB. Das reicht für embedded.

Das reicht nicht nur für embedded, das reicht für die meisten Windows PCs und Notebooks.
Gäbe in der "Billig Klasse" dann wohl auch einige Geräte ohne weitere Speichersockel und sehr günstige Mainboards.
HBM 2. Generation arbeitet ja schon mit 16 GB. Das würde dann nur noch wenig Anwendungsfälle lassen, bei denen noch mehr RAM benötigt wird.
Den über Sockel erweiterterten "langsamen" Ram könnte man gut als Ramdisk nutzen.
 
Das reicht nicht nur für embedded, das reicht für die meisten Windows PCs und Notebooks.
Gäbe in der "Billig Klasse" dann wohl auch einige Geräte ohne weitere Speichersockel und sehr günstige Mainboards.
HBM 2. Generation arbeitet ja schon mit 16 GB. Das würde dann nur noch wenig Anwendungsfälle lassen, bei denen noch mehr RAM benötigt wird.
Den über Sockel erweiterterten "langsamen" Ram könnte man gut als Ramdisk nutzen.

klingt prima! ...aber passt das alles auf den sockel fm2+ ?
 
Wenn man dann noch die TDP grenze von <100W auf 150-200W erhöht (für die Topmodelle) und ein Modul mehr einbaut, wäre das perfekt.

Denn erst da können die APUs ihre stärke ausspielen und sich auch klar von intel absetzten.

E1: Also 150W für eine APU und nicht so ein 5GHz FX9 den keiner braucht

E: @Alter Sack:
HBM und FM2+ dürften sich theoretisch nicht widersprechen, die CPU bräuchte nur einen weiteren Speichercontroller für HBM. Einzig das Management des Speichers könnte zu einem Problem werden, denn es gibt dann ja zwei verschieden schnelle Speicherbereiche. Und das würde Anpassungen am OS bedeuten.
 
Zuletzt bearbeitet:
Wenn man dann noch die TDP grenze von <100W auf 150-200W erhöht (für die Topmodelle) und ein Modul mehr einbaut, wäre das perfekt.
Denn erst da können die APUs ihre stärke ausspielen und sich auch klar von intel absetzten.
Gegen welche Intel? Die APUs leiden eher unter schwacher Speicherperformance, zumindest solange sie keinen aufgelöteten Cache am zweiten Speicherkontroller hängen haben.
Zwei Kerne mehr kann auch Intel in ihre Sockel 1150-CPUs einbauen. Das kanabalisiert dann die teureren Plattformen im Haus, hält aber AMD gut in Schach.
 
Gegen welche Intel? Die APUs leiden eher unter schwacher Speicherperformance, zumindest solange sie keinen aufgelöteten Cache am zweiten Speicherkontroller hängen haben.
Zwei Kerne mehr kann auch Intel in ihre Sockel 1150-CPUs einbauen. Das kanabalisiert dann die teureren Plattformen im Haus, hält aber AMD gut in Schach.

Das HBM mit an Bord sein soll dachte ich wäre klar und in dem "dann" beinhaltet, etwas unverständlich im nachhinein.

Betrachten wir es mal ganz nüchtern, was spricht für eine APU außer ein zweit PC?

Fürs richtige Zocken ist die GPU etwas zu schwach. (Hab selber einen 6800K und es könnte etwas mehr GPU power sein)
Für Office und Filme ist sie zu stark.
Verbrauch hängt hinter einem Intel (Fertigungstechnisch)
Preislich wildert ein 7850K in i5 regionen
HSA das alles Ändern könnte lässt leider noch auch sich warten.

Unterm strich sind es aktuell nur CPUs für Casual gamer und/oder "fanboys" (ohne jetzt nen shitstorm lostreten zu wollen) Es sind interessante Produkte, aber sie können sich einfach nicht von Intel absetzen und ihren eigenen Markt bedienen.

Wenn man allerdings das Topmodell für sagen wir mal 180€ anbieten kann, mit 4GB HBM RAM, einer 7790-7850 (260x) GPU und einem FX6 bei 150W TDP würde man damit nicht nur die Casual gamer sondern auch mainstream gamer gewinnen. Damit wäre ein Leistungsfähiger, kompakter Gaming Rechner für 300-350€ machbar.

Sollte Excavator allerdings in 20nm kommen, könnte das natürlich anders aussehen, in 28nm glaube ich aber nicht an riesen Effizienzsprünge um sich entsprechend absetzen zu können.
 
Sollte Excavator allerdings in 20nm kommen, könnte das natürlich anders aussehen, in 28nm glaube ich aber nicht an riesen Effizienzsprünge um sich entsprechend absetzen zu können.
Carrizo könnte bedingt durch eine neue Grafikarchitektur ("GCN2.0") auch auf gleicher Fertigung einen signifikanten Effizienzsprung verzeichnen. Bzgl. Excavator sind dagegen in den letzten 4-8 Wochen keine neuen Spekulationen hinzugekommen...(?).
 
Wenn man dann noch die TDP grenze von <100W auf 150-200W erhöht (für die Topmodelle) und ein Modul mehr einbaut, wäre das perfekt.

Denn erst da können die APUs ihre stärke ausspielen und sich auch klar von intel absetzten.

E1: Also 150W für eine APU und nicht so ein 5GHz FX9 den keiner braucht

E: @Alter Sack:
HBM und FM2+ dürften sich theoretisch nicht widersprechen, die CPU bräuchte nur einen weiteren Speichercontroller für HBM. Einzig das Management des Speichers könnte zu einem Problem werden, denn es gibt dann ja zwei verschieden schnelle Speicherbereiche. Und das würde Anpassungen am OS bedeuten.


meinte das im hinblick auf ein mögliches platzproblem bzgl. eines speicherstapels auf dem APU-gehäuse neben dem DIE.
wieviel fläche würde ein solcher stapel wohl benötigen ?
 
HBM und FM2+ dürften sich theoretisch nicht widersprechen, die CPU bräuchte nur einen weiteren Speichercontroller für HBM. Einzig das Management des Speichers könnte zu einem Problem werden, denn es gibt dann ja zwei verschieden schnelle Speicherbereiche. Und das würde Anpassungen am OS bedeuten.

HBM dann als grosser L3 gegenüber dem OS sollte dann doch passen.

wieviel fläche würde ein solcher stapel wohl benötigen ?
Anscheinend kann man HBM schon kaufen, mit 1Gb aber zum Platzbedarf findet man bisher nix ausser 5mKGSD.
 
Ich denke das die Form wichtiger als die Fläche an sich wäre. Ich rechne zwar damit das er wegen DDR4 so oder so einen neuen Sockel bekommt aber die derzeitige Bauform des Sockels/Gehäuses könnte gegenüber der von Intel einen gewissen Vorteil haben. Sofern an der Stelle keine zusätzliche Kühlung nötig ist könnte die Trägerplatte ein gewisses Stück über den Sockelrand hinaus ragen. Platz für den zusätzlichen Speicher
 
Vielleicht könnte ein Mod die Beiträge ab #674 in den neuen Carrizo-Thread verschieben.
Danke.
 
Ein paar neue Infos zu Excavator und Carrizo von der nächsten ISSCC.

http://www.eetimes.com/document.asp?doc_id=1324643&page_number=2

AMD will disclose Carrizo, an integrated processor with its latest x86 core. The 28 nm chip measures 244.62 mm² and packs more than 3.1 billion transistors. Its new Excavator core is 23% smaller and uses 40% less power than AMD’s previous x86 core.

23% kleiner und 40% weniger Energie im selben Node hört sich erst mal recht beeindruckend an. Scheint der erste Prozessor von AMD mit HDL zu werden.

Da dürfte es umso ärgerlicher sein, dass es wohl weiterhin keine aktuellen 4-Moduler geben wird. Man stelle sich mal einen 4-Modul Excavator @ 4 GHz mit kleiner iGPU (128 Shader) in 95W TDP und <220 mm² für FM2+ vor. Der würde sicherlich eine ziemliche gute Alternative zu den Haswell i5/i7 darstellen, sowohl was Performance als auch Kosten betrifft.
 
Also genauso groß/klein wie Kaveri. Wurde die GPU aufgepumpt? Oder der MC für HBM? Irgendwo muss der Platz ja hin..
 
Die iGPU wird weiterhin 8 CUs haben. Zusätzliche Transistoren sind sicherlich in andere Verbesserungen geflossen. Wie Excavator, Speicherinterface, HSA, UVD/VCE, Stromsparmechanismen, etc. Zudem ist der FCH jetzt mit auf dem Die.
 
Kann der FCH mit auf den Die und dennoch FM2+ Sockel nutzen?
 
Man stelle sich mal einen 4-Modul Excavator @ 4 GHz mit kleiner iGPU
Sollen nicht nur max 65W Typen kommen? Kann also sein, dass die nur knapp über 3 GHz schaffen und darüber die Leistungsaufnahme überproportional steigt. Somit würden 100W Typen grad ein paar MHz mehr schaffen, dass es sich nicht lohnt die Frequenz hoch zu drehen.
Würde mich nicht wundern, wenn Carrizo kaum schneller, vielleicht sogar etwas langsamer als Kaveri/Richland wird, nur eben effizienter.

Die GPU wird doch der gleiche Typus wie bei Tonga? Ob der Mehrverbrauch an Fläche auch auf die Multitasking Fähigkeiten der GPU zurückzuführen ist?
 
Zuletzt bearbeitet:
Zurück
Oben Unten