News PDF zum Fastforward Project bestätigt AMDs Stacked-DRAM-Ambitionen

Nero24

Administrator
Teammitglied
Mitglied seit
01.07.2000
Beiträge
24.066
Renomée
10.446
  • BOINC Pentathlon 2019
  • BOINC Pentathlon 2020
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2021
Die Darstellung zeigt einen HSA-Prozessor, dem Stacked Memory für schnellen Speicherzugriff direkt neben das Die gepflanzt wurde. Das soll Latenzzeiten minimieren und die Transferrate massiv erhöhen, was insbesondere bei APUs wünschenswert ist, da sich hier nicht nur CPU und GPU die zur Verfügung stehende Bandbreite teilen müssen, bereits die schnellen GPUs alleine mit derzeit bis zu 512 Shaderprozessoren bringen herkömmliche externe Dual-Channel Speichersysteme an ihre Grenzen.
(…)

» Artikel lesen
 
Das DIE auf dem Bild ist auf jeden Fall der von Trinity bekannte.
 
...wobei das aber natürlich überhaupt nichts aussagt, denn es wurden schon öfter irgendwelche Die-Bildchen für verschiedenstens verwendet.
 
Ich weiß, ist mir nur aufgefallen, es ist eben keine unbekannte Struktur aus der man jetzt irgendwas ableiten könnte.
 
Kann sich auch auf kommende ARM Derivate beziehen.
HSA heißt ja nicht, dass es X86 sein muss, und auch nicht zwingend eine APU.

Interessant ist auch, dass HBM schematisch neben die CPU/APU platziert wird. Wenn das in der Realität so umgesetzt würde, dann entspräche es dem Konzept von Intels integrierter GPU (in höchster Ausbaustufe) oder dem, was AMD früher in einigen Konsolen getan hatte. Im Prinzip nicht verkehrt, aber die hohe Bandbreite müsste dann auf dem Trägermaterial zu den HBM Modulen geführt werden. Ich hatte es bisher anders verstanden (vielleicht falsch), und zwar dass die HBM Module oberhalb der APU liegen sollen mit dem Nachteil der höheren Wärmedichte.
MfG
 
Wenn man das Bild genau nehmen würde, wäre das ja sogar ein stacked trinity ... ;D
Denn der selbe Die shot ist ja gleich nochmal drunter für Netzwerk etc.
 
Verstehe ich das richtig, dass auf der APU nicht nur CPU + L1/2/3 Cache sitzt sondern auch bei der GEN APU Speicher von sagen wir z.B. 8 GB die schneller als DDR3 RAM angebunden sind und dieser für z.B. die GPU genutzt werden können um insgesamt mehr Leistung zu haben? (Mehr FPS also bessere Auslastung der GPU in der APU)
 
Werden wohl weniger 8GByte sein als 8GBit. Alles andere dürfte zu groß und zu teuer sein. Sieht man ja bei Intel, was die bei ihrem Iris Pro für einen Aufschlag verlangen. Und das sind nur 128MB. Die CPU wird allerdings kaum davon profitieren. Die GPU schon eher.
 
@hoschi_tux
OK. Dann habe ich das also richtig verstanden. Also irgendwas ab von 32 MB rein für die GPU um damit insgesamt mehr heraus zu holen. Also so in etwa wie bei der XOne. Gut das wäre was.
 
Werden wohl weniger 8GByte sein als 8GBit. Alles andere dürfte zu groß und zu teuer sein. Sieht man ja bei Intel, was die bei ihrem Iris Pro für einen Aufschlag verlangen. Und das sind nur 128MB. Die CPU wird allerdings kaum davon profitieren. Die GPU schon eher.


intel nutzt aber keinen stapelspeicher. es sollten schon mehr als 128mb sein.
am besten als teilweiser ram-ersatz. bei 8gbyte, könnte man im notebook auf extra ramriegel verzichten.
schon relativiert sich das mit den kosten. ...auf´s system bezogen.
 
Werden wohl weniger 8GByte sein als 8GBit.
Also irgendwas ab von 32 MB rein für die GPU um damit insgesamt mehr heraus zu holen. Also so in etwa wie bei der XOne. Gut das wäre was.
Hynix legt nahe, das es 4GBit HBM Stacks sind, und nach der Präsentation vom Februar her zeigt 4/8 HBM DRAM Stack womit dennoch 2/4 GByte möglich wäre. Mit 8 Die hohen Stacks sind sogar 8GByte möglich nur im Moment nicht verfügbar.
 
Zuletzt bearbeitet:
@ONH
Also doch was vernünftigeres. 2 GB oder 4 GB sollten dann für so knapp 1080p bis gute Spielbar in 1080p reichen.

Wie war das noch mal? 4 Gbit sind .... das dann durch 8 und dann durch 1.000 sind dann MB oder? Kannst du mir das bitte noch mal aufschreiben weil ich da gerade auf dem Schlauch stehe und mich frage wie man da auf die 2 oder 4 Gigabyte kommt? Danke.
 
Klar, 8 Bit = 1 Byte. Er meint, pro Stack sind 4 oder gar 8 GBit möglich (wie alle einzelnen Speicherbausteine wird das eben in Bits angegeben). Die Frage ist, wieviele Stacks man davon auf einem Die oder Package unterkriegt bzw. verbauen will (ist ja ne Kosten-/Nutzen-Rechnung). Auf jeden Fall wird es ohne zusätzliche RAM-Slots auf dem Mainboard sicher nicht gehen, man kann den Kunden ja nicht sagen "hier habt Ihr eine tolle APU, die ganz viele Sachen gleichzeitig rechnen kann, aber bitte kommt mit den läppischen 8 GB aus, die wir Euch erlauben", gerade wenn CPU und GPU sich den Platz teilen müssen. Wenn also eh RAM dazugesteckt werden muß, dann wird der auf dem Package verbaute wohl eher relativ klein sein, also bestimmt keien 8 GB, sondern eher so ähnlich wie Intel nur 128 MB oder vielleicht 1 GB. Aber das ist ja auch alles skalierbar, d.h. die kleineren Varianten werden evtl. weniger Stacks bekommen, die teureren Varianten mehr (was ja nicht nur mehr Speicherplatz bedeutet, sondern auch mehr Bandbreite).
 
@OBrian
Soweit klar. Was ich mich frage wie kommt ONH da auf 2 oder 4 Gigabytes? Ist das so gemeint, dass ein Stack 500 MB hat und man kann 4 oder 8 Stacks zu je 500 MB drauf machen? Bei 4 hat man 2 Gigabytes und bei 8 hat man hat man halt 4 Gigabytes. Ist das so richtig?

Wenn ja dann sind 4Gigabits = 4.000.000.000 Bits und das dann durch 8 = 500.000.000 Bytes und das Ergebnis dann 2 Mal durch 1.000 und man hat 500 Megabytes. So kommt man dann auf die 2 oder 4 Gigabytes die ONH angibt würde ich sagen. Da war gestern wohl mein Denkfehler.
 
Zuletzt bearbeitet:
Hmm, wenn dann etwas Stacked RAM mit dabei ist und man (natürlich) noch normalen DDR3/4 RAM dazu Steckt wird aus dem Stacked RAM doch mehr oder weniger eine Art L3 Cache, oder?


Ist halt die Frage ab welcher Größe sich der Stacked RAM überhaupt lohnt.
Um den Flaschenhals in 3D Games zu eliminieren sollten es mindestens 2GB sein (Texturen, Bildspeicher ect.) Ist halt die frage ob AMD das will, da es Teuer ist und wer wirklich viel Spielt wohl eher ne richtige 3D Karte dazu steckt.
Bei Anwendungen sollten 512MB schon eher genug sein.
 
Anwendungen sind in der Regel eher latenzkritisch als bandbreitenkritisch. Solange die Latenz bei HBM nicht sinkt ggü. DDR3, wird man da nicht viel merken. Aber da lasse ich mich überraschen.
 
Wir wissen ja, Kaveri besitzt einen Quadchannel, zwei sind aber deaktiviert.
http://www.hardwareluxx.de/index.ph...nnel-speichercontroller-mit-gddr5-option.html

Da oben erwähnt wird, dass im Bild ein Trinity Die zu sehen ist, kann man eventuell annehmen, dass man bereits seit Trinty an eine HBM Integration arbeitet ?
Kann es sein dass AMD ursprünglich sogar bei Kaveri bereits HBM + DDR3 einführen wollte und sogar deshalb Richland noch zwischengeschoben hat um auf HBM zu warten?
Eventuell war die Technologie bei Einführung von Kaveri immer noch nicht verfügbar und man hat HBM dann auf Carrizo verschoben ?
Also ich würde HBM noch nicht so schnell abschreiben, denn wir wissen nicht mal, ob AMD nicht schon früher vor hatte, HBM zu integrieren. Und was Notebooks angeht, wir haben hier eine Limitierung der TDP auf 35 watt. HBM würde hier deshalb keinen Sinn machen, weil die DDR3 2133 sowieso die GPU "kaum" limitiert, dazu bräuchte AMD eher zuerst einen besseren Prozess der der GPU noch höhere Taktraten erlaubt. Anders bei den fetten Desktop Prozessoren, wo die GPU klar limitiert wird, hier wird doch HBM momentan doch erst interessant, weil man hier eine TDP von 95 hat.

Besonders die 65-95 watt tdp APUs mit HBM kann für AMD wichtig sein, kann man dann OEM kleine "Gaming" APUs verkaufen und könnte so gegenüber Intel/NV Kombis Marktanteile gewinnen.

hier habt Ihr eine tolle APU, die ganz viele Sachen gleichzeitig rechnen kann, aber bitte kommt mit den läppischen 8 GB aus, die wir Euch erlauben
Naja, bei einem Tablet oder Notebook mit passenden Preis kann man sich das durchaus erlauben, insofern das dann mit der Wartung passt.
 
Zuletzt bearbeitet:
Besonders die 65-95 watt tdp APUs mit HBM kann für AMD wichtig sein, kann man dann OEM kleine "Gaming" APUs verkaufen und könnte so gegenüber Intel/NV Kombis Marktanteile gewinnen.

erwartet doch nicht das unmögliche von AMD. HBM macht nur Sinn mit entsprechen viel Grafikleistung also mindestens 512+ shadern und die brauchen nunmal mindestens ~50W.
Ein entsprechend getakteter 2 Moduler wird auch nochmal mindestens 40W brauchen und dann sind die 65W schon lange überschritten.

Ein Paar mehr shader oder Module wären auch nicht schlecht. Also auf eine 150W TDP 3 Modul APU mit 1024 shadern und HBM würde ich sofort kaufen nur ist da dann wieder die Frage, welches Board, denn da hat sich AMD blöderweise gedacht maximal 95W TDP.... Eine APU ist nunmal nicht nur eine CPU sondern auch eine potentere GPU. Und die brauchen beide nun mal Leistung.

Von einer 65 oder gar einer 40W APU zu träumen, die mit Intel den Boden wischt ist bis 2016, wenn dann mal wieder etwa Fertigungsgleichstand (?) herrscht reines Wunschdenken.

Und auch bei Notebooks würde es mMn. eher Sinn ergeben eine größere APU zu verbauen und diese Per BIOS auf eine niedriger TDP im Akkubetrieb runter zu regeln/limitieren. In so einer Konfiguration kann dann auch HBM etwas bringen.
 
Und was Notebooks angeht, wir haben hier eine Limitierung der TDP auf 35 watt. HBM würde hier deshalb keinen Sinn machen, weil die DDR3 2133 sowieso die GPU "kaum" limitiert, dazu bräuchte AMD eher zuerst einen besseren Prozess der der GPU noch höhere Taktraten erlaubt.

gerade der gpu-teil wird massiv durch den ram eingebremst. im notebook würde der stapelspeicher extrem sinn machen,
da hiermit spieletaugliche geräte ohne extra gpu möglich wären. ...allerdings nicht mit 35 watt tdp.
aber warum sollte eine spieletaugliche apu nicht mit 65 watt tdp spezifiziert werden, noch dazu als soc ?
 
Wieso werden in OEM PCs immer 65 watt tdp APUs von AMD verbaut ? Wieso gibt es nur 35 watt tdp Modelle bei den mobilen APUs ?
Der Gurnd ist einfach, weil die OEM wenn es um AMD geht, immer gerne bei der Kühlung sparen. Wieviele 45 watt tdp AMD Phenom II Notebook gab es denn ?
Somit ja jeder hier im Forum wird sich denken, ja wieso nicht wie Intel ein 47 tdp Modell mit potenter IGP ect. Aber die Erfahrung zeigt, es wird keine verbauen, wenn es nicht ein passendes Intel Modell in gewissen "Preis-Klassen" gibt und AMD ist leider für OEM oft eher die billig Modelle.

Somit macht HBM mit 28 nm für Notebooks keinen Sinn, weil hier die DDR3 2133 nicht limitieren, da die 65-95 Watt tdp Desktop Modelle es aufzeigen.
Und was die 100 watt tdp angeht. Hier ist sicherlich nicht die GPU der Part, der die TDP so "ausreizt" sondern die CPU. Man könnte die GPU sicherlich noch höher Takten, nur hat man davon wegen DDR3 Speicheranbindung nichts. Auch eine 65 watt tdp Variante, könnte man mit HBM noch viel rausholen, weil man ja sieht, dass der Takt der GPU bei den 95, 65 watt tdp Modelle immer die 720 Mhz betragen und wir kaum einen Unterschied zwischen 384 und 512 sehen.
Also ein Excavator mit 65 watt tdp und HBM wäre genau das, womit AMD sich bei OEM interessant machen könnte, weil man hier billige Fertig PC mit Grafikperformance anbieten könnte. Man muss sich nur aus seiner Seifenblase befreien und klar machen, was bei Media Markt, Saturn und Co alles als Gaming PC durchgehen lässt.
 
Der Großteil der TDP fällt aber beim CPU Part ab, die GPU ist allerdings der Bandbreitenfresser.
Es wäre also kein Problem die Speicherbandbreit auch im geringeren TDP Bereich so auszureizen das man vom HBM profitieren würde.
CPU Takt runter, GPU aufgebohrt und ab geht die Post.
 
AMD reserviert beim Kaveri (95W) 47W für den GPU-Teil - klingt nicht nach viel, aber der Rest steht nicht nur dem CPU-Teil zur Verfügung sondern muss auch für den Rest reichen (Crossbar, Memory-Controller, PCIe-Root-Complex ....) somit hat AMD bei Kaveri den Großteil bei Grafik und nicht wie sompe schreibt bei CPU ....

Einzig beim geplanten 3Moduler soll(te) eine Verschiebung in Richtung CPU passieren ...
 
Quelle?
Es mag ja vielleicht sein das die Hälfte dafür reserviert ist aber meiner praktischen Erfahrung nach kommt bei der Auslastung der GPU deutlich weniger bei rum wärend man mit der Auslastung der CPU schon recht nahe an das Limit ran kommt.....Turbo sei Dank.
 
Zurück
Oben Unten