AMD Interposer Strategie - Zen, Fiji, HBM und Logic ICs

Complicated · 23.05.2015

AMD hat eine Abkehr von dem "Fusion"-Konzept angekündigt, welches zuvor mit der Einführung der ersten APUs, CPU und GPU auf einem einzigen Chip, der 2011 der Öffentlichkeit vorgestellt wurde. Dieses Konzept scheint an ein Limit gelangt zu sein, welches AMD nun seine Strategie beim grundsätzlichen Aufbau einer CPU/APU/GPU ändern lässt.

Auf der diesjährigen Investoren-Tagung wurden erste Details dazu veröffentlicht, wie Planet3D berichtet hatte - hier nochmals die relevanten Folien als Übersicht:

Die Fragen die ich in diesem Thread gerne diskutieren würde betreffen die einzelnen Chip-Baugruppen. Welche davon wird AMD auslagern wie z.B. die Chipsätze, welche von ASMedia entwickelt und hergestellt werden. oder wie HBM-Speicher, der bei der in Kürze erscheinenden Fiji-GPU zum Einsatz kommen wird und der erste auf einem Interposer basierenden Chip ein wird im Zuge dieser Strategie.

Auf dieser Folie werden die Partner der Interposer-Technologie genannt mit UMC, Amkor und ASE.
UMC ist als Foundry bekannt, doch die beiden andere sind nicht so geläufig.
Amkor ist Partner von Globalfoundries bei der Zulieferkette für 2.5 Stacking Technologie:
ASE ist der weltweit größte "assembly and test service Provider" was soviel wie ein Dienstleister rund um Zusammenbau und Tests von Halbleitern ist.

Weiterhin ist von großem Interesse wie nun AMD mit dieser Technik die Komponenten aufteilt und in welchem Fertigungsprozess diese produziert werden, bevor sie auf den Interposer kommen.

Sehr interessante und ausführliche technische Keynote zu Die-Stacking - Danke an amdfanuwe für die Quelle:
http://www.microarch.org/micro46/files/keynote1.pdf

Kosten des Interposers bei der Herstellung:
Da es passive Interposer sind, sind die Kosten überschaubar. Das ist simples Silizium von einem Wafer ohne wirklich komplizierte Strukturen:
http://electroiq.com/blog/2012/12/lifting-the-veil-on-silicon-interposer-pricing/

Der Interposer kostet pro 100mm² 1$
Der gesamte Wafer kostet gerade mal 500-650$

Weitere Quellen:
AMD TECHNICAL REPORT: Inter-device Communication and Sharing in Emerging Memory Systems
Challenges for Power, Signal, and Reliability Verification on 3D-IC/Silicon Interposer Designs
Patent von Altera für zusammengesetzte Interposer "Stiched Interposer"
Vergleich zwischen Silikon- und Polymer-Interposer
EETimes: Vergleich 2D vs 2.5D vs 3D ICs - Grundlagen zu Stacking Technologien

Bildquellen:

A 2.5D IC/SiP using a silicon interposer
and through-silicon vias (TSVs)

A simple “True 3D IC/SiP”

A more complex “True 3D IC/SiP”

Enabling Interposer-based Disintegration of Multi-Core Processors

Alter Sack · 23.05.2015

Bei jeweils einem Die für CPU, GPU und NB/SB-Funktionen, könnte man ein komplettes GPU-Die aus einer jeweils aktuellen Serie unterbringen.
@Fertigung z.B.: CPU/14nm, GPU/28nm und NB/SB in irgendwas zwischen 55 und 28nm? Wäre praktisch und flexibel.

amdfanuwe · 23.05.2015

Du solltest noch diese AMD Präsentation von 12-2013 hinzufügen:
http://www.microarch.org/micro46/files/keynote1.pdf
Seite 48 finde ich interessant.

FredD · 23.05.2015

Bedenkt man, wie lange schon am Stapeln von Silizium getüftelt wird, denke ich nicht, dass die Abkehr vom Fusion-Konzept Resultat einer erst neulichen Erkenntnis war.
Weitere Gründe absets des Fertigungsvorsprungs der Konkurrenz werden ja in der von amdfanuwe zitierten Präsentation ab S. 36 recht schön benannt:

• All similar technology components have been integrated such as Cache, FPU, MultiMedia, NB, GPU, SB, etc...
• Only disparate technologies such as DRAM, MEMS, True IVR, Storage, Optics are left

• Process scaling will to stop supporting diverse functionalities on a single die such as fast logic, low power logic, analog, and cache
• The single die will want to break into specialized components to maximize the value of new and existing process nodes

• Process complexity is increasing and yield is dropping as mask count increases
• Large die sizes will continue to have yield challenges
• Die partitioning is challenging and there is significant microarchitecture research

Konsequenterweise müssten auch die APUs mit dem gemeinsamen Speicherkontroller wieder aufbrechen, so dass CPU und GPU im jeweils besten geeigneten Prozess hergestellt werden. Der Speicherkontroller müsste dann Hauptbestandteil des (aktiven) Interposers werden.

TNT · 23.05.2015

Complicated schrieb:
AMD hat eine Abkehr von dem "Fusion"-Konzept angekündigt, welches zuvor mit der Einführung der ersten APUs, CPU und GPU auf einem einzigen Chip, der 2011 der Öffentlichkeit vorgestellt wurde. Dieses Konzept scheint an ein Limit gelangt zu sein, welches AMD nun seine Strategie beim grundsätzlichen Aufbau einer CPU/APU/GPU ändern lässt.....

Irgendwie eine komische Einleitung... Was hat Fusion mit dem Aufbau einer CPU/APU oder gar Interposern zu tun!?
Ich denke mal nicht, dass sich irgendetwas ausschliesst... oder !?

TNT

amdfanuwe · 23.05.2015

Diesen Artikel von Charlie Demerjian find ich auch noch interessant.:
https://semiaccurate.com/2015/05/19/amd-finally-talks-hbm-memory/
Bisher waren die Verbindungen der Komponenten untereinander durch die "geringe" Pinanzahl, ca. 1000 Pins / CPU, beschränkt.
Es sind nur eine begrenzte Anzahl an PCI-e, RAM Leitungen, etc. möglich, die über das Board geleitet werden müssen. Zudem sind für jeden Pin stromfressende Leitungstreiber nötig.
Durch die Microbumps und den Interposer sind wesentlich mehr Leitungen möglich, mit denen die Chips auf dem Interposer kommunizieren können (Faktor 100). Daurch ließen sich die Interconnects zwischen den Chips nicht nur durch 8 oder 16 sondern durch 128, 256 oder noch mehr Leitungen ausführen. Z.B. könnte ein GPU Chip mit der CPU nicht nur über "16 PCI-e 3.0" Leitungen angebunden sein sondern über den Interposer eben mit 256 Leitungen.

Complicated · 23.05.2015

amdfanuwe schrieb:
Du solltest noch diese AMD Präsentation von 12-2013 hinzufügen:
http://www.microarch.org/micro46/files/keynote1.pdf
Seite 48 finde ich interessant.

amdfanuwe schrieb:
Diesen Artikel von Charlie Demerjian find ich auch noch interessant.:
https://semiaccurate.com/2015/05/19/amd-finally-talks-hbm-memory/

Danke für die Links. Die Keynote ist sehr detailiert. Charlies Artikel finde ich oft interessant, doch leider auch zu reisserisch und nicht immer nur auf Fakten basierend. Daher verwende ich SemiAc nicht als primäre Quelle, solange es nicht anderweitig bestätigt wurde.

Complicated · 25.05.2015

Stacked DDR4 RAM ist auch schon angekündigt von Samsung:
http://community.cadence.com/cadenc...igh-bandwidth-memory-hmb-will-transform-drams

In August 2014, as Tabrizi noted, Samsung announced that it has started mass production of the industry’s first 64GB, DDR4 RDIMMs that use 3D TSV packaging technology. The new RDIMMs include 36 DDR4 DRAM chips, each of which consists of four 4Gb DDR4 DRAM dies. According to Samsung, the new 64GB TSV module performs twice as fast as a 64GB module that uses wire bonding, while consuming half the power.

Complicated · 01.06.2015

Joe Marci, CTO von AMD und früherer JEDEC-Vorstand lässt ein paar Details zu den verwendeten Interconnects zwischen HBM und GPU/CPU/APU in einem Interview zu HBM raus:
http://techreport.com/review/28294/amd-high-bandwidth-memory-explained

The interposer is what makes HBM's closer integration between DRAM and the GPU possible. A traditional organic chip package sits below the interposer, as it does with most any GPU, but that package only has to transfer data for PCI Express, display outputs, and some low-frequency interfaces. All high-speed communication between the GPU and memory happens across the interposer instead. Because the interposer is a silicon chip, it's much denser, with many more connections and traces in a given area than an off-chip package.

Diese Anbindungen sind nach wie vor traditionell auf dem Package.

BoMbY · 01.06.2015

Naja, wie ich im anderen Thread schon geschrieben habe: Es wäre wirklich super wenn AMD das schaffen würde, dass sie nur noch kleine Module herstellen, und alles, nach belieben kombiniert, auf einem Interposer zusammen backen könnten. Bei den APUs sollte das deutlich weniger Ausschuss (in Prozent pro Wafer) bedeuten. Und man könnte die Module besser selektieren und kombinieren, für stromsparende oder hochleistungsfähige CPUs. Und man könnte z.B. einfach ein gutes CPU-Modul mit einem guten GPU-Modul kombinieren, für eine High-End-APU (wo man vorher vielleicht eine schlechte Ausbeute hatte). Selbst unterschiedliche, angepasste/angemessene, Fertigungsprozesse für GPU, CPU und Zusatzmodule wie Chipsatz etc. wären denkbar. Alles in Allem ein großer Gewinn - bis auf die zusätzlichen Kosten für Interposer und das zusammen backen.

Complicated · 01.06.2015

Da es passive Interposer sind, sind die Kosten überschaubar. Das ist simples Silizium von einem Wafer ohne wirklich komplizierte Strukturen:
http://electroiq.com/blog/2012/12/lifting-the-veil-on-silicon-interposer-pricing/

Der Interposer kostet por 100mm² 1$
Der gesamte Wafer kostet gerade mal 500-650$

Selbst wenn AMD 10$ pro CPU/APU/GPU für den Interposer benötigt, so spart alleine die Reduzierung des Dies bei z.B. Fiji um 40mm² deutlich mehr ein. Zudem noch ein halb so grosses PCB, keine RAMs mehr die verbunden werden sollen, weniger Stromlanes, wenige Layers. Da kommt deutlich mehr zusammen als die 10$.

Und nicht zu vergessen, dass der Umsatz für den verwendeten RAM ab sofort durch AMDs Bücher geht - alleine dadurch sollte eine Umsatzsteigerung möglich werden.

unl34shed · 01.06.2015

Die Mehrkosten durch den interposer dürften sich aber durch die höhere yield relativieren. (Vermutung)

Möglich wahre auch dass man die selbe DIE\Maske für die kleinen dGPUs und APUs nutzt.

Oder wie im diesjährigen Aprilscherz auf die Spitze treibt. Ganz unrealistisch find ich den nicht.

LoRDxRaVeN · 01.06.2015

Complicated schrieb:
Das ist simples ~~Silikon~~ Silizium von einem Wafer ohne wirklich komplizierte Strukturen:

Allerdings wäre es mit Silikon auch ganz witzig

Woerns · 01.06.2015

Ein hier häufig angebrachter Kritikpunkt war es doch auch, dass die Designs von CPU und GPU sich nicht gut miteinander kombinieren lassen. Das Design der CPU wird z.B. auf höheren Takt ausgelegt als das der GPU. Die APU wies dann fertigungstechnische Probleme auf, die man Globalfoundries in die Schuhe schob.
Das Problem sollte mit dem Interposer der Vergangenheit angehören.
MfG

PS: Was ist eigentlich Silikon?
Ok, LoRDxRaVeN, warst schneller.

Gast11062015 · 01.06.2015

Amd hätte die Zeit bis zur neuen Gen. bei den Apu´s auch besser überbrücken können.

z.b. mit GDDR5, das Interface ist auf den Kaveri ja da

Oder wenigstens die Komprimierung die die 285 beherrscht dann wäre DDR3 noch nicht soooo .........

Complicated · 01.06.2015

LoRDxRaVeN schrieb:
Allerdings wäre es mit Silikon auch ganz witzig

Ja danke habs geändert

Die Amis mit ihren Elementen

Markus Everson · 01.06.2015

Ihr überseht m.E. das die Defect-Rate bei Interposer/TSV überproportional steigt. Das macht man weil man muss (zum Beispiel wegen der Anzahl der Kontakte), aber nicht weil es so toll flexibel ist. ct hat das seinerzeit mal analysiert, als Intel beim Pentium II den Cache aufs MCM brachte weil er nicht mit brauchbarer Yield in ein Die integrierbar war.

BoMbY · 01.06.2015

Markus Everson schrieb:
Ihr überseht m.E. das die Defect-Rate bei Interposer/TSV überproportional steigt. Das macht man weil man muss (zum Beispiel wegen der Anzahl der Kontakte), aber nicht weil es so toll flexibel ist. ct hat das seinerzeit mal analysiert, als Intel beim Pentium II den Cache aufs MCM brachte weil er nicht mit brauchbarer Yield in ein Die integrierbar war.

Meinst Du nicht, dass sich in den letzten 18 Jahren vielleicht etwas verbessert haben könnte, bei der Technik?

Woerns · 02.06.2015

Die Herstellung des Interposers in einem ausgereiften, gröberen Prozess sollte jedenfalls kein Problem darstellen. Sind die TSVs schwierig miteinander zu verbinden, oder gibt es Alterserscheinungen? Was genau meinst Du mit der Defect-Rate bei Interposer/TSV?
MfG

Complicated · 02.06.2015

Hier eine Abhandlung von AMD zu den kommenden Speicherarchitekturen und deren Anbindung:
http://www.amd.com/Documents/AMD-Research-Report-2014-1776.pdf

SPINA · 02.06.2015

Intel ist nicht geizig mit Masken, aber manchmal greifen sie dennoch auf Multi-Chip-Packages zurück. Nehmen wir Westmere mit der iGPU auf einem separaten Chip oder Broadwell mit dem PCH auf einem separaten Chip. Natürlich ist dies eine "Notlösung", aber eine gangbare, falls sonst die Kosten für eine Maske durch zu geringe Stückzahlen nicht wieder eingespielt würden. Mit jedem Shrink steigen die Kosten für eine Maske schließlich exponentiell an. Außerdem bekommt Intel so noch ältere Fabs ausgelastet. Insofern begibt sich AMD hier in gute Gesellschaft. Ein Interposer ist zwar ein belichteter Halbleiter und demnach nicht mit einem herkömmlichen Package vergleichbar, aber da er lediglich Leiterbahnen enthält, übernimmt er (teilweise) dieselbe Aufgabe. Allerdings sehe ich persönlich bei HBM und gegebenfalls noch FCH das Ende der Fahnenstange erreicht. Weiter ausdehnen sollte man die Interposertechnik nicht. Verglichen mit herkömmlichen Packages ist sie nämlich doch ziemlich teuer. Verwundern sollte dies jedoch niemand, denn man muss die Interposer in Rein(st)räumen belichten und braucht dafür sehr aufwendige Anlagen sowie bei jedem Durchlauf hektoliterweise kostspielige Chemikalien.

Complicated · 02.06.2015

SPINA schrieb:
Verglichen mit herkömmlichen Packages ist sie nämlich doch ziemlich teuer. Verwundern sollte dies jedoch niemand, denn man muss die Interposer in Rein(st)räumen belichten und braucht dafür sehr aufwendige Anlagen sowie bei jedem Durchlauf hektoliterweise kostspielige Chemikalien.

Du hast dazu eine belastbare Quelle? Denn wir haben hier schon eine die für den Interposer Kosten in Höhe von 500-650$ pro 200mm Wafer benennt.
100mm² kommen auf ca. 1$

Complicated schrieb:
Da es passive Interposer sind, sind die Kosten überschaubar. Das ist simples Silizium von einem Wafer ohne wirklich komplizierte Strukturen:
http://electroiq.com/blog/2012/12/lifting-the-veil-on-silicon-interposer-pricing/

Der Interposer kostet por 100mm² 1$
Der gesamte Wafer kostet gerade mal 500-650$

Meckel · 02.06.2015

Complicated schrieb:
Da es passive Interposer sind, sind die Kosten überschaubar. Das ist simples Silizium von einem Wafer ohne wirklich komplizierte Strukturen:
http://electroiq.com/blog/2012/12/lifting-the-veil-on-silicon-interposer-pricing/

Der Interposer kostet por 100mm² 1$
Der gesamte Wafer kostet gerade mal 500-650$

Selbst wenn AMD 10$ pro CPU/APU/GPU für den Interposer benötigt, so spart alleine die Reduzierung des Dies bei z.B. Fiji um 40mm² deutlich mehr ein. Zudem noch ein halb so grosses PCB, keine RAMs mehr die verbunden werden sollen, weniger Stromlanes, wenige Layers. Da kommt deutlich mehr zusammen als die 10$.

Und nicht zu vergessen, dass der Umsatz für den verwendeten RAM ab sofort durch AMDs Bücher geht - alleine dadurch sollte eine Umsatzsteigerung möglich werden.

Wenn der Interposer quasi nix kostet dann könnte die neue HBM Grafikkarte ja auch mit mehr als 4 RAM-Stacks bestückt werden?

Houston2603 · 03.06.2015

Könnte man. Ist unsinnig. Das zusammenbasteln ist das teure.

Complicated · 03.06.2015

Ich bin mir nicht sicher inwiefern das in Abhängigkeit stehen sollte? Was meinst du?

AMD Interposer Strategie - Zen, Fiji, HBM und Logic ICs

Grand Admiral Special

Anhänge

Lt. Commander

Grand Admiral Special

Gesperrt

Grand Admiral Special

Grand Admiral Special

Grand Admiral Special

Grand Admiral Special

Grand Admiral Special

Grand Admiral Special

Grand Admiral Special

Commodore Special

Grand Admiral Special

Grand Admiral Special

Gast11062015

Guest

Grand Admiral Special

Grand Admiral Special

Grand Admiral Special

Grand Admiral Special

Grand Admiral Special

Grand Admiral Special

Grand Admiral Special

Commodore Special

Gesperrt

Grand Admiral Special

Ähnliche Themen