News Spekulationen um AMDs Bulldozer-Architektur

@Dresdenboy
Super Grafik.
Ich gehe aber davon aus, dass die meisten Leser nicht viel damit was anfangen können.
Eine Vergleichsgrafik vom K10.5 und/oder K8 wichtig, damit viele die großen Neuerungen auch verstehen.
Dazu einige Erleuterungen, was die einzelnen Prozesse so machen und wie wichtig in der CPU sie sind.

Grundsätzlich finde ich deine Aussagen und Spekulationen hoch interessant, nur kommt man da als Architektur-Laie oft nicht micht, was ich schade finde.

Da muss ich Dir recht geben - ein bisserl heavy und ein Vergleich in Bild und Text waere schoen und fuer jeden anschaulich. Allerdings auch schoen, dass selbst solchen Ausfuehrungen hier mal auch Platz eingeraeumt wird.
Ein Artikel, der alles mehr oder weniger erklaert, wuerde sicher die Geduld vieler Leser fordern und die uebliche Seitenzahl 'sprengen'.
Mal sehen was kommt und was nicht...leider dauert das noch sehr lange und wer weiss, wie und was von AMD dann noch gibt.... ;-) !
 
Für weitere Infos zum Thema Server-Roadmap von AMD kann ich diesen Thread jedem wärmstens empfehlen. Die Infos werden von mir stetig aktualisiert!


MfG @
 
Es erscheint mir gefährlich, daß AMD für das kommende Jahr im Bereich Desktop und Single-Socket Workstation kaum etwas Neues bringt. Magny Cours ist schon aufgrund des gigantischen Sockels für eine Schrumpfung ungeeignet, bleibt noch die byzantinische CPU mit ihren 6 Kernen, aber, das wurde weiter oben schon gesagt, in einem Einzelsockel wird diese CPU ihre eigentliche Stärke, HT-Assist, nicht nutzen können.

Chipzilla baut die Turmspitze mit 'Gulftown' in 32nm und einigen Erweiterungen im 2. Quartal des kommenden Jahres aus, der Mittel- und Unterbau wird mit 'Lynnfields' versorgt. Architektonisch bieten diese ja nun nichts, was wirklich spektakulär vom Core-i7-Design abweicht, aber immerhin vollzieht sich im Bereich Chipsatz ein kleiner Paradigmenwechsel. AMD kann nun nicht unendlich an der Takt- und Preisschraube drehen, mit irgendetwas muß das Haus ja auch Geld verdienen.
 
ich bin da eher skeptisch, dass man mehr als 3,8 Ghz bei ner TDP von 125 Watt packt
Kommt immer darauf an, wie weit man die Vcore drücken kann. Hier liegt enormes Einsparungspotenzial.

Aber nicht genug:
http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1243891692


Zumal der Istanbul in einem Single-Sockel AM3-System auch sein "Killerfeature" HT-Assist nicht ausspielen könnte.
Nun ja, Anandtech ist relativ Intel affin. Da sollte man nicht zu viel rein interpretieren. Istanbul hat schon gezeigt, dass er bei gleicher Taktrate problemlos mit Nehalem mithalten kann. Und das bei 2P, wo HT-Assist ebenfalls nicht zum Tragen kommt.
Die meisten werden aber mit einem Desktop Istanbul nicht viel anfangen können, da hier vier höher getaktete Kerne oftmals für mehr Leistung sorgen. So ein Prozessor wäre maximal für Freunde exzessivem Transkodierens oder Distributed Computings etwas. Wobei man sich fragen muss, ob hier eine entsprechend leistungsfähige GPU für die Zukunft sinnvoller wäre.


@Dresdenboy
Ich kann nur nochmal ein grosses Dankeschön loswerden. Echt klasse, wie viel Arbeit du dir hier gemacht hast. *great*
 
Zur Bulldozer Architektur frage ich mich:

1. Wo wird die GPU abgebunden und wie viel Prozent Vorteil bringt das gegenüber einer Externen GPU.
2. Wie schwierig wird es für die Linux Distries diese Grafikeinheiten bei normalen Berechnungen mit zu benutzen.
3 Wird es vieleicht möglich durch einfaches neu kompilieren die integrierte Grafikeinheit einfach mit zunutzen. So ein Debian x86 AMD64 GPU Kompilat wär schon toll.

Zum PHENOM III

Ich befürchte den wird s nicht geben aber spinnen wir mal.

1. Latenzverkützung des Speicherkontrollers um c.a. 10 % bei gleichen Takt
2. NB Takt 3 GHz
3. Suche und Verbesserung der einheiten welche den Takt auf 3,8 GHZ bei Luftkühlung begrenzen und einer damit verbundenen Takterhöhung auf 4,4 bis 4,6 Ghz (Neues Stepping)
4. Veränderung des Fertigunsverfahrens so das er weniger Strom frisst.
5. In Windooff 7 Einführung des AMD Hyperdrives welcher wie bei Intel den Prozessor ohne den Kunden zu Fragen übertaktet. (der TDP des Motherboard muss ja immer voll ausgeschöpft werden)
6. Und der Phenom Fx on Boxed wo die Heatpipeflüssigkeit direkt den Kern umspült und welcher 4 Kanal Speicher hat, wie 6 Kerne und ein TDP von 200Watt.
7. Ach ja, das 33 nm Fertigungsverfahren habe ich noch glatt vergessen

Mahl ganz in ernst, gegen so ein Phenom III FX ist doch der Core i7 985 nicht EX geschützt doch n alter Turnschuh.
Nur leider hat AMD wahrscheinlich nicht die Entwicklungskapazität um diesen wie den Bulldozer gleichzeitig zu stämmen.
Intel schon, denn Intels Gewinn >> als AMD s Umsatz. :(
 
Zuletzt bearbeitet:
Zur Bulldozer Architektur frage ich mich:

1. Wo wird die GPU abgebunden und wieviel Prozent Vorteil bringt das gegenüber einer Externen GPU.
2. Wie schwirig wird es für die Linux Distries diese Grafikeinheiten bei normalen Berechnungen mit zu Benutzen.
3 Wird es vieleicht möglich durch einfaches neu kompilieren die Integrierte Grafikeinheit einfach mitzunutzen. Sohn Debian x86 AMD64 GPU Kompilat wär schon toll.

1) Bulldozer als neue Mikroarchitektur hat nix direkt mit Fusion zu tun
2) Ergibt sich aus 1), unveröffentlichtes Produkt, keine Informationen bisher
3) OpenCL


Zum PHENOM III

Ich befürchte den wirds nicht geben aber spinnen wir mal.

1. Latenzverkützung des Speicherkontrollers um c.a. 10 % bei gleichen Takt
2. NB Takt 3 GHz
3. Suche und Verbesserung der einheiten welche den Takt auf 3,8 GHZ bei Luftkühlung begrenzen und einer damit verbundenen Takterhöhung auf 4,4 bis 4,6 Ghz (Neues Stepping)
4. Veränderung des Fertigunsverfahrens so das er weniger Strom frisst.
5. In Windoff 7 Einführung des AMD Hyperdrives welcher wie bei Intel den Prozessor ohne den Kunden zu Fragen übertaktet. (der TDP des Motherboard muss ja immer voll ausgeschöpft werden)
6. Und der Phenom Fx on Boxed wo die Hedpipeflüssigkeit direkt den Kern umspült und welcher 4 Kanal Speicher hat, wie 6 Kerne und ein TDP von 200Watt.
7. Ach ja das 33 nm Fertigungsverfahren habe ich noch glatt vergessen

Mahl ganz in ernst, gegen so ein Phenom III FX ist doch der Core i7 985 nicht EX geschützt doch n alter Tornschuh.
Nur leider had AMD wahrscheinlich nicht die Entwicklungskapazität um diesen wie den Bulldozer gleichzeitig zu stämmen.
Intel schon, denn Intels Gewinn >> als AMD s Umsatz. :(

Wünsch dir was!


MfG @
 
1. Wo wird die GPU abgebunden und wie viel Prozent Vorteil bringt das gegenüber einer Externen GPU.
2. Wie schwierig wird es für die Linux Distries diese Grafikeinheiten bei normalen Berechnungen mit zu benutzen.
3 Wird es vieleicht möglich durch einfaches neu kompilieren die integrierte Grafikeinheit einfach mit zunutzen. So ein Debian x86 AMD64 GPU Kompilat wär schon toll.
1. Die erste Bulldozer Generation wird noch kein Fusion Design haben. 1H 2011 soll ebenfalls Llano als Fusion Design gelauncht werden. Dieser ist aber noch K10 basiert.
2. Kommt ganz darauf an, inwiefern OpenCL unter Linux zur Verfügung steht. Theoretisch sehe ich da aber kein Problem.
3. Nein, einfach neu kompilieren wird nicht zum gewünschten Ergebnis führen. Software muss für OpenCL angepasst werden.
 
An gruffi und Dr@,

dass mit dem Fusion und Buldozer unterschied wusste ich nicht. (tut mir Leid)

Da ich aber davon ausgehen kann das Open CL sehr schleppend in GPL Software eingeführt werden wird, macht das den Buldozer, für mich interessanter ohne Fusion.
Zur Befehlssatz Erweiterung die von SSE 5 in AVX umgenannt worden ist:
ist es möglich durch einen guten Compiler AVX Erwiterungen durch eine neu Compilierung zumindestens teilweise zu nutzen, oder ist eine Umeditierung des alten codes zwingend erforderlich.
Bei der AMD 64 Erweiterung musste der Quellcode ja meines Wissens ja auch kaum angefasst werden. Ich bin kein Programmierer aber das würde mich wirklich interessieren.

Ich hoffe das AVX nicht sogar gestrichen worden ist.

mfg

der schwarze Mann
 
Zum Thema AVX und SSE 5 sind dieser Artikel und dieser Blogeintrag von AMD interessant.

Bin kein Experte, aber normalerweise müssen sowohl Compiler als auch Quellcode angepasst werden um die Befehlssatzerweiterungen vollständig nutzen zu können. Gerade die Mehrfach-Operanden-Befehle sollten zu ganz anderen effizienteren Algorithmen führen.


MfG @
 
Zuletzt bearbeitet:
Da ich aber davon ausgehen kann das Open CL sehr schleppend in GPL Software eingeführt werden wird, macht das den Buldozer, für mich interessanter ohne Fusion.
Praktisch kannst du ja immer noch eine diskrete GPU für GPGPU Berechnungen nutzen, falls es notwendig sein sollte.

ist es möglich durch einen guten Compiler AVX Erwiterungen durch eine neu Compilierung zumindestens teilweise zu nutzen
Das hängt ganz vom Quellcode ab. Wenn dort Intrinsics genutzt werden, also Funktionen, die Assembler Instruktionen nahezu 1 zu 1 auf high level bereitstellen, dann ist eine Anpassung des Quellcodes erforderlich. AVX benötigt eben neue Assembler Instruktionen bzw neue Intrinsics. Wenn der Quellcode allerdings komplett high level ist, also ISO C bzw ISO C++ konform, die Datenstrukturen passend und der Compiler entsprechend clever ist, dann reicht es, einfach neu zu kompilieren.
 
2. Wie schwierig wird es für die Linux Distries diese Grafikeinheiten bei normalen Berechnungen mit zu benutzen.
Dürfte kein großses Problem sein, Intel hat die Treiber über die ersten derartigen Produkte im Kernel, der Anfang September rauskommt.

3 Wird es vieleicht möglich durch einfaches neu kompilieren die integrierte Grafikeinheit einfach mit zunutzen. So ein Debian x86 AMD64 GPU Kompilat wär schon toll.
Verstehe dich nicht ganz, die GPU auf dem Prozessorsockel ist immernoch die selbe wie vorher.

ist es möglich durch einen guten Compiler AVX Erwiterungen durch eine neu Compilierung zumindestens teilweise zu nutzen, oder ist eine Umeditierung des alten codes zwingend erforderlich.
Es muss mindestens der Compiler bzw. die Laufzeitumgebung angepasst werden bzw. Unterstützung bieten. Java Bytecode muss z. B. nicht geändet werden. "Harte" Binärprogramme müssen mindestens neu kompiliert werden.
 
Könntest jemand den großen Unterschied zwischen eDRAM und dem momentan genutzen DRAM-Sorten nennen? ...
Die Meldung bestätigt erste Berichte von der Hot Chips 21 im Sommer 2009. IBM plant dies für den Power7 mit 32 MByte L3-Cache (45 nm SOI Technik).

Embedded RAM hat den Vorteil, dass es im Grunde genommen DRAM ist, wie wir es von den klassischen zurüstbaren Speicherriegeln im PC kennen.
Da wird die Speicherzelle aus einem Transistor und einem Kondensator aufgebaut.

Die üblichen Caches sind SRAM. Die lassen sich im Takt relativ leicht hoch betreiben und haben geringe Latenzen. Dafür müssen 8 bis 6 Transistoren im Speicherzellenaufbau genutzt werden. Natürlich ist solch eine schnelle SRAM-Speicherzelle raumfressend - eDRAM nicht.

Erste Vorserien Power7 laufen jetzt schon im Jahr 2009. Ab 2010 soll der Power7 serienmässig von IBM eingeführt werden. Offenbar haben sie nun den nächsten Node abgeschlossen in 32 nm und zertifiziert.

MFG Bobo(2009)
 
Zuletzt bearbeitet:
Könntest jemand den großen Unterschied zwischen eDRAM und dem momentan genutzen DRAM-Sorten nennen?
Weil, so kann ich relativ wenig damit in Verbindung bringen :)


sehr geringer Platzbedarf auf dem Die
<-- einfachste Antwort

frag riknet ;)


edit: zu spät
 
Zurück
Oben Unten