AMD greift beim Phenom-Nachfolger auf K6 Design-Elemente zurück

Nero24

Administrator
Teammitglied
Mitglied seit
01.07.2000
Beiträge
24.066
Renomée
10.446
  • BOINC Pentathlon 2019
  • BOINC Pentathlon 2020
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2021
AMD-Hauptkonkurrent Intel hat diesen Schritt bereits hinter sich. Bis 10 GHz sollte die Netburst-Architektur des Pentium 4 skalieren können. Als sich <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1083942664">abzeichnete</a>, dass bereits bei deutlich weniger als der Hälfte das Ende der Fahnenstange bei vertretbaren Verlustleistungen erreicht war, tat Intel das einzig Richtige: man griff auf Bewährtes zurück, in diesem Fall auf das Design des Pentium III, eliminierte Schwachstellen und brachte das Layout in Sachen Features und Produktion auf den letzten Stand. Heraus kam der Core 2, ein Prozessor der Intel nach 3 Jahren Mittelmäßigkeit wieder zurück auf die Siegerstraße brachte. Dass Intel sich in Sachen Layout bei Opa Pentium III bedient hat, nimmt den Amerikanern niemand krumm.

In einem ähnlichen Dilemma wie Intel damals steckt AMD heute. Der aktuelle K10-Prozessor in Gestalt des Phenom und des Quad-Core Opteron hat bisher nicht gehalten, was sich die Kunden davon versprochen hatten. Nur geringfügig bessere Pro-Takt-Pro-Kern Leistung als der Vorgänger K8, dafür aber deutlich niedrigere maximale Taktfrequenzen (2,5 GHz statt 3,2 GHz) und trotzdem ein höherer Stromverbrauch. Das ist nicht gerade das, was man sich unter erfolgreicher Weiterentwicklung vorstellt. Zeit zu handeln für AMD...

Wie uns zugetragen wurde soll für den Nachfolger des Phenom das Design des K6 in abgewandelter Form wieder reaktiviert werden. Der AMD K6 und seine Derivate, die Mitte bis Ende der 90er Jahre die Kastanien für die Kalifornier aus dem Feuer holen mussten, gelten bis heute als eine der Prozessoren mit dem besten IPC - zumindest im Integerbereich. Ein für damalige Verhältnisse riesiger Translation-Lookaside-Buffer, eine enorm kurze Pipeline mit nur 6 Stufen und ein hochintelligenter Branch-Predictor machten dem K6 damals ordentlich Beine. Allerdings krankte die Architektur an der schwachen Fließkomma-Einheit und der langsamen Anbindung zur Infrastruktur, deren real gemessene Bandbreite mit ca. 100 MB/s nur etwa auf dem Niveau heutiger Festplatten (!) lag.

<center><img src="http://www.planet3dnow.de/news_images/k62ad.jpg" border="1" alt=""></center>

Das soll sich nun grundlegend ändern, denn die Fehler von damals will AMD dieses Mal vermeiden. So soll der Phenom-Nachfolger wie der aktuelle K10 eine integrierte Northbridge mit L3-Cache und integriertem Dual-Channel Memory-Controller bekommen, der DDR3 unterstützt. An den Rest der Infrastruktur wird der "Bazooka", wie sein Entwicklungscode lautet, wie der K10 per HyperTransport 3.0 Links angebunden. Das Bandbreiten-Problem ist damit eliminiert. In einem Die sollen dabei je nach Variante 2, 4, 8 oder 16 K6-Kerne Platz finden und per Crossbar miteinander verbunden sein.

<center><img src="http://www.planet3dnow.de/news_images/bogus.png" border="0" alt=""></center>

Selbstverständlich werden die K6-Kerne nicht mehr im 300 nm, 250 nm oder 180 nm Verfahren gefertigt wie damals, sondern strom- und platzsparend im 45-nm SOI Germanium Prozess. Zusammen mit einigen weiteren Speedpath-Optimierungen soll dieses alte Design so für 2 GHz Taktfrequenz oder mehr gut sein und damit ein weiteres Problem des alten K6 aus der Welt schaffen: die mangelnde Skalierfähigkeit in Sachen Taktfrequenz.

<center><img src="http://www.planet3dnow.de/news_images/bogus-arch.gif" border="1" alt=""></center>

Damit der Prozessor für die aktuellen Bedürfnisse gerüstet ist, fliegt die alte non-pipelined FPU raus. Stattdessen erhält der Prozessor die Fließkomma-Einheiten des aktuellen K10. So werden selbstverständlich auch SSE, SSE2, SSE3 und SSE4a unterstützt, und zudem das neue SSE5, mit dem es erstmals im x86-Bereich möglich wird mehr als zwei Operanden miteinander zu verrechnen. x86-64 alias AMD64 versteht sich von selbst. Gegenüber dem Classic-K6 wurden auch die Cache-Anbindungen verbreitert und die L1-Caches verdoppelt.

Die Architektur ist zwar nach wie vor nur zweifach superskalar (ggü. K7/K8/K10 dreifach; Core 2 vierfach), dafür jedoch kann der Scheduler die Funktionseinheiten zu jeder Zeit nahezu komplett auslasten. Aufgrund des extremen Low-Latency Designs mit lediglich 6 Pipelinestufen fällt auch der Penalty nach einem Flush oder einem Stall minimal aus, daher sind die Kerne wesentlich seltener mit Verwaltungsaufgaben beschäftigt, wo effektiv keine Berechnungen stattfinden. Die Effizienz profitiert dadurch enorm. Zudem ist der Prozessor aufgrund der kurzen Pipeline, des aufwändigen Branch-Predictors und der klassischen Doppel-Pipeline weitestgehend unabhängig von Software-Optimierungen. Ein Vorzug, der schon den Classic-K6 auszeichnete und ein enormer Pluspunkt, nachdem AMD im Gegensatz zu Intel keinen eigenen Compiler anbietet.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=1850&w=l" border="1" alt=""></center>

Das Layout des Prozessors orientiert sich dabei am M-SPACE Konzept, das auch für die <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1201340879">APU "Swift"</a> vorgesehen ist. Es ermöglich die Integration verschiedenartiger Kerne und Kernanzahlen auf relativ einfache Weise ohne dabei jedes Mal ein komplett neues Layout designen zu müssen.

<center><img src="http://www.planet3dnow.de/news_images/enhanced_k6.png" border="1" alt=""></center>

Aufgrund der im Vergleich zum aktuellen K10 geringen Transistoranzahl ist der Prozessor relativ stromsparend zu betreiben. So verbrauchte damals beispielsweise ein K6-2 500 lediglich 20 W, ein Athlon 500 im gleichen Herstellungsverfahren (250 nm) mehr als das Doppelte. Diese Bescheidenheit der Architektur in Sachen Stromverbrauch kommt natürlich dem neuen "Bazooka" ebenfalls zu Gute. Selbst die 16-Kernvariante des 45-nm-Prozessors soll mit maximal 95 W Leistungsaufnahme auskommen, die Dual-Kerner sollen in der mobile-Version weniger als 10 W TDP aufweisen. Und last but not least ist der "Bazooka" aufgrund der kleinen Die-Fläche für AMD sehr preisgünstig zu produzieren. Jeder Kern besitzt lediglich 24 Mio. Transistoren und eine Fläche von gerade einmal 5 mm² zzgl. der Northbridge und des L3-Caches. So kommt selbst die 16-Kern Variante auf weniger Transistoren und Die-Fläche, als ein "Shanghai" mit nur 4 Kernen. Weniger Die-Fläche entspricht mehr CPUs pro Wafer. Darüber werden sich AMDs Bilanzen sicherlich ebenfalls freuen.
Bleibt nur zu hoffen, dass AMD den Zeitplan einhalten und die CPU noch 2009 tatsächlich auf den Markt bringen kann.

<b>Links zum Thema:</b><ul><li><a href="http://www.planet3dnow.de/artikel/hardware/duron_k62p/">AMD K6-2+ gegen AMD Duron - Treffen der Generationen</a></li><li><a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=978224524">AMD K6-2+ Umsteiger: Asus P5A(-B) Revisionen beachten</a></li><li><a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1083942664">Intel schiebt Pentium 4 möglicherweise auf's Abstellgleis</a></li><li><a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1201340879">AMD bestätigt Pläne zum Fusion</a></li></ul>
 
Pünktlich pünktlich, wolltet wohl die ersten sein am 1 April.
 
Für ein paar Sekunden hab ich net dran gedacht, dass der 1. April ist, fand das Konzept interessant aber reichlich schwachsinnig - weil der K6 ja schlicht an der Taktbarkeit gescheitert ist. Aber AMD trau ich die Tage ja alles zu ;) Aber dann fiel mir ein, dass es ja kurz nach 12 ist...

Aber mal wirklich ne gute Idee und schön umgesetzt!! *great*

P.S.: Die IPC des K5 war der des K6 noch weit überlegen!!
 
Dabei wollt ich meinen alten K6-2+ die Tage selbst nochmal mit paar K8-Teilen tunen...8)
 
die c't aprilscherze der letzten zwei jahre waren der absolute hammer - 1) dvb über den stromversorger 2) glare displays per software und webcam enstpiegeln.... wahnsinn, auf das erste bin ich vollkommen reingefallen xD
 
Also mit hat´s gefallen das zu lesen ;D

Vielleicht ist das nicht mal so eine schlechte Idee! *lol*
 
Wer rechnet denn schon so früh mit einem Aprilscherz? :P
 
nicht schlecht!!! man hat das bei mir gedauert, bis ichs gerafft hab *buck*
 
Wenn man die Bilderchen schon "bogus.png" usw. nennt fliegt der Schwindel schnell auf. ;D



Schön wäre auch was gewesen wie "NVidia benutzt abgewandeltes VSA-100 Design für SLI Bridgechips" ;D



Ist aber auf jeden Fall mit Liebe geschrieben, danke dafür.
 
Zuletzt bearbeitet:
args - ich depp - die Zeit LOL. Ich sitz hier und bin nur am rumwundern.... grrrrrrr... naja gut nacht - morgen wirds ja hoch hergehen dann auf Arbeit erstmal alle "Scherze" entlarven.

gruß
skell
 
Tja, ich war angesichts der letzten Jahre schon mental vorbereitet. Aber trotzdem *great*

P.S.: Besonders geil ist ja dann doch noch die "Bazooka" ;D vielleicht würde sich AMD damit nicht mehr so oft selber ins Knie schießen. ;D
 
Schön geschrieben, bin auch drauf reingefallen. Aber ich kann mich wenigstens damit rausreden dass es hier erst in 7,5 Stunden April ist ;)
 
Genial ich bin nur am feiern. Schöner 1. April
 
Hervorragende Entscheidung, AMD!
Ich wäre sogar noch nen Schritt weiter gegangen und hätte den alten Am386 reaktiviert.
Der machte halt noch ordendlich Druck, nicht wie so ne olle Phenom-Möhre!!!!!

;)
 
Macht definitiv Sinn, vor allem heute ;)

Aber mal ernsthaft, ich denke AMD könnte durchaus dort einige Designideen wiederbeleben, um die Integer-IPC zu steigern. Und so wirklich weit hergeholt ist es auch nicht unbedingt, man hört ja auch von anderen Firmen, daß sie eine Multicore-CPU mit relativ einfachen Kernen (noch viel einfacher als ein K6) in der Mache haben, z.B. Intels Atom wird ja wohl sowas. Nur sind die Entwicklungsresourcen AMDs einfach zu mager, als daß sie verschiedene Kernarchitekturen gleichzeitig zur Produktionsreife bringen könnten.

Und schließlich ist das ein P3D-Aprilscherz, da muß man immer vorsichtig sein, es als Unfug abzutun. *suspect* Immerhin gabs hier scherzweise auch den ersten DualCore, ein lockeres Jahr bevor er tatsächlich kam.
 
Zurück
Oben Unten