AMDs G2-Stepping: das letzte Aufbäumen des K8-Kerns

Nero24

Administrator
Teammitglied
Mitglied seit
01.07.2000
Beiträge
24.058
Renomée
10.440
  • BOINC Pentathlon 2019
  • BOINC Pentathlon 2020
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2021
file.php

Vergangene Woche haben wir ausführlich über neu auf den Markt gekommene AMD Athlon 64 X2 und Athlon X2 Prozessoren berichtet, die in einem brandneuen G2-Stepping gefertigt wurden. Das Ungewöhnliche daran: AMD hat dieses Stepping weder angekündigt, noch mit einer Pressemitteilung eingeführt. Zum Zeitpunkt unserer News war das G2-Stepping noch nicht einmal auf der AMDCompare-Seite geführt, wo alle aktuellen Varianten der AMD Desktop- und Notebook-Prozessoren gelistet werden.

Natürlich waren wir neugierig was sich am G2-Stepping geändert hat. Das bis dato bei den Athlon 64 X2 Prozessoren in 65 nm verwendete G1-Stepping war immerhin schon fast ein Jahr alt - und es war nicht der Weisheit letzter Schluss. So hat AMD damals bei den 65 nm Prozessoren die L2-Cache Latenzen zu Lasten der Performance ein wenig zurück geschraubt. Statt 12 Clocks wie noch bei den 90 nm Modellen mit F2- oder F3-Stepping vergingen bei den CPUs mit G1-Stepping satte 20 Clocks von der Anforderung aus dem L2-Cache bis zu Lieferung. AMDs damalige Begründung war, man wolle sich die Option offen halten 65 nm CPUs mit deutlich mehr Cache zu produzieren. Allerdings ist davon bis heute nichts zu sehen. Im Gegenteil! Während die Athlon 64 X2 Prozessoren in 90 nm bis zu 2x 1024 KB Cache aufweisen, gibt es von den 65 nm CPUs bisher nur jene Versionen mit 2x 512 KB L2-Cache. Das führt natürlich die Begründung AMDs ad Absurdum. Die Hoffnung der AMD-Gemeinde ist berechtigt, dass dieser "Irrtum" mit dem G2-Stepping wieder korrigiert wurde. Ein weiteres Problem mit dem G1-Stepping kennen die Anwender von Monitoring-Tools wie CoreTemp oder Speedfan. Diese Programme sind wegen eines Bugs im G1-Stepping nicht in der Lage, die Core-Diode sauber auszulesen - aufgrund von Initialisierungsproblemen lesen die Tools die Dioden-Temperatur viel zu niedrig aus. Das wäre an sich noch nicht schlimm, wenn man mit einem konstanten Korrekturwert gegensteuern könnte. Allerdings ist die Abweichung von Initialisierung zu Initialisierung leider nicht konstant. Auch hier gilt die Hoffnung: evtl. hat AMD dies ja korrigiert.

Um offizielle Infos von AMD zum G2-Stepping zu erhalten, haben wir um eine Stellungnahme gebeten. Leider blieb dieses Ersuchen bislang unbeantwortet. Aus diesem Grund haben wir uns auf eigene Faust einen G2-Stepping Prozessor auf dem freien Markt besorgt und ihn gegen ein G1-Stepping der gleichen Modellnummer antreten lassen. Aufgrund der knappen Zeit konnten wir leider nicht den vollen Benchmark-Parcours durchlaufen wie die Leser von Planet 3DNow! es gewohnt sind. Aber um die interessantesten Fragen zu beantworten hat es gereicht.

Update:
Auf Leserwunsch haben wir auch das alte F2-Stepping (Windsor-Kern in 90 nm) noch einmal durch den gleichen Testparcours gejagt, um nun endgültig die Frage nach dem besten Athlon 64 X2 Stepping beantworten zu können. Der Artikel wurde am 22.10.2007 um die F2-Tests ergänzt.

[break=Bestellnummern und Heatspeader-Shots]

Beginnen wir mit den Daten, die AMD mittlerweile offiziell zum G2 veröffentlicht hat:

file.php

Zum Vergleich der alte G1:

file.php

Die Beschriftung des Heatspreaders ist entsprechend der Bestellnummern (oben G2):

1_G2-Stepping.jpg


1_G1-Stepping.jpg

[break=CPU-Z, CoreTemp und Speedfan]

Selbst die neueste Version von CPU-Z muss beim Auslesen der Revision noch passen:

file.php

Interessant ist, dass AMD in den Unterlagen als minimale Spannung 1,325 V angibt. Das MSI-Board jedoch stellt die VCore per Default auf 1,300 V ein.

Das G1-Stepping (genauer BH-G1) wird korrekt erkannt:

file.php

Update:
Hier sehen wir den CPU-Z Screenshot des alten F2-Steppings in 90 nm Strukturen.

file.php

Wie man sieht handelt es sich hierbei um eines der seltenen JH-F2 Kerne. Selten deshalb, da der AMD Athlon 64 X2 5000+ in 90 nm normalerweise die Revision BH-F2 besitzt. Die 5200+ mit 2x 1024 KB Cache sind es, die eigentlich JH-F2 Kerne tragen. Das bedeutet, dass dieser 5000+ ursprünglich einmal ein 5200+ hätte werden sollen. Entweder aus wirtschaftlichen Gründen (Nachfrage nach 5000+ war höher, als nach 5200+), oder aus technischen Gründen (ein Teil des Caches war defekt) wurde jedoch jeweils die Hälfte der beiden L2-Caches deaktiviert, was den 5200+ zum 5000+ degradierte. Auf die Performance hat dies laut AMD keinen Einfluss ob es sich um einen BH-F2 mit "echten" 2x 512 KB Cache handelt, oder um einen JH-F2 mit 2x 1024 KB, die jeweils zu Hälfte deaktiviert sind.

Starten wir unsere Testlaufe mit den Auslesedaten von CoreTemp und Speedfan:

1_g2-speedfan.PNG


file.php

Damit ist klar, dass sich die erste Hoffnung der User auf das G2-Stepping schon einmal nicht erfüllt hat. CoreTemp und Speedfan lesen auch mit dem G2-Stepping nur "Müll" aus. Das Statement dazu von den Entwicklern von CoreTemp ("All AMD K8 CPUs are supported starting with the early SH-C0 stepping and up. The latest 65nm BH-G1 and DH-G1 revisions give inaccurate readings.") gilt damit auch für den G2. Allerdings bleibt an dieser Stelle offen, ob die Tools - sobald sie das G2-Stepping offiziell unterstützen - korrekte Werte anzeigen können. Beim G1 war das ja nicht möglich und zum aktuellen Zeitpunkt mit der aktuellen Beta auch beim G2 nicht.

Update:
Hier zum Vergleich CoreTemp mit dem F2-Stepping:

file.php

Obwohl es sich um das selbe Mainboard handelt, wird hier die Diode korrekt ausgelesen.

[break=Latenz-Tests mit CPU-Z und Sciencemark]

Fahren wir fort mit den Performance-Tests. Wie erwähnt hat AMD bei der Einführung des G1 die L2-Latenzen verlängert. Daher prüfen wir doch gleich einmal, wie es beim G2 aussieht:

file.php

Zum Vergleich der G1:

file.php

Sofort ist zu erkennen (jeweils unten rechts), dass die Latenzen beim Zugriff auf den L2-Cache beim G2-Stepping genauso schlecht sind wie beim G1. Wer allerdings einen Blick auf die übrigen Latenzzeiten wirft, die über den L2-Cache hinaus gehen, der wird sofort bemerken, dass das G2-Stepping hier bis zu 30 Zyklen niedriger liegt, als der G1. Daher prüfen wir doch gleich einmal, ob das BIOS die Speicherlatenzen identisch eingestellt hat:

Update:
Hier zum Vergleich das alte F2-Stepping
file.php

Wie erwähnt benötigen die 90 nm CPUs für den Zugriff auf den L2-Cache nur 12 Takte statt 20 und auch die Latenzzeiten für den Speicherzugriff sind nicht von schlechten Eltern.

G2-Stepping:

file.php

G1-Stepping:

file.php

Wie man sieht arbeitet das RAM in beiden Fällen mit den gleichen Latenzzeiten und dem gleichen Speichertakt. Der "krumme" Speichertakt von lediglich 371 MHz statt der zu erwartenden 400 MHz bei Verwendung von DDR2-800 Speicher kommt daher, dass die AMD AM2-Sockel CPUs keine halben Speicherteiler besitzen. Daher läuft der Speicherbus bei "ungünstigen" Taktfrequenzen z.B. bei 2,6 GHz bekanntlich mit etwas niedrigerem Takt.

Ganz offensichtlich hat AMD beim G2 also Feintuning am Memory-Controller betrieben. Das macht Lust auf mehr Benchmarks, daher sehen wir uns gleich einmal den Sciencemark V2 an:

G2-Stepping:

file.php

G1-Stepping:

file.php

Der Sciencemark V2 misst sowohl die Speicherlatenzen, als auch die Speicherbandbreite. Auch hier kann man deutlich sehen, dass das G2-Stepping einen beachtlichen Vorsprung auf seinen Vorfahren herausarbeiten kann.

Update:

file.php

Wie man sieht kann der alte F2 die Werte des G2 noch einmal toppen.

[break=Sandra Speicher- und Kerntests]

Wir bleiben bei den Speichertests und sehen uns den Bandbreitentest von SiSoft Sandra an:

G2-Stepping:

file.php

G1-Stepping:

file.php

Auch SiSoft Sandra bestätigt die höhere Speicher-Bandbreite des G2-Steppings.

Update:

file.php

Das alte F2-Stepping schafft die Werte des neuen G2 trotz besserer L2-Cache-Performance (die notgedrungen die Werte des Speichertests mit beeinflusst) nur knapp.

Um gleich bei Sandra zu bleiben überprüfen wir an dieser Stelle, ob sich auch am Kern selbst etwas getan hat. Dhrystone und Whetstone geben die Antwort:

G2-Stepping:

file.php

G1-Stepping:

file.php

Hier fällt das Ergebnis negativ aus. Bis auf ein paar zu vernachlässigende Punkte im Rahmen der Meßgenauigkeit sind die Kerne selbst gleich schnell.

G2-Stepping:

file.php

G1-Stepping:

file.php

Gleiches Bild auch hier. Die SIMD-Einheiten (MMX, 3DNow!, SSE) sind nicht schneller beim G2.

[break=Super Pi und Cinebench]

Um diese Thesen zu verifizieren sehen wir uns doch gleich noch ein paar Tests an, die ebenfalls vorwiegend ausschließlich die CPU-Kerne belasten: Cinebench und Super-Pi:

G2-Stepping:

file.php

G1-Stepping:

file.php

G2-Stepping:

1_g2-cine.PNG

G1-Stepping:

2_g1-cine.PNG

Kein Unterschied bei Super-Pi, marginaler Vorsprung für den G2 beim Cinebench.

Update:

file.php

Tatsächlich kann sich das alte F2-Stepping auch hier um die Winzigkeit von 1 Sekunde absetzen. Bei 1M Datengröße verschafft ihm wohl die kürzere L2-Latenz einen kleinen Vorteil.

1_f2-cine.PNG

Auch beim Cinebench kann das alte F2-Stepping die 65 nm CPUs knapp überflügeln.


[break=3DMark03, Xvid und BOINC]

Der alte 3DMark03 stand uns für die CPU-Benchmarks im Direct3D-Bereich zur Verfügung. Hier laufen zwei Szenen aus dem 3DMark03 nicht über die 3D-Grafikkarte, sondern ausschließlich über die CPU:

G2-Stepping:

file.php

G1-Stepping:

file.php

Auch hier sehen wir wieder einen Vorteil beim G2-Stepping: 977 CPU-Punkte statt 918. Der 3DMark03-Gesamtindex unterscheidet sich aus dem Grund nicht, da die im zur Verfügung stehenden Testsystem verbaute Radeon X300SE bei den GPU-Tests natürlich "deckelt".

Update:

file.php

Auch den 3DMark03 CPU-Test kann der F2 mit 1001 Punkten zu 977 (G2) und 918 (G1) für sich entscheiden.

Ebenfalls eine Kombination aus Speicher-Performance und Kern-Performance ist beim Encoden eines DVB-Streams mit VirtualDubMod in XviD gefragt. Die verwendete XviD 1.2 SMP Version nutzt die beiden Kerne allerdings nur rudimentär, die Hauptlast liegt auf einem einzelnen Kern.

- G2-Stepping: 8:14 Minuten
- G1-Stepping: 8:22 Minuten
- F2-Stepping: 8:04 Minuten

8 Sekunden Vorsprung bei einer Laufzeit von 8 Minuten sind keine Welt, aber besser als nichts.

Update:
Dank der besseren Cache-Performance kann der alte F2 jedoch auch das Encoden in der kürzesten Zeit bewältigen.

Um eine komplette WU von SETI@Home oder QMC durch die Transistoren der beiden CPUs zu jagen, hatten wir natürlich viel zu wenig Zeit. Daher müssen wir uns an dieser Stelle mit den offiziellen Benchmark-Werten des BOINC-Client bescheiden, die allerdings nicht die selbe Aussagekraft der WUs haben:

G2-Stepping:

file.php

G1-Stepping:

file.php

[break=Stromverbrauch und Spannungen]

In Sachen Stromverbrauch nehmen sich die beiden Kerne nichts. Unter Vollast nimmt das mit dem G1-Prozessor bestückte System auf der Eingangsseite des Netzteils ca. 15 mA mehr Strom, da dieser Prozessor by Default auf 1,35 V vom Mainboard eingestellt wurde, während der G2 mit 1,30 V betrieben wurde. Beide CPUs manuell auf 1,30 V fixiert lagen die Werte gleichauf.

Von Hardcore-Übertaktungen mussten wir an dieser Stelle Abstand nehmen, da einerseits das zur Verfügung stehende Mainboard nicht gerade als OC-Killer durchgehen darf und andererseits das System einem Kunden gehört. Allerdings ist es auch möglich den Spielraum, den ein Kern zur Verfügung hat, anderweitig zu testen: durch untervolten. Man stellt die Kernspannung so lange um 0,025 V niedriger, bis das System mit Prime95 SMP Fehler liefert. Hier schlug die Stunde des G2-Kerns. Bis auf 1,125 V ließ sich die Kernspannung senken, ohne unter Vollast Fehler zu produzieren. Selbst bei 1,075 V bootete das System noch fehlerfrei mit 2600 MHz (Defaulttakt), allerdings dann natürlich nicht mehr primestable.

file.php

Zum Vergleich: bei unserem G1-Stepping Exemplar war bei 1,200 V Schluss. Bei 1,175 V war noch ein Booten möglich, allerdings kein fehlerfreier Betrieb mehr.

Update:
In dieser Disziplin musste der alte F2-Kern ordentlich Federn lassen. 1,275 V Kernspannung! Weniger war nicht drin, ehe der Prozessor bei Prime95 erste Fehler produzierte. Für Übertakter und Untervolter eine denkbar ungeeignete CPU.

Auch in Sachen Stromverbrauch trennt sich die Spreu vom Weizen. Mit 10 mA mehr Stromaufnahme auf der Eingangsseite des Netzteils im Idle (ohne Cool'n'Quiet) ist der Unterschied noch relativ gering. Unter Vollast jedoch zieht das mit dem F2-Prozessor bestückte System satte 160 mA mehr Strom aus dem Netz. Das wäre ca. 36 W mehr Verlustleistung. Natürlich darf man das nicht 1:1 der CPU zuschreiben, schließlich fließen auch Netzteil-Wirkungsgrad, Spannungsregler und -Wandler und das Mainboard selbst noch in die Berechnung mit ein, aber für die Berechnung der Stromkosten ist nun einmal die Leistungsaufnahme auf der Eingangsseite des Netzteils relevant und hier würde der F2 z.B. dem 24/7-Teilnehmer eines Distributed-Computing Teams immerhin 50 EUR im Jahr mehr Stromkosten gegenüber dem G2 aus der Tasche ziehen. Anwender, die das Potenzial des G2 konsequent nutzen und die CPU bis an die Grenze untervolten, können sogar noch deutlich mehr sparen.

[break=Fazit und Testsysteme]

An dieser Stelle müssen wir unseren Kurztest leider abbrechen, da nicht mehr Zeit zur Verfügung stand. Allerdings haben wir die wichtigsten Fragen zum G2-Stepping beantworten können. Nein, das Auslesen der CPU-Diode mit Core-Temp (zumindest mit der aktuellen Version) und Speedfan funktioniert im Gegensatz zu den alten F-Steppings noch immer nicht korrekt und die Cache-Latenzen wurden ebenfalls nicht wieder verkürzt. Allerdings scheint AMD enormes Feintuning am Memory-Controller betrieben zu haben. Bei gleichem Speichertakt und gleichen Speichertimings legt das G2-Stepping nicht nur deutlich kürzere Latenzzeiten an den Tag, sondern liefert auch je nach verwendetem Benchmark 800 bis 1200 MB/s mehr Bandbreite. Aus diesem Grund profitieren Anwendungen, die wohlwollend auf kurze Latenzen und/oder hohe Speicherbandbreite reagieren auch mit höherer Leistung. An der Performance des Kerns selbst scheint sich nichts getan zu haben.

Dafür jedoch scheint das G2-Stepping deutlich mehr Spielraum nach oben zu haben. Ein Prozessor, der noch bei 1,125 V primestable mit 2600 MHz Defaulttakt läuft (statt 1,300 V), dürfte den Übertaktern mit einem entsprechenden Mainboard, guter Kühlung und angehobener VCore viel Freude bereiten.

Aus diesem Grund unsere Empfehlung: Augen auf beim Prozessorkauf! Viele Prozessoren und gerade der hier von uns getestete Athlon 64 X2 5000+ ist mittlerweile in 4 verschiedenen Steppings auf dem Markt (F2, F3, G1 und G2). Es lohnt sich also in diesem Fall etwas genauer hinzusehen und auf das G2-Stepping zu bestehen.

Update:
Nachdem wir nachträglich nun auch noch die wichtigsten Werte des alten 90 nm F2-Steppings betrachtet haben, müssen wir konstatieren, dass unter dem Strich die 90 nm Athlon 64 X2 immer noch schneller sind, als die neuen 65 nm CPUs, selbst nach der Einführung des G2-Steppings. Die deutlich kürzeren Latenzzeiten beim Zugriff auf den L2-Cache machen den Unterschied. Daher gilt: wer sein System weder übertakten, noch untervolten will und obendrein keinen 24/7-Vollast-Betrieb fährt, wo der deutlich höhere Stromverbrauch des F2 ins Gewicht fallen würde, der kauft mit dem alten F-Stepping den schnellsten Athlon 64 X2 Prozessor. Für viele Modelle gibt es inzwischen auf Basis der alten 90 nm Produktion auch noch das neuere F3-Stepping, das weniger Strom verbraucht, als das F2-Stepping. Wer die Wahl hat, hat die Qual...

Links zum Thema:
- Preisvergleich G2-Stepping
- Preisvergleich G1-Stepping
- Preisvergleich F2-Stepping
- Preisvergleich F3-Stepping
- Preisvergleich AMD Athlon 64 X2 5000+
- BIOS-Probleme mit dem neuen G2-Stepping des Athlon 64 X2
- Artikel im Forum diskutieren

Testsystem Benchmarks:
MSI K9N Neo V2 BIOS 2.2
2x 1024 MB Aeneon PC2-6400 CL5 RAMs (auf by SPD Timings)
Seagate Barracuda 7200.10 250 GB 16 MB Cache
Windows XP SP2 Stand Juli 2007 Patchday
ATI Radeon X300SE mit Catalyst 7.9 ohne CCC.


Testsystem Untervolten und BOINC:
ASRock ALiveNF6-DVI BIOS 2.20
2x 1024 MB MDT PC2-6400 CL5 RAMs (auf by SPD Timings)
Seagate Barracuda 7200.10 250 GB 16 MB Cache
Windows XP SP2 Stand Juli 2007 Patchday
Onboard IGP
 
Zurück
Oben Unten