Die Skalierfähigkeit des AMD Duron - was Overclocking bringt

Nero24

Administrator
Teammitglied
Mitglied seit
01.07.2000
Beiträge
24.066
Renomée
10.446
  • BOINC Pentathlon 2019
  • BOINC Pentathlon 2020
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2021
Vor ein paar Monaten habe ich einen Artikel über die Skalierfähigkeit des AMD K6-2 veröffentlicht. Schon damals haben wir gesehen, daß eine lineare Erhöhung der Taktfrequenz nicht zwingend auch eine lineare Steigerung der Rechenleistung zur Folge hat. Prozessoren ohne oder mit nur sehr kleinen 2nd Level Caches trifft dieser Effekt natürlich ungleich härter, als jene, die mit ausreichend Pufferspeicher gesegnet sind. Ein Kriterium dafür ist die Relation Taktfrequenz / Speicherfrequenz, die derzeit immer weiter auseinanderzuklaffen droht. Wenn der Prozessor ständig auf Daten aus dem RAM warten muß, arbeitet er selbstredend nur sehr ineffizient.

Der Grund, warum ich diesen Test ausgerechnet mit dem AMD Duron durchgeführt habe, ist seine Beliebtheit bei den Overclockern. Er ist billig und hat ein Übertaktungs-Potential von mehr als 50%. Bis zu 950 MHz sollen Freaks aus einem 600er Duron mit Hilfe von Hochleitungskühlern gequetscht haben. Dies ist vermutlich nicht einmal gelogen, läuft doch mein 600er sogar mit einem popeligen Super 7 Kühler stabil mit 750 MHz. Doch für richtige Krawallo-Übertaktungen muß der User eine Menge Geld für entsprechende Kühlung (Peltier/Wasser) investieren. Nicht zu vergessen das sündhaft teuere Netzteil, das dem Stromdurst eines mit dann 1,85 V laufenden Durons @950 MHz gewachsen ist. Hier stellt sich natürlich die Frage, ob der Aufwand überhaupt lohnt. Genau deshalb habe ich versucht zu beleuchten, wie sich der Duron mit steigender Taktfrequenz verhält.

Hier zuerst das Testsystem:

<TABLE BORDER="1" WIDTH="100%" CELLPADDING="4" CELLSPACING="0" BGCOLOR="#FFFFFF" BORDERCOLOR="#000000" BORDERCOLORLIGHT="#000000" BORDERCOLORDARK="#000000"><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">CPU</FONT></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">AMD Duron 600</FONT></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">FSB-Takt</FONT></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">100 MHzDDR</FONT></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">vCore soll</FONT></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">1,5 V</FONT></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">L1 Cache Data / Code</FONT></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">64 KB /64 KB 2 wege assoziativ</FONT></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">L2 Cache unified</FONT></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">Fullspeed 64 KB 16 wege assoziativ exklusiv</FONT></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">Sockel</FONT></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">SockelA</FONT></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="+1">&nbsp;</FONT></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="+1">&nbsp;</FONT></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">Mainboard</FONT></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">Asus A7V Rev. 1.01</FONT></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">Mainboard Spannung</FONT></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">3,5 V</FONT></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">Externer L3 Cache</FONT></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">-</FONT></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">Chipsatz</FONT></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">VIAKT133</FONT></TD></TR><TR><TD WIDTH="50%"><P ALIGN="left"><FONT SIZE="2" FACE="Arial">Northbridge</FONT></P></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">VIA VT8363</FONT></TD></TR><TR><TD WIDTH="50%"><P ALIGN="left"><FONT SIZE="2" FACE="Arial">Southbridge</FONT></P></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">VIA VT82C686A</FONT></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">AGP-Treiber</FONT></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">4.03</FONT></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">Busmaster-Treiber</FONT></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">aus 4in 1 4.23</FONT></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">RAM</FONT></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">128 MB SDRAM PC-133 2-2-2</FONT></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">Grafikkarte</FONT></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">ELSA Erazor III TV AGP</FONT></TD></TR><TR><TD WIDTH="50%"><P ALIGN="left"><FONT SIZE="2" FACE="Arial">Chipsatz</FONT> </P></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">nVidia Riva TNT2 @ 150 MHz</FONT></TD></TR><TR><TD WIDTH="50%"><P ALIGN="left"><FONT SIZE="2" FACE="Arial">Speicher</FONT> </P></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">32 MB SDRAM @ 156 MHz</FONT></TD></TR><TR><TD WIDTH="50%"><P ALIGN="left"><FONT SIZE="2" FACE="Arial">Treiber</FONT> </P></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">nVidia Detonator 5.30</FONT></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">Monitor</FONT></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">Samsung SyncMaster 700p</FONT></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">1024x768</FONT></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">@ 100Hz</FONT></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">800x600</FONT></TD><TD ALIGN="center" WIDTH="50%" BORDERCOLOR="#000000" BGCOLOR="#FFFFFF" BORDERCOLORLIGHT="#000000" BORDERCOLORDARK="#000000"><FONT SIZE="2" FACE="Arial">@ 120 Hz</FONT></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">640x480</FONT></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">@ 160Hz</FONT></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">vsync</FONT></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">OFF</FONT></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">Quake III</FONT></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">Version1.17 + DLLs</FONT></TD></TR><TR><TD WIDTH="50%"><P ALIGN="left"><FONT SIZE="2" FACE="Arial">Einstellungen</FONT></P><FONT SIZE="+1"></FONT></TD><TD ALIGN="center" WIDTH="50%"><P ALIGN="left"><FONT SIZE="2" FACE="Arial">1. Grafikstufe &quot;Normal&quot;+ 640x480 16 Bit Colordepth<BR> 2. Grafikstufe &quot;Normal&quot; + 1024x768 + 32 Bit Texturquality<BR> 3. Highest Geometic D. + Lowest Texture D. + 512x384 + Vertex</FONT></P></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">3DMarks</FONT></TD><TD ALIGN="center" WIDTH="50%"><FONT SIZE="2" FACE="Arial">Standard Benchmarks mit vorgegebenen Aufl&ouml;sungen</FONT></TD></TR><TR><TD WIDTH="50%"><FONT SIZE="2" FACE="Arial">Gamestar</FONT></TD><TD ALIGN="center" WIDTH="50%"><P ALIGN="left"><FONT SIZE="2" FACE="Arial">D3D: Alle Optionen ON, Gouraurd Shading, Z-Buffer sortieren, Lineares Mipmapping, Alpha-Blending<BR> RGB: Kein Z-Buffer, Keine Sortierung, Mipmapping</FONT> </P></TD></TR></TABLE>

Zum letzten Test gegen den K6-III hat sich lediglich das VIA 4in1 Paket geändert, das jetzt die Version 4.23 besitzt.

Beginnen wir wie gewohnt mit meinem Neumeier Benchmark Ver. 4. Entscheidend bei unserer Zielsetzung sind nicht die absoluten Werte, sondern die Relation zur Basis - in diesem Fall zum Duron 500. Die Meßreihen, die gewöhnlich in Sekunden dargestellt werden, habe ich wegen der besseren Lesbarkeit in 1/s umgerechnet, sodaß sich in jedem Fall ein mit der Taktfrequenz steigender Graph ergibt. Die rote Linie gibt in allen Diagrammen die lineare Erhöhung der Taktfrequenz an. An diesem Idealzustand haben sich die Meßreihen zu orientieren.

dskalin.gif


Ein kurzer Blick auf das Diagramm genügt, um zu sehen, daß der Neumeier Benchmark Ver. 4 kein passender Test ist, um die Gesamtleistung eines Systems zu messen. Dafür sind die Datenmengen der ersten 4 Module einfach zu klein. Sie passen komplett in den L1 Cache des Prozessors und wachsen damit wohl oder übel mit der Taktfrequenz. Nur das fünfte Modul - Sort95 - fällt aus dem Rahmen. Dies liegt einfach daran, daß die 10.000 Strings der zu sortierenden Liste nicht komplett in den L1/L2 Cache passen und daher immer wieder aus dem langsamen RAM gelesen werden müssen. Wer einen Blick auf die Meßreihen des K6-2 Tests wirft wird sehen, daß der Duron bei Sort95 anfangs wesentlich schlechter skaliert, als sein Großvater K6-2, der zumindest noch einen externen 512 KB großen L2 auf dem Mainboard als doppelten Boden für sich nutzen konnte. Dafür verläuft die Steigung beim Duron aufgrund seines Fullspeed L2 zumindest gerade, während das K6-System mit seinem konstant 100 MHz langsamen L2 tangential an ein Maximum stößt.

Für den typischen Overclocker wesentlich interessanter dürften die Meßreihen der 3D-Benchmarks sein:

dskalid.gif


Hier ergibt sich ein komplett anderes Bild. Bei 3D-Tests stößt das System natürlich leicht an die Füllgrenze der Grafikkarte. Bei der heute üblichen Standardauflösung von 1024x768 ist die für den Test verwendete TNT2 AGP hoffnungslos überfordert. Ich habe die Werte (gelbe Linie) nur deshalb mit abgedruckt, um deutlich zu machen, daß eine Übertaktung nur dann etwas bringt, wenn die Grafikkarte damit auch umgehen kann. Die besagte gelbe Meßreihe zeigt den Verlauf von Quake III Arena in 1024x768x16 mit 32 Bit Texturqualität. Zwischen dem 500er und 800er Duron ist kein einziges Zehntel Frame Unterschied!!! Generell gilt natürlich: je niedriger die Auflösung, je einfacher die Texturen und je komplexer die Polygonen-Szenerie, desto näher ist die Linie an der roten Referenz. Aber selbst der Gamestar RGB-Test, der komplett ohne 3D-Beschleunigung arbeitet, ist weit von der idealen Steigung entfernt. Eine 60% höhere Taktfrequenz resultiert in nur 35% mehr Leistung. Der Durchschnitt der Meßwerte bewegt sich um die 25% Mehrleistung (wenn man den Extremfall der gelben Waagrechten ausklammert). Eine doch eher ernüchtende Erkenntnis.

Als nächstes konzentrieren wir uns auf die Rubrik "Duron At Work". Zu seinen typischen Einsatzgebieten rechne ich MP3-Encoden, Arbeiten mit Word und das Verwalten von Archiven. Die MP3-Datei erstellt der Plugger+ Encoder, das Word-Makro formatiert einen mehrere 100 Seiten langen Text rauf und runter und beim Archivieren muß WinRAR ein bereits komprimiertes, etwa 90 MB großes ARJ-Archiv ein weiteres mal in der höchstmöglichen Stufe als RAR-File packen.

dskaliw.gif


In diesem Beispiel ergeben sich komplett voneinander differierende Szenarien. Das MP3-Encoden kommt fast an den Idealzustand heran. Ein Indiz dafür, daß der Encoder nur jeweils sehr kleine Daten-Pakete für seine Arbeit benötigt. Daß die Linie dann doch knapp unterhalb der Referenz bleibt, liegt wohl daran, daß der Encoder die Prefetch-Funktion der AMD-Maschine nicht zu seinem Vorteil nutzt. Damit könnte der Chipsatz die nächsten Daten bereits holen, während die CPU noch mit der Berechnung des momentanen Frames beschäftigt ist.

Das plötzliche Abflachen der Word-Makro Linie bei 750 MHz dürfte wiederum an der Grafikkarte liegen. Hier ist wohl trotz nur 16 Bit Farbtiefe die Grenze der 2D-Leistung erreicht. Anders ist der abrupte Knick im zuerst fast idealen Verlauf kaum zu erklären. Unglaublich schlecht skaliert bei diesem Test der WinRAR-Packer! Wer auf die Festplatte als Flaschenhals tippt, liegt falsch. WinRAR versucht über 8 Minuten verzweifelt die 90 MB große ARJ-Datei noch weiter zu packen. Die HDD-LED blinkt dabei nur äußerst selten auf. Tatsächlich scheint das RAM der limitierende Faktor zu sein. Auffällig hingegen ist die merkwürdige Delle bei 700 MHz, die auch bei einigen 3D-Benchmarks im Diagramm darüber sichtbar ist. Dies ist kein Meßfehler. Als ich das Diagramm zum ersten mal sah, habe ich natürlich sofort weitere Male nachgemessen, jedoch ohne daß sich daran etwas geändert hätte. 700 MHz scheint eine ungünstige Taktfrequenz für ein Duron-System zu sein. Eventuell ist dies ein Punkt, wo die CPU beim Zugriff auf das langsame RAM ein zusätzliches Waitstate mehr einlegen muß und damit mehr verliert, als sie durch die höhere Frequenz gewinnt. Anders kann ich mir dieses seltsame Phänomen nicht erklären! Immerhin packt der 650er Duron das File schneller, als ein 700er!!!

Zum Schluß wollen wir noch die Frage klären, in wieweit das RAM die Leistungsfähigkeit des Systems beeinflußt. Zum einen natürlich im Hinblick auf die vielen Upgrader, die vor der Entscheidung stehen, PC-100 SDRAM zu behalten und damit Leistungseinbußen in Kauf zu nehmen, oder in derzeit sündhaft teueres PC-133 zu investieren. Zum anderen lassen sich damit natürlich auch Schlüsse auf die kommenden DDR-RAM Plattformen ziehen.

dskalir.gif


Wie erwartet auch hier wieder ein sehr gespaltenes Ergebnis. Die Tests mit kleinen Datenmengen oder die durch die Grafikkarte limitierten scheren sich einen Teufel um die Geschwingkeit des RAMs. Andere, wie das Packen mit WinRAR oder der Q3A-Benchmark bei 512x384 und höchster Geometiestufe profitieren spürbar von PC-133. Interessant ist auch der 3DMark99 1st Person Test. Bei diesem AGP-intensiven Benchmark muß sich die CPU die verringerte Bandbreite des PC-100 RAMs auch noch mit dem AGP-Port teilen, was sich sofort in einem merklichen Abfall der Framerate bemerkbar macht.

Nicht sehr viel anders dürfte das obige Diagramm natürlich mit DDR-RAM versus SDRAM aussehen - nur etwas ausgeprägter. Die 33%ige Erhöhung der RAM-Frequenz von PC-100 auf PC-133 hat im realen Einsatz zwischen 0 und 5% mehr Leistung gebracht. Der satte Zuwachs von 100% (PC-133 auf 133 MHz DDR-RAM) wird nach Adam Riese maximal 15% Vorsprung ergeben. Nicht schlecht, aber eben auch nicht so gut, wie viele sich vielleicht erhofft hatten.

Somit muß im Endeffekt jeder anhand seines Einsatzgebietes selbst entscheiden, ob sich der Wechsel auf die 33 MHz schnelleren SDRAMs oder das Warten auf DDR-RAM für ihn lohnt. Die differenzierte Darstellung des Diagramms kann dabei in jedem Fall sehr hilfreich sein...
 
Zurück
Oben Unten