Erstes kleines Dual Core Preview

Dresdenboy

Redaktion
☆☆☆☆☆☆
Mitglied seit
28.10.2003
Beiträge
3.090
Renomée
203
Standort
Berlin
http://www.hwupgrade.it/articoli/1193/1.html

Es ist zwar auf Italienisch, aber die Bilder sagen schon alles. Und wer sich selbst keine Schlüsse ziehen mag, kann ja Babelfish nutzen. ;)

Interessant ist, daß das DC-System bei dem verwendeten Benchmark noch etwa 2,5% schneller ist, als ein Dual Opteron System mit Opteron 250 (auch 2,4GHz). Unterschiede können sich allerdings schon durch die Speichertypen ergeben (Opteron 250 mit registeren RAM). Aber die 2 Opterons haben wahrscheinlich jeweils eigenen Speicher, während der DC mit der halben Speicherbandbreite leben muß.

Doch kann es durchaus sein, daß Cinebench recht wenig RAM-Zugriffe verursacht und gut mit dem Cache auskommt. Der Skalierungfaktor vom 3000+ im Chart zum 3200+ beträgt 96,5% und vom 3200+ zum 3500+ sogar 98,9%. Das zeigt, daß die CPU zum größten Teil selbts ausschlaggebend für das Ergebnis ist. Das ist wohl auch der Grund, warum Intel für die Smithfield-Vorführung auf der IDF auf Cinebench zurückgriff. So ein Benchmark läßt Dual Core CPUs in bestem Licht erscheinen. Spannend wird es, wenn Ergebnisse auf breiterer Front verfügbar werden.

Hier noch der Chart:
benchmark.png
 
Original geschrieben von Dresdenboy
Interessant ist, daß das DC-System bei dem verwendeten Benchmark noch etwa 2,5% schneller ist, als ein Dual Opteron System mit Opteron 250 (auch 2,4GHz). Unterschiede können sich allerdings schon durch die Speichertypen ergeben (Opteron 250 mit registeren RAM). Aber die 2 Opterons haben wahrscheinlich jeweils eigenen Speicher, während der DC mit der halben Speicherbandbreite leben muß.

Dafür muss der DualCore nicht über den HTr, welcher einiges an Latenzen fressen dürfte im Vergleich zum XBar. Vor allem bei Anwendungen, die viel auf dem Cache arbeiten können, sollte das stark ins Gewicht fallen.
 
Erstaunlich und positiv, daß AMD bereits ein Engineering Sample mit 2* 2,4 GHz liefern kann. Nachdem ja diesmal nicht der Takt, sondern die max. Leistungsaufnahme ein Limit ist (Boards gehen eben nur bis 80A sicher), kann man für serie nur Gutes erwarten.

Also auch 1 MB-L2 für die Serie, vielleicht in gewohnter (Barton/Thorton) Manier noch 2* 512k für langsamere Modelle.

Schön auch, das der einzelne Duale Chip bereits knapp am Xeon DP System mit 4 logischen Kernen ist.
Der Smithfield EE könnte den Abstand vielleicht wieder leicht erhöhen (bessere CPU <> CPU Kommunikation), vielleicht bricht er aber durch nur 2* 3,2 GHz wieder etwas ein.
 
Original geschrieben von PuckPoltergeist
Dafür muss der DualCore nicht über den HTr, welcher einiges an Latenzen fressen dürfte im Vergleich zum XBar. Vor allem bei Anwendungen, die viel auf dem Cache arbeiten können, sollte das stark ins Gewicht fallen.
Das habe ich ja vor längerer Zeit hier mit anderen inkl. dir diskutiert. Wir können den Einfluß dieser Architektur aber nur abschätzen, wenn Benchmarkergebnisse vorliegen, die mehr RAM-Zugriffe verursachen und auch mehr Kommunikation zw. den CPUs erfordern. Das scheint hier nicht der Fall zu sein.
 
Original geschrieben von rkinet
Erstaunlich und positiv, daß AMD bereits ein Engineering Sample mit 2* 2,4 GHz liefern kann. Nachdem ja diesmal nicht der Takt, sondern die max. Leistungsaufnahme ein Limit ist (Boards gehen eben nur bis 80A sicher), kann man für serie nur Gutes erwarten.
Sehe ich ganz genauso. Ein ES mit 2.4 GHz DualCore ist schon ziemlich heftig. Was da in Serie kommt, wird wohl noch einige Kinnladen klappen lassen ... ;)

Interessant ist auch der gut 3% Vorteil gegenüber dem Dual-Opteron bei gleichem Takt. Vermutlich auf non-registered Speicher, 800 MHz vs. 1000 MHz HT sowie interne Verbesserungen zwischen 130nm Clawhammer und dem getesteten 90nm Core zurückzuführen.
 
Original geschrieben von rkinet
Erstaunlich und positiv, daß AMD bereits ein Engineering Sample mit 2* 2,4 GHz liefern kann. Nachdem ja diesmal nicht der Takt, sondern die max. Leistungsaufnahme ein Limit ist (Boards gehen eben nur bis 80A sicher), kann man für serie nur Gutes erwarten.

Also auch 1 MB-L2 für die Serie, vielleicht in gewohnter (Barton/Thorton) Manier noch 2* 512k für langsamere Modelle.

Schön auch, das der einzelne Duale Chip bereits knapp am Xeon DP System mit 4 logischen Kernen ist.
Der Smithfield EE könnte den Abstand vielleicht wieder leicht erhöhen (bessere CPU <> CPU Kommunikation), vielleicht bricht er aber durch nur 2* 3,2 GHz wieder etwas ein.
mas auf IHub hat die Hotchips-Presentations verlinkt. Da findest du auch den Vortrag, welcher zeigt, was AMD alles vorgenommen hat, um ein besseres Low Power Modell des A64 (sehr wahrscheinlich der jetzige Turion) zu erhalten. Die Dual-Core-CPU wurde im Vortrag als weiterer Anwendungsfall gezeigt.

Die 2x512kB L2 Teile kommen garantiert, es sei denn, AMD stoppt deren Produktion, nachdem ich davon erfahren habe. Aber das macht auch Sinn. Die von uns hier ermittelte Die-Size im Bereich von 155 mm² spart ja etwa 26% an Die-Fläche und erhöht damit die Ausbeute pro Wafer um einiges. Das ist sogar ein klein wenig mehr eingespart, als z.B. vom 1MB A64 zum 512kB A64, weil beim DC etwas weniger Fläche für I/O verwendet wird (die 2 Kanten zwischen den Einzel-CPUs sind ja weggefallen).

Bedenke aber, das der Smithfield sich sehr wahrscheinlich genauso verhält, wie 2 einzelne Cores an einem FSB. Da hat es Intel sogar einfacher als AMD, weil sie keine Punkt-zu-Punkt-Verbindungen nutzen, wie schon der K7, sondern einen richtigen Bus, über den man auch mehrere Cores verbinden kann. Das kann beim Smithfield eigentlich schon durch einfaches Aussägen 2er Einzel-Dies in einem Stück und entsprechend angepasstes Packaging erreichen.
 
Original geschrieben von xxmartin
... non-registered Speicher, 800 MHz vs. 1000 MHz HT sowie interne Verbesserungen zwischen 130nm Clawhammer und dem getesteten 90nm Core zurückzuführen.
Die internen E-Revision Verbesserungen werden wohl das Meiste ausmachen. Schließlich ist auch der 1CPU Test um 0,7 Punkte schneller als ein "normaler" A64 4000+. Letzerer ist wiederum nur um 0,3 Punkte besser als ein Opteron 250. Unter der Annahme, dass einigermaßen vergleichbare RAM Timings verwendet wurden, läßt sich also schließen, dass das registered RAM keinen soo großen Einfluß hat.
Zur Info:
Da mein System in der gleichen Region liegt, hab ich mal den Test kurz laufen lassen. Mein Opteron 146@150 braucht 78,1 Sekunden. Speichertakt liegt dabei auch bei ~200 Mhz, da ich den 5:6 Teiler ("166Mhz") einschalten muss, damit das RAM noch stabile CL2:3:2 Werte schafft. Hypertransport ist bei dem Test wohl ziemlich unerheblich, ich hab ein 16/8bit nforce3 board ... Wen es trotzdem interessiert, bei mir taktet derselbige schön nach Spezifikation mit 2,5 * 240 Mhz = 600 Mhz :)

Eventuell spielt auch noch das BS eine kleine Rolle bei den "schlechten" Werte des Dual Opteron Systems. Es fehlt der NUMA Support, sodass sich die beiden Opterons Daten quer über den Htr nutzlos gegenseitig zuschieben. Bei dem neuen Dual Core geht das ja erst gar nicht ;-)

Aber der Abstand ist so gering, da reichen die internen Verbesserungen und Unterschiede in den RAM-Ansprechzeiten als Erklärung.
Genaueres kann man nur sagen, wenn man mehr Infos über die Testumgebungen hätte. Gibt es die Liste vielleicht noch irgendwo anders ? Ich mein der Kollege wird ja kaum mal schnell auf der cebit ~30 Konfigurationen selbst getestet haben. Wenn die Quelle bekannt wär, findet man dort vielleicht auch mehr Systeminfos.

ciao

Alex
 
@Opteron:
Die Liste ist mir bisher noch nicht bekannt gewesen, aber vielleicht hilft da eine Web-Image-Suchmaschine.

Bezügl. E-Stepping-Auswirkungen:
Diese (wie auch eventuelle Bugfixes beim D0-Stepping, die nicht mehr das Abschalten bestimmter Features erfordern) bezogen sich meistens (bis auf SSE3) auf Speicherzugriffe - d.h. z.B. Prefetching, MCT-Optimierungen. Aber wie es scheint, ist die Auswirkung der Speichergeschwindigkeit zumindest hier nicht so groß. Evtl. könntest du ja mal den Test beim Opteron mit sehr langsamen Speichereinstellungen machen.
 
moin

ich brauche mit meinem sys 52,8 sec.

ich hoffe mal, dass der dual-core athlon preislich deutlich unter einem dual-opteron
system angesiedelt wird.
dann wäre es mein nächster prozessor ;)

gruss

heftig
 
Zuletzt bearbeitet:
Also jetzt geht mir grade ein Licht auf warum AMD z.Z. so langsam an der Taktschraube dreht: Die wollen einfach verhindern das die DUAL Cores in manchen/vielen Anwandungen langsamer sind als die Singles bei gleichem Takt?!? Wäre doch net möglichkeit oder?

Naja vieleicht isses auch was anderes ^^

Auf jedenfall: IMPRESSIV und ich hoffe das Terragen auch DUAL Core unterstützt :D
 
Original geschrieben von Opteron
Aber der Abstand ist so gering, da reichen die internen Verbesserungen und Unterschiede in den RAM-Ansprechzeiten als Erklärung.
Genaueres kann man nur sagen, wenn man mehr Infos über die Testumgebungen hätte. Gibt es die Liste vielleicht noch irgendwo anders ? Ich mein der Kollege wird ja kaum mal schnell auf der cebit ~30 Konfigurationen selbst getestet haben. Wenn die Quelle bekannt wär, findet man dort vielleicht auch mehr Systeminfos.
Nachtrag:
Google-Ergebnis

Dort findest du viele Cinebench-Ergebnisse der gleichen Site. Allerdings gibt es nur wenige Artikel, wo S940 und S939 gleichzeitig beteiligt sind. Tip: Die Artikel-Nr. in der URL läßt grob auf das Alter schließen.
 
@Dresdenboy:
Danke für die Links, so wies ausschaut sind die Ergebnisse ziemlich unabhängig von der CL, komischerweise gibts bei mir einen (kleinen) Unterschied, wenn ich die Refreshwerte verändere (von 2520 µs auf 3120 µs). In Zahlen: 0,2-0,3 Sekunden Unterschied... Das wars auch wieso ich im ersten Lauf 78,1 s erreichte. Mit 2520 µs sind es, egal ob CL2 oder CL3, 78,3 oder 78,4 Sekunden. Wieso das von der Refreshzeit abhängt, keine Ahnung, vielleicht beeinflußt der BIOS Schalter auch andere Parameter.
Allerdings kratzt man bei solchen Werten schon an der Testgenauigkeit.

Fazit: Am RAM liegen die Punktunterschiede höchstwahrscheinlich nicht, hier erreicht z.B. ein FX53 (hat ja auch 2,4 Ghz) 78,3 laut Testbeschreibung mit reg. RAM und CL2,5. An dem kleinen Tempovorsprung des neuen Dualcores, werden wohl alleine die internen Verbesserungen daran "schuld" sein :) Mal Abwarten, bis die ersten Rivision E single core K8 herauskommen und was die dann leisten.

ciao

Alex
 
Zuletzt bearbeitet:
Original geschrieben von Dresdenboy
und von da auch ein Vergleichwert vom Smithfield:
http://www.vr-zone.com/?i=1821&s=1: 44 Sekunden.
Sehr interessant! Das Bild hatte ich zwar auch schon gesehen, aber nicht unter diesem Gesichtspunkt.

Und der XE 840 ist mit 3.2 GHz schon am Limit dessen was Intel launchen will (2.8/3.0/3.2) und trotzdem 8% langsamer als ein 2.4 GHz K8-DualCore.

Sieht mal wieder gut aus für AMD. :)
 
Original geschrieben von xxmartin
Und der XE 840 ist mit 3.2 GHz schon am Limit dessen was Intel launchen will (2.8/3.0/3.2) und trotzdem 8% langsamer als ein 2.4 GHz K8-DualCore.
Tja ... mehr geht halt bei der Verlustleistung nicht .. jetzt rächt sich der hohe Stromverbrauch doppelt ... Intel hätte lieber nen alten Northwood core nehmen sollen, der liefert mit 3,2 GHz wenigstens respektable Leistung. Man braucht nur die Werte des 3,46 GHz P4 EE in der geposteten Tabelle anschauen :)

ciao

Alex
 
Zurück
Oben Unten