AMD liefert bereits M2 Samples - DDR-II ab Q1'06 im Handel

Es gibt ja die Vermutung, dass nicht mehr Bandbreite zu sehen ist, da der Cache einfach nicht schnell genug. Hab mal schnell ein TecChannel Diagramm herausgepickt: Transferleistung eines Athlon 64 X2 4800+:
01852BF4D7B60B7C945F4FA51F12ABBA_1000x700.jpg

Ich denke an der Theorie ist durchaus etwas dran, maximal erreicht der L2 Cache ca. 6500 MB/s.

Dann müsste man sich aber echt fragen: Warum weiß dass AMD nicht selber, dass da ein Nadelöhr besteht? Ist an dieser Theorie etwas dran, dann müsste jedoch zumindest ein Dual-Core in speicherintensiven Multithreading Anwendngen von dieser Bandbreite profitieren können.

Insgesamt frage ich mich aber sowiso: Wieso ist bei AMD das Cache Subsystem so langsam, theoretisch könnte der L2 Cache einen Wert von 32 GB/s erreichen *noahnung*
 
Ich glaub so langsam solltest auch du anerkennen, dass da einfach net mehr geht und der AM2 keinen riesigen Schub bringen wird.
Oben = mtb][sledgehammer sieht man das alte Nadelöhr des heutigen K8.

AMD ist sicherlich nicht entgangen, daß der L2 ein Limit hat.
Definitiv aber hat AMD aber den gesamten Memorycontroller incl. L2 für Pacifica überarbeitet und es erscheint sehr erstaunlich daß das Endprodukt wieder bei ca. 6-7 GByte/s an Grenzen stößt.

AM2 ist übrigens die Basis für DDR-II UND -III, also noch mehr Grund zum handeln.
Bliebe noch die Lösung, daß nur Stepping F / 90nm limitiert ist, aber AMD hat ja schon mit die OEMs auf DDR-II 800 eingeschworen, was Blödsinn wäre, wenn obiges Limit beim Stepping F im Serienprodukt verbliebe.
Wenn man an den Test bei THG zurückdenkt (nur langsamtes Timing = DDR-II 400 möglich) dann sieht es wirklich nicht nach optimierten Vorseriensteppings aus.
 
Ich behaupte auch nicht, dass das ewig bei AM2 so bleiben wird. Aber ich denke, dass sich beim Stepping F bis zum Verkaufsstart keine enormen Sprünge mehr ergeben werden.
Das ist auch aus alter Planung heraus gar nicht nötig, denn Am2 + Stepping F ist eher ein evolutionärer Schritt. Keinesfalls als Conroe Konkurrenz gedacht.

MfG
 
mtb][sledgehammer;2687043 schrieb:
Ist an dieser Theorie etwas dran, dann müsste jedoch zumindest ein Dual-Core in speicherintensiven Multithreading Anwendngen von dieser Bandbreite profitieren können.

habe ich etwas verpasst? denn genau solche benches - nämlich dual-core/multi-threading - habe ich hinsichtlich ddr2 und am2 noch nicht gesehen. es waren doch durchweg nur einzelne anwendungen. wenn diese nicht besonders bandbreitenlastig sind (z.b. games), dann ist doch klar, daß ddr2 wenig bringt. deswegen wundere ich mich auch ein wenig über die bisherige aufregung bzw. enttäuschung. der letzte test bei andandtech hat doch deutlich gemacht:

- der neue sockel am2 bringt gegenüber 939 minimalste leistungszuwächse bei ddr667, bei ddr800 immerhin schon mehr. dies ist schonmal besser gelungen, als ehedem mal wieder bei intel :-)

- anwendungen, die keine bandbreite brauchen, profitieren nicht (welch ein wunder :] )

desweiteren zu bemerken:

- multithreading und multicore wurde noch nicht speziell ausgetestet

- latenzen von ddr2 bewegen sich abwärts

- höher getaktete athlon64 profitieren mehr, ebenso multicore. d.h. ddr2 sichert das gute skalieren! dies gilt gerade auch für den kommenden k8l, der mehr datennachschub für seine verbesserte fpu brauchen wird (integer einheit bleibt unverändert, oder?)

ich finde, man sollte lieber mal festhalten, daß amd völlig recht hatte mit dem langen warten auf ddr2, nicht wahr? und der conroe schreckt mich nicht, die gründe sind so klar und oft genannt, brauche ich nicht wiederholen...

fazit: sockel am2 ist keine revolution sondern investition in die zukunftssicherheit der athlon64 architektur. und, wie so oft bei amd im gegensatz zu intel: mehr leistung bei weniger energieverbrauch. daher: richtige richtung!

p.s.:

1. fünf eis, daß der conroe sich verspätet

2. zehn eis, daß er zum zeitpunkt des erscheinens keine 10% rechenstärker ist, als die schnellste amd cpu (benches: alles querbeet ;-) )
 
Zuletzt bearbeitet:
- latenzen von ddr2 bewegen sich abwärts

ich finde, man sollte lieber mal festhalten, daß amd völlig recht hatte mit dem langen warten auf ddr2, nicht wahr? und der conroe schreckt mich nicht, die gründe sind so klar und oft genannt, brauche ich nicht wiederholen...
a) geringe Latenzzeiten zeigt, daß AMD DDR-II voll ausnutzt

b) DDR-II früh (=400/533) war wirklich nur ein Marketing-Gag von Intel. Allerdings stellt AMD ja selbst den Sempron auf Dual-Channel DDR-II um, also muss das Produktionsstepping hier wirklich Vorteile vs. So.939 oder gar So.754 bringen.
Zumindest sollten die Transferraten in Richtung 11 MBit/s gehen, selbst Pacifica kann nicht im K8 drosseln wie die ersten Ergebnisse es vermuten lassen.
 
mtb][sledgehammer;2687043 schrieb:
Ist an dieser Theorie etwas dran, dann müsste jedoch zumindest ein Dual-Core in speicherintensiven Multithreading Anwendngen von dieser Bandbreite profitieren können.
Ja, eine sehr gute Erklärung! Macht für mich jedenfalls sehr gut Sinn.

Den "Beleg" für speicherintensives Multithreading liefert Anandtech ja gleich mit. CoD 2 war ja das Game, daß in den Benchmarks teilweise 10% und mehr profitiert hat von DDR2.

http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2741&p=3

Call of Duty 1.2 was used in these tests, which supports dual processors, and test results did not follow the same expected scaling of other benchmarks. For this reason, the Call of Duty 2 results are considered suspect until we have more experience with Revision 1.2.

Ich finde, das ist die Bestätigung Deiner Vermutung schwarz auf weiß.
 
habe ich etwas verpasst? denn genau solche benches - nämlich dual-core/multi-threading - habe ich hinsichtlich ddr2 und am2 noch nicht gesehen. es waren doch durchweg nur einzelne anwendungen. wenn diese nicht besonders bandbreitenlastig sind (z.b. games), dann ist doch klar, daß ddr2 wenig bringt. deswegen wundere ich mich auch ein wenig über die bisherige aufregung bzw. enttäuschung. der letzte test bei andandtech hat doch deutlich gemacht:

- der neue sockel am2 bringt gegenüber 939 minimalste leistungszuwächse bei ddr667, bei ddr800 immerhin schon mehr. dies ist schonmal besser gelungen, als ehedem mal wieder bei intel :-)

- anwendungen, die keine bandbreite brauchen, profitieren nicht (welch ein wunder :] )

desweiteren zu bemerken:

- multithreading und multicore wurde noch nicht speziell ausgetestet

- latenzen von ddr2 bewegen sich abwärts

- höher getaktete athlon64 profitieren mehr, ebenso multicore. d.h. ddr2 sichert das gute skalieren! dies gilt gerade auch für den kommenden k8l, der mehr datennachschub für seine verbesserte fpu brauchen wird (integer einheit bleibt unverändert, oder?)

ich finde, man sollte lieber mal festhalten, daß amd völlig recht hatte mit dem langen warten auf ddr2, nicht wahr? und der conroe schreckt mich nicht, die gründe sind so klar und oft genannt, brauche ich nicht wiederholen...

fazit: sockel am2 ist keine revolution sondern investition in die zukunftssicherheit der athlon64 architektur. und, wie so oft bei amd im gegensatz zu intel: mehr leistung bei weniger energieverbrauch. daher: richtige richtung!

p.s.:

1. fünf eis, daß der conroe sich verspätet

2. zehn eis, daß er zum zeitpunkt des erscheinens keine 10% rechenstärker ist, als die schnellste amd cpu (benches: alles querbeet ;-) )

Bei Intel kann man aber aufgrund des FSB"s den DDR-RAM II schneller als den FSB laufen lassen. Bei AMD ist dies aufgrund des anderen Prinzips nicht möglich !

Vermutlich wird die CPU da keinen Nutzen ziehen können, aber evt. die restlichen Komponenten die daran angeschlossen sind.

Und warum sollte sich der Conroe verspäten, bisher kamen die neuen Intel 9xx Modelle auf dem Markt mit neuem Stepping, den Core-Duo fürs NB u.s.w, warum sollte dies jetzt gerade beim Conroe anders sein.

Ich gehe des weiteren einfach davon aus, das 10% durchaus realitisch sind, vielleicht aber nicht in allen Bereichen, das wird man sehen.

Er soll aber wohl weniger Verbrauchen, ...........

Warum sollte AMD von OC mehr profitieren als AMD, da hast du wohl die vielen Pentium Mobile Thread übersehen, der skaliert verdammt gut, und das trotz seiner bescheidenen Speicheranbindung, darin sieht man jedenfalls deutlich das "Speicherbandbreite" nicht alles, zumal scheint diese Speicherorganisation in der CPU optimierter als bei AMD.

DDR-RAM II bringt ja auch nicht nur Vorteile, siehe A64er teilweise auch heute zickt der interne Controller ganz schön rum, und kann je nach CPU unterschiedlich ausfallen - ich gehe mal davon aus das mit DDR-RAM II in den kommenden Wochen ebenfalls erstmal mit Problemen zu rechnen ist, und das ganze erstmal reifen muß. Ähnlich wie bei den ersten A64er Clawhammer, und wie es jetzt bei den Venice der Fall ist. Da hat sich nochmal einiges getan, neue Steppings gab es.

Aber ich denke das sowohl bei Intel auch AMD man 6-12 Monate später ausgereifte Produkte kaufen kann.
 
mtb][sledgehammer;2687043 schrieb:
Es gibt ja die Vermutung, dass nicht mehr Bandbreite zu sehen ist, da der Cache einfach nicht schnell genug. Hab mal schnell ein TecChannel Diagramm herausgepickt: Transferleistung eines Athlon 64 X2 4800+:
[Bild siehe Originalposting]
Ich denke an der Theorie ist durchaus etwas dran, maximal erreicht der L2 Cache ca. 6500 MB/s.

Dann müsste man sich aber echt fragen: Warum weiß dass AMD nicht selber, dass da ein Nadelöhr besteht? Ist an dieser Theorie etwas dran, dann müsste jedoch zumindest ein Dual-Core in speicherintensiven Multithreading Anwendngen von dieser Bandbreite profitieren können.

Insgesamt frage ich mich aber sowiso: Wieso ist bei AMD das Cache Subsystem so langsam, theoretisch könnte der L2 Cache einen Wert von 32 GB/s erreichen *noahnung*
Die 32 bit-Transfer-Tests sind noch nicht aussagekräftig genug. Deshalb hier (auch mit interessanten Unterschieden!) die 128 bit-Transfer-Diagramme vom X2 4800+:

2DC415C16D8DED65BD817952F9BDA774_1000x700.jpg


und FX-60:

3067C5A86AFC52AF91B5F558CC8C0F17_1000x700.jpg


(http://www.tecchannel.de/technologie/prozessoren/434002/index18.html

Das sind schon seltsame Unterschiede bei 2 CPUs, die sich architektonisch doch kaum unterscheiden sollten. Möglicherweise bewirkt durch untersch. Board/BIOS u. entsprechend andere IMC-Konfiguration, trotz gleichen Speichers. Aber reine Lese-/Schreib-Schleifen werden kaum die Load-Store-Unit- und IMC-Buffer beanspruchen, wie die des Stream-Benchmarks.
 
Bei Intel kann man aber aufgrund des FSB"s den DDR-RAM II schneller als den FSB laufen lassen. Bei AMD ist dies aufgrund des anderen Prinzips nicht möglich !

Vermutlich wird die CPU da keinen Nutzen ziehen können, aber evt. die restlichen Komponenten die daran angeschlossen sind.
Der Memorycontroller sitzt im Core. Daher würden mich folgende Fragen interessieren:

1. Welche "restlichen Komponenten" (ausser der CPU) sind an den Memorycontroller angeschlossen?
2. Wie sind diese dort angeschlossen?
3. Warum sollten diese dann ausgerechnet mehr von einer schnelleren Anbindung des Controllers profitieren, als der Core selbst?

Und warum sollte sich der Conroe verspäten, bisher kamen die neuen Intel 9xx Modelle auf dem Markt mit neuem Stepping, den Core-Duo fürs NB u.s.w, warum sollte dies jetzt gerade beim Conroe anders sein.
Mir wäre jetzt aus dem Stehgreif keine CPU aus den letzten Jahren bekannt, die pünktlich geliefert wurde - und zwar an den Kunden im Laden (oder meinetwegen auch Online-Shop)!
Bitte nicht verwechseln: Auslieferung von OEM-Mustern =! Markteinführung

Ich gehe des weiteren einfach davon aus, das 10% durchaus realitisch sind, vielleicht aber nicht in allen Bereichen, das wird man sehen.

Er soll aber wohl weniger Verbrauchen, ...........
Wovon redest Du jetzt? Vom Conroe oder vom AM2? Hmm ... ist wohl auch egal, denn das dürfte auf beide zutreffen.

Warum sollte AMD von OC mehr profitieren als AMD, da hast du wohl die vielen Pentium Mobile Thread übersehen, der skaliert verdammt gut, und das trotz seiner bescheidenen Speicheranbindung, darin sieht man jedenfalls deutlich das "Speicherbandbreite" nicht alles, zumal scheint diese Speicherorganisation in der CPU optimierter als bei AMD.
Warum verkauft dann Intel keine PMs für den Desktop, wo diese doch so gut sind und so hervorragend skalieren?
Gehört aber nicht in diesen Thread ... nur mal so zum Nachdenken.

DDR-RAM II bringt ja auch nicht nur Vorteile, siehe A64er teilweise auch heute zickt der interne Controller ganz schön rum, und kann je nach CPU unterschiedlich ausfallen - ich gehe mal davon aus das mit DDR-RAM II in den kommenden Wochen ebenfalls erstmal mit Problemen zu rechnen ist, und das ganze erstmal reifen muß. Ähnlich wie bei den ersten A64er Clawhammer, und wie es jetzt bei den Venice der Fall ist. Da hat sich nochmal einiges getan, neue Steppings gab es.
Wenn Du die Probleme meinst, die irgendwelche OC-ler mit ihrem hoffnungslos getakteten Speicher haben oder mit Riegeln, die nicht innerhalb festgelegter Spezifikationen laufen, Wayne ...:]
Oder hab ich jetzt irgendeine Rückrufaktion von CPUs wegen teildefekter Memorycontroller verpasst?
 
@derDuke

danke für die antworten - war mir einfach zu doof :]

für zidane dennoch eine ergänzung: beim skalieren der amd-cpus geht es nun wirklich um alles a u ß e r den bedürfnissen der oc-gemeinde. es geht darum, daß reguläre höhere taktraten auch tatsächlich beim kunden mehr leistung ankommen lassen. gleiches gilt insbesonders für server mit mehreren cpus.

also, guckst du:

specint_rate.gif


specfp_rate.gif


gerade bei der fp leistung müßte der woodcrest schon noch deutlich zulegen. nun gut, angeblich sind es 800mhz und wie immer fetter cache, die eh noch drauf kommen ( http://planet64bit.de/node/1326 ). dennoch: zum überholen fehlt schon noch was, wenn amd endlich auch mit 65nm rauskommt...
 
Der Memorycontroller sitzt im Core. Daher würden mich folgende Fragen interessieren:

1. Welche "restlichen Komponenten" (ausser der CPU) sind an den Memorycontroller angeschlossen?
2. Wie sind diese dort angeschlossen?
3. Warum sollten diese dann ausgerechnet mehr von einer schnelleren Anbindung des Controllers profitieren, als der Core selbst?

Mir wäre jetzt aus dem Stehgreif keine CPU aus den letzten Jahren bekannt, die pünktlich geliefert wurde - und zwar an den Kunden im Laden (oder meinetwegen auch Online-Shop)!
Bitte nicht verwechseln: Auslieferung von OEM-Mustern =! Markteinführung

Wovon redest Du jetzt? Vom Conroe oder vom AM2? Hmm ... ist wohl auch egal, denn das dürfte auf beide zutreffen.

Warum verkauft dann Intel keine PMs für den Desktop, wo diese doch so gut sind und so hervorragend skalieren?
Gehört aber nicht in diesen Thread ... nur mal so zum Nachdenken.

Wenn Du die Probleme meinst, die irgendwelche OC-ler mit ihrem hoffnungslos getakteten Speicher haben oder mit Riegeln, die nicht innerhalb festgelegter Spezifikationen laufen, Wayne ...:]
Oder hab ich jetzt irgendeine Rückrufaktion von CPUs wegen teildefekter Memorycontroller verpasst?

Wenn du mal lesen könntest, was Treverer geschrieben hat, und dann genau meine Antworten lesen würdest, würdest du hier jetzt keine Fragen stellen, was ich hier und da vermutlich gemeint habe könnte. Habe aber auch ehrlichgesagt keine Lust, jeden Thread wieder auseinander zu wursteln, wieder zu Antworten und jemand daher kommt und meint alles besser wissen zu müssen. Warten wir besser ab bis jeder nen Conroe, AM-2 kaufen kann, und falls ich richtig liege .......melde ich mich gerne nochmal zurück, um zu Fragen wiso man mir damals das Gegenteil behauptete.

@Treverer, was hat das jetzt mit dem eigentlichen Thema zu tun, und mit dem worauf ich auf deinem Post eingegangen war, der mir den Anschein hatte, ehr Contra Intel eingestellt zu sein. Als wenn bei AMD alles weiter entwickelt wäre, kann ich aber auch verstehen, da man ja nun evt. Angst haben muß das Intel nunmal ein besseres Produkt anbieten kann wie Jahre zuvor.
 
Ich geb ein paar Sachen zur Auswahl:

=>Der AM2 ist schlecht.

=>Intel ist schlecht.

=>Alles ist schlecht.

=>Mir ist schlecht.


*lol*
Btw.: Ich plädiere für letzteres.
 
mtb][sledgehammer;2687043 schrieb:
Es gibt ja die Vermutung, dass nicht mehr Bandbreite zu sehen ist, da der Cache einfach nicht schnell genug.
Ich denke an der Theorie ist durchaus etwas dran, maximal erreicht der L2 Cache ca. 6500 MB/s.

Dann müsste man sich aber echt fragen: Warum weiß dass AMD nicht selber, dass da ein Nadelöhr besteht? Ist an dieser Theorie etwas dran, dann müsste jedoch zumindest ein Dual-Core in speicherintensiven Multithreading Anwendngen von dieser Bandbreite profitieren können.

Insgesamt frage ich mich aber sowiso: Wieso ist bei AMD das Cache Subsystem so langsam, theoretisch könnte der L2 Cache einen Wert von 32 GB/s erreichen *noahnung*
Wie kommst du auf 32 GB/s ?
Der L2 ist mit 64+64 Bit angebunden. Daraus resultiert für einen L2 bei einem Takt von 2,4 Ghz eine theoretische Bandbreite von 19200 MB/s.
Schon etwas ältere aber interessante Artikel:
http://www.digit-life.com/articles2/amd-hammer-family/amd-hammer-family2-add0.html
http://www.cpuid.com/reviews/K8/index.php
Für DDR2:
http://www.digit-life.com/articles2/ddr2-rmma/ddr2-rmma.html

Man sollte hier beachten das die theoretische Bandbreite mit dem Takt steigt. Die gemessene Bandbreite steigt aber nur unterdurchschnittlich.
Ein X2 3800 hat bei einem Takt von 1,8Ghz eine theoretische L2-Bandbreite von 14400 MB/s und erreicht im ScienecMark2 7361 MB/s was eine Ausnutzung von 51,11% bedeutet.
Ein X2 4800 kommt bei 2,4 Ghz Takt auf eine theoretische Bandbreite von 19200 MB/s und erreicht beim SM2 8833 MB/s was einer Ausnutzung der Bandbreite von nur 46,00% bedeutet.

Bei diesen Werten sollte man aber beachten das sie sich auf einen Kern mit einem L2-Cache beziehen. Wenn beide Kerne mit ihren L2 zusammenarbeiten könnte der Memorycontroller auch mehr Daten in den L2 schieben.

Für mich sieht es so aus, als hätte sich AMD gesagt das ein Kern von der zusätzlichen Bandbreite so wenig profitiert das es sich nicht lohnt den Cache auf 128+128 Bit aufzuweiten oder ihn deutlich effizienter zu machen. Letztlich sorgt DDR2 ja dafür das alle Kerne (jetzt 2 bald 4) genug bekommen.
Ich meine wenn DDR2 sagen wir mal 10GB/s liefern könnte, dann würden bei 4 Kernen nur 2,5 GB/s pro Kern zur verfügung stehen. Da muss mann dann nicht umbedingt die L2 Anbindung so umbauen das sie 10GB/s aufnehmen kann.

Was mich interessiert ist weshalb die realen Werte nur bei ca 50% der theoretischen Werte der Bandbreite liegen und wie man diese Steigern könnte ohne die Anbindung auf 128 Bit zu verbreitern. Sollte man das nicht können, würde 128 Bit ja auch deshalb Sinn machen, da dann 128 Bit SSE in einem Takt statt in 2 verarbeitet werden können.
 
Würde das sich denn Messen lassen?
Also per Software beide Kerne eines X2 auf den Speicher zugreifen lassen und dann mal die gesammtbandbreite testen?
 
Würde das sich denn Messen lassen?
Also per Software beide Kerne eines X2 auf den Speicher zugreifen lassen und dann mal die gesammtbandbreite testen?
Man wird verschiedene Sachen machen können. Ein Test könnte ja schon mal darin bestehen zu sehen was mit einem Channel passiert. Ein Channel sollte ja theoretisch 6400 MB/s bringen. Wenn man mit diesem einem Channel eine gute Effizient erziehlt und sagen wir mal 5500 MB/s bekommt, dann würde es auf einen Engpass beim Cache etc. hinweisen.

Redpriest von ScienceMark hat ja auf aces schon angekündigt das sie an einer multithread Erweiterung arbeiten.
Bis dahin könnte man ja auch einfach mal 2 Speicherintensive Dinge laufen lassen und sich ansehen wie die sich verändern. Also zb PI und dazu einen Speichertest.
 
@Treverer, was hat das jetzt mit dem eigentlichen Thema zu tun, und mit dem worauf ich auf deinem Post eingegangen war, der mir den Anschein hatte, ehr Contra Intel eingestellt zu sein. Als wenn bei AMD alles weiter entwickelt wäre, kann ich aber auch verstehen, da man ja nun evt. Angst haben muß das Intel nunmal ein besseres Produkt anbieten kann wie Jahre zuvor.

ich finde deine posts sehr schwer verständlich - vielleicht liegt es daran, daß du auch meine nicht verstehst. ;)

also, nochmals zur erklärung, warum ich die specs gepostet habe: es geht um die fähigkeit der cpus von intel bzw. amd mit der anzahl der cores und dem takt zu skalieren. wenn du die specs betrachtest, dann siehst du ja die derzeitigen werte der duo-cores im vergleich zu denen von amd. in integer könnte sogar der duo-core einen höheren ipc/watt haben. aber wenn du die werte der 8-cores vom opteron anschaust wird auch klar, da muß sich intel schon noch ganz schön strecken, um mit dem woodcrest gegenan zu kommen... wie es am ende kommt, werden wir sehen -aber einfach zu behaupten, die duo-cores, conroes, woodcrest etc. pp. seien der große, ausreichende wurf? na, das halte ich in anbetracht der werte bei servern für sehr sehr optimistisch. umso mehr, als ddr2 genau diesen systemen einen schub bringen wird, wie ich ja ebenfalls behauptete.

jetzt klar, warum ich die grafiken postetet? :)
 
Ich muss Zidane's Posts auch immer zweimal sehr genau lesen, bis ich einigermaßen verstehe was er meint.
Aber glücklicherweise müssen Computerfachleute ja auch keine Sprachgenies sein. ;) 8)
 
Hi..

Das hört sich doch besser an, so hätte ich auch Lust daran auf hohem Nivue weiter damit auseinander zu setzen, gut aber wenn man bedenkt wie der DuoCore angebunden ist, und mit welchem Takt er abeitet, gegenüber den Opteron.

Das Hauptproblem liegt allerdings vermutlich mit daran das unter anderem der FSB, wenn ich versuchen wollte z.b 4 Intel DCs sich diesen Teilen müssen, zumindest würde ich gerne Wissen wie Intel das mit dem "Kentsfield" lösen will.

Daher kann ich anhand der Grafiken für "Server-Plattformen" sagen das AMD hier defintiv die besseren Karten hat, aber für den Dektop/Notebookmarkt sehe ich Intel an Platz 1 stehen, und AMD an 2. Da scheinbar der Flaschenhals hier nicht zur Geltung kommt.

Die Conroes sollen ja ebenfalls mit 2,6Ghz wohl das Top-Modell mit einem 1066er FSB kommen, .........
 
Mal abseits von der L2 Diskussion:

Die Speicherlatenzen des AM2, die in einigen wenigen Tests vorliegen, sehen ja relativ gut aus. Niedriger sogar, als die von DDR1 auf S939.
Kann es denn sein, dass AMD, in Anbetracht der schlechteren Timings, den MemoryController auf Latenzen optimiert hat und darunter schlichtweg der Datendurchsatz leidet, den die CPU's derzeit aber auch gar nicht so nötig haben?

MfG
 
Die 32 bit-Transfer-Tests sind noch nicht aussagekräftig genug. Deshalb hier (auch mit interessanten Unterschieden!) die 128 bit-Transfer-Diagramme vom X2 4800+:
und FX-60:
Das sind schon seltsame Unterschiede bei 2 CPUs, die sich architektonisch doch kaum unterscheiden sollten. Möglicherweise bewirkt durch untersch. Board/BIOS u. entsprechend andere IMC-Konfiguration, trotz gleichen Speichers. Aber reine Lese-/Schreib-Schleifen werden kaum die Load-Store-Unit- und IMC-Buffer beanspruchen, wie die des Stream-Benchmarks.
Der Speicher ist eine Sache. Erstaunlich sind doch die Unterschiede beim Cache. Dieser ist doch vom Board/BIOS etc. nicht betroffen.

Der FX-60 hat 200 MHz mehr Takt, was für den Cache eben auch 200 MHz mehr Takt und damit eine geringere Latenz in Sekunden und eine höhere Bandbreite bedeutet.

Doch was ist zu sehen?
Beim L1-Cache steigt die Transferrate von 18371 MB/s auf 19890 MB/s. Das sind 8,26% mehr. Da der FX-60 nur 200 MHz(8,33%) mehr Takt hat ist dies eine perfekte Skalierung.

Sehr seltsamm sind jedoch die Werte für den L2-Cache.
Beim 4800 hat er bei load ca. 12000 MB/s und bei store ca 9100 MB/s. Der FX-60 hat bei store ca. 9900 MB/s was ca. 8,5% mehr sind, was mit der Taktsteigerung (wie auch beim L1) gut zusammenpasst. Ganz anders der Wert für load. Hier erreicht der FX-60 trotz 200 MHz mehr Takt nur ca. 10250 MB/s. Das sind fast 2000 MB/s weniger als der 4800 !
Man kann in den Diagrammen deutlich sehen das beim 4800 zwischen load und store beim L2 und beim RAM ein deutlicher Abstand vorhanden ist. Beim FX-60 hingegen ligen die Kurven sehr nahe beieinander. Dabei ist der store besser geworden und der load deutlich schlechter.

Weiterhin ist zu bemerken das die Kurve für load beim FX-60 sehr gleichmäßig ist. Beim 4800 sehen wir eine schwankende in Tendenz fallende Kurve, wohingegen sie beim FX-60 völlig gleichmäßig ist.

Die Fragen sind also weshalb schon beim FX-60 die load-Transferrate im L2 so viel niedriger ist, während der Store im L2 wie auch load und store im L1 gemäß der Taktsteigerung zulegen konnten?
Außerdem würde mich interessieren weshalb der load im L2 so gleichförmig ist.
 
Auch wenn es vermutlich nicht viel Erhellung bringt - ich habe mal mit einem Opteron 170 Dual-Core bei 2*3 GHz den SiSoft Cache-Benchmark laufen lassen. Einmal im Single-Channel und einmal im Dual-Channel bei ansonsten identischen Einstellungen.

sisoft_cache_3000.png


Code:
SiSoftware Sandra

Benchmark Results
Combined Index : 8744 MB/s
Speed Factor : 6.4
2kB Blocks : 21619 MB/s
4kB Blocks : 22713 MB/s
8kB Blocks : 23218 MB/s
16kB Blocks : 23479 MB/s
32kB Blocks : 20328 MB/s
64kB Blocks : 18922 MB/s
128kB Blocks : 14440 MB/s
256kB Blocks : 12575 MB/s
512kB Blocks : 12594 MB/s
1MB Blocks : 12102 MB/s
4MB Blocks : 3650 MB/s
16MB Blocks : 3672 MB/s
64MB Blocks : 3654 MB/s
256MB Blocks : 3641 MB/s
Results Interpretation : Higher index values are better.

Float SSE2 Cache/Memory Results Breakdown
Data Item Size : 16 byte(s)
Buffering Used : No
Offset Displacement Used : Yes

Performance Test Status
Run ID : MARTIN on Montag, 17. April 2006 at 21:25:53
NUMA Support : No
SMP Test : No
Total Test Threads : 1
Multi-Core Test : Yes
SMT Test : No
Dynamic MP/MT Load Balance : No
Processor Affinity : P0C0T0 
Page Size : 4kB
Use Large Memory Pages : No

Processor
Model : 1x Dual Core AMD Opteron(tm) Processor 170
Speed : 3.00GHz
Model Number : 4702 (estimated)
Performance Rating : PR9004 (estimated)
Cores per Processor : 2 Unit(s)
Type : Dual-Core
Internal Data Cache : 2x 64kB Synchronous, Write-Back, 2-way set, 64 byte line size
L2 On-board Cache : 2x 1MB ECC Synchronous, Write-Back, 16-way set, 64 byte line size

Features
SSE Technology : Yes
SSE2 Technology : Yes
EMMX - Extended MMX Technology : Yes
HTT - Hyper-Threading Technology : No

Chipset 1
Model : Advanced Micro Devices (AMD) Athlon 64 / Opteron HyperTransport Technology Configuration
Front Side Bus Speed : 2x 900MHz (1800MHz data rate)
In/Out Width : 16-bit / 16-bit
Maximum Bus Bandwidth : 7200MB/s (estimated)

Logical/Chipset 1 Memory Banks
Bank 2 : 1GB DDR-SDRAM 3.0-3-2-8 1CMD
Bank 3 : 1GB DDR-SDRAM 3.0-3-2-8 1CMD
Channels : 1
Bank Interleave : 2-way
Speed : 2x 250MHz (500MHz data rate)
Width : 128-bit
Maximum Memory Bus Bandwidth : 8000MB/s (estimated)


sisoft_cache_3000_single.png


Code:
SiSoftware Sandra

Benchmark Results
Combined Index : 7179 MB/s
Speed Factor : 10.0
2kB Blocks : 21616 MB/s
4kB Blocks : 22745 MB/s
8kB Blocks : 23481 MB/s
16kB Blocks : 23173 MB/s
32kB Blocks : 20234 MB/s
64kB Blocks : 18935 MB/s
128kB Blocks : 14456 MB/s
256kB Blocks : 12592 MB/s
512kB Blocks : 12613 MB/s
1MB Blocks : 12100 MB/s
4MB Blocks : 2342 MB/s
16MB Blocks : 2338 MB/s
64MB Blocks : 2346 MB/s
256MB Blocks : 2348 MB/s
Results Interpretation : Higher index values are better.

Float SSE2 Cache/Memory Results Breakdown
Data Item Size : 16 byte(s)
Buffering Used : No
Offset Displacement Used : Yes

Performance Test Status
Run ID : MARTIN on Montag, 17. April 2006 at 21:42:58
NUMA Support : No
SMP Test : No
Total Test Threads : 1
Multi-Core Test : Yes
SMT Test : No
Dynamic MP/MT Load Balance : No
Processor Affinity : P0C0T0 
Page Size : 4kB
Use Large Memory Pages : No

Processor
Model : 1x Dual Core AMD Opteron(tm) Processor 170
Speed : 3.00GHz
Model Number : 4702 (estimated)
Performance Rating : PR9004 (estimated)
Cores per Processor : 2 Unit(s)
Type : Dual-Core
Internal Data Cache : 2x 64kB Synchronous, Write-Back, 2-way set, 64 byte line size
L2 On-board Cache : 2x 1MB ECC Synchronous, Write-Back, 16-way set, 64 byte line size

Features
SSE Technology : Yes
SSE2 Technology : Yes
EMMX - Extended MMX Technology : Yes
HTT - Hyper-Threading Technology : No

Chipset 1
Model : Advanced Micro Devices (AMD) Athlon 64 / Opteron HyperTransport Technology Configuration
Front Side Bus Speed : 2x 900MHz (1800MHz data rate)
In/Out Width : 16-bit / 16-bit
Maximum Bus Bandwidth : 7200MB/s (estimated)

Logical/Chipset 1 Memory Banks
Bank 2 : 512MB DDR-SDRAM 3.0-3-2-8 1CMD
Bank 3 : 512MB DDR-SDRAM 3.0-3-2-8 1CMD
Channels : 1
Bank Interleave : 2-way
Speed : 2x 250MHz (500MHz data rate)
Width : 64-bit
Maximum Memory Bus Bandwidth : 4000MB/s (estimated)
 
Auch wenn es vermutlich nicht viel Erhellung bringt - ich habe mal mit einem Opteron 170 Dual-Core bei 2*3 GHz den SiSoft Cache-Benchmark laufen lassen. Einmal im Single-Channel und einmal im Dual-Channel bei ansonsten identischen Einstellungen.
Hm ich kenne mich mit Sandra nicht aus, aber da sind einige Werte recht komisch.
bei2-16kB sind die Werte ja auf dem zu erwartenen Niveau. Die Werte für 32,64 und 128 kB sind aber sehr komisch. Da der L1-Cache 128 kB hat müssten diese auch aus diesem kommen. Wieso sind diese dann aber so viel niedriger? Und so stark fallend?
Die Werte für 256, 512 und 1 MB sind ja dann wieder auf einen ähnlichen Niveau, das man auch erwarten konnte.
Strange. Evtl ist ScienceMark oder drgl ein besserer Test?

Zu deinen RAM-Werten:
Im DualChannel erreichst du so ca. 3650 MB/s von 8000 was ca. 45,5% sind. Im SingleChannel erreichst du ca. 2345 von 4000 MB/s was etwa 58,5% entspricht.
Hier sieht man schon das die zusätzliche Bandbreite durch den zweiten Channel nicht so effizient umgesetzt werden kann.
Da du aber mit 3GHz auch hoch getaktet hast, ist ein Engpass durch den L2 oder etwas anderem nicht zu erwarten.

Spannend würde es sein wenn du den RAM auf 250 lässt aber den Prozessor niedriger taktest.
Der L2-Cache hat ja eine theoretische Bandbreite von Takt*64bit. Hier bei 3 Ghz also 3000*8 = 24000 MB/s. Laut Sandra erreichst du davon ca 12500 was für den RAM mehr als ausreichend ist.
Wenn du die CPU auf sagen wir mal 1500 MHz takten würdest dann müssten die theoretischen 1500*8= 12000 MB/s des L2 für die theoretischen 500*16=8000 MB/s des DualChannel DDR500 ja ausreichen.
Wenn aber der L2-Cache der Bottleneck ist, dann würde ich erwarten das die Transferraten für DualChannel deutlich niedriger sind und sich denen des SingleChannel annähern. Wenn der L2 bei 1,5 Ghz also zB nur 2500 MB/s aufnehmen kann, dann würde der DualChannel eben auch nur 2500/MB/s bringen, wohingegen der SingleChannel kaum betroffen währe. (Er dürfte aber auch etwas sinken)
 
http://www.geizhals.at/deutschland/?cat=cpuamdam2&sort=p

Da war geizhals ja mal richtig flott. :)

Preise nahezu identisch auf S939 Niveau.

Angenehm der offizielle 4000+, den es für fast 100€ weniger als einen Opteron 170 für Sockel 939 gibt. Schließlich wollen ja immer einige den großen Cache bei wenig Takt (der sich durch OC ja kompensieren läßt).

Das Sempron-Rating jedenfalls mal wieder hoffnungslos. Aber anders kann man gegen die 3-4 GHz Celerons scheinbar nicht bestehen.

Vom L3 Cache des FX jedenfalls keine Spur. War wohl auch mehr Fantasie dabei.
 
Zuletzt bearbeitet:
Zurück
Oben Unten