Neuigkeiten zum K10

Hhmmm, wäre schade - aber ich muss ehrlich sagen, dass ich die Fake-Iindizien auf den 2 Extrabildern garnicht erkenne...???
 
Hm ok, der eine Kollege hat einen Punkt, wenn er sagt, dass SuperPi x87 nützt, was ja nicht verbessert wurde ... positiv wirken sich nur Caches, Prefetch & 128bit L2 Bus aus, dass das gleich für 13sec reichen sollte ist dann doch etwas zweifelhaft.

Was mich aber noch beunruhigt .. "dave" scheint ja mit Barcelonas rumzuspielen, bekommt sie aber nicht zum laufen:

so, here's the happy news....managed to load out XP Pro with the 2210s, swapped the 2347 in and....guess what i'm staring at now?

yup....that damn XP loading screen....

yippee..

EDIT: 3 dead boards so far.....from a variety of ailments. *sniff, sniff*
dave
Klingt ja nicht gerade toll .. :(

ciao

Alex

P.S: Mit ner dunkelgrünen Brille kann man auch weiterhin an die 13s glauben, bei anandtech wurde ja doppeldeutig von 26s besser geschrieben. Da man davor 39s brauchte wäre dann summa summarum 39-26 = 13s über. Man wird aber wohl 26s gemeint haben und nicht 26s besser ;-)
 
Zuletzt bearbeitet:
Und die alten Versionen sollen hier und da mal Cache Probleme gehabt haben. Da macht es Sinn, wenn ein Cache lastiges Programm enorm von einer zusätzlichen Cache Stufe profitiert. Würde passen *noahnung*

Naja, definitiv auch auch kein wichtiges Programm :]

Edit: Hab mir mal die Hilfe zu SuperPi angeschaut, demnach hat der Algorithmus viele Wurzeln und Divisionen. Habe zwar keine Zahlen für x87 Code parat, aber bei SSE Skalar ist der K10 dem Core einfach haushoh überlegen. Ich gehe davon aus, dass es bei x87 Code nicht viel anders ist. Ergo ist es nicht unwahrscheinlich, dass die Ergebnisse stimmen.
 
Zuletzt bearbeitet:
WWas ist nicht verstehe ist das der AMD in Float's 30% schneller als der Intel und in Intenger 30% langsamer sein soll, aber müssten einfache Zahlen(Integer) nicht leichter zu berechnen sein als Fließkommazahlen(Float)?
 
WWas ist nicht verstehe ist das der AMD in Float's 30% schneller als der Intel und in Intenger 30% langsamer sein soll, aber müssten einfache Zahlen(Integer) nicht leichter zu berechnen sein als Fließkommazahlen(Float)?

Nicht wenn man unterschiedliche Rechenwerke für beides benutzt. ;)
 
Mal wieder ne Bechmarkfolie:
large_amd_promises_performance.png

Der Xeon hat 2,33 Ghz .. fragt mich grad nur, was das für Benchmarks sind, Fluent .. noch nie gehört:
http://www.fluent.com/

Sieht stark nach FPU Last aus ...
mtb][sledgehammer;3314970 schrieb:
Edit: Hab mir mal die Hilfe zu SuperPi angeschaut, demnach hat der Algorithmus viele Wurzeln und Divisionen. Habe zwar keine Zahlen für x87 Code parat, aber bei SSE Skalar ist der K10 dem Core einfach haushoh überlegen. Ich gehe davon aus, dass es bei x87 Code nicht viel anders ist. Ergo ist es nicht unwahrscheinlich, dass die Ergebnisse stimmen.
Bei SSE Skalar dürfte aber auch wieder die neue 128bit FPU aktiv sein, bei x87 aber wohl nicht. Bin mir aber nicht sicher, ist auch egal, nur noch 2 Tage ;-) Vielleicht hat AMD einfach nur auch die Wurzelbefehle verbessert, stand ja auch irgendwo auf einer Folie, dass man mehrere Befehle vom langsamen Microcode in die schnellere direct path Variante umgelegt hat, vielleicht hilft das was ... *noahnung*


ciao

Alex
 
Zuletzt bearbeitet:
Kannst du auch antworten oder erwiderst du nur?
 
... Der Xeon hat 2,33 Ghz .. fragt mich grad nur, was das für Benchmarks sind, Fluent .. noch nie gehört:
...
stand ja auch irgendwo auf einer Folie, dass man mehrere Befehle vom langsamen Microcode in die schnellere direct path Variante umgelegt hat, vielleicht hilft das was ...
Warum kein Vergleich mit den 7300`Xeons?

Die hatte Intel vor kurzem ebenso vorgestellt und wären da der richtige Gegner (Tigerton auf Canland-Plattform).

Die Bemessungsgrundlage "Strombedarf" veraltet so schnell, wie die Fertigungstechnik immer besser bei AMD und Intel wird.

AMD hat allerhand Latenzverbesserungen beim K10 betrieben, hatte auch schon so manch eine Tabelle bei mir auf dem Rechner. Aber für 3 Tage eine pi x Daumen Abschätzung wollte ich da auch nicht mehr machen.

AMD hat weitere Befehle in den "Direct Path" geschickt. Von der SSE-128-Verbesserung verspreche ich mir die grössten Leistungssprünge.

MFG Bobo(2007)
 
Hmm, ich denke eben die Vorstellung vor kurzem ist das Problem: Solche Folien von AMD sind sicherlich nicht erst in den letzten 3 Tagen erstellt worden.

Abgesehen davon würde man in einem Vergleich mit den 7xxx-ern wahrscheinlich im Vergleich nicht so gut abschneiden wie hier. Daher bezweifel ich so ein bisschen, dass man solche Vergleiche schnell auf AMD-Folien nachgereicht bekommt. ;)
 
Was heißt dennn "Normalized Performance"? Inwiefern normalisiert?
Ja normalisiert auf den Xeon, der überall 100% darstellt, deswegen ist der Xeon Balken auch immer gleich hoch.

Neue (Spec) benches bei PCGH / zdnet aufgetaucht:

http://www.pcgameshardware.de/?article_id=612403

Edit: So wie es ausschaut, sind das aber nur Hochrechnungen:
http://blogs.zdnet.com/Ou/?p=735
Here are the SPECfp_rate2006 peak numbers which are used for the niche HPC market. The leaked Barcelona 2.0 numbers are based on AMD’s slide that claims a 35% advantage over Intel’s 5345 as of 8/28/2007 (this is the date that these slides were generated).
Voll die Konfusion hier, vor Montag / Dienstag .. ich glaub ich poste jetzt bis dahin nichts mehr.

ciao

Alex
 
Zuletzt bearbeitet:
Ja normalisiert auf den Xeon, der überall 100% darstellt, deswegen ist der Xeon Balken auch immer gleich hoch.

Danke! Manchmal bin ich echt mit Blindheit geschlagen ... die sozialistischen Einheitsergebnisse vom Xeon waren mir gar nicht aufgefallen (dachte halt, der kann alles gleich gut ^^)
 
Abgesehen davon würde man in einem Vergleich mit den 7xxx-ern wahrscheinlich im Vergleich nicht so gut abschneiden wie hier.
Unsinn. 73xx Xeons stehen in direkter Konkurrenz mit Opteron 83xx, 53xx Xeons mit Opteron 23xx. Auf der Xeon-Seite haben sowohl die 73xx wie auch die 53xx je CPU-Sockel eine dedizierte Anbindung zum Chipsatz, das war vor Caneland anders.
Zdnet behauptet, geleakte SPEC-Scores zum Thema zu haben: http://blogs.zdnet.com/Ou/?p=735 (ah, hat schon jemand anderes gepostet und spekulative Werte sind's auch noch? Na toll :()
Hier zeigt sich, daß Michael Dell mit seinen 30%-Werten (je nach Rechenweise) ungefähr richtig lag, wenn man den schnellsten Launch-Opteron mit dem jeweils aktuell schnellsten Xeon vergleicht, bei 2 und 4 Sockeln zeigt sich ungefähr das gleiche Bild.

4S SPEC_int_rate2006 peak
214 / 160 * 100 = 134%, also 34% schnellerer Xeon
160 / 214 * 100 = 75%, also 25% langsamerer Opteron

2S SPEC_int_rate2006 peak
116 / 88 * 100 = 132%, also 32% schnellerer Xeon
88 / 116 * 100 = 76%, also 24% langsamerer Opteron

2S SPEC_fp_rate2006 peak
66,9 / 82,1 * 100 = 81%, also 19% langsamerer Xeon
82,1 / 66,9 * 100 = 123%, also 23% schnellerer Opteron

Man darf aber noch anmerken, daß SPEC_fp_rate zwar sehr FP-haltig ist, aber vor allem auch ein Speicherbenchmark ist, zumindest scheint dies Konsens bei aceshardware zu sein.
Noch etwas: den SPEC-Werten nach ist AMDs Dominanz bei vier Sockeln für Datenbankserver u. dgl. erstmal vorbei. Warten wir ab, wie gut Barcelona auf 4 Sockeln in Richtung 3 GHz skaliert, hier hat er vermutlich bessere Karten als Xeon mit dem nicht skalierenden FSB. Theoretisch wären 160 / 2GHz * 3 GHz = 240 SPECint_rate2006 peak drin, das ist aber natürlich ein unerreichbarer theoretischer wert - 100% Skalierung mit der CPU-Frequenz ist definitiv nicht zu erwarten.


Zu SuperPI sagt SOLDNER-MOFO64 in dieser Thread-Seite:
From the benches I've been priveledged enough to see the results of :-)))a 2ghz K10 will score around a 19sec 1M Pi time......at 3ghz approx 12secs.

Edit: Hier haben wir eine echte Neuheit in AMDs Marketing: ACP "Average Computing Power", ein Wert, der vermutlich Intels TDP näher kommt als AMDs TDP und für Unwissende eine bessere Vergleichbarkeit schaffen könnte. IMHO ein ganz brauchbarer Ansatz, da AMD zuvor mit seiner absolut-worst-case-TDP ggü. Intels "typical" TDP immer relativ schlecht aussah.
Noch ein Edit: allerdings ist der Name nicht so toll gewählt, hier geht es nicht um einen typischen Durchschnittsverbrauch im kommerziellen Betrieb (ist auch *etwas* schwer zu ermitteln), sondern um Werte, die während des Abarbeitens von SPEC- und anderen Benchmarks entstehen, also unter maximaler "praktischer" Last.
 
Zuletzt bearbeitet:
Ich will Game- und Videorenderbenchmarks sehen!!! :D
 
Bestätigung für die o.a. SPEC-Werte: bei IBM gibt es ein PDF (Datei-Datum auf dem FTP-Server: 7.September.2007), welches für ein IBM System x3455 mit 2 1,9 GHz Bacelonas folgende Werte angibt:
SPECint2006: 11.3
SPECint_rate2006: 83.2
SPECint_rate_base2006: 72.8
SPECfp2006: 11.2
SPECfp_rate2006: 73.0
SPECfp_rate_base2006: 68.5

Nimmt man eine lineare Skalierung auf 2.0 GHz vor, so kommt man für die SPEC_rate-Werte fast genau auf jene, die George Ou in seinem Blog angegeben hat.

Diese Config soll übrigens erst ab 16. November 2007 erhältlich sein, ähnliches (irgendwann im 4. Quartal) hat man ja auch schon von HP gehört. Zusammen mit den mäßigen Single-Threaded Werten für SPECint ergibt das kein rosiges Bild, aber warten wir einfach auf morgen. SPECfp-seitig sieht es immerhin erwartungsgemäß gut aus.

Im selben FTP-Verzeichnis bei IBM finden sich noch zwei weitere PDFs mit LS-DYNA und Fluent-Werten. Da mir diese Benchmarks wenig sagen, kann sich ja vielleicht jemand anderes drum kümmern :)


Nachtrag: auf spec.org finde ich folgende Bestwerte von Xeons mit K10-ähnlicher Performance:
CINT2006:
Xeon 5110,1.60GHz: 10,5
Xeon 5320,1.86GHz: 11,9 (die 12,x-Werte sind Xeon 3040 mit schnellerem Ram)

CFP2006:
Xeon 5320,1.86GHz: 10,9
Xeon 5130,2.00GHz: 12,2

Demnach scheint Barcelona bei CFP2006 (single-Threaded ungefähr auf dem Niveau von Xeon zu liegen, bei CINT2006 ist er etwas schlechter. Hmmm hmmm... Mal sehn, ob ich noch Rate-Vergleiche raussuche ;D

Ich bin übrigens wirklich gespannt, wie sich die K10 in den für viele hier interessanten Bereichen aussieht: Spiele (real-world), Encoding u. dgl. Beruflich interessiert mich noch die Leistung als dynamischer Webserver (.NET, 2 Sockel) und dickes DB-Eisen (4 Sockel) - Gerade bei letzterem zählt zwar Int, aber ganz besonders auch I/O und Speicherperformance, eine klassische Opteron-Domäne. Aber das werden wir beizeiten ohnehin in der Produktionsumgebung testen können / müssen :)

Weiter geht's:
CINT2006 Rate
Xeon 5310, 1.60 GHz: 73,6
Xeon 5320, 1,86 GHz: 80,2
Xeon 5335, 2,00 GHz: 92,2

hier stößt mir ein wenig sauer auf, wie weit Intels Werte von denen der anderen "Submitter" entfernt sind: ein hoher Anteil der Performance-Werte ist offenbar dem speziell optimierten Compiler geschuldet. Peak vs. Base tut ein übriges, es ist doch schade, daß stets nur Peak-Werte herausposaunt werden, wo Base-Werte doch deutlich mehr Realitätsnähe zeigen wo nur wenige Anwender Gelegenheit haben, ihre Awendungen selbst zu kompilieren (noch dazu mit einem selbst optimierten Compiler). Aber vielleicht bin ich auch nur ein schlechter Verlierer? *noahnung*
IBM kommt z.B. für den Xeon 5335 auf maximal 82,8, die IBM-Werte für K10 wurden mit "SUSE Linux® Enterprise Server 10 SP1" ermittelt, welcher Compiler verwendet wurde, ist leider nicht angegeben. Sämtliche Intel-Werte stammen vom neuesten Complier (10.1) aus eigenem Hause, selbst der viel schlchtere IBM-Wert bemüht einen nur geringfügig älteren Intel-Compiler (10.0). Kann also sein, daß sich hier auf K10-Seite noch einiges tut.

CINT2006 Rate:
Xeon 5365, 3.00 GHz: 66,9

Na also, geht doch! ;D
 
Zuletzt bearbeitet:
man sollte den thread fuer 2 tage speren lassen ;)

NOCH 2 TAGE AHHHR
 
... Beruflich interessiert mich noch die Leistung als dynamischer Webserver (.NET, 2 Sockel) und dickes DB-Eisen (4 Sockel) - Gerade bei letzterem zählt zwar Int, aber ganz besonders auch I/O und Speicherperformance, eine klassische Opteron-Domäne. ...
Das WAR eine Domäne vom K8 BEVOR der Nigara (Sun UltraSPARC T1) kam ... spätestens mit dem Niagara 2 dürfte der K10 hier nur noch die Rücklichter des Niagara 2 sehen, wie (fast) alle anderen konkurrierenden CPU-Architekturen auch.

Wenn du dich mit Solaris 10 und/oder mit aktuellen Linux-Distributionen auskennst, dann solltest du auch mal das, für den Bereich durchsatzstarke Webserver, in Betracht ziehen. ... is natürlich auch alles eine Preisfrage 8)

MFG Bobo(2007)
 
Zuletzt bearbeitet:
Das ist vor allem eine Frage der verwendeten Anwendung(en) und der Kosten einer potenziellen Migration, also Portierung. Und die Machbarkeit (Developer-Ressourcen). Bei uns wird - aus historischen Gründen - MS SQL verwendet, da bleibt die Auswahl der Plattformen begrenzt. Wir haben zuletzt Itanium 4-Sockel vs. Opteron 4-Sockel getestet, Itanium (dualcore, 1,6 GHz) war dabei DEUTLICH langsamer als unsere alten Opterons (2,2 GHz S940, 32GB Ram) mit gleichem Speicherausbau, aber trotzt MASSIVER Rabattierung 25% teurer als das konkurrierende Opteron 8222-System vom selben Hersteller (na rate mal ;)) Wir haben schließlich den Opteron genommen und 128GB reingeschmissen, das reicht hoffentlich erstmal.
Erst wenn der x86-64-Sektor oder Itanium nicht mehr mit unsrer DB mithalten (zu können drohen) und auch keine sw-seitige Optimierung mehr drin ist, suchen wir uns eine andere Plattform. Zudem finde ich leider keine Niagara 2 SPEC_Int-Werte und wage doch ein wenig zu bezweifeln, daß dieser gegenwärtig einen 4-Sockel-Opteron übertrifft. Ich laß mir allerdings gern das Gegenteil beweisen. Danke für den Tip übrigens :)

Oh, ich begreife grade, daß du die Webserver meinst. Tja, hier ist es .NET 2.0. Und eine Preis/Leistungs-Frage. Wenn ich beim Niagara 1 für den kleinsten Server (4 Cores) schon $9,995 hinlegen muß, beim Opteron mit 2 CPUs (Sockeln) vom selben Server-Hersteller aber weniger als die Hälfte, stellt sich die Frage nach der Rentabilität umso mehr.

@der2of6 (nächster Post): Ja, ich bin derjenige, der das durcheinander gebracht hat.
 
Zuletzt bearbeitet:
Zurück
Oben Unten