AnandTech: Opteron E4 Stepping - SSE3 Performance

pipin

Administrator
Teammitglied
Mitglied seit
16.10.2000
Beiträge
24.384
Renomée
9.729
Standort
East Fishkill, Minga, Xanten
  • SIMAP Race
  • QMC Race
  • RCN Russia
  • Spinhenge ESL
  • Docking@Home
  • BOINC Pentathlon 2019
  • SETI@Home Intel-Race II
  • THOR Challenge 2020
  • BOINC Pentathlon 2021
  • BOINC Pentathlon 2023
AnandTech hat in einem <A HREF="http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2350" TARGET="b">Kurztest</A> einen Opteron 250 und einen auf 2,4 GHz heruntergetakteten Opteron 252 mit dem neuen E4 Stepping auf einer HP wx9300 Workstation gegeneinander antreten lassen und dabei versucht die Vorteile des nun unterstützten SSE3 Instruktion Sets zu ergründen.<UL><I>"Finding good SSE3 benchmarks wasn't as easy as we would have liked. Other encoding suites react the same way that DivX and AutoGK do. This seems to indicate that the K8 architecture is simply resilient when it comes to unaligned 128bit loads. In the case of Intel's NetBurst, the lddqu instruction may have more impact.

As far as physics and graphics go, the added instructions show potential in our synthetic test. For DCC, CAD, scientific, and other workstation software, the E4 stepping could offer a bit of a performance boos"</I></UL>
 
Hi,

noch kommt SSE3 des E4 Stepping nicht so zur Geltung. Da muss man mal Abwarten.

Greetz
neax
 
Original geschrieben von neax
noch kommt SSE3 des E4 Stepping nicht so zur Geltung. Da muss man mal Abwarten.
Da wird auch nicht mehr viel kommen, da SSE3 nur eine minimale Erweiterung von SSE2 ist. SSE3 bietet nicht das Potenzial für riesige Performancesprünge (und außerdem hatte schon das irsprüngliche 3DNow! einige der SSE3-Befehle...).
 
Könnten die leichten Performancesteigerungen nicht von einem evtl. schneller angebundenen L2-Cache rühren?

L2-Cachelatenz beim Winnie wurde gegenüber dem Newcastle vekleinert - wieso nicht auch bei den Opteron-Kernen?

Grüße,
Tom
 
Original geschrieben von Seemann
Da wird auch nicht mehr viel kommen, da SSE3 nur eine minimale Erweiterung von SSE2 ist. SSE3 bietet nicht das Potenzial für riesige Performancesprünge
genau !

SSE3 wurde völlig technikfern von den PC-Medien hochgepuscht. Die Erweiterung gegenüber SSE2 ist so gering, daß nur Spezialroutinen/-aufgaben etwas davon profitieren können.

SSE3 und vielleicht bald SSE4 ist nur Marketing-bedingt eingeführt worden. Technisch eigentlich Unsinn.
 
Ich sag ja nicht das SSE3 nichts bewirkt, nur ist der Benefit im Allgemeinen derart gering das der Vorteil sich irgendwie nicht wirklich bemerkbar macht.

Btw, wie es scheint bringt SSE3 bei einigen Media-Encodern ungefähr 1 bis 3 % zusätzliche Performance. Tolle Wurst.
 
Original geschrieben von Bokill
sowie -> Hier <- Nicht wahr Seemann? ;D
Ohh, Jugendsünden... Naja, ist ja ein ganz anständiges Stück Code.
 
Original geschrieben von Seemann
Btw, wie es scheint bringt SSE3 bei einigen Media-Encodern ungefähr 1 bis 3 % zusätzliche Performance. Tolle Wurst.
Wobei sich wohl darüber diskutieren ließe, ob die paar Prozente aus der Verwendung von SSE3 resultieren, oder aber es vielleicht nur der Gewinn aus den kleineren Finetunigmaßnahmen (Adaptive Prefetch,2 zusätzliche Write-Combining Buffers) der E4 revision ist ...

ciao

Alex
 
Hey SSE3 ist doll ja!?! Genauso wie mein Ksellorhn 3Ghz. Achja und AMD sind alle viel wärmer und alle VIA Mainboards instalbier *grins*
 
Oder man verändert einiges, benutzt die SSE-Befehle führ andere Zwecke so wie Intel und nennt das ganze dann "HT" *g*
 
Original geschrieben von Opteron
Wobei sich wohl darüber diskutieren ließe, ob die paar Prozente aus der Verwendung von SSE3 resultieren, oder aber es vielleicht nur der Gewinn aus den kleineren Finetunigmaßnahmen (Adaptive Prefetch,2 zusätzliche Write-Combining Buffers) der E4 revision ist ...
Da gebe ich dir vollkommen Recht - eigentlich gehe icha uch davon aus, dass die sonstigen E4-Neuerungen mehr Einfluss haben als SSE3. Die anderen E4-Neuerungen bringen ja erwiesenermaßen einiges, aber das unterstützt ja nur meine These (die ich schon mit Erscheinen des Prescotts hatte), dass SSE3 fast vollkommen nutzlos ist.
 
Original geschrieben von Seemann
Da gebe ich dir vollkommen Recht - eigentlich gehe icha uch davon aus, dass die sonstigen E4-Neuerungen mehr Einfluss haben als SSE3. Die anderen E4-Neuerungen bringen ja erwiesenermaßen einiges, aber das unterstützt ja nur meine These (die ich schon mit Erscheinen des Prescotts hatte), dass SSE3 fast vollkommen nutzlos ist.

Naja, wenn im Prinzip nur 1-2 Programme gibt die einen direkten nutzen davon haben, wohl logisch das es dann kein Sinn macht. *g*
 
Da bekommt die x86-SIMD-Erweiterung für Double Precision endlich die Flexibilität von 3DNow! und plötzlich finden dies viele unnütz...

Um das noch etwas zu untermauern:
SSE2 ist oft noch unflexibel und man muß Umwege gehen. Da ist es doch nur gut, wenn es optimale Befehle zur Lösung dieser Dinge gibt, wie z.B. die neuen Horizontal-Rechenbefehle und jene, welche speziell für das Rechnen mit komplexen Zahlen geeignet sind.

Es sind ja nicht nur Video-Codecs, die davon profitieren könnten, sondern ein größerer Teil der für wissenschaftliche Zwecke eingesetzten oder entwickelten Software, jede Art von 3D-Software (inkl. Games, die Double Precision z.B. für empfindliche Physikengines benötigen*), Audio/Video-Processing-Software usw.


*) Es reichen schon Unterschiede von ein paar Werten in der Größenordnung von 100-1000, um schnell mal Bits in der 23bit-Mantisse bei Single Precision zu verlieren.
 
Zurück
Oben Unten