AnandTech: Opteron E4 Stepping - SSE3 Performance

pipin · 17.02.2005

AnandTech hat in einem <A HREF="http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2350" TARGET="b">Kurztest</A> einen Opteron 250 und einen auf 2,4 GHz heruntergetakteten Opteron 252 mit dem neuen E4 Stepping auf einer HP wx9300 Workstation gegeneinander antreten lassen und dabei versucht die Vorteile des nun unterstützten SSE3 Instruktion Sets zu ergründen.<UL><I>"Finding good SSE3 benchmarks wasn't as easy as we would have liked. Other encoding suites react the same way that DivX and AutoGK do. This seems to indicate that the K8 architecture is simply resilient when it comes to unaligned 128bit loads. In the case of Intel's NetBurst, the lddqu instruction may have more impact.

As far as physics and graphics go, the added instructions show potential in our synthetic test. For DCC, CAD, scientific, and other workstation software, the E4 stepping could offer a bit of a performance boos"</I></UL>

neax · 17.02.2005

Hi,

noch kommt SSE3 des E4 Stepping nicht so zur Geltung. Da muss man mal Abwarten.

Greetz
neax

Seemann · 17.02.2005

Original geschrieben von neax
noch kommt SSE3 des E4 Stepping nicht so zur Geltung. Da muss man mal Abwarten.

Da wird auch nicht mehr viel kommen, da SSE3 nur eine minimale Erweiterung von SSE2 ist. SSE3 bietet nicht das Potenzial für riesige Performancesprünge (und außerdem hatte schon das irsprüngliche 3DNow! einige der SSE3-Befehle...).

mocad_tom · 17.02.2005

Könnten die leichten Performancesteigerungen nicht von einem evtl. schneller angebundenen L2-Cache rühren?

L2-Cachelatenz beim Winnie wurde gegenüber dem Newcastle vekleinert - wieso nicht auch bei den Opteron-Kernen?

Grüße,
Tom

rkinet · 17.02.2005

Original geschrieben von Seemann
Da wird auch nicht mehr viel kommen, da SSE3 nur eine minimale Erweiterung von SSE2 ist. SSE3 bietet nicht das Potenzial für riesige Performancesprünge

genau !

SSE3 wurde völlig technikfern von den PC-Medien hochgepuscht. Die Erweiterung gegenüber SSE2 ist so gering, daß nur Spezialroutinen/-aufgaben etwas davon profitieren können.

SSE3 und vielleicht bald SSE4 ist nur Marketing-bedingt eingeführt worden. Technisch eigentlich Unsinn.

Bokill · 17.02.2005

ebend 8)

SSE Technology in New Intel Prescott Processors (page 6)

...

sowie -> Hier <- Nicht wahr Seemann?

@mocad_tom
Der L2 Cache ist nicht schneller (oder langsamer angebunden), es scheint so, dass Feinetuning bei den frischeren Revisionen betrieben wird.

MFG Bokill

Seemann · 17.02.2005

Ich sag ja nicht das SSE3 nichts bewirkt, nur ist der Benefit im Allgemeinen derart gering das der Vorteil sich irgendwie nicht wirklich bemerkbar macht.

Btw, wie es scheint bringt SSE3 bei einigen Media-Encodern ungefähr 1 bis 3 % zusätzliche Performance. Tolle Wurst.

Seemann · 17.02.2005

Original geschrieben von Bokill
sowie -> Hier <- Nicht wahr Seemann?

Ohh, Jugendsünden... Naja, ist ja ein ganz anständiges Stück Code.

Opteron · 17.02.2005

Original geschrieben von Seemann
Btw, wie es scheint bringt SSE3 bei einigen Media-Encodern ungefähr 1 bis 3 % zusätzliche Performance. Tolle Wurst.

Wobei sich wohl darüber diskutieren ließe, ob die paar Prozente aus der Verwendung von SSE3 resultieren, oder aber es vielleicht nur der Gewinn aus den kleineren Finetunigmaßnahmen (Adaptive Prefetch,2 zusätzliche Write-Combining Buffers) der E4 revision ist ...

ciao

Alex

Desertdelphin · 17.02.2005

Hey SSE3 ist doll ja!?! Genauso wie mein Ksellorhn 3Ghz. Achja und AMD sind alle viel wärmer und alle VIA Mainboards instalbier *grins*

Gast29012019_2 · 17.02.2005

Oder man verändert einiges, benutzt die SSE-Befehle führ andere Zwecke so wie Intel und nennt das ganze dann "HT" *g*

Seemann · 17.02.2005

Original geschrieben von Opteron
Wobei sich wohl darüber diskutieren ließe, ob die paar Prozente aus der Verwendung von SSE3 resultieren, oder aber es vielleicht nur der Gewinn aus den kleineren Finetunigmaßnahmen (Adaptive Prefetch,2 zusätzliche Write-Combining Buffers) der E4 revision ist ...

Da gebe ich dir vollkommen Recht - eigentlich gehe icha uch davon aus, dass die sonstigen E4-Neuerungen mehr Einfluss haben als SSE3. Die anderen E4-Neuerungen bringen ja erwiesenermaßen einiges, aber das unterstützt ja nur meine These (die ich schon mit Erscheinen des Prescotts hatte), dass SSE3 fast vollkommen nutzlos ist.

Gast29012019_2 · 17.02.2005

Original geschrieben von Seemann
Da gebe ich dir vollkommen Recht - eigentlich gehe icha uch davon aus, dass die sonstigen E4-Neuerungen mehr Einfluss haben als SSE3. Die anderen E4-Neuerungen bringen ja erwiesenermaßen einiges, aber das unterstützt ja nur meine These (die ich schon mit Erscheinen des Prescotts hatte), dass SSE3 fast vollkommen nutzlos ist.

Naja, wenn im Prinzip nur 1-2 Programme gibt die einen direkten nutzen davon haben, wohl logisch das es dann kein Sinn macht. *g*

Dresdenboy · 17.02.2005

Da bekommt die x86-SIMD-Erweiterung für Double Precision endlich die Flexibilität von 3DNow! und plötzlich finden dies viele unnütz...

Um das noch etwas zu untermauern:
SSE2 ist oft noch unflexibel und man muß Umwege gehen. Da ist es doch nur gut, wenn es optimale Befehle zur Lösung dieser Dinge gibt, wie z.B. die neuen Horizontal-Rechenbefehle und jene, welche speziell für das Rechnen mit komplexen Zahlen geeignet sind.

Es sind ja nicht nur Video-Codecs, die davon profitieren könnten, sondern ein größerer Teil der für wissenschaftliche Zwecke eingesetzten oder entwickelten Software, jede Art von 3D-Software (inkl. Games, die Double Precision z.B. für empfindliche Physikengines benötigen*), Audio/Video-Processing-Software usw.

*) Es reichen schon Unterschiede von ein paar Werten in der Größenordnung von 100-1000, um schnell mal Bits in der 23bit-Mantisse bei Single Precision zu verlieren.

AnandTech: Opteron E4 Stepping - SSE3 Performance

pipin

Administrator

neax

Grand Admiral Special

Seemann

Admiral Special

mocad_tom

Admiral Special

rkinet

Grand Admiral Special

Bokill

Gesperrt

Seemann

Admiral Special

Seemann

Admiral Special

Opteron

Redaktion
☆☆☆☆☆☆

Desertdelphin

Grand Admiral Special

Gast29012019_2

Guest

Seemann

Admiral Special

Gast29012019_2

Guest

Dresdenboy

Redaktion
☆☆☆☆☆☆

Ähnliche Themen

AnandTech: Opteron E4 Stepping - SSE3 Performance

Administrator

Grand Admiral Special

Admiral Special

Admiral Special

Grand Admiral Special

Gesperrt

Admiral Special

Admiral Special

Redaktion☆☆☆☆☆☆

Grand Admiral Special

Gast29012019_2

Guest

Admiral Special

Gast29012019_2

Guest

Redaktion☆☆☆☆☆☆

Ähnliche Themen

Redaktion
☆☆☆☆☆☆

Redaktion
☆☆☆☆☆☆