Bulldozer auf Weltreise (BD rollt an Part II)

Status
Für weitere Antworten geschlossen.
Kaum gelauncht, noch nirgendwo Verfügbarkeit absehbar, und schon wird nach drastischen Preissenkungen gerufen, 25€ unterhalb eines 2500k. Jawoll, warum nicht gleich geschenkt, und das ohnehin tendenziell günstigere Board auch gleich dazu :]
Der i5-2500k schaft Durchschnittlich mit Luft 4,5Ghz, das sind 37% mehr Takt! Dazu kommt noch das riesengroße IPC+ gegenüber BD.
 
Kaum gelauncht, noch nirgendwo Verfügbarkeit absehbar, und schon wird nach drastischen Preissenkungen gerufen, 25€ unterhalb eines 2500k. Jawoll, warum nicht gleich geschenkt, und das ohnehin tendenziell günstigere Board auch gleich dazu :]


Weiß man eigentlich schon, ob die FX nun sauber auf AM3-Brettern laufen? Hab bisher nur Benches auf AM3+ gesehen.

Man muss das Produkt aber auch WOLLEN, bzw KAEUFER haben.
Zu sagen, man bekommts eh kaum, rechtfertigt keinen hohen Preis. ;)

Preis/Leistungsmaessig muesste er guenstiger sein als der i5-2500k
wenn man den Stromverbrauch mit einrechnet muesse AMD seine CPUs verschenken damit sie, ueber 2 Jahre gesehen, guenstiger sind als ein i5-2500k.
 
Der FX-8150 wird am 25.10. bei Mindfactory & Co erwartet, also noch ca. 2 Wochen warten.
 
Fabian_HT4U


Also anandtech hat auch x264 AVX/XOP binaries getestet und da kommen die auf gute Werte und AVX bringt meines Erachtens deutliche Zugewinne im 1-Pass (Singlethread? oder doch mehrere?)

http://www.anandtech.com/show/4955/the-bulldozer-review-amd-fx8150-tested/7(relativ weit unten)
41696.png

41716.png

41697.png

41717.png


AMD also sent along a couple of x264 binaries that were compiled with AVX and AMD XOP instruction flags.
The standings don't change too much in the second pass, the frame rates are simply higher across the board. The FX-8150 is an x86 transcoding beast though, roughly equalling Intel's Core i7 2600K. Although not depicted here, the performance using the AMD XOP codepath was virtually identical to the AVX results.
 
Zuletzt bearbeitet:
Weiß jemand ne Erklärung für die durchweg schlechten Ergebnisse bei Anno?

Zählt das Spiel die Threads nicht richtig, oder was ist da los? Eigentlich skaliert das Spiel gut mit Kernen, aber irgendwie bei BD .... läuft da vielleicht ein dicker -IPC abhängiger- Hauptthread?

Die anderen schlechten Ergebnisse hab ich fast schon erwartet, aber das ... strange
 
Lol, achso *lol*


Noch zum CMT SpeedUp, da gibts ne nette Seite bei den Franzosen:
http://www.hardware.fr/articles/842-9/efficacite-cmt.html

Hab das von xtremesystems.org mal in eine Tabelle gepackt:

Bulldozer.jpg


Im Schnitt kann eine Integereinheit im Einzelbetrieb ggü. voller Modulauslastung, also 20-30 % mehr auf die Straße bringen(drittletzte Spalte). Bei Winrar, als repräsentativ für INT, sind es 26 %. So wie es jetzt läuft (letzte Spalte), kann es nicht von AMD geplant sein. Ich schätze die geplante Leistung entspricht eher der vorletzten Spalte. Nur leider scheinen in der Realität Pferdefüße aufgetreten zu sein, die eine reibungslose Funktion von 2 Kernen pro Modul stark behindern. Bei voller Auslastung eines Moduls mit unterschiedlichen Aufgaben, dürften sich die Integereinheiten, aufgrund mangelnden Nachschubs, geradezu langweilen, wenn man das brachliegende Potential (drittletzte Spalte) sieht. Bei WPRIME liegt ein Modul gegenüber zwei Integerkernen unterschiedlicher Module gar um knapp 40 % hinten. Das kanns ja nicht sein! :]

Allerdings ist das alles immer noch keine Erklärung für die schwache Leistung in Spielen. Dort scheinen die FPUs "abzukacken". Lt. deinem oben verlinkten französischen Test, bringt die Betrachtungsweise mit getrennter Modulbearbeitung bei Games gerade 5 % ein. Nehmen wir noch folgenden Sachverhalt unter Windows 8 dazu:

win%208%20wow%201680.png


Dann kommt man zwar von 75 fps auf 82+5%=86 fps mit neuem Scheduler und der o.g. Betrachtung. Das ist dann aber immer noch Meilen hinter i5 mit 114 fps. Das heißt selbst wenn man alles rauskitzelt an Integerleistung, liegt man immer noch gnadenlos zurück. So einen Murks kann man doch nicht ernsthaft anbieten.

Hoffen wir einfach dass die FPUs schlicht fehlerhaft sind und dass AMD die mangelnde Leistung im Modulbetrieb in den Griff bekommt und somit bei Anwendungen und Windows 8 kumuliert 25 % drauf packen kann.

Sehr interessant dazu der Hinweis von ht4u:
http://ht4u.net/reviews/2011/amd_bulldozer_fx_prozessoren/index11.php
"Die gesonderte Stellung innerhalb eines Moduls macht die Gleitkomma-Einheit im Übrigen zu einer Art Co-Prozessor, so wie es auch Grafikkarten sein können. AMD geht hier somit bereits den ersten Schritt, Gleitkomma-Berechnungen auf einen Co-Prozessor auszulagern. Wird später einmal eine GPU in eine Bulldozer-CPU oder spätere Prozessoren integriert lässt es dieses Design wesentlich einfacher zu die FPU durch die GPU ersetzen."

Evtl. wird man die FPUs bei Trinity und folgenden Bulldozer Generationen gleich weglassen und die GPU rechnen lassen. Man sollte nicht gleich den ersten Entwurf einer neuen Generation verdammen, wenn man den Gesamtplan nicht kennt. Mal sehen wie es dann mit Trinity weiter geht.
 
@deadohiosky:

Die Werte ohne AVX sind aber seltsam... Ich erreiche mit einem 1100T schon 127 FPS im Pass 1... Ich glaube das liegt bei Anandtech eher an etwas anderem. Wenn die wirklich den HD-Bench in Version 3.03 einsetzen, dann sind die x264-Binaries aus dem Jahre 2009. Kein Wunder, dass da neue AVX-Binaries einen großen Vorteil bringen.

Hier unsere Ergebnisse bei einem 2-Pass-Test mit r2053:
http://ht4u.net/reviews/2011/amd_bulldozer_fx_prozessoren/index34.php

Und hier der AVX vs. Non-AVX-Vergleich mit halbwegs aktuellen Binaries:
http://ht4u.net/reviews/2011/amd_bulldozer_fx_prozessoren/index17.php

grüße
Fabian
 
Eine Alternative wäre, den 2. Cluster aus der Compute Unit rausnehmen und dann die Compute Unit breiter designen, das wäre dann kein CMT mehr, die Pipeline würde ich dann auch kürzer designen & den L1D Cache verdoppeln, ein hochtakt Design wird ineffizient, wenn das mit den 10-15% stimmen sollte wird AMD mit CMT kein erfolg haben. D. Meyer hat das wahrscheinlich schon alles vorher erkannt, ein PlanB ala X8 in 32nm für 2011 wäre besser.
 
Der i5-2500k schaft Durchschnittlich mit Luft 4,5Ghz, das sind 37% mehr Takt! Dazu kommt noch das riesengroße IPC+ gegenüber BD.

OC-Ergebnisse sind weder verbindliche Leistungszusagen, noch im Vergleich zu einem anderen Prozessor @Stock angebracht. Dass man das überhaupt erwähnen muss... :]
 
@Fabian


Keine Ahnung, was da los ist, aber Techreport

http://techreport.com/articles.x/21813/13

hat sehr, sehr ähnliche Ergebnisse für den FX-8150 wie Anandtech... ohne AVX/XOP binaries
Gilt das Gleiche. Ebenfalls noch uralte Binaries, da Version 3.0. AVX und FMA können was bringen, aber bei etwa gleich alten Binaries tut es das leider (noch) nicht. Aber mal abwarten, was die Entwickler noch machen. Hier kann man das übrigens verfolgen:
http://git.videolan.org/gitweb.cgi?p=x264.git;a=shortlog

grüße
Fabian
 
Achso????


3.03 ist alt? Ich dachte das wäre die aktuellste Version und nur die binaries wären ausgetauscht worden? Gehe ich recht in der Annahme dass 4.xx die aktuelle ist?



Hier mal was zum Windows Scheduler unter Win7

http://www.hardwarecanucks.com/foru...amd-bulldozer-fx-8150-processor-review-3.html

Clock for Clock Vergleich und mit "ohne" und mit "mit" festgelegter Prozessoraffinität:

AMD_FX-8150-18.jpg


AMD_FX-8150-18a.jpg


Aber bitte den Text dazu lesen.
 
Hi Leute mal eine Kurze Frage.
Gibt es Informationen wann mit dem Phenom II x4 960T zu rechnen ist ?!

Bevor ich jetzt voreilig einen 2600k Kaufe, würde mich der 960t sehr interessieren.
Für 2 Jahre, und dann den nextGen Bulli drauf setzen. Ich hoffe das die nächsten Bullis AM3+ Bullis werden.
 
Noch etwas einigermaßen erfreuliches, AMD macht anscheinend weiterhin "(gut zu)kühle(nde) Prozessoren"


AMD_FX-8150-195.jpg


chart38.jpg
 
Ich hab ja eine Zeitlang schon schwarz gemalt aber das sind ja Ergebnisse die wirklich schlecht sind.
 
Ich bin mal gespannt wenn BD auf Serverapplikationen getestet wird. Schließlich soll er dort ja Bäume ausreißen. Wenn ihm dies gelingt, könnte ich ihm die Schwäche auf dem Desktop verzeihen. 35% schneller als MagnyCour...
 
Ich bin mal gespannt wenn BD auf Serverapplikationen getestet wird. Schließlich soll er dort ja Bäume ausreißen. Wenn ihm dies gelingt, könnte ich ihm die Schwäche auf dem Desktop verzeihen. 35% schneller als MagnyCour...


Wenn dem wirklich so ist was haben sie denn alles bei der Desktopversion deaktiviert?
 
Hi Oi!Olli

in gut paralelisierten anwendungen sieht der Bulli nicht schlecht aus im Server bereich hast du davon reichlich und spec etc. werte des Bulli sehen auch verdamt gut aus. Aber Orchi ist halt nicht Desktop und die Anforderungen unterscheiden sich doch sehr.

lg
 
Evtl. liegt es ja auch einfach am Marketing, dass hier einige so "enttäuscht" sind.

Hätte man von vornherein klar gemacht, dass es ein 4-Kern(Modul) Prozessor + CMT ist, würden einige jetzt sagen "wow, der 4-Kerner macht dem 6-Kern das Leben schwer, und dann hat der auch noch alle modernen Features".
Aber so ist es klar "8-Kerner kann sich nicht vom 6-Kern absetzten"...

Neoseeker.com hatte bei seinem Test ein geringeren Verbrauch als ein K6 Thuban.
power.png


Zudem hat man sich mal den Turbomodus angeschaut.
turbo.png


Grüße Lehmannn
 
Zuletzt bearbeitet:
Status
Für weitere Antworten geschlossen.
Zurück
Oben Unten