Bulldozer auf Weltreise (BD rollt an Part II)

  • Ersteller Ersteller Gast30082015
  • Erstellt am Erstellt am
Status
Für weitere Antworten geschlossen.
Bulldozer: 4 OoO Pipelines je INT-Core (alu+agu getrennt)
K10: 3
Bulldozer: 4 VektorPipelines + SMT
K10: 3 ohne SMT
Bulldozer: 2MB shared L2
K10: 512KB exclusiv L2
Bulldozer: mit macro-OP-fusion und Memory Disambiguation
K10: ohne

Gibt natürlich immer verschiedene weißen auf eine Architektur zu schauen...
 
Hi Duplex

ich glaube er meinte wie lange es braucht bis die cpus davon profitieren könnte.
das dauerte über 1jahr und ein neues os auf win sweite im linux ging das flotter.
(und in anbetracht das cmt aber zwingen funktionieren muss um seine leistung
zu erreich ist es um einiges wichtiger wie smt)

lg
 
Der Nehalem war zu Beginn auch schlechter als der Core2 (bezogen auf Benches wo SMT noch nicht implementiert war und trotz gleicher oder kleinerer Strukturgröße). Und er wäre es vor allem in Spielebenches auch Heute noch, wenn man die Möglichkeit eines vergleiches hätte.
 
@tex_
Die Cache Werte sind laut AIDA bei BD negativ.
MacroOP Fusion und Memory Disambiguation ist vorhanden aber möglich das es nicht funktoniert...
Pro Takt 4 Befehle nützt doch nichts wenn man auf der anderen Seite weniger Ausführungseinheiten / 3 > 2 Fach & weniger FPU Leistung hat...

@Alyva
http://www.anandtech.com/show/2542/6
http://www.anandtech.com/show/2542/7
 
Zuletzt bearbeitet:
SMT bringt je nach Anwendung bis zu 30 % mehr Leistung. Das bezieht sich jetzt aber nur auf Games ( RUSE, Lost Planet 2 usw ... ).

Als Gamer kann man Bully also liegen lassen.
.
EDIT :
.

Der Nehalem war zu Beginn auch schlechter als der Core2 (bezogen auf Benches wo SMT noch nicht implementiert war und trotz gleicher oder kleinerer Strukturgröße). Und er wäre es vor allem in Spielebenches auch Heute noch, wenn man die Möglichkeit eines vergleiches hätte.

Was nen Schwachfug. Die Gamebenches waren der Hammer gegenüber dem Core 2 Quad. Auch ohne SMT.
 
Nur ein Durchlauf ... ich bin dabei gegen zutestet mit meinem PII 945 Default und mit 3,6GHz und nebenbei ist mir aufgefallen das der erste Wert niemals der beste ist.

In der Regel ist der erste Durchlauf nicht der Beste. Aber die Veränderungen zu weiteren Durchläufen halten sich in sehr geringen Grenzen..... ;)
 
Vorläufiges Fazit: Vielen P3D-Nutzern ist es durchaus NICHT egal, wie hoch die IPC eines Bulldozerkerns ist. Es wäre schon ernüchternd, wenn taktbereinigt sogar noch weniger als beim K10 rauskäme. Dank Hochtaktdesign und potenziellen Stellschrauben für die Software ist aber noch selbst bei der IPC Luft nach oben. Einen Performancecounter hat ja AMD für Entwickler im Chip integriert - die Stellschrauben sind ja da, sie müssen "lediglich nur noch angezogen werden ...

MFG Bobo(2011)
Vielleicht sollten wir uns davon lösen, dass Bulldozer nur in Form von Silizium "anrollt".
Wenn mit manchen Optimierungen 400% Mehrleistung drin sind, sollte ja bekannt sein wo es klemmt.
Selbst wenn später nur 50% davon übrig bleiben, das wäre genug um den 2600k zu schlagen.

Wie lange optimiert Intel nun SMT?

MfG
 
Selbst wenn er ausgebremst werden würde, dürfte er nicht unter den Werten eines Core2 liegen.
 
Zuletzt bearbeitet:
Selbst wenn er ausgebremst werden würde, dürfte er nicht unter den Werten eines Core2 liegen.

1-2 fps nennst du also "unter"? Ich nenne das Messungenauigkeit und wegen dem Setup sowieso Unfähigkeit. Können wir das Thema beenden? Da gibts eigentlich nix mehr dazu zu sagen.
 
@tex_
Die Cache Werte sind laut AIDA bei BD negativ.
MacroOP Fusion und Memory Disambiguation ist vorhanden aber möglich das es nicht funktoniert...
Pro Takt 4 Befehle nützt doch nichts wenn man auf der anderen Seite weniger Ausführungseinheiten / 3 > 2 Fach & weniger FPU Leistung hat...
Cache Werte: Die sind immer noch genauso wirr wie bei den ES. Entweder das ist ein Auslesefehler, liegt am nicht finalen Bios oder die CPU hat hier noch einen Bug. (letzteres wäre alles andere als schön, aber zumindest für die Zukunft lösbar)
Dass alle neu beworbenen Funktionen noch nicht funktionieren sollen, wage ich dann doch mal nicht zu befürchten.
Und mit den weniger Ausführungseinheiten, würde ich dir zustimmen wenn Software zu 90% nur aus Rechenbefehlen bestehen würde. Meines Wissens nach, ist der Anteil der Speicherbefehle aber häufig sogar etwas größer.

Die letzte große Frage ist dann, was mit den letzten 2 neuen Bios Versionen noch für Fortschritte gemacht wurden und was Bulldozer mit neu Compilierter Software leistet. Beispielsweise bei x264 könnten sie sich eventuell bald dank XOP vom i7-2600 Niveau weiter absetzen.
Das neue Cachedesign bedarf hier recht wahrscheinlich auch neue Compileroptimierungen.
 
Hallo,
hab da mal ne blöde frage... kann ich den Phenom II X 1100T auch auf einem am3+ board betreiben? z.B. auf dem ASRock Fatal1ty 990FX Professional ?
 
Wobei noch angemerkt sein sollte, dass AM3+ -Mainboards auf den Bulldozer optimiert sein können, was in einem klitzekleinen Performance-Nachteil gegenüber einer AM3-Platine resultieren kann. Ist aber nicht sehr schlimmt. :)

Und wenn wir jetzt gemein sind, und sagen das auf einer 990FX Platine Nvidia SLI ohne Probleme zum laufen zu bringen ist, dann biste im Multi GPU Setup mit mehr Leistung und weniger Microrucklern unterwegs als mit jedem AM3 Mainboard ( okay das eine Nvidia Board von Asus ist ne Ausnahme :D )
 
Die letzte große Frage ist dann, was mit den letzten 2 neuen Bios Versionen noch für Fortschritte gemacht wurden und was Bulldozer mit neu Compilierter Software leistet. Beispielsweise bei x264 könnten sie sich eventuell bald dank XOP vom i7-2600 Niveau weiter absetzen.
Das neue Cachedesign bedarf hier recht wahrscheinlich auch neue Compileroptimierungen.

Der Typ von x264 hat XOP jetzt doch "gedroppt" weil sich die Idee es zu verwenden doch nicht so gelohnt hat.... FMA steht aber noch im Rennen!
(wobei ich nicht drauf wetten würde... wer weiß, vielleicht ist der Typ jetzt oder bald Millionär wenn er XOP und FMA nicht einbaut ;))
 
Hoffen wir das AMD nächste Woche überzeugen kann, es wird Zeit!
Das ist ein Spekulationsthread und keine Bete & Hoffnungs-Thread!!!

Ist völlig irrelevant wie lange SMT braucht, die Kerne sind sehr Leistungsstark, Nehalem hat pro Core 25-30% mehr IPC als Shanghai gehabt, außerdem kostet SMT keine 5% Fläche.
Ich kanns dir nochmal erklären.
SMT brauchte auch eine gewisse Zeit, bis es besser funktionierte.
Das wird auch bei CMT wahrscheinlich so sein.

Daher die Frage, weil ich es nicht ganz mitbekommen habe.
Wie lange dauerte bis SMT besser funktionierte?
 
Das ist ein Spekulationsthread und keine Bete & Hoffnungs-Thread!!!


Ich kanns dir nochmal erklären.
SMT brauchte auch eine gewisse Zeit, bis es besser funktionierte.
Das wird auch bei CMT wahrscheinlich so sein.

Daher die Frage, weil ich es nicht ganz mitbekommen habe.
Wie lange dauerte bis SMT besser funktionierte?

Genau genommen hat bei Anwendungen schon das erste SMT im P4 Single Core richtig gut Mehrpreformance gebracht !

Ohne das Anwendungen extra darauf optimirt wurden. Es gab damals nen Video bei Youtube welches einen Verlgeich zwischen Athlon XP und P4 mit SMT gezeigt hat ( Photoshop unter Windows XP ).
 
In der Regel ist der erste Durchlauf nicht der Beste. Aber die Veränderungen zu weiteren Durchläufen halten sich in sehr geringen Grenzen..... ;)
Ich hatte ca. 6,4Gflops unterschied in Linx, erster run 35,7Gflops, zweiter run 42,1Glops, bester run 18 mit 42,2Gflops. Finde das nicht gerade wenig, das ist für viele bei z.B. Grafikkarten benches schon kauf entscheidend.

Naja, einfach noch drei Tage warten dann gib es offizielle Benchmarks :), dann wird sich auch entschieden was mein PII 945 ablöst.


Edit:
Welches ist denn das beste am3+ Board, eurer meinung nach ?
Von vielen wird das ASUS Crosshair V Formula empfohlen, wenn es aber auch günstiger sein darf das ASRock Fatal1ty 990FX Professional / ASRock 990FX Extreme4 sind auch nicht schlecht.
 
Zuletzt bearbeitet:
Genau genommen hat bei Anwendungen schon das erste SMT im P4 Single Core richtig gut Mehrpreformance gebracht !
Also, war das SMT-Problem nur in Spielen, wo sie manchmal etwas langsamer waren als ohne SMT.

AFAIK ging die Verbesserung dann mit einer entsprechenden Mircosoft-Zusammenarbeit nach einer Zeit.
 
Status
Für weitere Antworten geschlossen.
Zurück
Oben Unten