TRINITY & Co: alles um Bulldozer-based APUs von AMD und deren Plattform

Status
Für weitere Antworten geschlossen.
@mocad_tom:
Fuchs.. Doch nicht etwa wegen Foxton ;-)

Da gabs doch mal Folien beim BD Start, das sind so um ~10% max. Wenn die jetzt 10% von 10% verbessern, dann wirds insgesamt 1%, also etwas mager, aber der Ertrag ist bei getuntend high-end chips ja immer gering.
Hab mal schnell gegoogelt, und hier die Teile gefunden:
http://www.theregister.co.uk/2011/02/24/amd_bulldozer_core_isscc/page2.html
Das habe ich mir auch angeschaut. Hinweis: da steht "global".
 
Wo kommt denn das mit den "10% von 10%" her? Wenn man sich mal die Kommentare bei eetimes durchliest, dann soll das Taktnetzwerk durchaus etwa ein Drittel des gesamten Energiebedarfs ausmachen. Wenn man mit Piledriver hier nun etwa ein Viertel einsparen kann, dann sollte die Leistungsaufnahme des gesamten Prozessors um knapp 10% sinken. Vermutlich sogar mehr, je höher der Takt ist. Und zukünftige Implementierungen könnten noch mehr bringen. Ich finde das schon relativ heftig. Zumal die dafür benötigte Chipfläche vergleichsweise gering ausfällt.
 
... Wenn man sich mal die Kommentare bei eetimes durchliest, dann soll das Taktnetzwerk durchaus etwa ein Drittel des gesamten Energiebedarfs ausmachen. ...
Das hatte Sun auch schon vor Jahren mit dem Niagara angesprochen. Also überraschend ist so etwas ganz und gar nicht.

Und genau daran hat AMD von Anfang an bei ihrem Bulldozer gearbeitet. Und genau das macht den Unterschied zum K8/K10 aus.

MFG Bobo(2012)
 
Wo kommt denn das mit den "10% von 10%" her?
Steht doch deutlich da und nen Link gibts auch:
Zitat von Opteron
Da gabs doch mal Folien beim BD Start, das sind so um ~10% max. Wenn die jetzt 10% von 10% verbessern, dann wirds insgesamt 1%, also etwas mager, aber der Ertrag ist bei getuntend high-end chips ja immer gering.
Hab mal schnell gegoogelt, und hier die Teile gefunden:
http://www.theregister.co.uk/2011/02/24/amd_bulldozer_core_isscc/page2.html
Das habe ich mir auch angeschaut. Hinweis: da steht "global".
Dresdenboy hat auch schon gleich Deine Frage beantwortet, wieso andere vielleicht von 30% sprechen, das sind nur Globalwerte, da fehlt also etwas. Ich ging irrtümlich davon aus, dass "global" bedeutet, dass sie alles zusammenrechnen, ist aber wohl nicht so. Hier noch ein Bildchen aus der Doktorarbeit:
clock_networktwf05.png

http://marco.stanford.edu/swong/Frank.pdf

Da frag ich mich dann, wieso AMD das auf den alten Stromverbrauchs-Bildchen nicht mit angegeben hat. Die Prozentrechnung macht dann doch wenig Sinn, wenn man was wegläßt ... *noahnung*

Edit, noch ein Zitat aus obigen PDF:
On the other hand, the global network drives a small amount of the total capacitance in the clock network because it is at the upper portion of the fanout network. Therefore, relatively little power is dissipated at this level of the distribution.
From a design point of view, achieving low timing uncertainty is more critical than reduc-ing power dissipation.
Er sagt also, dass das Globalnetzwerk eher wenig Leistung verbrät. Na wenn das dann bei BD trotzdem schon ~10% waren, muss da noch ein ganz schöner Brocken hinterherkommen. Sprich die Piledriver-Optimierung könnte sich doch relativ stark auswirken. Bin gespannt :)
 
Selbst für die 45nm Opteron´s "Lisbon" hat AMD keine ULK DIEs verwendet ;)

Belanglose Aussage bei gleicher Die

Ich denke man sollte Abstand von solchen Meldungen nehmen, was erwartet ihr den von Piledriver, durch ULK plötzlich 50% mehr Kerne wie Deneb > Thuban, ganz bestimmt nicht, nicht vergessen auf den blubber Folien von AMD steht irgendwas von 10-15% mehr Performance..das kommt bestimmt nicht durch ULK sondern durch Cache/Frontend Verbesserungen und vielleicht 5-10% mehr Takt.

Es erwartet auch keiner 50% mehr Leistung! Höchstens du!? Aber es ist noch anderes Verbesserung Potenzial bei BD vorhanden z.B.Leistungsaufnahme. Das ist doch mit der größte Kritikpunkt an BD, dass er bei etwa gleicher Leistungsaufnahme kaum mehr Leistung bringt Thuban.

@Ge0rgy/Duplex
Ich setze beim Thuban lieber 40% mehr an, da u.a. L3 mit 6MB nicht vergrößert wurde. Wenn die 15% Mehrleistung durch mehr Transistoren generiert werden, würden folglich noch etwa 25% zur Reduktion der Leistungsaufnahme "übrig" bleiben. Da aber der Leistungsschub auch teilweise durch Bugfixing erbracht werden soll, sind auch mehr drin als die von mir geschätzten 25% weniger Leistungsaufnahme möglich. Damit könnte Piledriver auf Augenhöhe bei der Performance pro Watt mit SB liegen, nur das dann schon Ivy wartet...


@Twodee
Habe eben auch nachgerechnet die 20% stimmen, aber die CPU Kerne habe die deutlich höheren Anteil am Strombudget, sodass man denke ich mit den 40% in etwa ganz gut hinkommt. ULK scheint in etwa so viel zu bringen wie eine kleinere Fertigungsstufe.
 
@bbott

Das mit der Effizienz, bzw. weniger Leistung bei höherer LA stimmt auch nur bedingt und trifft vor Allem auf den FX-8150 zu (und die teildeaktivierten Chips mit deutlich zu hoher VID, Stichwort "Leckströme"), samt 700/800/900er Chipsatz (NB+SB) der zusammen bestimmt schon über 20 Watt Spitze aufnimmt. Bei ht4u zeigt sich, dass die CPU-Archtitektur an sich schon effizienter ist als Phenom I/II nur die Begleitumstände verhindern ein positiveres Bild, wie gesagt abgesehen von der momentanen Gesamtleistung. Auch im Vergleich zu Llano sieht man, dass selbst ein FX-4100 mit extrem schlechter Vcore effizienter als ein A-3650 ist, lediglich der Chipsatz macht dann hier den Unterschied, der A75 FCH hat eine TDP von 7,8 Watt.


Komischerweise interessiert sich außer ht4u so gut wie keine Publikation für die FX-4er bzw. FX-6er Series, es gibt so gut wie keine Testberichte zu den Chips, und wenn dann sind sie (außer eben bei ht4u) "simuliert".
 
Hi deadohiosky

schauen wir mal wenn der 8140 wirklich mit 95watt kommt ob sich die betrachtung der tester dann ändert. bin zwar gespannt wie sie den der ja nur knap unter den taktraten des 8150ist auf 95watt gebracht haben.

lg
 
Naja, ich glaube nicht, das ein 8140 jetzt wesentlich bessere Effizienz liefern wird, allein schon, weil es anscheinend kein neues Stepping ist, sondern höchstwahrscheinlich einfach nur "gebinnte" Chips. Wenn die "geleakte" Folie recht behält sind es dazu auch einfach nur im Takt kastrierte 8150, "die Tester" werden diesen Knilch also auch an sich vorüberziehen lassen (™).

Von 3,1 GHz auf 3,6 GHz Basistakt sind es dann doch noch mal 500 MHz. Dafür wäre natürlich der Turbo-Takt, der bei 4,1 GHz läge, dem Binning geschuldet und kommt dem des 8150 mehr als nahe.
 
Komischerweise interessiert sich außer ht4u so gut wie keine Publikation für die FX-4er bzw. FX-6er Series, es gibt so gut wie keine Testberichte zu den Chips, und wenn dann sind sie (außer eben bei ht4u) "simuliert".

-Das stimmt, ht4u waren auch diejenigen die auch einen Nachtest gemacht haben zum Thema Bulldozer und auch gezeigt haben dass diese CPU Power hat, auch bei Spielen, obwohl noch nichtmal 100% angesprochen wird von Windows.
http://ht4u.net/reviews/2011/amd_fx_8150_bulldozer_3d_spiele/

-Und in den Trollforen wird in Beratungsforen gesagt dass die FX 8150 für Spiele nicht zu Empfehlen wäre, was ein Witz ist. -Klar hat der Bulli im Gegensatz zum i5 2500 mehr Stromverbrauch, aber auch viel "Hubraum" der z.Z. nicht genutzt wird.
-Hardwareluxx hat die kleineren Bullis auch noch getestet, komischerweise CB nicht, sonst Schreiben die ja auch jede Nachricht, auch wenn diese nicht so von Bedeutung ist.
-Es gibt noch die stillen Leser, bzw. Leute die sich weiterhin für AMD Produkte Interessieren, bestimmt nicht wenige, -only Intel will doch keiner haben ;) -Und auch heute gibt es noch Leute mit Moral, nicht alles ist "RTL verstrahlt" möchte ich damit sagen.
 
Aber auch ht4u, kommt völlig zu Recht zu dem Ergebnis, dass der Bulldozer der preislich zwischen i5-2500K und i7-2600K rangiert eben nur teilweise die Leistung des i5 erreicht und in CPU-lastigen Spielen/Szenarien das Nachsehen hat und es wurden auch nicht die min fps getestet, das ist eigentlich auch relativ wichtig, wenn man schon keinen frameverlauf aufzeichnet. Der FX würde hier nicht gut aussehen.

Das mit dem nicht genutzten "Hubraum" lasse ich erst einmal dahingestellt, das wird Windows 8 zeigen, ob da wirklich so viel Leistung brachliegt und die Auslastung der einzelnen Kerne wirklich noch erhöht werden kann. (Was meinst du eigentlich mit "nicht 100% angesprochen wird"?)

Bulldozer ist im Desktop momentan nur in Spezialfällen nützlich, darüber hinaus steht ihm die hohe Leistungsaufnahme im Weg. Das wird hoffentlich Piledriver hinbekommen und man hätte wieder ein konkurrenzfähiges Produkt (auch in Hinsicht auf die eigenen Vorgänger-Produkte), dass sich besonders in Multithreading-Anwendungen hervortun könnte. Ob die Spieleleistung deutlich ansteigt, wage ich noch zu bezeifeln (auf Grund des nicht optimierten Codes der zum Teil schon deutlich gealterten Game-Engines, einfach nur Unterstützung für mehrere Kerne reicht dann nicht. Das sieht man bei vielen Spielen bei denen das so gehandhabt wird, da müsste auch mal die Engine komplett neu geschrieben/kompiliert werden)
 
Es ist aber auch nicht so dass Zocken mit BD unmöglich wäre...
 
Was mich interessieren würde ist, ob die Leistungsaufnahme frischerer Bulldozer CPUs eigentlich niedriger ist als die der ersten Margen...
also kurz ob die z.T. an einem unausgereiften Fertigungsprozess lag der mittlerweile verbessert wurde?
 
Bulldozer ist im Desktop momentan nur in Spezialfällen nützlich

Das gilt nicht nur für den Desktop, auch für Server. Bulldozer ist ein extrem launisches Produkt. Unter optimalen Bedingungen mit sehr guter Performance. Aber eben nur da.
Man muss zur Zeit genau hinsehen und testen ob BD die richtige Wahl ist.
Nicht gut, weil zu zickig.
 
Was mich interessieren würde ist, ob die Leistungsaufnahme frischerer Bulldozer CPUs eigentlich niedriger ist als die der ersten Margen...
also kurz ob die z.T. an einem unausgereiften Fertigungsprozess lag der mittlerweile verbessert wurde?
Gibts, aber die werden dann höchstwahrscheinlich für die besseren Modelle aussortiert. Gab da letztens auf DH ne neue Roadmap ne Folie mit z.B. nem 8140 Modell bei nur 95W TDP.
Also die übliche Modellpflege..
 
Ich kann nur kurz meine Werte nennen, was Ihr daraus macht ist Eure Sache.
Kauf vor zwei Wochen.
System:
1. SCYTHE Mugen 2 Rev. B (SCMG-2100)
2. HEC/COMPUCASE Cougar CMX 550 - CMX-Serie
3. 8GB CORSAIR Vengeance - Dual Channel Memory (CMZ8GX3M2A1866C9)
4. Sapphire Radeon HD 5450 512MB DDR2 -> nur zum testen bis die XFX Radeon HD 6950 XXX Edition lieferbar ist.
5. LANCOOL PC-K57 (PC-K57)
6. ASUS M5A99X EVO
7. AMD FX-6100 (FD6100WMGUSBX)
8. 1TB HITACHI Deskstar 7K1000.D (HDS721010DLE630)

Windows Idle: 62-67 Watt
Prime95 Load: um die 110-120
Gruß Lehmann

PS: Ups, das ist eine TRINITY Thread ... Sorry für´s OT
 
Zuletzt bearbeitet:
@GeOrgy

Habe auch nichts gegenteiliges behauptet. Dennoch muss man feststellen das fps-Fetischisten (also hohe fps um jeden Preis) bei Intel im Moment deutlich besser aufgehoben sind, auch was das P/L-Verhältnis anbelangt. Im GPU-Limit hingegen ist das natürlich wieder egal.


@mariahellwig

Auch hier hast du nur bedingt recht. Denn das Problem liegt im Server-Bereich vor Allem an der Software.

Einige Anwendungen/OS unterstützen zum Beispiel Core Parking nicht oder nur fehlerhaft. Dazu unterstützen natürlich der Großteil der Anwendungen die neuen Befehlssätze nicht, die extra für Serveranwendungen implementiert wurden. Da liegt also noch so einiges brach.

Das P/L-Verhältnis der neuen Server-Bulldozer hingegen ist mal wieder eine Kampfansage an Intel und da wird Intel auch diesmal mit SB-E nicht entgegenkommen um die Marge nicht zu gefährden. Ob SB-E in Teilbereichen die BD für sich beansprucht deutlich besser dasteht und die Mehrkosten rechtfertigt muss sich zudem noch herausstellen.


@wendigo2k

Ich gehe mal ganz stark davon aus, das mit dem Yield sich auch das Binning verbessert und über kurz oder lang die Spannungen gesenkt werden können. Ich kann da leider immer nur das ht4u-Beispiel anbringen (außer xbitlabs gibt es ja, soweit ich weiß keine weitere Seite die native FX-4/6er getestet hat), wo der FX-4100 unwesentlich weniger verbraucht, als ein FX-6100 mit einem weiteren Modul und "nur" 300 MHz weniger Basistakt.
 
Zuletzt bearbeitet:
Ich schätze mal eher, dass das Bild einen ganzen Piledriver-Core darstellt ;)
Unten die FPU, in der Mitte die beiden Int-Cluster und oben der "Rest"^^

Oder was meinst du mit der "Struktur"?
 
Was meinst du mit Core? Ein Kern im Modul oder das gesamte Modul?

Bei ersteren würde ich sagen: könnte sein.

Bei letzterem würde ich sagen: sehe ich nicht so. Dazu muss ich aber auch sagen dass ich Probleme habe, überhaupt übereinstimmende Strukturen festzustellen.

Mit "Struktur" meinte ich den Teil der Module der sich (jeweils gespiegelt) direkt über den PCIe I/Os befindet.

Unterschrift des Bildes
Figure 7: Chip Microphotograph of the resonant-clocked 32nm AMD “Piledriver” core.

Zudem ist das Modul rechteckig, dieser Ausschnitt "nur" quadratförmig, also fehlt meines Erachtens etwas.;)

edit:

Habs jetzt mal gedreht (hätte ich ja auch mal früher drauf kommen können). Nicht nur dass es in der Tat rechteckig ist ( :-[ ), es scheint sich wohl um ein ganzes Modul zu handeln... trotzdem schwierig, besonders durch die verschiedenen Falschfarbenbilder.
 
Zuletzt bearbeitet:
Auf dem Bild erkennt man die SRAMs auch viel besser. Ich habe nochmal mit dem BD-Modul verglichen, konnte aber nix auffällig anderes sehen.

Hierbei meine ich aber nicht die offensichtlichen neuen Schaltungen für das Clocking, sondern nur die Funktionsblöcke selbst.
 
Zuletzt bearbeitet:
Auch hier hast du nur bedingt recht. Denn das Problem liegt im Server-Bereich vor Allem an der Software.

Einige Anwendungen/OS unterstützen zum Beispiel Core Parking nicht oder nur fehlerhaft. Dazu unterstützen natürlich der Großteil der Anwendungen die neuen Befehlssätze nicht, die extra für Serveranwendungen implementiert wurden. Da liegt also noch so einiges brach.

Das ist den Kunden sch... egal.
Dafür kann sich niemand etwas kaufen.
 
Das ist dem Kundewn nicht Sch...egal, weil viele Ihre Software selber schreiben im Bereich für Server.
 
Status
Für weitere Antworten geschlossen.
Zurück
Oben Unten