FUSION AMD's neue Klasse von x86er - Part II

Status
Für weitere Antworten geschlossen.
Stryki: SC2 ist was? StarCraft?
Ich bin bei Spielen reichlich unterbelichtet, also bitte in ganzen Wörtern :)

Ich hab jetzt die Unigine-Benches laufen (gibt's auch für Windows!) und endlich bekomme ich Maximalwerte: Sanctuary war noch ein Spaziergang mit 58W-61W, jetzt läuft Tropics und der Spitzenwert war 116 Watt, das ist das absolute Maximum, das ich bisher üerhaupt mit Llano gemessen hab. Die Quake-Engine-Spielchen unterfordern die Hardware also offenbar dramatisch.

Der Kühler den ich auf der APU sitzen hab, ist ein oller ArcticCooling Top-Blower aus Athlon64-Zeiten, der kommt jetzt richtig in Wallungen - hab ihn nichtmal bei Prime richtig gehört - jetzt aber schon! Ich werd denn doch mal den Mugen draufpacken denke ich ;D

Unigine ist übrigens ein Augenschmaus, kann ich nur empfehlen! Grad ist Heaven (alles bei 1280x1024) angelaufen - die beiden anderen liefen mit 25 bis weit über 30 FPS, Heaven hingegen ist eine flotte Slideshow: Minimum 5 FPS, mehr als 14 hab ich noch nicht gesehen.
 
Zuletzt bearbeitet:
Why AMD's APU hasn't fallen flat
Posted on Jul 11th 2011 by Aharon Etengoff

*
1
Share
Email
Share
JMP Securities chip analyst Alex Gauna believes AMD's recently launched APUs have "fallen flat."
"Our view stems from interviews with various computing retailers and OEMs - where representatives are not only unsupportive of new APU offerings, but are also discontinuing offerings," Gauna claimed earlier this morning.
"We believe many investors have been gravitating to [AMD, hoping] APU offerings could close some of the gap [with Intel] - when in fact it appears the reverse is happening as Intel ramps its Visibly Smart 2nd Generation Core offerings."
Gauna also opined that the so-called failure of AMD's APU may allow ARM to position itself as the primary alternative to Intel in the lucrative PC market.
"OEMs could pull the life support from AMD, as other ARM-based second source alternatives to Intel emerge - with the Windows 8 transition expected to emerge around year-end." ??
However, JoAnne Feeney of LongBow Research disputed Gauna's claims in an industry note obtained by TG Daily.
"Our checks indicate AMD is selling out its APUs, both the low-end for small, cheap notebooks (Brazos family of APUs, debuted in 12/10) and the very new Llano mainstream APUs," Feeney confirmed.
"[Remember], Llano is just starting to ship in volume this quarter so we would not expect systems to appear on websites until later in the summer. It [actually] began shipping in limited quantities last quarter, [and is] ramping this quarter. In preparation, inventories of systems based on the older processors are likely to be clearing."
The LongBow Research analyst also rebuffed Gauna's prediction that PC OEMs could, in theory, adopt ARM-based processors as a second source to Intel CPUs instead of using AMD.??
"Our research indicates the switch from x86 to ARM is technically infeasible now and for at least the next few years; this view emerges from our extensive discussions with CPU designers and system builders. Far too many challenges still remain to using ARM to power a notebook (or a desktop) due to the greater complexity of the memory system, I/O and storage.
"The OS is just the tip of the iceberg, so Microsoft's move to support ARM is only one step of many needed to pave the way for ARM to power full-service notebooks. More importantly, perhaps, ARM does not yet offer nearly the computing power that x86 processors do and the willingness of consumers to sacrifice computing speed, response time, and overall experience should not be overestimated."??
Finally, Feeney reiterated that system builders continue to express "solid enthusiasm" for AMD's move in 2012 to "combine the more advanced Bulldozer cores with its already leading-edge graphics." ??
"As such, it appears AMD's appeal for PC OEMs will be on the rise, not the decline... We see AMD's market share in both notebooks and servers rising in coming quarters, [while] a key barrier to OEM adoption for notebooks lifts as AMD processors finally enable compelling battery life."
See more about: HARDWARE FEATURES ALEX GAUNA AMD APU ARM INTEL JMP SECURITIES JOANNE FEENEY LONGBOW RESEARCH
You might like:
 
Zuletzt bearbeitet:
@Nazgul99

... der Mugen ist zum testen bestimmt besser geeignet als so ein AC Cooler. Wie schaut eigentlich der Boxedkühler zum Llano aus? Taugt der was?

MfG
 
... der Mugen ist zum testen bestimmt besser geeignet als so ein AC Cooler.
Logisch. Das war nur wieder mein Phlegma, ich hatte keinen Nerv, die Ram-Module unter den Mugen zu klemmen. Wie ich jetzt sehe, passen die RipJaws so gerade eben darunter. Der 12cm-Lüfter hängt auf einer Seite über dem Ram und ist dort etwas nach oben gedrückt, weil dafür eigentlich zu wenig Platz ist. Obendrein hab ich jetzt einen Gehäuselüfter angeworfen, damit die Bord-Komponenten gekühlt werden. Beim AC64 Silencer Ultra TC (so heißt er, wie ich jetzt weiß, vollständig) blies der Luftstrom ja nach unten auf die Board-Komponenten. Der Antec TriCool ist auch in kleinster Einstellung für mein Empfinden zu laut, da kommt demnächst wieder ein vom Board (deshalb kauf ich ja Asus) geregelter hin, hab ich in meinem älteren P180 auch so. Das "Neue" Gehäuse (gebraucht aus der Firma) ist ein P182.
Wie schaut eigentlich der Boxedkühler zum Llano aus? Taugt der was?
Nö. Die CPU-Schachtel war insgesamt so klein, dass ich dachte, da sei gar kein Kühler drin ;D Ist ein reiner Alukühler ohne Heatpipes, immerhin hat er eine gewisse Tiefe. Für Overclocking jedenfalls völlig ungeeignet. Ich hatte mal richtig gute AMD-Kühler mit bis zu 4 Heatpipes, als AMD pro Athlon 64 X2 noch viele hundert Euro nehmen konnte, das waren feine Dinger. Bei 100€ pro APU erwarte ich sowas aber auch nicht, ein vernünftiger Kühler muss eh immer zugekauft werden. Von mir aus könnten die Boxen ohne Kühler daherkommen, ich hab schon 5-10 Stück von dem unnützen Zeug rumliegen (ein paar immerhin mit zwei Heatpipes, aber zu lautem Lüfter).
 
Und hier meine ersten Unigine-Benchmarks mit DDR3-1866 und 1333. In der auf den 1333er Lauf normalisierten Version lässt sich der Performance-Gewinn durch den schnelleren Speicher erkennen: 10%, 13% und 6%, im Schnitt also knapp 10%.
.
EDIT :
.

Übrigens hab ich den Grafikspeicher auf ein GB erhöht (default war 512MB), bei Unigine Tropics hatte ich nun keinen so hohen Stromverbrauch mehr, kurzzeitiges Maximum war nun 108 Watt. Meist lagen die Werte aber bei 95-105 Watt. Der Idle-Verbrauch ist nach Aktivierung eines Gehäulüfters und Tausch des CPU-Lüfters zum Scythe Mugen um ca. 1 Watt erhöht.

Interessant ist sicherlich, dass die Threads nicht von Kern zu Kern springen, das hab ich unter Linux schon öfters beobachtet. Besonders für Bulldozer ist das ja interessant, ob aber eine spezielle Verteilung der Threads auf die Module stattinden wird, lässt sich daraus natürlich nicht schließen. Warsaw (oder war es Tremolous? Muss ich doch nochmal explizit überpüfen) nutzt übrigens zwei Last-Threads, dieses Bild ergibt sich anhand der hochtaktenden Kerne. Eins der Spieledemos hat nichtmal einen einzigen Kern zum wirklichen Hochtakten überreden können, definitiv kein CPU-lastiger Titel.

Die Angaben zu den Threads muss ich später nochmal in Ruhe überprüfen, momentan läuft VDrift mit 1333er Ram, anschließend lade ich auch die freien Gaming-Tests hoch. Und dann hau ich mich auf's Ohr, ich weiß schon garnicht mehr, was ich schreibe. Falls also viel Stuss dazwischen ist: sorry, morgen geht's vermutlich (halbwegs) ausgeschlafen weiter. *oink*
 
Zuletzt bearbeitet:
In einem Llano Test stand als Fazit, dass Latenzen kaum messbar Unterschiede bringen, sondern der Takt.
Ok, dann hätten die Module wohl derzeit das beste P/L Verhältnis:
http://geizhals.at/deutschland/a654722.html

~50 Euro für CL11 1600er ... ok.
Schafft 99% wahrscheinlich auch jedes Kingston 1333er Set, aber so hat mans halt 100%ig, und die paar Euro mehr sind ok ;)
Zu den Ram-Timings: da hab ich eigentlich keinen Nerv drauf, von Hand dran rumzufummeln. Wenn das SPD das nicht hergibt, werd ich mich da auch nicht dummfummeln, sorry. Mal sehen, ob ich die Latencies überhaupt rausbekomme. Nen Grafik-Overclock will ich aber noch probieren, wenn mit Standard-Core-Spannung (1,41V) der Basistakt auf 117 MHz erhöht werden kann, setz ich das Ram auf 1600 und hab resultieren wieder nahe 1866. Mehr hab ich eigentlich nicht vor zu testen, in der Praxis will ich außer dem Undervolting (für mich eine Korrekturmaßnahme) nichts verändern.
Ja nur kein Stress und schlaf Dich gut aus :)
 
A8 @3.5Ghz vs. X6-1100T @4Ghz
http://www.tweaktown.com/reviews/4182/asus_f1a75_v_pro_amd_a75_motherboard_review/index2.html

Schade das Llano nicht die geplanten Taktraten ab Werk bietet kann, normalerweise müsste Llano in 32nm mit High K gegenüber Propus, Deneb 4-4,5Ghz OC potential bieten können, vielleicht ändert sich das noch mit einem neuem Stepping gegen ende des Jahres.
Hmm, wat is dat denn:
x4182_37_asus_f1a75_v_sjf1.png


Seit wann ist die (CPU) Speicherleistung so gut?

Naja, ich will mich mal nicht beschweren *buck*
 
Ok, dann hätten die Module wohl derzeit das beste P/L Verhältnis:
http://geizhals.at/deutschland/a654722.html
Geht noch billiger!
Ja nur kein Stress und schlaf Dich gut aus :)
Ausschlafen wird an nem Arbeitstag wohl nicht drin sein ... Undank ist des Nerds Lohn ;D
Hmm, wat is dat denn:
Seit wann ist die (CPU) Speicherleistung so gut?
Hoppla? Oder ist da eine Beschriftung verrutscht und die hohen Werte sind jeweils von den übertakteten Läufen?

Wie auch immer. Hatte ich nicht was von horizontal oder so geschwafelt? *noahnung*
 
Interessant ist sicherlich, dass die Threads nicht von Kern zu Kern springen, das hab ich unter Linux schon öfters beobachtet.

Muss an Ubuntu 11.10 liegen, kann ich hier nicht bestätigen:
attachment.php

(Boinc mit einer WU)
 
Nö, einfache, technische Notwendigkeit.
Außerdem wird der Vliw4 Chip sicherlich gut als "Rohrfrei" für den 28nm Prozess getaugt haben.
das weiß ich auch. aber ich bezweifle, das amd eine 7670 als crossfiremodell zu trinity anbieten würde wenn dieser deutlich weniger leistung hätte!
 
http://news.softpedia.com/news/AMD-...50-Use-Existing-GPU-Architecture-210689.shtml

According to XTReview, AMD took this decision in order to enable the GPUs to work with the company's upcoming Trinity APUs in a Hybrid CrossFireX mode.

ein dezenter hinweis auf die grafikleistung des trinity? *suspect*

Wie Opteron schon sagte - es wird wohl VLIW4 in der iGPU und in der externen GPU benötigt.
Ob da jetzt die Grafikleistung 1 zu 1, 1 zu 2 oder 1 zu 3 sein wird lässt sich noch nicht sagen.
 
Muss an Ubuntu 11.10 liegen, kann ich hier nicht bestätigen:
(Boinc mit einer WU)
Womit hast Du das aufgezeichnet? Ich hab mich per ssh auf dem Bench-Rechner eingeloggt und beobachtet, welche Kerne jeweils hochtakten. Gewandert sind die Threads nur bei neuen Benchmark-Läufen, also wenn die alten beendet und neue Threads gestartet wurden.
 
Womit hast Du das aufgezeichnet? [...]

Mit der Systemüberwachung *suspect*

Das ist der Lastverlauf, danaben habe ich aber je Kern ein Applet zur Überwachung der Prozessortaktstufen. Die konnten das perfekt nachzeichnen, man sieht deutlich, wie sie abwechselnd hoch- und runtertakten.
 
Mit der Systemüberwachung *suspect*
Ah, ok. Nehme an, ein GNOME-Programm, gibt's in KDE aber auch sowas. *guck* stimmt: der Sytemmonitor. An GUI-Progs denke ich bei sowas immer nicht, beim Server-Überwachen nützt mir das ja auch nix, ist also nicht meine Denkschiene. Diverse Applets u.dgl. vermeide ich eigentlich gern beim Benchen, von wegen "reine Werte" ;) Aber ich guck danach mal heut Abend. Danke!
.
EDIT :
.

Ich hab die Encoding-Tests noch mit DDR3-1333 ausgeführt, das geht auch aus der Ferne. GUI-Tools zur System-Überwachung sind dabei natürlich nicht sehr praktikabel ;D Hier die Ergebnisse und die auf den 1866er-Lauf normalisierte Variante: der 1333er lief mit 100%, 100%, 100%, 99%, 99%, 98%, 99% und 99% der 1866er-Speed. Minimal langsamer also oder im Rahmen der Messgenauigkeit gleich schnell.
 
Zuletzt bearbeitet:

Das ist ja sensationell günstig.
Bisher habe ich mich nicht getraut, diese Speicher Frage im CPU Thread zu stellen.

Aber wenn es eh im Zusammenhang mit Llano darum geht: ist es eigentlich besser, bei 1600 MHz Ram 1,5 Volt oder 1,65 Volt zu kaufen?

1,5 V sieht auf dem ersten Blick sparsamer und "kühler" aus.
1,65 V soll angeblich der Standard für diese Geschwindigkeit sein, aber einige benötigen lästige Lüfter Kits.

Und welchen von beiden kann man stabiler übertakten, da sie Reserven bieten?

Und ist "unterstützt Intel Extreme Memory Profile (XMP)" ein Nachteil für ein AMD System?
 
Zuletzt bearbeitet:
Und da sind die Ergebnisse der freien Spiele-Benchmarks, sowie die normalisierte Version!

Gewinn DDR3-1866 vs 1333: 22%, 31%, 6%, 8%, 8%, 13%, 11% und 12%. Schnitt: 14%...

Wow! Ist Llano also ziemlich Bandbreiten-Beschränkt durch die iGPU?

Von daher denke ich, dass AMD dem Trinity eher weniger iGPU spendieren wird, um Diesize zu sparen. Bei VLIW4 erwarte ich max. 320 bzw.160 Shader (wenn nicht gar weniger), da man hoffentlich zudem endlich die Takte der iGPU hoch bekommt, sodass das Ding dann besser performt (hoffentlich!).

Dass AMD eine 7670-GPU in 28nm extra mit VLIW4 für Trinity macht, glaube ich auch nicht. Hier würde es doch reichen, einfach nochmal eine neue kleine 40nm-GPU mit VLIW4 zu basteln, die man zudem optimal an die Crossfire-Anforderungen von Trinity anpassen könnte: also auch nur 320 Shader (das Ganze könnte dann <100mm² in 40nm sein).
 
Wow! Ist Llano also ziemlich Bandbreiten-Beschränkt durch die iGPU?
Du hast es mal wieder (absichtlich? Kann ja schon garnicht anders sein) falsch verstanden! Wie Du an meinen Ausführungen hättest erkennen können, langweilt sich die CPU-Seite bei den meisten Tests, mitunter hat sich kaum ein Kern bemüßigt gesehen, über 800 MHz hinaus hochzutakten. Der limitierende Faktor ist hier die Speicherbandbreite für die iGPU, das ist nun schon seit den ersten Zacate-Benches bekannt. Und eigentlich ist das seit Jahren eine Binsenweisheit für GPUs.

Das was an GPU in den Sandys steckt, ist hingegen offenbar weniger bandbreiten-limitiert, die Dinger schaffen wohl einfach nicht mehr - sonst würde sich der Speichertakt wohl stärker auswirken.
.
EDIT :
.

Onkel_Dithmeier:

Ich hab mal die Holzklase-Methode in Sachen Tasksprung-Test probiert:
Code:
[FONT="Courier New"]~$ burnK7 & for i in {1..100}; do echo $(grep MHz /proc/cpuinfo | awk '{print $4}'); sleep 1; done; killall burnK7
[1] 5202
800.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
2900.000 800.000 800.000 800.000
[1]+  Beendet                 burnK7
[/FONT]

Der Task bleibt am ersten Kern kleben wie festgetackert. Ich habe das so eigentlich schon lange beobachtet, nicht erst mit dieser Ubuntu-Release, sondern schon vor Längerem, mit 2.6.xy-Kerneln, unter Debian etc.
 
Zuletzt bearbeitet:
@nazgul99:

Mehr wollte ich doch garnicht sagen, sondern nur, dass es diese Bandbreitenbegrenzung für die iGPU offenbar recht massiv zuschlägt.

Solange die iGPU dadurch begrenzt ist, macht deren Leistungssteigerung aber wenig Sinn, weil vieles davon verpufft. Da müssten dann erst mal andere Tricks her, um das Prob zu beheben.
 
@BavarianRealist

Und Trotzdem gibt AMD für Trinity 50% mehr FLOPS an. Klar sollte da irgendwie die Bandbreiten ausreichend sein, damits auch beim Kunden ankommt.
 
Status
Für weitere Antworten geschlossen.
Zurück
Oben Unten