Kaveri - der Trinity Nachfolger

Dann warte mal bis Spiele wie Star Citizen mit Double Precision Physik und Geometrie rauskommen.
Das ist kein Argument. Physik kann über die GPU beschleunigt werden. Soweit ich weiss unterstützt SC auch GPU-Physik. Momentan allerdings wohl nur mittels PhysX. Mal abwarten, was sich da bis zum Release noch tut.

Und wer sagt denn, dass Spiele in Zukunft doppelte Genauigkeit für Geometrieberechnungen nutzen? Das ergibt eigentlich keinen Sinn. Einfache Genauigkeit reicht normalerweise für Spiele vollkommen aus. Und wer verzichtet schon freiwillig auf theoretisch die Hälfte der FPS ohne sichtbare optische Vorzüge? In der Praxis können da übrigens noch deutlich weniger FPS übrig bleiben, weil Hersteller ihre Desktopkarten bezüglich doppelter Genauigkeit gerne mal ordetlich beschneiden. Wenn du also schon so argumentierst, solltest du dir vielleicht Gedanken über eine teure Workstation Grafikkarte anstatt einer Intel CPU machen. *lol*
 
Star Citizen wird auf jeden Fall eine 64bit Floatbasierte Geometrie haben.
Das hat aber weniger mit Genauigkeit zu tun, sondern eher damit, dass sie einen extrem grossen Raum darstellen müssen und das in einem 32bit-System nicht so möglich ist, wie der Entwickler sich das vorstellt.

Das ein Großteil der Spiele das in Zukunft ebenfalls so machen wird bezweifle ich aber.
Ich denke, dass ist Star Citizen-spezifisch.
 
Das muß man erstmal abwarten, aber allgemein sind die Spiele, die gleichmäßig gut viele Kerne auslasten, ja gar nicht das Problem von AMD, sondern die anderen, die ungleichmäßige Verteilugn haben, also einen schwergewichtigen Haupthread und einige leichtere Threads nebenher. Was AMD bei den meisten Spielen bremst, sind nicht die Kerne 2 bis 8 oder die nicht vorhandene 3. und 4. FPU, sondern immer nur der erste Kern. Wetten, daß ein FX, der auf dem ersten Kern 6 GHz hätte, auf dem zweiten 4 GHz und auf dem Rest nur 2 GHz viel schneller wäre als ein FX mit 5 GHz auf allen? Die reinen theoretischen GFLOPS kann man sich bei Spielen doch regelmäßig sonstwohin schmieren.

Da man z.B. durch Übertaktung der Northbridge einiges an Performance gewinnen kann, ist offenbar da einer der Schwachpunkte. Gibt aber sicher noch einige andere, größere Baustellen. Daß es einfach nur die gesharte FPU ist, glaube ich irgendwie nicht. In Tests, wo man jeweils nur einen Thread auf ein Modul gegeben hat, also praktisch einen 4-Kerner mit 4 FPUs hatte (http://www.planet3dnow.de/cms/366-vishera-reloaded/subpage-performance-mit-vier-threads/), waren Spiele auch nicht auf einmal total viel schneller. Ein paar Prozentchen, aber das deutet nicht auf eine wesentlich zu schwach ausgelegte FPU hin, wenn eine Verdoppelung der pro Thread verfügbaren FPU-Power nicht zu einer sagen wir mal wenigstens 70%igen Leistungssteigerung führt. Man kann hier statt FPU auch gleich alle gesharten Teile (Frontend und Backend ja auch) anbringen, die Modulbauweise ist eben nicht das Problem.

Kommt auch aufs Spiel an würd ich sagen.
BF3:
FX @x8 4,2GHz 429% Auslastung 52,5FPS/GPU 73% Auslastung an einer bestimmten Stelle.
FX @x4 4,6GHz 346% Auslastung 51,0FPS/GPU 78% Auslastung an der gleichen Stelle.
Aber auch so fühlt er sich als x4 mit 4 FPUs zum teil besser an in Spielen,vermutlich weil er dann von den Spielen besser erkannt wird und verwendet wird.
 
@Casi030
Das wird bestimmt auch am L3 bzw. am L2 Cache liegen, es sind ja beide shared (geteilt)
FX-8 = 1MB L2 + 1MB L3 pro Kern.
FX-4 = 2MB L2 + 2MB L3 pro Kern. (Wenn ein Kern pro Modul abgeschalten wird)

Du hast bei BF3 nur ~50FPS, lol da sieht man mal was die GPU ausmacht! Kann mich nicht erinnern, wann ich da unter 60FPS Minimum hatte.
Ah doch im Energiesparmodus waren es nur 40FPS rum! *buck*
 
Zuletzt bearbeitet:
Könnt natürlich auch sein.
Habe halt auch nur ne 7950 mit (beim Test) 1000/1500MHz Takt.Die schafft die meisten Tittel nicht auf Ultra/+Max AA und Co.;)
 
@Casi030
Die HD 7950 ist schon kräftig, ein Ackergaul eben! ;D
BF3 hat damals schon mit 3x HD 7970 skaliert, das waren so 100FPS im Schnitt.
Hier mal von Anfang des Jahre mit nur 2x HD 7970:



Alles mit Standard Takt (HPC Mode) und die Windows Energieoptionen auf Ausbalanciert. Max Peak an der Steckdose: 550W
 
Ja,weil im Modul ja ein Kern abgeschaltet wird bei UNS.
Im Laden bekommst natürlich nur die hälfte beim x4,ist ja logisch.
 
Die Eliebooks sind anscheinend in der Weise ausdifferenziert, dass die SSD Modelle die A10 Pro-7350B APU bekommen.
Die Modelle mit HDD gibt es wohl eher mit AMD A6 PRO-7050B APU. Hoffentlich nicht ausschließlich sondern wahlweise...
Jedenfalls ist da im Preisvergleich noch eine Dikrepanz zwischen dem, was dort angezeigt wird, und dem, was dann in den jeweiligen Shops für Spezifikationen stehen.
MfG
 
...
FX-4 = 2MB L2 + 2MB L3 pro Kern. (Wenn ein Kern pro Modul abgeschalten wird) ...
Und wenn nicht, sondern wenn komplette Module abgeschaltet werden, dann hast du:
1MB L2 + 2MB L3 pro Kern.
Es gibt übrigens auch FX-4 mit nur 4MB L3. Dann hast du:
1MB (oder 2MB L2) + 1MB L3 pro Kern.
Wobei das beim L3 problematisch ist, da er ja shared ist. Da kann es sein, dass 1 Kern alle 4 bzw. 8 MB hat.
 
Das wird jetzt teilweise aus aus dem Kontext gerissen. Es ging darum, dass Bomby meinte, dass die nur zwei FPUs (bei einem Zweimoduler) zum Problem werden. Als Vergleich wurde eben ein FX-8000 @FX-4000, also 4 Module mit 4 FPUs und jeweils einem aktiven und einem deaktivierten Integer-Kern angeführt. So kommt man eben auf die Werte von Windhund:

FX-8 = 1MB L2 + 1MB L3 pro Kern.
FX-4 = 2MB L2 + 2MB L3 pro Kern. (Wenn ein Kern pro Modul abgeschalten wird)

Das die im Verkauf befindlichen FX-4000 anders aufgebaut sind, ist glaube ich jeden hier bewusst.

LG
 
Die Eliebooks sind anscheinend in der Weise ausdifferenziert, dass die SSD Modelle die A10 Pro-7350B APU bekommen.
Die Modelle mit HDD gibt es wohl eher mit AMD A6 PRO-7050B APU. Hoffentlich nicht ausschließlich sondern wahlweise...
Jedenfalls ist da im Preisvergleich noch eine Dikrepanz zwischen dem, was dort angezeigt wird, und dem, was dann in den jeweiligen Shops für Spezifikationen stehen.
MfG

Woerns,
das wird wohl eher Wahlweise sein. Schaut man sich das Modell HP EliteBook 725 G2 (J0H65AW) an, so werkelt dort eineAMD Quad-Core Pro A10-7350B und eine 500GB HDD drinen.

Das gleiche beim 14-Zoll Modell HP EliteBook 745 G2 (J0X31AW) - aber auch beim 15-Zoll Modell HP EliteBook 755 G2 (J0X38AW).

Gruß Lehmann
 
@NOFX
Danke, ich habe es oben editiert! :)
Und wenn nicht, sondern wenn komplette Module abgeschaltet werden, dann hast du:
1MB L2 + 2MB L3 pro Kern.
Es gibt übrigens auch FX-4 mit nur 4MB L3. Dann hast du:
1MB (oder 2MB L2) + 1MB L3 pro Kern.
Wobei das beim L3 problematisch ist, da er ja shared ist. Da kann es sein, dass 1 Kern alle 4 bzw. 8 MB hat.
Was mir da noch eingefallen ist, wenn der Turbo greift, wirkt ja CC6 (Kerne abschalten) somit hat der FX-8 dann nicht nur 4x4.2GHz sondern auch 2MB L2 & L3 pro Kern.

So genung OT, back to Kaveri.
Ich bin mal gespannt was außer "GrassFX" noch so kommt: http://www.tweakpc.de/hardware/tests/cpu/amd_a10-7800/s05.php
 
Sonntag bis Dienstag auf der Hot Chips u. A.
Applying AMD’s “Kaveri” APU for Heterogeneous Computing und
The AMD Opteron “Seattle”: A 64b ARM Dense Server Processor

http://www.hotchips.org/
 
Noch einen Nachtrag zu den Physikeffekten

GrassFX-640x262.jpg


 
@LoRDxRaVeN
Wieso müssen die FX-4000er anders aufgebaut sein als FX-8000er mit einem deaktivierten Kern pro Modul? Bei den Phenoms gab es schließlich auch deaktivierte Kerne, sodass Vierkerner als Dreikerner verkauft wurden uswusf. Könnte bei einigen FX-4000ern doch auch der Fall sein, oder nicht?

@WindHund
Kann CC6 nicht wirksam werden, wenn der Turbo im BIOS deaktiviert ist?
 
@LoRDxRaVeN
Wieso müssen die FX-4000er anders aufgebaut sein als FX-8000er mit einem deaktivierten Kern pro Modul?

Sie müssen nicht, aber sie sind es ganz einfach :) Zwei Module sind deaktiviert und nicht je ein Int-Kern pro Modul.

LG
 
Ist das nicht dumm? Ergäbe sich nicht eine geringere Hitzeentwicklung, wären die Kerne verteilt? Wäre es nicht besser bzgl. der Cachemenge und -anbindung? Wäre es nicht besser wegen der FPU-Anzahl? Wäre es denn viel schwieriger?
 
Natürlich hätte es auch Vorteile, aber man will ja auch die 4000er Reihe von der 8000er abgrenzen. Schwieriger wäre es vermutlich kaum bis nicht, doch das ist sicher zu großen Teilen eine produktpolitische Entscheidung. Aber es müssen so eben auch nur zwei Module voll funktionsfähig sein, was für die Ausbeute von Vorteil ist. Anders müsste man tendenziell voll funktionsfähige Viermoduler verkrüppeln, da es nicht oft vorkommen wird, dass nur jeweils ein Int-Kern defekt ist :)

LG
 
Es wäre auch ein PR-Desaster, wenn AMD gegen sein eigenes Modulkonzept vorgehen würde. Womöglich würden die Module mit nur einem aktiven Int-Kern sogar eine konkurrenzfähigere Singlethread-Leistung erzielen. :o
Bobo hatte sowas ja mal als alternativen Serverchip vorgeschlagen.
MfG
 
OBrian meint, die nicht mehr geteilte FPU bei einem deaktivierten Kern pro Modoul helfe zumindest bei Spielen nicht. Ich glaube daher nicht, dass die ST-Leistung weitaus oder auch nur spürbar besser wäre.
Für ein PR-Desaster hielte ich es nicht, da man sagen könnte: "Ohne Modulbauweise wäre uns der Vertrieb solcherart konfigurierter CPUs nicht möglich, ohne einen enormen Aufwand hervorzurufen. CMT rules." (Wäre eine feine Pressemeldung, was?)
 
Sie müssen nicht, aber sie sind es ganz einfach :) Zwei Module sind deaktiviert und nicht je ein Int-Kern pro Modul.

LG
*great*
Ist das nicht dumm? Ergäbe sich nicht eine geringere Hitzeentwicklung, wären die Kerne verteilt? Wäre es nicht besser bzgl. der Cachemenge und -anbindung? Wäre es nicht besser wegen der FPU-Anzahl? Wäre es denn viel schwieriger?
Das ganze Modul Design ist auf viel Fläche ausgelegt, damit die Temperaturabgabe so gut wie möglich verteilt wird. ;)
Die Frage ist immer wie vereinheitlicht man das auf Software ebene, da sind Module einfacher Handzuhaben, als reine Integer Booster.
Bezüglich CC6 das kannst im Ressourcen Monitor nachschauen: http://abload.de/img/resourcenmonitor_core9iu4z.jpg
"Geparkt" = Kern aus.
 
Zuletzt bearbeitet:
Es gibts durchaus mobile APUs, bei denen einzelne INT-Kerne statt Modulen deaktiviert sind.
 
OBrian meint, die nicht mehr geteilte FPU bei einem deaktivierten Kern pro Modoul helfe zumindest bei Spielen nicht. Ich glaube daher nicht, dass die ST-Leistung weitaus oder auch nur spürbar besser wäre.
Für ein PR-Desaster hielte ich es nicht, da man sagen könnte: "Ohne Modulbauweise wäre uns der Vertrieb solcherart konfigurierter CPUs nicht möglich, ohne einen enormen Aufwand hervorzurufen. CMT rules." (Wäre eine feine Pressemeldung, was?)

Doch das ist so wenn man 4 Module/4Threads vs 2Module/4Threads gegeneinander antreten lässt.
4Module/4Threads mit 3,2GHz sind immer noch schneller als 2Module/4Threads mit 3,4GHz.
 
Zurück
Oben Unten