News APU13: Kaveri mit 856 GFLOPS laut AMD ab 14. Januar im Laden erhältlich

Dr@ · 12.11.2013

Auf der gerade stattfindenden Entwicklerkonferenz APU13 hat AMD ein paar neue Details bezüglich seiner APU der dritten Generation verraten, der erstmals Unterstützung für die HSA bieten soll. Entsprechend vereint “Kaveri” zwei “Steamroller”-Module, eine GCN-GPU, PCIe‑3.0‑Interface und erstmals einen hUMA-fähigen Speichercontroller auf einem Die. Außerdem bietet “Kaveri” Unterstützung für heterogeneous Queuing (hQ), sodass sich CPU-Kerne und GPU gleichberechtigt Arbeit zuteilen können.
(…)

» Artikel lesen

TNT · 12.11.2013

Na, was ist das denn..AMD nennt einen konkreten Termin aber was genau ist 'initial availability'!?
Doch eher ungewoehnlich...ein gutes Zeichen oder doch nicht!?

Waren nicht mehr GFLOPS angedacht worden!?

TNT

nVoodoo · 12.11.2013

AMD hatte im Februar 2012 noch 1.050 GFlops in Aussicht gestellt.

laut golem.de

Wenn man die CPU Cores jetzt von den 856GFlops abzieht dürfte man so zwischen "R7 240 DDR3" und "R7 250 DDR3" Leistung liegen...? Wobei dann eher Richtung R7 250...

TNT · 12.11.2013

nVoodoo schrieb:
war mal von >1k GFlops die rede......

Genau ..so etwas denke ich auch, dass so etwas durch Netz schwirrte...entweder war das nur ein Geruecht oder AMD's Wunschdenken, dass man aufgrund des bislang vermuteten geringen Takts begraben musste... !?

Doch Ziel schon jetzt verfehlt (was die max. ther. Leistung angeht) ?
Hier mal eine Folie dazu:
http://pics.computerbase.de/3/9/3/8/6/3.png

Wie sind denn die Einschaetzungen zum CPU Part!?
Kann aus diesen Angaben die Leistungsfaehigkeit der CPU Parts sinnvoll schliessen!?

TNT

Locuza · 12.11.2013

Mich verwundert die Namensgebung:
A10-7850K

Dabei hatte man zuvor nur runde Tausender. (Außer der neue Richland 6790)
Wenn es nach dem Llano Schema geht, dann schreit es noch nach einem 7870K Modell später.

TNT · 12.11.2013

Locuza schrieb:
Mich verwundert die Namensgebung:
A10-7850K ....

Erinnert an die APU 3850K - die auch lange die hoechste ihre Art war...aber dann kam noch etwas nach 3870K...
Aber wie AMD auf diese Nummerierung kommt...nun ja, bleibt ein Geheimnis...oder!?

TNT

Locuza · 12.11.2013

Die Taktraten 3,7 Ghz für die CPU und 720 Mhz für die GPU sind ziemlich dürr.
Wenn das die Turbo Taktraten sind, ist ein Richland deutlich höher getaktet, bei der CPU alleine 19%.

Also Bulk haut voll rein oder AMD geht mit der TPD runter oder es gibt wieder sonstige Probleme.

HITCHER · 12.11.2013

verstehe ich auch nicht, weshalb man die Fertigungstechnik schon wechselt, wenn dann 20% weniger Taktfrequenz raus schaut.
Dann hätte man lieber auf 32nm bleiben sollen, und die GPU mit weniger CUs (ca. 256 max) ausstatten, damit die Chipfläche nicht zu groß wird.

Crashtest · 12.11.2013

Nee sind keine Turbo Raten !

Processor 1 ID = 0
Number of cores 4 (max 4)
Number of threads 4 (max 4)
Name AMD K15
Codename Kaveri
Specification AMD Eng Sample: ZD3xxxxxxxxxx_38/34/18/07_1313 (Engineering Sample)
Package Socket FM2+ (906)
CPUID F.0.1
Extended CPUID 15.30
Core Stepping KV-A1
Technology 28 nm
Core Speed 1859.9 MHz
Multiplier x Bus Speed 18.5 x 100.5 MHz
Stock frequency 3800 MHz
Instructions sets MMX (+), SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, SSE4A, x86-64, AMD-V, AES, AVX, XOP, FMA3, FMA4
L1 Data cache 4 x 16 KBytes, 4-way set associative, 64-byte line size
L1 Instruction cache 2 x 96 KBytes, 3-way set associative, 64-byte line size
L2 cache 2 x 2048 KBytes, 16-way set associative, 64-byte line size
FID/VID Control yes
Min FID 10.0x
# of P-States 8
P-State FID 0x16 - VID 0x14 - IDD 18 (19.00x - 1.300 V)
P-State FID 0x15 - VID 0x14 - IDD 24 (18.50x - 1.300 V)
P-State FID 0x14 - VID 0x16 - IDD 20 (18.00x - 1.275 V)
P-State FID 0x12 - VID 0x1E - IDD 17 (17.00x - 1.175 V)
P-State FID 0xF - VID 0x2E - IDD 14 (15.50x - 0.975 V)
P-State FID 0xC - VID 0x3E - IDD 10 (14.00x - 0.775 V)
P-State FID 0x8 - VID 0x4C - IDD 8 (12.00x - 0.600 V)
P-State FID 0x118 - VID 0x60 - IDD 6 (10.00x - 0.350 V)

PStateReg 0x800001AF-0x00002816
PStateReg 0x800001ED-0x00002815
PStateReg 0x800001C3-0x00002C14
PStateReg 0x800001A5-0x00003C12
PStateReg 0x80000187-0x00005C0F
PStateReg 0x80000164-0x00007C0C
PStateReg 0x8000014D-0x00009808
PStateReg 0x8000013C-0x0000C058

Package Type 0x1
Model 00
String 1 0x0
String 2 0x0
Page 0x0
Max non-turbo ratio 19.00x
Max turbo ratio 19.00x
TSC 3418.3 MHz
APERF 3745.9 MHz
MPERF 3382.0 MHz

....
Graphic APIs
-------------------------------------------------------------------------

API ATI I/O
API ADL SDK

Display Adapters
-------------------------------------------------------------------------

Display adapter 0
Name KV SPECTRE LITE DESKTOP 65W/100W (1313)
Memory size 1024 MB
PCI device bus 0 (0x0), device 1 (0x1), function 0 (0x0)
Vendor ID 0x1002 (0x1002)
Model ID 0x1313 (0x0123)
Performance Level 0
Core clock 351.2 MHz
Memory clock 933.0 MHz
Performance Level 1
Core clock 720.0 MHz
Memory clock 933.0 MHz

Win32_VideoController AdapterRAM = 0x40000000 (1073741824)
Win32_VideoController DriverVersion = 13.250.0.0
Win32_VideoController DriverDate = 09/10/2013

und dies war nur der 3.4er Kaveri; Turbo bis 3,8 - GPU@720MHz

isigrim · 12.11.2013

Danke @Crashtest.
Am wichtigsten wird für Kaveri mMn der idle-Verbrauch werden. Mal sehen was da bei Bulk rauskommt. 0.35 v klingt ja schonmal nett.

Wegen der theoretischen Leistung: dank GCN kann man diese deutlich besser nutzen als bei VLIW. Insofern dürfte das schon ein netter Schritt nach vorne sein vor allem bei Compute und das ist ja wichtig.

Pirx · 12.11.2013

Am wichtigsten ist eher die Leistung - CPU, GPU, das die ganzen neuen Features endlich mal von Software in größerem Umfang genutzt werden und der Lastverbrauch. Der Idle-Verbrauch ist jetzt schon nicht schlecht.

Peilo · 12.11.2013

Pirx schrieb:
Am wichtigsten ist eher die Leistung - CPU, GPU, das die ganzen neuen Features endlich mal von Software in größerem Umfang genutzt werden und der Lastverbrauch. Der Idle-Verbrauch ist jetzt schon nicht schlecht.

Gibts zu den ganzen Features aussagen, dass jene nur mit angpasster software laufen werden?
TrueAudio, HSA, geteilter Memory Controller, dynamische Aufgabenverteilung,...
Alees schön und gut, aber wenn dazu neue Software bzw. Patches erforderlich sind, dann wird ein großteil der neuen Möglichkeiten wohl niemals genutzt werden oder erst dann, wenn diese Prozessoren eh zu langsam georden sind.
Wenn das ganze so aussehn würde, das man zum Prozessorkauf ne Treibercd bekommt, installiert und alles läuft, wäre es ja ok, aber daran glauben kann ich nicht *suspect*

mmoses · 12.11.2013

Ich hoffe ja auf einen Zweikerner mit 3Ghz Standardtakt bei 45W

damit wäre ich erstmal zufrieden.
FM2+ in Mini-ITX gibbet ja schon wäääs
Wenn die hQ-Nummer noch ansatzweise hinhaut (OS-unabhängig!) ist das schon eine Hausnummer

Mmoe

Starcraftfreak · 12.11.2013

Crashtest schrieb:
Nee sind keine Turbo Raten !

und dies war nur der 3.4er Kaveri; Turbo bis 3,8 - GPU@720MHz

Woher stammt dieser Dump? 0,35V find ich etwas sehr wenig...

Wenn du die VID nimmst und gemäß der üblichen Formel abziehst, sollte 0,95V herauskommen. Ab Trinity wurde der Schritt zwischen den VIDs halbiert, von 0,0125V auf 0,00625V.

bbott · 12.11.2013

Schein auf einen Llano 2.0 hinaus zulaufen

Crashtest · 12.11.2013

Starcraftfreak schrieb:
Woher stammt dieser Dump? 0,35V find ich etwas sehr wenig...

Wenn du die VID nimmst und gemäß der üblichen Formel abziehst, sollte 0,95V herauskommen. Ab Trinity wurde der Schritt zwischen den VIDs halbiert, von 0,0125V auf 0,00625V.

CPUZ File eines Bekannten von dem auch der Bulldozer und Trinity Dump kam ... CPUZ kann nicht alles richtig auslesen ...

Insb. die beiden letzten PStats sind eher Reserve (Temperatur) weil unter 1,4GHz gehen die idR nicht

Starcraftfreak · 12.11.2013

Crashtest schrieb:
CPUZ File eines Bekannten von dem auch der Bulldozer und Trinity Dump kam ... CPUZ kann nicht alles richtig auslesen ...

Insb. die beiden letzten PStats sind eher Reserve (Temperatur) weil unter 1,4GHz gehen die idR nicht

Das ändert nichts daran, dass die 0,35V falsch sind. Verwendet man die richtige Formel für Trinity/Richland/Kaveri, kommen 0,95V heraus. die anderen Spannungswerte sind auch entsprechend falsch.

Seit Trinity gilt: 1,55 - VID * 0,00625 (während bei Llano und AM3 der Faktor 0,0125 ist)

Crashtest · 12.11.2013

sag dies Frank (CPUZ)

Ge0rgy · 12.11.2013

Wie schön zu sehen dass sich nichts verändert hat.
Wenn neue HW auf den markt kommt und es wagt nicht alles bisher dagewesene in einer Rauchwolke zu zerschroten dann bricht die welt zusammen.
Irgendwie hab ich das gefühl dass heutzutage alle zu sehr von Actionfilmen verwöhnt sind, in dem immer alles und jedes mit einem spektakulären Knall begleitet passieren muss.
Was genau war an AMDs Aussage dass man sich nicht mehr im HighEnd mit Intel prügeln will eigentlich falsch zu verstehen?
Es wird keinen Haswell Killer geben. Weder in Form von Kaveri noch einem seiner direkten Nachfolger.
Aber, oh wunder, es existiert tatsächlich ein Markt abseits der High-End Gamer, für die alles unter 60fps bei ultraHD als unspielbar gilt oder Hardware x nicht in Benchmark Y neue Rekorde aufstellt sodass man dastehen kann und auf die "Gestrigen" mit dem Finger zeigen wir Nelson bei den Simpsons...
Bei der Logik frage ich mich, warum es eigentlich noch Produkte abseits der Highend-Schiene gibt. Egal bei welchem Hersteller. Wenn die keiner kaufen würde, könnten sich die Firmen den Aufwand für Boardentwicklung, Validierung, Spezifikation, Treiber etc. einfach sparen.

Für APU-Verhältnisse ist die Leistung IMHO durchaus ganz ok. In Anbetracht dessen dass Battlefield 4 weder für Kaveri optimiert ist noch sonst irgendwie von den neuen Features gebraucht macht.
Bei den beschriebenen Möglichkeiten und wenn das HSA SDK was taugt, dürfte es nicht allzu lange dauern bis die ersten Libraries und Frameworks nutzen daraus ziehen. Sortieralgorithmen, map-Reduce etc. einfach über HSA abzuwickeln.
Das würde dann bedeuten dass ein Teil der Software grade mal einen Recompile benötigt um davon zu profitieren.
Aber wie üblich werden wieder die ersten maulen wenn nicht sofort ab Start die 400 fache Leistung dabei herauskommt. Was fällt den Entwicklern auch ein.
Schickt sie alle nach Hause, macht die Forschungslabore zu und schaltet das Internet ab. Vielleicht sind die jeweiligen dann zufrieden. Zumindest können wir der NSA dann eine lange Nase drehen.

TOMBOMBADIL · 13.11.2013

Ge0rgy schrieb:
Wie schön zu sehen dass sich nichts verändert hat.
Wenn neue HW auf den markt kommt und es wagt nicht alles bisher dagewesene in einer Rauchwolke zu zerschroten dann bricht die welt zusammen.
Irgendwie hab ich das gefühl dass heutzutage alle zu sehr von Actionfilmen verwöhnt sind, in dem immer alles und jedes mit einem spektakulären Knall begleitet passieren muss.
Was genau war an AMDs Aussage dass man sich nicht mehr im HighEnd mit Intel prügeln will eigentlich falsch zu verstehen?

hmm, laut http://www.heise.de/newsticker/meld...rmance-Ziel-fuer-Kaveri-deutlich-2044473.html
und http://www.golem.de/news/accelerated-processing-unit-kaveri-leistet-856-gflops-1311-102670.html
macht der CPU teil der neuen APU 118,4 GFlops bei 3800 MHz
der A10-6800K CPU teil macht 131 GFlops bei 4100 MHz.
d.h. (wenn ich mich nicht beim rechnen ganz dumm angestellt habe) das es nahezu keinen zuwachs auf der IPC seite gibt.
Ich hab ja kein Wunder erwartet, aber das ist dann doch etwas entäuschend, wenn der gesamte APU performance gewinn allein vom wechsel auf die neuere GPU architektur kommt.

Bei Anwendungen die keine GPU brauchen bzw. den GPU teil nicht nutzen können bedeutet das da dann nicht sogar einen performance verlust von fast 10% verglichen zum vorgänger modell??

nVoodoo · 13.11.2013

Da SR ja für Desktop-CPUs gestrichen worden ist wird der denke ich ma nur auf Verbrauch und Yield getrimmt worden sein wobei wir ja nicht wissen wie hoch der Verbrauch ist... Wenn der CPU Teil zwar nicht schneller geworden ist aber 10-20% sparsamer z.B. wäre das ja auch schonma was

genervt · 13.11.2013

Ganz ruhig Jungs. Hatten wir nicht lange und breit diskutiert, dass Bulldozer ein Auslastungsproblem hat, sprich die theoretische Performance nicht auf die Straße bringt? Genau da setzen die geänderten Dekoder doch an - weiter weit weg vom Intel High-End, aber das war nicht das Ziel!
Wir wissen auch nicht, ob Kaveri nun in der 2012 angedachten Konfiguration (#GCN ALUs) kommt oder noch beschnitten wurde.

Wo liegt eigentlich Intel bei der theoretischen Rechenleistung?

LoRDxRaVeN · 13.11.2013

TOMBOMBADIL schrieb:
Bei Anwendungen die keine GPU brauchen bzw. den GPU teil nicht nutzen können bedeutet das da dann nicht sogar einen performance verlust von fast 10% verglichen zum vorgänger modell??

Nein. Wie vermutlich auch in diesem Thread schon gesagt wurde, handelt es sich ja hier nur um einen theoretischen Wert, der nicht unbedingt etwas über die IPC aussagen muss. Die Anzahl der parallel ausführbaren Instruktionen (pro Takt) ist ja gleich geblieben. Also ist es völlig klar, dass die FLOPS bei niedrigerem Takt ebenfalls niedriger sind.

Kaveri: 3,7GHz x 4 Kerne x 8 = 118 GFLOPS
Richland: 4,1GHz x 4 Kerne x 8 = 131 GFLOPS

Wie du siehst, ist hier die einzige Variable der Takt. Wie die Performance aber bei realen Anwendungen aussieht, ist wieder ein ganz anderes Thema. Bei dieser Rechnung gibt es überhaupt keine "IPC-Unterschiede" (nicht "nahezu keine", so wie du schreibst). Es wird nämlich nicht berücksichtigt, wie gut die Recheneinheiten ausgelastet werden können (wo Kaveri nennenswerte Vorteile haben sollte) oder es wird auch nicht berücksichtigt ob der auszuführende Code überhaupt für die vorhandenen Einheiten passend ist usw.
Die FLOPS sagen eigentlich nur dann relativ zuverlässig etwas aus, wenn man innerhalb der völlig identen Architektur vergleicht.

LG

Kaveri · 13.11.2013

LoRDxRaVeN schrieb:
Kaveri: 3,7GHz x 4 Kerne x 8 = 118 GFLOPS
Richland: 4,1GHz x 4 Kerne x 8 = 131 GFLOPS

Darf ich fragen, wie die "x 8" zustande kommen?

Laut wikipedia sind das ja die theoretischen "CPU-Instruktionen pro Takt". Nun hatte Agner Fog aber festgestellt, dass Bulldozers Decoder alternierend nur jeweils 4 Instruktionen absetzen kann. Das sieht jetzt mit Steamroller natürlich besser aus, weshalb ich denke, dass man diese Zahlen nicht unreflektiert vergleichen sollte.

mfg

Dr@ · 13.11.2013

Pro Kern eine 128 Bit FMAC -> 4 Floats (Vektor mit vier 32 Bit Werten) * 2 weil eine Addition und eine Multiplikation in einem Takt ausgeführt werden

News APU13: Kaveri mit 856 GFLOPS laut AMD ab 14. Januar im Laden erhältlich

Grand Admiral Special

Grand Admiral Special

Vice Admiral Special

Grand Admiral Special

Commodore Special

Grand Admiral Special

Commodore Special

Vice Admiral Special

Redaktion☆☆☆☆☆☆

Grand Admiral Special

Admiral Special

Vice Admiral Special

Admiral Special

Vice Admiral Special

Grand Admiral Special

Redaktion☆☆☆☆☆☆

Vice Admiral Special

Redaktion☆☆☆☆☆☆

Grand Admiral Special

Lt. Commander

Vice Admiral Special

Admiral Special

Grand Admiral Special

Cadet

Grand Admiral Special

Ähnliche Themen

Redaktion
☆☆☆☆☆☆

Redaktion
☆☆☆☆☆☆

Redaktion
☆☆☆☆☆☆