News APU13: Kaveri mit 856 GFLOPS laut AMD ab 14. Januar im Laden erhältlich

Dr@

Grand Admiral Special
★ Themenstarter ★
Mitglied seit
19.05.2009
Beiträge
12.791
Renomée
4.065
Standort
Baden-Württemberg
  • BOINC Pentathlon 2011
  • BOINC Pentathlon 2012
Auf der gerade stattfindenden Entwicklerkonferenz APU13 hat AMD ein paar neue Details bezüglich seiner APU der dritten Generation verraten, der erstmals Unterstützung für die HSA bieten soll. Entsprechend vereint “Kaveri” zwei “Steamroller”-Module, eine GCN-GPU, PCIe‑3.0‑Interface und erstmals einen hUMA-fähigen Speichercontroller auf einem Die. Außerdem bietet “Kaveri” Unterstützung für heterogeneous Queuing (hQ), sodass sich CPU-Kerne und GPU gleichberechtigt Arbeit zuteilen können.
(…)

» Artikel lesen
 

TNT

Grand Admiral Special
Mitglied seit
27.07.2008
Beiträge
2.269
Renomée
174
Standort
Pott
Na, was ist das denn..AMD nennt einen konkreten Termin aber was genau ist 'initial availability'!?
Doch eher ungewoehnlich...ein gutes Zeichen oder doch nicht!?

Waren nicht mehr GFLOPS angedacht worden!?

TNT
 
Zuletzt bearbeitet:

nVoodoo

Vice Admiral Special
Mitglied seit
16.03.2007
Beiträge
531
Renomée
1
Standort
Nördliches Emsland
  • Spinhenge ESL
  • BOINC Pentathlon 2013
  • BOINC Pentathlon 2014
  • BOINC Pentathlon 2015
  • BOINC Pentathlon 2016
  • BOINC Pentathlon 2017
AMD hatte im Februar 2012 noch 1.050 GFlops in Aussicht gestellt.
laut golem.de

Wenn man die CPU Cores jetzt von den 856GFlops abzieht dürfte man so zwischen "R7 240 DDR3" und "R7 250 DDR3" Leistung liegen...? Wobei dann eher Richtung R7 250...
 
Zuletzt bearbeitet:

TNT

Grand Admiral Special
Mitglied seit
27.07.2008
Beiträge
2.269
Renomée
174
Standort
Pott
war mal von >1k GFlops die rede......

Genau ..so etwas denke ich auch, dass so etwas durch Netz schwirrte...entweder war das nur ein Geruecht oder AMD's Wunschdenken, dass man aufgrund des bislang vermuteten geringen Takts begraben musste... !?

Doch Ziel schon jetzt verfehlt (was die max. ther. Leistung angeht) ?
Hier mal eine Folie dazu:
http://pics.computerbase.de/3/9/3/8/6/3.png

Wie sind denn die Einschaetzungen zum CPU Part!?
Kann aus diesen Angaben die Leistungsfaehigkeit der CPU Parts sinnvoll schliessen!?

TNT
 
Zuletzt bearbeitet:

Locuza

Commodore Special
Mitglied seit
03.03.2011
Beiträge
351
Renomée
3
Mich verwundert die Namensgebung:
A10-7850K

Dabei hatte man zuvor nur runde Tausender. (Außer der neue Richland 6790)
Wenn es nach dem Llano Schema geht, dann schreit es noch nach einem 7870K Modell später.
 

TNT

Grand Admiral Special
Mitglied seit
27.07.2008
Beiträge
2.269
Renomée
174
Standort
Pott
Mich verwundert die Namensgebung:
A10-7850K ....

Erinnert an die APU 3850K - die auch lange die hoechste ihre Art war...aber dann kam noch etwas nach 3870K...
Aber wie AMD auf diese Nummerierung kommt...nun ja, bleibt ein Geheimnis...oder!?

TNT
 

Locuza

Commodore Special
Mitglied seit
03.03.2011
Beiträge
351
Renomée
3
Die Taktraten 3,7 Ghz für die CPU und 720 Mhz für die GPU sind ziemlich dürr.
Wenn das die Turbo Taktraten sind, ist ein Richland deutlich höher getaktet, bei der CPU alleine 19%.

Also Bulk haut voll rein oder AMD geht mit der TPD runter oder es gibt wieder sonstige Probleme.
 

HITCHER

Vice Admiral Special
Mitglied seit
15.06.2007
Beiträge
586
Renomée
11
verstehe ich auch nicht, weshalb man die Fertigungstechnik schon wechselt, wenn dann 20% weniger Taktfrequenz raus schaut.
Dann hätte man lieber auf 32nm bleiben sollen, und die GPU mit weniger CUs (ca. 256 max) ausstatten, damit die Chipfläche nicht zu groß wird.
 

Crashtest

Redaktion
☆☆☆☆☆☆
Mitglied seit
11.11.2008
Beiträge
8.925
Renomée
1.216
Standort
Leipzig
  • Docking@Home
  • BOINC Pentathlon 2011
  • BOINC Pentathlon 2012
  • BOINC Pentathlon 2013
  • BOINC Pentathlon 2014
  • BOINC Pentathlon 2015
  • BOINC Pentathlon 2016
  • BOINC Pentathlon 2017
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2019
  • BOINC Pentathlon 2020
  • THOR Challenge 2020
  • BOINC Pentathlon 2021
Nee sind keine Turbo Raten !


Processor 1 ID = 0
Number of cores 4 (max 4)
Number of threads 4 (max 4)
Name AMD K15
Codename Kaveri
Specification AMD Eng Sample: ZD3xxxxxxxxxx_38/34/18/07_1313 (Engineering Sample)
Package Socket FM2+ (906)
CPUID F.0.1
Extended CPUID 15.30
Core Stepping KV-A1
Technology 28 nm
Core Speed 1859.9 MHz
Multiplier x Bus Speed 18.5 x 100.5 MHz
Stock frequency 3800 MHz
Instructions sets MMX (+), SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, SSE4A, x86-64, AMD-V, AES, AVX, XOP, FMA3, FMA4
L1 Data cache 4 x 16 KBytes, 4-way set associative, 64-byte line size
L1 Instruction cache 2 x 96 KBytes, 3-way set associative, 64-byte line size
L2 cache 2 x 2048 KBytes, 16-way set associative, 64-byte line size
FID/VID Control yes
Min FID 10.0x
# of P-States 8
P-State FID 0x16 - VID 0x14 - IDD 18 (19.00x - 1.300 V)
P-State FID 0x15 - VID 0x14 - IDD 24 (18.50x - 1.300 V)
P-State FID 0x14 - VID 0x16 - IDD 20 (18.00x - 1.275 V)
P-State FID 0x12 - VID 0x1E - IDD 17 (17.00x - 1.175 V)
P-State FID 0xF - VID 0x2E - IDD 14 (15.50x - 0.975 V)
P-State FID 0xC - VID 0x3E - IDD 10 (14.00x - 0.775 V)
P-State FID 0x8 - VID 0x4C - IDD 8 (12.00x - 0.600 V)
P-State FID 0x118 - VID 0x60 - IDD 6 (10.00x - 0.350 V)

PStateReg 0x800001AF-0x00002816
PStateReg 0x800001ED-0x00002815
PStateReg 0x800001C3-0x00002C14
PStateReg 0x800001A5-0x00003C12
PStateReg 0x80000187-0x00005C0F
PStateReg 0x80000164-0x00007C0C
PStateReg 0x8000014D-0x00009808
PStateReg 0x8000013C-0x0000C058

Package Type 0x1
Model 00
String 1 0x0
String 2 0x0
Page 0x0
Max non-turbo ratio 19.00x
Max turbo ratio 19.00x
TSC 3418.3 MHz
APERF 3745.9 MHz
MPERF 3382.0 MHz

....
Graphic APIs
-------------------------------------------------------------------------

API ATI I/O
API ADL SDK

Display Adapters
-------------------------------------------------------------------------

Display adapter 0
Name KV SPECTRE LITE DESKTOP 65W/100W (1313)
Memory size 1024 MB
PCI device bus 0 (0x0), device 1 (0x1), function 0 (0x0)
Vendor ID 0x1002 (0x1002)
Model ID 0x1313 (0x0123)
Performance Level 0
Core clock 351.2 MHz
Memory clock 933.0 MHz
Performance Level 1
Core clock 720.0 MHz
Memory clock 933.0 MHz

Win32_VideoController AdapterRAM = 0x40000000 (1073741824)
Win32_VideoController DriverVersion = 13.250.0.0
Win32_VideoController DriverDate = 09/10/2013

und dies war nur der 3.4er Kaveri; Turbo bis 3,8 - GPU@720MHz
 

isigrim

Grand Admiral Special
Mitglied seit
26.08.2008
Beiträge
2.139
Renomée
84
Danke @Crashtest.
Am wichtigsten wird für Kaveri mMn der idle-Verbrauch werden. Mal sehen was da bei Bulk rauskommt. 0.35 v klingt ja schonmal nett.

Wegen der theoretischen Leistung: dank GCN kann man diese deutlich besser nutzen als bei VLIW. Insofern dürfte das schon ein netter Schritt nach vorne sein vor allem bei Compute und das ist ja wichtig.
 

Pirx

Admiral Special
Mitglied seit
11.11.2001
Beiträge
1.233
Renomée
7
Standort
Mädels auf Bäumen wachsen
Am wichtigsten ist eher die Leistung - CPU, GPU, das die ganzen neuen Features endlich mal von Software in größerem Umfang genutzt werden und der Lastverbrauch. Der Idle-Verbrauch ist jetzt schon nicht schlecht.
 

Peilo

Vice Admiral Special
Mitglied seit
05.11.2004
Beiträge
574
Renomée
1
Standort
Kleve
Am wichtigsten ist eher die Leistung - CPU, GPU, das die ganzen neuen Features endlich mal von Software in größerem Umfang genutzt werden und der Lastverbrauch. Der Idle-Verbrauch ist jetzt schon nicht schlecht.


Gibts zu den ganzen Features aussagen, dass jene nur mit angpasster software laufen werden?
TrueAudio, HSA, geteilter Memory Controller, dynamische Aufgabenverteilung,...
Alees schön und gut, aber wenn dazu neue Software bzw. Patches erforderlich sind, dann wird ein großteil der neuen Möglichkeiten wohl niemals genutzt werden oder erst dann, wenn diese Prozessoren eh zu langsam georden sind.
Wenn das ganze so aussehn würde, das man zum Prozessorkauf ne Treibercd bekommt, installiert und alles läuft, wäre es ja ok, aber daran glauben kann ich nicht*suspect*
 

mmoses

Admiral Special
Mitglied seit
20.10.2006
Beiträge
1.874
Renomée
42
Standort
Bembeltown
Ich hoffe ja auf einen Zweikerner mit 3Ghz Standardtakt bei 45W ;D damit wäre ich erstmal zufrieden.
FM2+ in Mini-ITX gibbet ja schon wäääs
Wenn die hQ-Nummer noch ansatzweise hinhaut (OS-unabhängig!) ist das schon eine Hausnummer

Mmoe
 

Starcraftfreak

Vice Admiral Special
Mitglied seit
02.04.2004
Beiträge
851
Renomée
7
Nee sind keine Turbo Raten !

und dies war nur der 3.4er Kaveri; Turbo bis 3,8 - GPU@720MHz
Woher stammt dieser Dump? 0,35V find ich etwas sehr wenig...

Wenn du die VID nimmst und gemäß der üblichen Formel abziehst, sollte 0,95V herauskommen. Ab Trinity wurde der Schritt zwischen den VIDs halbiert, von 0,0125V auf 0,00625V.
 

bbott

Grand Admiral Special
Mitglied seit
11.11.2001
Beiträge
4.370
Renomée
60
Schein auf einen Llano 2.0 hinaus zulaufen :-(
 

Crashtest

Redaktion
☆☆☆☆☆☆
Mitglied seit
11.11.2008
Beiträge
8.925
Renomée
1.216
Standort
Leipzig
  • Docking@Home
  • BOINC Pentathlon 2011
  • BOINC Pentathlon 2012
  • BOINC Pentathlon 2013
  • BOINC Pentathlon 2014
  • BOINC Pentathlon 2015
  • BOINC Pentathlon 2016
  • BOINC Pentathlon 2017
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2019
  • BOINC Pentathlon 2020
  • THOR Challenge 2020
  • BOINC Pentathlon 2021
Woher stammt dieser Dump? 0,35V find ich etwas sehr wenig...

Wenn du die VID nimmst und gemäß der üblichen Formel abziehst, sollte 0,95V herauskommen. Ab Trinity wurde der Schritt zwischen den VIDs halbiert, von 0,0125V auf 0,00625V.

CPUZ File eines Bekannten von dem auch der Bulldozer und Trinity Dump kam ... CPUZ kann nicht alles richtig auslesen ...

Insb. die beiden letzten PStats sind eher Reserve (Temperatur) weil unter 1,4GHz gehen die idR nicht
 
Zuletzt bearbeitet:

Starcraftfreak

Vice Admiral Special
Mitglied seit
02.04.2004
Beiträge
851
Renomée
7
CPUZ File eines Bekannten von dem auch der Bulldozer und Trinity Dump kam ... CPUZ kann nicht alles richtig auslesen ...

Insb. die beiden letzten PStats sind eher Reserve (Temperatur) weil unter 1,4GHz gehen die idR nicht
Das ändert nichts daran, dass die 0,35V falsch sind. Verwendet man die richtige Formel für Trinity/Richland/Kaveri, kommen 0,95V heraus. die anderen Spannungswerte sind auch entsprechend falsch.

Seit Trinity gilt: 1,55 - VID * 0,00625 (während bei Llano und AM3 der Faktor 0,0125 ist)
 

Crashtest

Redaktion
☆☆☆☆☆☆
Mitglied seit
11.11.2008
Beiträge
8.925
Renomée
1.216
Standort
Leipzig
  • Docking@Home
  • BOINC Pentathlon 2011
  • BOINC Pentathlon 2012
  • BOINC Pentathlon 2013
  • BOINC Pentathlon 2014
  • BOINC Pentathlon 2015
  • BOINC Pentathlon 2016
  • BOINC Pentathlon 2017
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2019
  • BOINC Pentathlon 2020
  • THOR Challenge 2020
  • BOINC Pentathlon 2021
sag dies Frank (CPUZ) :P
 

Ge0rgy

Grand Admiral Special
Mitglied seit
14.07.2006
Beiträge
4.322
Renomée
82
Wie schön zu sehen dass sich nichts verändert hat.
Wenn neue HW auf den markt kommt und es wagt nicht alles bisher dagewesene in einer Rauchwolke zu zerschroten dann bricht die welt zusammen.
Irgendwie hab ich das gefühl dass heutzutage alle zu sehr von Actionfilmen verwöhnt sind, in dem immer alles und jedes mit einem spektakulären Knall begleitet passieren muss.
Was genau war an AMDs Aussage dass man sich nicht mehr im HighEnd mit Intel prügeln will eigentlich falsch zu verstehen?
Es wird keinen Haswell Killer geben. Weder in Form von Kaveri noch einem seiner direkten Nachfolger.
Aber, oh wunder, es existiert tatsächlich ein Markt abseits der High-End Gamer, für die alles unter 60fps bei ultraHD als unspielbar gilt oder Hardware x nicht in Benchmark Y neue Rekorde aufstellt sodass man dastehen kann und auf die "Gestrigen" mit dem Finger zeigen wir Nelson bei den Simpsons...
Bei der Logik frage ich mich, warum es eigentlich noch Produkte abseits der Highend-Schiene gibt. Egal bei welchem Hersteller. Wenn die keiner kaufen würde, könnten sich die Firmen den Aufwand für Boardentwicklung, Validierung, Spezifikation, Treiber etc. einfach sparen.

Für APU-Verhältnisse ist die Leistung IMHO durchaus ganz ok. In Anbetracht dessen dass Battlefield 4 weder für Kaveri optimiert ist noch sonst irgendwie von den neuen Features gebraucht macht.
Bei den beschriebenen Möglichkeiten und wenn das HSA SDK was taugt, dürfte es nicht allzu lange dauern bis die ersten Libraries und Frameworks nutzen daraus ziehen. Sortieralgorithmen, map-Reduce etc. einfach über HSA abzuwickeln.
Das würde dann bedeuten dass ein Teil der Software grade mal einen Recompile benötigt um davon zu profitieren.
Aber wie üblich werden wieder die ersten maulen wenn nicht sofort ab Start die 400 fache Leistung dabei herauskommt. Was fällt den Entwicklern auch ein.
Schickt sie alle nach Hause, macht die Forschungslabore zu und schaltet das Internet ab. Vielleicht sind die jeweiligen dann zufrieden. Zumindest können wir der NSA dann eine lange Nase drehen. :]
 

TOMBOMBADIL

Lt. Commander
Mitglied seit
28.04.2008
Beiträge
130
Renomée
5
Standort
Kopenhagen, Dänemark
Wie schön zu sehen dass sich nichts verändert hat.
Wenn neue HW auf den markt kommt und es wagt nicht alles bisher dagewesene in einer Rauchwolke zu zerschroten dann bricht die welt zusammen.
Irgendwie hab ich das gefühl dass heutzutage alle zu sehr von Actionfilmen verwöhnt sind, in dem immer alles und jedes mit einem spektakulären Knall begleitet passieren muss.
Was genau war an AMDs Aussage dass man sich nicht mehr im HighEnd mit Intel prügeln will eigentlich falsch zu verstehen?

hmm, laut http://www.heise.de/newsticker/meld...rmance-Ziel-fuer-Kaveri-deutlich-2044473.html
und http://www.golem.de/news/accelerated-processing-unit-kaveri-leistet-856-gflops-1311-102670.html
macht der CPU teil der neuen APU 118,4 GFlops bei 3800 MHz
der A10-6800K CPU teil macht 131 GFlops bei 4100 MHz.
d.h. (wenn ich mich nicht beim rechnen ganz dumm angestellt habe) das es nahezu keinen zuwachs auf der IPC seite gibt.
Ich hab ja kein Wunder erwartet, aber das ist dann doch etwas entäuschend, wenn der gesamte APU performance gewinn allein vom wechsel auf die neuere GPU architektur kommt.

Bei Anwendungen die keine GPU brauchen bzw. den GPU teil nicht nutzen können bedeutet das da dann nicht sogar einen performance verlust von fast 10% verglichen zum vorgänger modell??
 
Zuletzt bearbeitet:

nVoodoo

Vice Admiral Special
Mitglied seit
16.03.2007
Beiträge
531
Renomée
1
Standort
Nördliches Emsland
  • Spinhenge ESL
  • BOINC Pentathlon 2013
  • BOINC Pentathlon 2014
  • BOINC Pentathlon 2015
  • BOINC Pentathlon 2016
  • BOINC Pentathlon 2017
Da SR ja für Desktop-CPUs gestrichen worden ist wird der denke ich ma nur auf Verbrauch und Yield getrimmt worden sein wobei wir ja nicht wissen wie hoch der Verbrauch ist... Wenn der CPU Teil zwar nicht schneller geworden ist aber 10-20% sparsamer z.B. wäre das ja auch schonma was ;)
 

genervt

Admiral Special
Mitglied seit
27.07.2006
Beiträge
1.135
Renomée
10
Standort
Berlin
  • Spinhenge ESL
  • BOINC Pentathlon 2012
  • BOINC Pentathlon 2013
  • BOINC Pentathlon 2014
  • BOINC Pentathlon 2015
  • BOINC Pentathlon 2016
  • BOINC Pentathlon 2017
Ganz ruhig Jungs. Hatten wir nicht lange und breit diskutiert, dass Bulldozer ein Auslastungsproblem hat, sprich die theoretische Performance nicht auf die Straße bringt? Genau da setzen die geänderten Dekoder doch an - weiter weit weg vom Intel High-End, aber das war nicht das Ziel!
Wir wissen auch nicht, ob Kaveri nun in der 2012 angedachten Konfiguration (#GCN ALUs) kommt oder noch beschnitten wurde.

Wo liegt eigentlich Intel bei der theoretischen Rechenleistung?
 

LoRDxRaVeN

Grand Admiral Special
Mitglied seit
20.01.2009
Beiträge
4.169
Renomée
64
Standort
Oberösterreich - Studium in Wien
  • BOINC Pentathlon 2012
  • BOINC Pentathlon 2011
  • BOINC Pentathlon 2013
Bei Anwendungen die keine GPU brauchen bzw. den GPU teil nicht nutzen können bedeutet das da dann nicht sogar einen performance verlust von fast 10% verglichen zum vorgänger modell??
Nein. Wie vermutlich auch in diesem Thread schon gesagt wurde, handelt es sich ja hier nur um einen theoretischen Wert, der nicht unbedingt etwas über die IPC aussagen muss. Die Anzahl der parallel ausführbaren Instruktionen (pro Takt) ist ja gleich geblieben. Also ist es völlig klar, dass die FLOPS bei niedrigerem Takt ebenfalls niedriger sind.

Kaveri: 3,7GHz x 4 Kerne x 8 = 118 GFLOPS
Richland: 4,1GHz x 4 Kerne x 8 = 131 GFLOPS

Wie du siehst, ist hier die einzige Variable der Takt. Wie die Performance aber bei realen Anwendungen aussieht, ist wieder ein ganz anderes Thema. Bei dieser Rechnung gibt es überhaupt keine "IPC-Unterschiede" (nicht "nahezu keine", so wie du schreibst). Es wird nämlich nicht berücksichtigt, wie gut die Recheneinheiten ausgelastet werden können (wo Kaveri nennenswerte Vorteile haben sollte) oder es wird auch nicht berücksichtigt ob der auszuführende Code überhaupt für die vorhandenen Einheiten passend ist usw.
Die FLOPS sagen eigentlich nur dann relativ zuverlässig etwas aus, wenn man innerhalb der völlig identen Architektur vergleicht.

LG
 

Kaveri

Cadet
Mitglied seit
13.11.2013
Beiträge
26
Renomée
1
Standort
TU BS im Labor
Kaveri: 3,7GHz x 4 Kerne x 8 = 118 GFLOPS
Richland: 4,1GHz x 4 Kerne x 8 = 131 GFLOPS

Darf ich fragen, wie die "x 8" zustande kommen?

Laut wikipedia sind das ja die theoretischen "CPU-Instruktionen pro Takt". Nun hatte Agner Fog aber festgestellt, dass Bulldozers Decoder alternierend nur jeweils 4 Instruktionen absetzen kann. Das sieht jetzt mit Steamroller natürlich besser aus, weshalb ich denke, dass man diese Zahlen nicht unreflektiert vergleichen sollte.

mfg
 

Dr@

Grand Admiral Special
★ Themenstarter ★
Mitglied seit
19.05.2009
Beiträge
12.791
Renomée
4.065
Standort
Baden-Württemberg
  • BOINC Pentathlon 2011
  • BOINC Pentathlon 2012
Pro Kern eine 128 Bit FMAC -> 4 Floats (Vektor mit vier 32 Bit Werten) * 2 weil eine Addition und eine Multiplikation in einem Takt ausgeführt werden
 
Oben Unten