News AMD Kaveri-APU: Leak bestätigt erneut Starttermin im ersten Quartal 2014 und benennt neue Features [Update]

Dr@

Grand Admiral Special
Mitglied seit
19.05.2009
Beiträge
12.791
Renomée
4.066
Standort
Baden-Württemberg
  • BOINC Pentathlon 2011
  • BOINC Pentathlon 2012
Nachdem AMD in der Telefonkonferenz zur Vorstellung der Quartalszahlen für das abgelaufene dritte Quartal 2013 noch die Hoffnung nährte, “Kaveri” könne eventuell doch noch dieses Jahr im Handel verfügbar werden, bestätigen Leaks aus Asien offenbar erneut das erste Quartal 2014. Dort verlas AMDs CEO Rory Read in seiner vorbereiteten Erklärung, die entsprechend juristisch geprüft gewesen sein dürfte, folgendes:
(…)

» Artikel lesen
 
"Kaveri Desktop Features" und drunter "Discrete GPU Performance with optimal battery life"

tmVBNni_Nuclear_Facepalm_Poster_by_Nianden.jpg


Sorry, AMD, aber das ist doch völliger Blödsinn. APU's sind schön und gut, aber ein 3 oder sogar 4 Modul Kaveri würde AMD wahrscheinlich aus den Händen gerissen werden...AM3+ ist einfach tot. Keine neuen Chipsätze, alle neuen Features nur mit Zusatzchip (die wenns blöd läuft nur Probleme machen) und der Stromverbrauch is auch nich mehr Zeitgemäß. Nachdem ich jetz 750K und 760K nebeneinander hatte, war ich doch sehr begeistert, dass der 760K deutlich weniger Strom braucht, als FX-6350 und 760K. Teilweise ist die Leistung auch deutlich über FX-6350 (Wenn natürlich alle 6-Kerne genutzt werden, hat der 760K keine Chance...)

APU's sind toll und haben auch im Mid-Range bereich absolut ihren Zweck - aber Discrete GPU performance with optimal battery life ist ja wohl absolut Idiotisch. Und ob die Kiste jetz 150 Watt säuft und ich in F-HD ne Diashow aufm Schirm hab, oder ob sie 190 Watt zieht und ich alles schön flüssig zocken kann...da geb ich nen feuchten Handkäse auf die 40 Watt. (R9 270X und 760K...)
 
Zuletzt bearbeitet:
Die Verwirrung kommt eben daher, daß "Kunden" für AMD nicht die Endverbraucher sind, sondern andere Firmen, die die Prozessoren in Computern verbauen. Klar werden auch ein paar direkt in Retailverpackungen angeboten, aber deren Menge dürfte so verschwindend gering sein, daß die gar nicht erwähnt werden.

Wirklich klar, wann die genau von unseresgleichen im Handel kaufbar sein werden, ist es damit immer noch nicht.


@David64: Ich kann Deine Aufregung nicht ganz nachvollziehen, was redest Du von 150W? Wenn von "battery life" gesprochen wird, geht es doch wohl um Notebooks. Und dort die GPU-Performance zu bekommen, die man sonst nur mit extra Grafikmodul bekommt, ist doch durchaus sinnvoll.
 
@David64: Ich kann Deine Aufregung nicht ganz nachvollziehen, was redest Du von 150W? Wenn von "battery life" gesprochen wird, geht es doch wohl um Notebooks. Und dort die GPU-Performance zu bekommen, die man sonst nur mit extra Grafikmodul bekommt, ist doch durchaus sinnvoll.

Weil obendrüber "Kaveri Desktop" steht und der Rest der Folie ein Kaveri Desktop-Modell suggeriert (zumindest für mich).
 
zu 3_4 Module erstmal sehen wieviel Power Steamroller(B) hat bzw AMD wird wenn überhaupt vermutlich max 3 Module einsetzen können wenn sie es wollten, für 4 Module + starker iGPU würde die Speicherbandbreite fehlen..bzw wäre schon möglich aber würde den Preis, bzw die Akzeptanz dann für dieses Produkt dann nach unten treiben, ich denke da zb an Quattro_Channel. mfg :)

Steamroller A = BulldozerIII?;D
 
Zuletzt bearbeitet:
Mir persönlich geht es aber darum, dass man entweder die wahl hat, zwischen "APU" oder CPU auf dem gleichen Sockel. 4 Module ohne GPU oder 2 Module mit GPU.
 
Gut würde aber zumindest eine Extra Maske erfordern ......wäre vlt sonst keine schlechte Idee Platz wäre durch die fehlende iGPU dann ja auch vorhanden mfg:)
 
Zuletzt bearbeitet:
Zuletzt bearbeitet:
zu 3_4 Module erstmal sehen wieviel Power Steamroller(B) hat bzw AMD wird wenn überhaupt vermutlich max 3 Module einsetzen können wenn sie es wollten, für 4 Module + starker iGPU würde die Speicherbandbreite fehlen..bzw wäre schon möglich aber würde den Preis, bzw die Akzeptanz dann für dieses Produkt dann nach unten treiben, ich denke da zb an Quattro_Channel. mfg :)

Steamroller A = BulldozerIII?;D

Compute-Aufgaben (-> CPU, GPGPU) sind garnicht so Bandbreiten-hungrig. High-Res-Texturen für hohe Auflösungen schon. Möglich auch, dass durch den gemeinsamen Adressraum die Anforderungen an die Speicher-Bandbreite reduziert werden können.
 
Compute-Aufgaben (-> CPU, GPGPU) sind garnicht so Bandbreiten-hungrig. High-Res-Texturen für hohe Auflösungen schon. Möglich auch, dass durch den gemeinsamen Adressraum die Anforderungen an die Speicher-Bandbreite reduziert werden können.

Also wenn ich mir Einstein anschaue.... Dann klebt die APU bereits bei einem GPGPU-Task zu 100% an der RAM-Bandbreite fest wie eine Muecke auf der Windschutzscheibe bei einer Autobahnfahrt. Dazu noch parallele CPU-Tasks, und selbst mit DDR3-1866 kloppt sich alles wie Fight Club um die Bandbreite. Da ist es bereits bei 4 Kernen besser, die APU aussen vor zu lassen, weil sie den Rest des Systems viel zu sehr belastet.

Solange kein dediziertes VRAM auf die Motherboards kommt, werden die APUs immer (wie jede andere IGP auch) an der RAM-Bandbreite kleben wie Fliegen an der Scheibe. Es kommt zwar Leistung raus, aber mit hellrot gluehender Handbremse...
Gemeinsamer Addressraum ist da sowas wie der sprichwoertliche Tropfen in den Vulkan.

IMHO wird's allerhoechste Eisenbahn fuer eine AMD CPU mit drastisch mehr FPU power, sonst wird's nichts (selbst mit irrwitzigen FX-9000 >200W TDP-Monstern a la Pentium 4 Willamette hoch 2). Eine FPU pro CPU-Kern, weniger geht einfach nicht mit AMD's derzeitiger x87-Technologie.
Wenigstens besteht Hoffnung, dass FM2 jetzt evtl. mal leistungsfaehige Chipsaetze bekommt, da sieht's auch verdammt mager aus. Ich muss demnaechst deswegen wieder von FM2 auf AM3+ zurueckruesten, da gibt's -trotz Jahre alter Chipsaetze - wenigstens mehr CPU power und mehr PCIe lanes in brauchbarer Anbindung (dennoch kein Vergleich zu intel, die spielen mittlerweile in einer eigenen Liga) :]
 
Zuletzt bearbeitet:
Weil obendrüber "Kaveri Desktop" steht und der Rest der Folie ein Kaveri Desktop-Modell suggeriert (zumindest für mich).
Ja, das verwirrt mich auch, weil für mich "Desktop" auch noch sowas wie ein ATX-Gehäuse mit eingebauten Teilen ist. Aber AMD scheint das einfach als Gegensatz zu "embedded" (= industrielle Anwendungen) zu sehen. Auf der Folie steht ja nicht nur was von "battery life", sondern auch von "ultrathin experience" usw., da wird ganz klar an tragbare Computer gedacht. Aber das ist sowieso Marketing, da muß man nicht jedes Wort auf die Goldwaage legen, die Werbefuzzis quatschen viel, wenn der Tag lang ist, und können sich nie am nächsten Tag daran erinnern, was sie behauptet haben.

Deswegen gehe ich auch davon aus, daß die genannte Verfügbarkeit von Komplettsystemen sich auf Notebooks bezieht, und das sind eben immer ein paar Monate drauf. Weil die davon ausgehen, daß sich alle Welt NUR für Notebooks interessiert. Aber wir hier wollen ja wohl einzelne FM2+-Packages kaufen, um sie selbst in passende Mainboards zu setzen. Das ist einfach prozentual ein so kleiner Markt geworden, daß das in den Köpfen von folienerstellenden Marketingfuzzis nicht mehr vorkommt.

Also nehme ich einfach mal an, daß zu dieser Verfügbarkeit solcher einzelner APUs einfach gar nichts gesagt wurde. Sollte aber irgendwo zwischen erster Auslieferung an "Kunden" (= Lenovo, Acer usw.) und der Verfügbarkeit von kompletten Notebooks liegen.


@FalconFly: Das wird wohl nichts, der Trend bei AMD geht eindeutig Richtung GPU für rechenintensive Aufgaben, die FPU wird nur für alten Code noch längere Zeit mitgeschleppt. Wer Leistung braucht, muß die GPU nutzen.

An den Bandbreitenanforderungen ändert das natürlich nichts, da muß was passieren, klar. Hätte man eine FPU mit der Rechenkraft der GPU, bräuchte die sicher auch mehr Bandbreite. Es ist natürlich so, daß man gerade bei komplizierterem Code mit mehr Cache einiges abfangen kann. Aber auch nicht alles. Möglichkeiten gibt es ja einige, darf aber alles nichts kosten, sonst hätten wir z.B. schon seit Jahren DDR4, und sowas wie HMC wird wohl einfach nicht kommen wie viele andere gute Ideen.
 
@Falconfly
Verlinke mal ein paar Mess-/Testergebnisse mit der Anwendung deiner Wahl, um deine Aussage zu untermauern.
Meine Aussage orientiert sich an folgenden Testparcours von HT4U, in welchem die HD 7750 DDR3 gegenüber der HD 7750 GDDR5 bei weitem nicht derart stark einbricht, wie in Spielen. Dem 35% Performance-Verlust im Durchschnitt aller Spiele steht lediglich ein 7%iger Einbruch der OpenCL/GPGPU-Leistung gegenüber: *click*.
 
Zuletzt bearbeitet:
Nachfrage am 11.10.13 bei ASRock wegen den KaveriPI-BIOS Zeuch (war aber "unter der Hand") - kann nun aber auch anders sein, immerhin ist mein Fred schon 16 Tage alt .... AMD wollte und sollte neue Dinge versenden

AMDs "Plan" sieht eigentlich die "Veröffentlichung" des AGESA's erst ab 0.7 vor; ASRock und auch ASUS hatten aber bereits 0.6er verteilt die nunmehr im Oktober per Update auf 0.8.1 aktualisiert wurden ...

@Codenamen:
stimmt - Santa Rosa - Intel Centrino & AMDs x2xxer Opterons (JH-Fx)
 
Zuletzt bearbeitet:
Ich vermute mal, du meinst am Ende des Satzes den 750K. ;)

Äh, ja, meinte ich :D

Sind etwa 15 - 20 Watt Unterschied. Übertaktet sogar fast 40 Watt. Allerdings könnte das auch am Mainboard liegen...Gigabyte hat das UEFI ziemlich verpfuscht, während Asrock verdammt gute Arbeit geleistet hat...bis auf die Load-Line Calibration, die is bei Asrock schrott.
 
@Falconfly
Verlinke mal ein paar Mess-/Testergebnisse mit der Anwendung deiner Wahl, um deine Aussage zu untermauern.
Meine Aussage orientiert sich an folgenden Testparcours von HT4U, in welchem die HD 7750 DDR3 gegenüber der HD 7750 GDDR5 bei weitem nicht derart stark einbricht, wie in Spielen. Dem 35% Performance-Verlust im Durchschnitt aller Spiele steht lediglich ein 7%iger Einbruch der OpenCL/GPGPU-Leistung gegenüber: *click*.

Das laesst sich schlecht verlinken, die Threads sind alle verteilt im Einstein@Home community Forum. Dort ist das Thema mangelhafte Bandbreite der AMD-Plattformen Allgemeinwissen bei erfahrenen Usern (ich habs selbst am eigenen Leib erfahren und musste quasi Lehrgeld zahlen ;) ).

Hierzu zaehlt auch die stark limitierte PCIe-Anbindung der GPUs bei FM2 Chipsaetzen sowie AMD PCIe 2.0 generell, meine HD7970 z.B. brauche ich hier mit 16x PCIe 2.0 gar nicht an den Start gehen lassen, ich verliere die vollen 50% gegenueber 16x PCIe 3.0 bei intel-Chipsaetzen, kann sie selbst mit der schnellsten AM3+ CPU nicht mal im Ansatz ausreizen. Ist einfach extrem ineffizient.

Die von HT4U durchgefuehrten Tests scheinen kaum Bandbreite zu benoetigen, das sieht bei Einstein oder POEM ganz anders aus.

Einen (meinen Test der 128bit VRAM HD7790 Turbo, 1GB GDDR5) hab ich aber :
http://einstein.phys.uwm.edu/forum_thread.php?id=10362&nowrap=true#127233

Ich habe den Test durchgefuehrt, da die Bonaire GPU relativ hohe GFLOPs bei relativ geringer TDP produzieren koennte und somit meiner damaligen Theorie nach fuer ein Multi-GPU Cruncher gut geeignet gewesen waere.
( Karte ist diese hier )

Ergebnis :
Die Karte wird trotz relativ hoher GPU-Leistung durch die geringe VRAM bandbreite (obwohl hoch getakteter GDDR5) gnadenlos abgestraft und landet in einem ineffizienten Bereich, in dem sich der Aufwand schlicht nicht lohnt (die GPU zieht volle Energie, sodass der Stromverbrauch unter Voll-Last anliegt - jedoch ohne die erforderliche Leistung zu erzielen, wie ein Auto auf der Autobahn im 3. Gang im roten Drehzahlbereich).
Ich mag gar nicht daran denken, wie miserabel die Ergebnisse ausgefallen waeren, wenn ich eine normal getaktete Variante mit GDDR3 gekauft haette.

Hier noch mein Thread bez. der unerwartet niedrigen Performance meiner HD7970, sie lag wie gesagt hoffnungslos unterhalb vergleichbarer intel-Plattformen :

http://einstein.phys.uwm.edu/forum_thread.php?id=10316&nowrap=true#126659

Diese Ergebnisse und die gewonnenen Erkenntnisse waren der Grund, warum ich mich sehr intensiv mit dem Thema Bandbreite im GPGPU Computing bei AMD Plattformen beschaeftigen musste. Teures Lehrgeld, aber immerhin bin ich jetzt schlauer :-/

Aktuell bin ich soweit, dass sich fuer mich der Betrieb schnellerer Karten als der HD78xx-Serie auf AMD Plattformen nur bedingt oder gar nicht lohnt - es sei denn, man benutzt GPGPU-Projekte/Software, welche durch die mangelnde Bandbreite nicht behindert werden.
Das muss man allerdings vorher (nicht wie ich erst nachher :( ) sorgsam herausfinden...
Meinen Cruncher musste ich daher bereits mehrfach umruesten, ein letztes Mal steht demnaechst an. Wird dann wie gesagt eine AM3+ Plattform mit real 16/16/8 PCIe 2.0 und 3x HD7850 (die 3. verliert durch 8x PCIe 2.0 "nur" ca. 10%, das kann ich verschmerzen; aktuell verlieren mir die HD7850 auf der FM2 Plattform @ 8x PCIe 2.0 35% Leistung, das ist mir zuviel :P . Mit aktivierter HD8670D auf der A10-6700 CPU war es nochmal ne ganze Ecke mehr, deswegen habe ich sie wieder deaktiviert; die Mehrleistung der integrierten GPU macht den systemweiten Verlust leider nicht wett)

Beispiel aus meinen eigenen Daten :
Einstein Binary Radio Pulsar Search (Perseus Arm Survey)
FX-6300 mit HD7850 (16x PCIe 2.0) : 10500sec fuer 2 Tasks
FX-6300 mit HD7970 (16x PCIe 2.0) : 8900sec fuer 2 Tasks
Obwohl die HD7970 der HD7850 haushoch ueberlegen ist, springt nur 15% mehr Leistung dabei raus.
Die verfuegbaren Auswerte-Tools (Catalyst, GPU-Z etc.) zeigen zwar eine relativ hohe Auslastung, aber die ist - gelinde gesagt - nicht sehr aussagekraeftig.

Wie gesagt, alles nur ein Faktor wenn die Bandbreite auch gebraucht wird, dann wird sie bei AMD zum massiven Flaschenhals (dann allerdings selbst trotz so ziemlich leistungsfaehigster Boards/Chipsaetze und CPU, die ich fuer Geld kaufen konnte; mehr geht bei AMD leider einfach nicht, gibt nix schnelleres zu kaufen)

PS.
Verbaut ist alles in einem extra dafuer beschafften Enermax Fulmo GT mit reichlich Luftdurchsatz, nichts in dem Case erreicht unter Maximal-Last auch nur 60 Grad (trotz 3 Grafikkarten), die A10-6700 CPU mit einem Alpehfoehn Cooler ist permanent mit allen Kernen im Turbo-Modus unter 45 Grad.
Ich versuche im Prinzip, den flottesten AMD-Rechner fuer GPGPU computing zusammenzustellen, als alter AMD'ler fast schon Ehrensache *g*
Allerdings ist es ziemlich ernuechternd zu sehen, wie mich selbst kleine Core i3-Systeme aufgrund ihrer Bandbreitenvorteile der intel-Chipsaetze bei vergleichbarer GPU-Ausstattung regelrecht auf dem Standstreifen stehenlassen :-X
Aber ich versuch's, mal sehen wie weit ich komme.
 
Zuletzt bearbeitet:
Ich stelle absolut keinen Unterschied, zwischen PCIe 2.0 und 3.0 fest. Die R9 270X ist hier immer zu 100% ausgelastet, sowohl GPU als auch Memory-Controller...(getestet mit Witcher 2, Metro 2033, Crysis 2, Anno 2070, Unigine Valley, Assassins Creed, 3DMark11 und Luxmark), Framerate ist auch die gleiche.

Wie das bei irgendwelchen GPU-Berechnungen aussieht - keine Ahnung.
 
@Falconfly:
Das ist ja recht interessant. Dir drängt sich also der Verdacht auf, dass das PCI-E 2.0 Interface deine Crunch-Resultate limitiert. Wie aus der von dir verlinkten Forum-Diskussion hervorgeht, sind deine Resultate aber nicht reproduzierbar von anderen Forenmitgliedern, d.h. es könnte auch ein anderer Fehler am Mainboard oder dessen Treiber vorliegen. Es wäre aber interessant zu sehen, ob du in den von ht4u getesteten GPGPU-Applikationen: FLACCL, Lux Render, oclHashcat-lite und evtl. einem Bildbearbeitungs-Bench ähnliche Verhältnisse wie in Einstein erzielst.
Wirklich plausibel erscheint mir deine Geschichte jedoch nicht: gerade jene Art rekursiver Crunching-Aufgaben sollte alles andere als Bandbreiten-hungrig reagieren, da Input- und Output Ressourcen im Vergleich zu GB-großen Texturen relativ gering sind.
 
Solche Crunching Geschichten sind doch aber in der Regel sehr latenzempfindlich. Wenn ich mich nicht irre, hat sich da bei PCIe 3 einiges getan. Die Bandbreite ist dabei eher nebensächlich.
 
Hm, also mit anderen AMD Systemen und AMD Grafikkarten verglichen sind meine Ergebnisse eigentlich ganz ordentlich und fielen auf einer AM3+ Plattform nicht aus dem Rahmen (aktuell fehlt da halt einiges an Performance, FM2 und 8/8/4 PCIe 2.0 - daher der erneute Umbau).

Wenn ich am Wochenende mit einem ASUS Sabertooth 990FX R2.0 (PCIe2.0 16/8/8 bei Vollbestueckung) und dem FX-6300 an den Start gehe und mit bisherigen AM3+ Ergebnissen vergleichbar rauskomme, sieht's verglichen mit anderen AMD-Systemen und dazu deutlich staerkeren Grafikkarten u.U. sogar hervorragend aus.

Ich mache im Prinzip nichts anderes, als mich optimal an die Bandbreiten-Limits anzupassen, damit die GPUs effektiv bei zugleich guter CPU-Performance arbeiten koennen.
(so ist zumindest der Plan, nochmal bau ich definitiv nicht um *g* )

Was Bandbreitenhunger angeht, ist POEM@Home angeblich noch extremer als Einstein (da reicht angeblich selbst 16x PCIe3.0 nicht, um z.B. eine HD7970 voll auszulasten), SETI kann ich nur schaetzen als etwas weniger empfindlich wie Einstein.
Werde das alles selbst sehen muessen, wenn ich in ca. 1 Monat auf POEM und spaeter auf SETI umschwenke, da habe ich lange nichts gemacht.
 
Zuletzt bearbeitet:
Zurück
Oben Unten