Kaveri - der Trinity Nachfolger

Opteron

Redaktion
☆☆☆☆☆☆
Mitglied seit
13.08.2002
Beiträge
23.643
Renomée
2.249
  • SIMAP Race
  • Spinhenge ESL
  • BOINC Pentathlon 2012
Welches Mainboard würdet ihre zu dem A10-7850K empfehlen?
Das hier bereits erwähnte Asus A88X-Pro macht nen soliden Eindruck und wurde auch von AMD bei der Vorführung verwendet ... Verfügbar wie gesagt Ende Januar.
Persönlich würde mir aber das A88X-Plus schon reichen, mehr als die 6 Spannungsphasen, die das Board schon hat sollte man mit nem Kaveri eigentlich nicht brauchen. Das Pro hat 8.
Das Einzige was mir an beiden Brettern nicht gefällt ist der nur 4polige CPU-Stromanschluss, aber wie besagt .. so viel wird Kaveri schon nicht saugen, selbst unter OC.
 

Starcraftfreak

Vice Admiral Special
Mitglied seit
02.04.2004
Beiträge
851
Renomée
7
Naja ich meinte relevant für den Mittelwert.
Entweder man arragiert sich mit der schlechteren Leistung, oder wenn wer Packweltmeiter sein sollte, kann er auch die Dollars für Winzip löhnen.
Das Problem an Winzip ist IMHO nicht dass es etwas kostet, sondern dass es für mich keine akzeptable Software ist, OpenCL hin oder her. Ich weiß ja nicht wie andere zu dem Thema stehen.

Das gleiche Problem hat AMD in anderen Anwendungsbereichen. Erst wenn breit verwendete Software durch OpenCL/HSA/HUMA/HQ einen deutlichen Vorteil hat, kann AMD diesen Vorteil richtig ausspielen. Bisher hatte ich den Eindruck es sind ein paar einzelne Applikationen die von der GPU Beschleunigung profitieren, der Rest braucht klassische CPU Leistung.

Wenn man überhaupt wesentlich über 2133 kommt, da wird die Luft schon ziemlich dünn, evtl haut auch der Speichercontroller eine zusätzliche Bremse rein - DDR3 ist halt ausgelutscht.
Laut BKDG haben sowohl Trinity/Richland als auch Kaveri einen Teiler für 2400, sollte also kein Problem sein. Zumindest bei Kaveri gibt es Reviews die auch schon mit Frequenzen über 2400 MHz getestet haben.

Beides (eSATA und Displayport) ist ja schon im Chipsatz und bräuchte nur noch eine Schnittstelle.
Wie wärs mit einer eSATA Slotblende? Die internen Ports sind ohnehin Hotplug-fähig. Ich weiß ist nicht die schönste Lösung. Aber angesichts der Tatsache, dass eSATA von der Industrie inzwischen als Premiumnischenfeature betrachtet wird sollte man es in Betracht ziehen.
 
Zuletzt bearbeitet:

mariahellwig

Grand Admiral Special
Mitglied seit
28.08.2008
Beiträge
2.084
Renomée
27
Standort
Bielefeld
Das gleiche Problem hat AMD in anderen Anwendungsbereichen. Erst wenn breit verwendete Software durch OpenCL/HSA/HUMA/HQ einen deutlichen Vorteil hat, kann AMD diesen Vorteil richtig ausspielen. Bisher hatte ich den Eindruck es sind ein paar einzelne Applikationen die von der GPU Beschleunigung profitieren, der Rest braucht klassische CPU Leistung.

Da muss ich dir heftig widerprechen. Man macht sich nur die Mühe etwas auf OpenCL zu implementieren, wenn es
a.) einen signifikanten Performancegewinn bingt.
b.) ich ein Perfomanceproblem habe.
c.) Entwicklungsaufwand und Gewinn in einem gesunden Verhältnis stehen.

Bei rechenintensiven Applikationen hat so ziemlich jede Softwarebude Gehversuche gemacht, mit unterschiedlichen Ergebnissen.

Bei Games sitzt der Flaschenhals bei DirectX. OpenCL hat aktuell noch zu viel Overhead und würde hier wenig bringen.
Bei Bildbearbeitung hängt es von der Aufgabenstellung ab. Die Großen wie Adobe oder Corel setzen stark auf OpenCL. AMD bringt demnächst einen optimierten JPEG Dekoder der den Standarddekoder in Windows ersetzt. Eine einfaches Beispiel einer Alltagsanwendung.
Rendering, Konstruktion und Simulation gibt es auch schon gute Implementierungen.

Wirklich spannend wird es aber erst in den nächsten 12 Monaten, weil der Entwicklungsaufwand mit HSA deutlich sinkt(Punkt C) und die Ausführungsperformance dramatisch steigt(Punkt A). Eine Facebook-App wird auch künftig ohne OpenCL auskommen, weil sie kein Perfomanceproblem hat(Punkt B). Allerdings benötigt diese dann auch keinen i7
 

Starcraftfreak

Vice Admiral Special
Mitglied seit
02.04.2004
Beiträge
851
Renomée
7
Ich widerspreche dir da nicht. Aber erst wenn Software da ist, die einen Vorteil mit diesen Technologien liefert, kann sich AMD stärker gegen Intel behaupten. Ich weiß auch dass sich OpenCL nicht für alle Software eignet. Aber genau da entsteht für die Nische, die man versucht größer zu bekommen.
 

LoRDxRaVeN

Grand Admiral Special
Mitglied seit
20.01.2009
Beiträge
4.169
Renomée
64
Standort
Oberösterreich - Studium in Wien
  • BOINC Pentathlon 2012
  • BOINC Pentathlon 2011
  • BOINC Pentathlon 2013
Freilich ist da nichts mit Echtzeit, zumindest nach oben hin - da ist einfach ein fixer Deckel.

So "freilich" finde ich das keinesfalls. Die Leistungsaufnahmemessung damals vom A10-6700 von Tom habe ich immer so interpretiert, dass das 65W Modell immer wieder an seine TDP- oder Temperatur Grenze kommt und deshalb den Takt viel öfter ändert (womit die Spannung, die Temperatur und die Leistungsaufnahme sinkt), als die 100W TDP Modelle. So könnte es auch solchen Sachen wie cTDP realisiert werden und nicht über eine simple Deckelung.

LG
 

Onkel_Dithmeyer

Redaktion
☆☆☆☆☆☆
Mitglied seit
22.04.2008
Beiträge
12.860
Renomée
3.698
Standort
Zlavti
  • BOINC Pentathlon 2011
  • BOINC Pentathlon 2012
  • BOINC Pentathlon 2013
  • BOINC Pentathlon 2014
  • BOINC Pentathlon 2015
  • BOINC Pentathlon 2016
  • BOINC Pentathlon 2017
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2019
  • SETI@Home Intel-Race II
  • BOINC Pentathlon 2020
  • THOR Challenge 2020
  • BOINC Pentathlon 2021
Definitiv kein DDR4 ;)
 

y33H@

Admiral Special
Mitglied seit
16.05.2011
Beiträge
1.767
Renomée
9
So "freilich" finde ich das keinesfalls. Die Leistungsaufnahmemessung damals vom A10-6700 von Tom habe ich immer so interpretiert, dass das 65W Modell immer wieder an seine TDP- oder Temperatur Grenze kommt und deshalb den Takt viel öfter ändert (womit die Spannung, die Temperatur und die Leistungsaufnahme sinkt), als die 100W TDP Modelle. So könnte es auch solchen Sachen wie cTDP realisiert werden und nicht über eine simple Deckelung.
Meines Wissens ist das wie folgt: Es gibt festgelegte Obergrenzen aus CPU-, GPU- und NB-Takt samt passenden Spannungen. Sofern diese und eine bestimme Temperatur erreicht werden, drosselt der Chip. Es ist also eine Mischung aus TDP- und Takt-Limit, alles in Echtzeit zu messen gibt es offenbar nur bei GPUs.
 

Dr@

Grand Admiral Special
Mitglied seit
19.05.2009
Beiträge
12.791
Renomée
4.065
Standort
Baden-Württemberg
  • BOINC Pentathlon 2011
  • BOINC Pentathlon 2012
, alles in Echtzeit zu messen gibt es offenbar nur bei GPUs.
Die "digitale Berechnung" der aktuellen Leistungsaufnahme auf Basis der Auslastung einzelner Funktionseinheiten gibt es bei CPU-Kernen seit dem Llano. Seither wurde dieser Algorithmus mehrfach erweitert -> Abschätzung der Temperaturverteilung -> Abgleich mit gemessener Temperatur
 

y33H@

Admiral Special
Mitglied seit
16.05.2011
Beiträge
1.767
Renomée
9
Auf dem Papier mag das korrekt sein, die Praxis ist eine andere Sache. Wenn dem so wäre, also alles in Echtzeit, warum sind dann fixe Taktlimits hinterlegt?
 

Dr@

Grand Admiral Special
Mitglied seit
19.05.2009
Beiträge
12.791
Renomée
4.065
Standort
Baden-Württemberg
  • BOINC Pentathlon 2011
  • BOINC Pentathlon 2012
Auf dem Papier mag das korrekt sein, die Praxis ist eine andere Sache. Wenn dem so wäre, also alles in Echtzeit, warum sind dann fixe Taktlimits hinterlegt?

Wo sind die hinterlegt? Für welche Fälle?
 

FredD

Gesperrt
★ Themenstarter ★
Mitglied seit
25.01.2011
Beiträge
2.472
Renomée
43
Ganz hinten im Foliensatz zu Kaveri finden sich noch die folgenden 3 Folien, welche auf die Abhängigkeit der Performance von der verwendeten RAM-Geschwindigkeit hinweisen:

Spiele
amd_kaveri_prasentation_komplett_178.png

Anwendungen
amd_kaveri_prasentation_komplett_177.png

Überblick
amd_kaveri_prasentation_komplett_179.png



Bei Semi-Accurate wird in folgendem Artikel näher darauf eingegangen, mit u.a. diesen Ergebnissen:

BF4-Memory-Perf-Graph.png


BF4-Memory-perf-table.png


Ryan@S|A schrieb:
The big take away here is that if you are building a Kaveri based system you need to have at least 2133 Mhz DDR3 RAM to see the best performance out of your system. More to the point using anything slower than DDR3 1600 MHz RAM will lead to unplayable frame rates in Battlefield 4.


Im Vergleich dazu meine vorher gemachte Abschätzung:

Die Speicherbandbreite ("RAM bremst?") ist zwar knapp bemessen, aber nach persönlicher Einschätzung noch im Rahmen. Was wir bisher sagen können, ist dass irgendwo zwischen 20 und 30 Gflops / GB/s (Shader-Leistung pro Speicherbandbreite) der Speicher sozusagen die Grafikperformance bremst. Möglichst schneller DDR3-RAM wird auf jeden Fall von Vorteil sein. Für meine Tabelle bin ich einmal von DDR3-2400 ausgegangen.
Siehe dazu auch ein früherer Post von mir: http://www.planet3dnow.de/vbulletin...y-Nachfolger?p=4797845&viewfull=1#post4797845



ModellRAMShaderGesamt
TypMHzBreiteGB/sAnzahlMHzGflopsGT/sGflops / GB/sPerf.Index
HD 7790GDDR54x1500128 Bit96.08961000179256.018.8163%
HD 7770GDDR54x1125128 Bit72.06401000128040.017.7129%
HD 7750GDDR54x1125128 Bit72.051290092228.812.8100%
HD*7750DDR32x800128 Bit25.651280081925.632.065%
*KaveriDDR32x1200128 Bit38.451290092228.824.0?

Man muss auch hinzufügen, dass die hohe Bandbreite v.a. für Grafik-intensive Anwendungen nötig ist, für GPGPU wird (bei gängigen, d.h. bisher getesteten Applikationen) weitaus weniger Bandbreite benötigt. Auch steht die Frage noch offen, ob der HSA-fähige Speicherkontroller von Kaveri nicht noch die eine oder andere Optimierung mit sich bringt, um den Speicherdurchsatz zu verringern. Wäre Kaveri eine reine GPU und keine APU, müsste DDR3-2800 schon regelrecht obligatorisch sein, um keine Grafikleistung zu verschenken (20.6 Gflops / GB/s). Ich gehe aber davon aus, dass Kaveri als voll HSA-fähige APU durch den kohärenten Speicher und v.a. den gemeinsamen Adressraum noch etwas Spielraum offen lässt.


EDIT:
Ganz unterschlagen habe ich, dass die GFLOPs der Grafikeinheit nun, bedingt durch die reduzierte GPU-Taktung, ein gutes Stück niedriger liegen, d.h. beim bisherigen Spitzenmodell 7850k bei rund 738 GFLOPs statt 922. Mit den 38.4 GB/s bei verwendetem DDR3-2400 Speicher liegt mein Index für Gflops pro GB/s schon unter 20, nämlich bei 19.2. Das lässt auch darauf schließen, dass die GCN Architektur sogar noch etwas mehr Speicherdurchsatz gebrauchen könnte, bis Shader und andere Ausführungseinheiten bei hohen Anforderungen "satt" und zufrieden werden. Ich tippe da auf einen Wert von 15-18 GFLOPs/GB/s. Wo genau eine Sättigung, d.h. kein weiterer Performance-Gewinn trotz schnellerem Speicher, bei anspruchsvollen Spielen und Anwendungen auftritt, müsste mit entsprechend noch schnellem RAM noch ausführlicher getestet werden.
 
Zuletzt bearbeitet:

Dr@

Grand Admiral Special
Mitglied seit
19.05.2009
Beiträge
12.791
Renomée
4.065
Standort
Baden-Württemberg
  • BOINC Pentathlon 2011
  • BOINC Pentathlon 2012

FredD

Gesperrt
★ Themenstarter ★
Mitglied seit
25.01.2011
Beiträge
2.472
Renomée
43
Was die Grafiken von AMD unterschlagen ist die noch recht linear verlaufende Art des Performancezuwachses durch schnelleren Speicher. Würde man DDR3-1866 noch hinzufügen, ergäbe sich eine Gerade durch die 266MHz Schritte 1600 - 1866 - 2133 - 2400. Erst wenn diese Gerade abflacht, stellt sich eine Sättigung ein. Falls sich ein Kaveri-Besitzer mit schnellerem RAM, z.B. DDR3-2800, DDR3-2933 oder DDR3-3000 dazu bereit erklärt, weitere Benchmark-Ergebnisse zu liefern, könnte die Kernfrage noch ein gutes Stück weiter beantwortet werden.
 

Starcraftfreak

Vice Admiral Special
Mitglied seit
02.04.2004
Beiträge
851
Renomée
7
Für eine grobe Abschätzung könnte man auch eine diskrete Grafikkarte nehmen und den Speicher untertakten um ähnliche Bandbreiten zu bekommen. Dann sieht man wo in etwa der Sättigungspunkt für eine GPU mit vergleichbaren Spezifikationen ist. Das gilt dann zwar nicht 1:1 aber wäre leichter zu machen als extreme Speicherfrequenzen für die man ziemlich stark übertakten muss (2400 ist der höchste Teiler, höher gehts nur wenn man den Referenztakt anhebt).
 

Shadowtrooper

Grand Admiral Special
Mitglied seit
02.02.2009
Beiträge
2.476
Renomée
35
Standort
Krefeld

derDruide

Admiral Special
Mitglied seit
09.08.2004
Beiträge
1.825
Renomée
61
Ja, mit dem A10 und A8 probiert. Der 7600r drosselt von 3,3 (65W) auf 3,1 (45W) GHz, GPU hat Prio und bleibt idR 720 MHz. Der 7850K drosselt von 3,7 (95W) auf 2,4 GHz (45W). Ist schlicht eine UEFI-Option.

Danke für die Info! Kannst Du bitte auch die Werte für 65 W nachgucken (und vielleicht auch den Turbo ;D), das würde glaube ich viele interessieren! Wenn sie identisch zum A10-7800 sind, kann man den 7850K jetzt schon kaufen, der Preis soll ja gleich sein. Wäre das schlau, weil der 7850K auch nach dem Runtertakten mindestens so gut oder besser ist (meint hier: Güte des Dies) und man für den Fall des Falles eine Reserve hat? Oder ist die kleinere APU in ihrem TDP-Bereich doch überlegen? (schneller bzw. effizienter?). Die 700 MHz Taktverlust bei 45 W (2,4 statt 3,1) könnte man sich über die bessere GPU des 7850 erklären, ist aber trotzdem etwas viel. *noahnung*


Wie wärs mit einer eSATA Slotblende? Die internen Ports sind ohnehin Hotplug-fähig. Ich weiß ist nicht die schönste Lösung. Aber angesichts der Tatsache, dass eSATA von der Industrie inzwischen als Premiumnischenfeature betrachtet wird sollte man es in Betracht ziehen.

Davon wird abgeraten (z. B. c't), die Signalqualität leidet zu sehr. Nicht nur durch das längere Kabel, auch durch den zusätzlichen Stecker. Ich hab's bei SATA I 2x ausprobiert und die externen Platten reagierten nicht. Bei SATA II und III würde ich es sowieso lassen.
 
Zuletzt bearbeitet:

y33H@

Admiral Special
Mitglied seit
16.05.2011
Beiträge
1.767
Renomée
9
Ja, SHP ist SOI, steht u.a. bei Golem und Heise in den Tests.

Danke für die Info! Kannst Du bitte auch die Werte für 65 W nachgucken (und vielleicht auch den TurboD), das würde glaube ich viele interessieren! Wenn sie identisch zum A10-7800 sind, kann man den 7850K jetzt schon kaufen, der Preis soll ja gleich sein. Wäre das schlau, weil der 7850K auch nach dem Runtertakten mindestens so gut oder besser ist (meint hier: Güte des Dies) und man für den Fall des Falles eine Reserve hat? Oder ist die kleinere APU in ihrem TDP-Bereich doch überlegen? (schneller bzw. effizienter?). Die 700 MHz Taktverlust bei 45 W (2,4 statt 3,1) könnte man sich über die bessere GPU des 7850 erklären, ist aber trotzdem etwas viel.
Nope, Testsystem ist weg, der eigene 7850K noch unterwegs. Deine Idee mit der GPU dürfte stimmen.
 

Woerns

Grand Admiral Special
Mitglied seit
05.02.2003
Beiträge
2.816
Renomée
103
Ich glaube es erst, wenn es dazu ein offizielles Statement gibt.
Die Daten im AMD Shop füllt ein € 10,- Jobber aus dem Vertrieb aus, das reicht mir nicht.
Da kann auch einer nach Copy&Paste in der Zeile 32nm SOI nur die Zahl in 28 geändert haben.
MfG
 

derDruide

Admiral Special
Mitglied seit
09.08.2004
Beiträge
1.825
Renomée
61
Nope, Testsystem ist weg, der eigene 7850K noch unterwegs. Deine Idee mit der GPU dürfte stimmen.

Dann bin ich weiterhin gespannt ;D Am besten wär natürlich ein 2. Golem-Artikel mit weiteren Details (oder eine Ergänzung des 1. Artikels).

Andererseits: Der 7800 hat bei 30 W weniger TDP nur 100-200 MHz Taktverlust. Und 700 MHz für die bessere GPU kommt mir auch viel vor. Werden die effizienteren Dice (Selektion) doch in den niedrigen TDP-Klassen verwurstet (weil ein schlechteres Die das nicht schaffen würde)?
 

y33H@

Admiral Special
Mitglied seit
16.05.2011
Beiträge
1.767
Renomée
9
Ist oft so, dass die schnellsten Modelle mit etwas mehr Spannung "geprügelt" werden und die besseren für die Low-Power-SKUs genutzt werden. Müsste man testen wenn es den 7600er retail gibt.
 

derDruide

Admiral Special
Mitglied seit
09.08.2004
Beiträge
1.825
Renomée
61
Dann ist der A10-7800 wohl wirklich am interessantesten, die 100-200 MHz sind auch egal. :D
Wenn du noch Infos zur cTDP nachschieben könntest, wär das trotzdem toll. Das Thema ist sehr neu und den meisten noch nicht klar, auch was die Mainboards angeht. Falls es so ist wie ich denke wäre der Hinweis gut, dass ein runtergetakteter 7850K nicht so gut performt wie ein nativer 45/65er. Das denkt man nämlich im ersten Moment.
 

ONH

Grand Admiral Special
Mitglied seit
31.08.2009
Beiträge
4.051
Renomée
66
Standort
🇨🇭
  • BOINC Pentathlon 2011
  • BOINC Pentathlon 2012
  • BOINC Pentathlon 2013
  • BOINC Pentathlon 2014
  • BOINC Pentathlon 2015
@y33H

Bist du sicher? Ich dachte immer, das die DIE mit der geringsten Lekage für die hohen Spannungen aussortiert werden, wenn einem die Leistung eh schon knapp ist, natürlich naben den kleinen TDP APU mit sehr engem Korsett (15W TDP), und der Rest wird so gut es geht den anderen Versionen zugeordnet.
 

Shadowtrooper

Grand Admiral Special
Mitglied seit
02.02.2009
Beiträge
2.476
Renomée
35
Standort
Krefeld
Nein Intel nutzt die Besten zum Beispiel immer für die T Modelle und die ULV Mobiel Chips das wird bei AMD sicherlich nicht anders sein. Für die Höchsten Modelle nimmt man meist mittelmäßige Exemplare und halt genug Spannung. Die schlechtesten findet man natürlich in den langsamen Modellen mit Hoher TDP also bei AMD höchstwahrscheinlich aktuell beim A10 7700k.
 
Zuletzt bearbeitet:
Oben Unten