Als kleine Anmerkung zum Speicherdurchsatz der kommenden Kaveri APUs:
Ich hatte ja vor einiger Zeit
befürchtet, dass der Verbleib auf einem Dual Channel DDR3 Speicherinterface zu einem starken Flaschenhals bei Kaveri würde, also insbesondere verschenkte Performance bei 3D-Applikationen bedeuten könnte. Ein Blick auf den Grafikkarten-Test von ht4u.de, September 2012 lässt mich meine ursprüngliche Einschätzung ein Stück weit moderieren. Im Vergleich zeigt die GDDR5 Edition der HD 7750 etwa 50% bis 60% mehr Leistung als ihre gleichgetaktete DDR3 Variante, sowohl in der
1920x1080 Auflösung, als auch in der niedrigeren
1650x1050 Auflösung. Die mit 900MHz getaktete GDDR5-Variante der HD7750 liegt etwa 60% bis 70% und im Schnitt gut 65% höher als das DDR3 Vergleichsmodell. Für
GPGPU Aufgaben sind diese Performance-Unterschiede deutlich geringer, grob zwischen 0% (Hashing) und 31% (LuxRender), im Schnitt bei 8% unter gleichem GPU-Takt und 18% für das 900MHz GDDR Modell.
Unter der Annahme/Prämisse, dass eine (vollkommen) lineare Skalierung zwischen Performance und Speicherdurchsatz vorliegt, dürfte die Kombination von DDR3-2400 (oder höher) und etwaigen Optimierungen in der Nutzung der Speicherbandbreite vermeintliche Flaschenhälse weitgehend reduzieren. Eine Erhöhung des möglichen Speicherdurchsatzes um 50% (DDR3-2400 gegenüber DDR3-1600) könnte ausreichen, um den vermeintlichen Flaschenhals zu minimieren.
Als Anhaltspunkt mal eine Tabelle vergleichbarer Grafikkarten und eines imaginären *Kaveri-Modells (Schätzung aus veröffentlichten Angaben, rein auf den GPU-Part bezogen), und dem Performance-Index von HT4U, aus Gründen der Vergleichbarkeit in der Auflösung 1920x1080 mit Kantenglättung, abgeglichen mit dem
Test der HD 7790
Code:
[U]Modell[/U] [U]Speicheranbindung[/U] [U]GPU[/U] [U]Perf[/U] [U]Gflop/(GB/s)[/U]
HD 7790 GDDR5 1500 MHz 128 Bit 96,0 GB/s 56,0 GT/s 14 CUs 1000 MHz 1792 Gflops 163% 18,8
HD 7770 GDDR5 1125 MHz 128 Bit 72,0 GB/s 40,0 GT/s 10 CUs 1000 MHz 1280 Gflops 129% 17,7
HD 7750 GDDR5 1125 MHz 128 Bit 72,0 GB/s 28,8 GT/s 8 CUs 900 MHz 922 Gflops 110% 12,8
HD 7750 GDDR5 1125 MHz 128 Bit 72,0 GB/s 25,6 GT/s 8 CUs 800 MHz 819 Gflops 100% 11,4
HD 7750 DDR3 800 MHz 64 Bit 25,6 GB/s 25,6 GT/s 8 CUs 800 MHz 819 Gflops 65% 32,0
*Kaveri DDR3 1200 MHz 64 Bit 38,4 GB/s 28,8 GT/s 8 CUs 900 MHz 922 Gflops - - - 24,0
Angemerkt sei noch, dass selbst die 72 GB/s schnelle GDDR5 Speicheranbindung der HD7750 und sogar der HD7770 noch ausreichend Luft für eine leistungsstärkere GPU lassen dürfte: Die HD 7790 hat grob etwa die doppelte Rohleistung einer HD 7750, aber eine "nur" 33% leistungsfähigere Speicheranbindung wurde für nötig erachtet. Den "Flaschenhals" der Speicheranbindung könnte man so (d.h. ceteris paribus) für 512 GCN Shader mit 800 MHz bis 900 MHz Takt im Bereich von grob 40 GB/s bis 50 GB/s ansetzen, also rein auf 3D-Applikationen/Spiele bezogen; oder anders: Werte von schätzungsweise deutlich mehr als 20 Gflops Rechenleistung je GB/s Speicherdurchsatz scheinen die Leistung der GCN Architektur einzuengen.