Die Dual-Core Optimierungen des ATI CATALYST 5.12

Nero24

Administrator
Teammitglied
Mitglied seit
01.07.2000
Beiträge
24.066
Renomée
10.446
  • BOINC Pentathlon 2019
  • BOINC Pentathlon 2020
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2021
Bereits bei der <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=2&id=1134340314">Vorstellung</a> des neuen ATI CATALYST 5.12 Referenztreibers haben wir auf die zahlreichen Optimierungen auf Dual-Core Prozessoren hingewiesen. Bis zu 20 Prozent Performancezuwachs wurde von ATI versprochen.

Auf <a href="http://www.driverheaven.net/articles/dualcore512/" TARGET="b">Driverheaven</a> hat man sich nun mit dem neuen CATALYST befasst und dazu auch gleich noch ATI Senior Software Architect Phil Rogers zu einem Interview geladen. Natürlich ist klar, dass eine Optimierung auf einen Prozessortyp (hier Dual-Core CPUs und damit SMP) nur dann Vorteile bringen kann, wenn auch die Rechenleistung der CPU der Flaschenhals im System ist. Bei 1600x1200 Auflösung mit FSAA ist jedoch ganz sicher nicht der Prozessor das bremsende Element, sondern die Grafikkarte. Wer in diesen Auflösungen spielt, dürfte von einer CPU-Optimierung nicht das geringste bemerken. Die Optimierungen können nur dann zum tragen kommen, wenn in relativ niedrigen Auflösungen (z.B. 1024x768) gespielt wird und die Grafikkarte noch Luft nach oben hat. In dieser Konfiguration hat Driverheaven auch getestet und dabei auf einen Pentium D 820, einen Pentium 4 3,67 und einen Athlon 64 X2 4800+ zurück gegriffen.

In der Tat ist je nach verwendetem Spiel und Prozessor eine deutliche Verbesserung zu sehen. Bis zu 13 Prozent Performance-Zuwachs konnte gemessen werden. Interessanterweise profitiert auch der Pentium 4 von den Verbesserungen, der zwar kein Dual-Core Prozessor ist (SMP), jedoch mit Hyper-Threading (SMT) ein verwandtes Feature besitzt (Details siehe dazu unser Artikel <a href="http://www.planet3dnow.de/artikel/diverses/doping/index.shtml">Doping für CPUs - Möglichkeiten der Leistungssteigerung</a>). Leider wurde es versäumt einen Prozessor in den Test mit aufzunehmen, der weder SMP, noch SMT beherrscht (z.B. Athlon 64), um bestimmen zu können, ob der 5.12 nicht vielleicht generell schneller ist, als der 5.11, was diverse Dual-Core Optimierungen relativieren würde.

Interessant ist die Tatsache, dass diese Verbesserungen laut ATI erreicht wurden, obwohl die Anwendungen (sprich: Spiele) selbst keine Unterstützung für SMP/SMT bieten. Dafür wurde, so Phil Rogers, der Treiber-Thread in den jeweils anderen Core des Prozessors verlegt. So kann SMP/SMT genutzt werden, obwohl das Spiel selbst keinen Vorteil daraus zieht. Momentan sollen sich die Vorteile noch auf DirectX-Spiele beschränken. Wann die Optimierungen auch für OpenGL implementiert werden sollen, ließ der ATI-Entwickler offen.
 
Habe auf einem So-A-Sys bisher keine signifikante Performancesteigerung gegenüber den Vorgängern festgestellt - weder in Benches, noch beim Zocken...
--> Ergo scheint die Leistungssteigerung wirklich auf die Nutzung von SMP/SMT zurückzuführen zu sein.
--> Feine Sache - wenn ATI nich (mal wieder...!!!) OpenGL sträflich vernachlässigt hätte 8-(
 
Kann man eigentlich nicht noch mehr Vorteile aus DCs ziehen, wenn man bei ausgelasteter Grafikkarte diverse Dinge einfach von der CPU berechnen lässt, oder ist die CPU da einfach viel zu langsam/der Flaschenhals zu groß?
Der 2. Kern liegt ja momentan meistens eh brach und hätte so wenigstens bissal was zu tun
 
Zuletzt bearbeitet:
Kleine Info: Es ist ein 4600+ und kein 4800+

Und er ist ziemlich schnell gegenüber Intel :P
 
Kann man eigentlich nicht noch mehr Vorteile aus DCs ziehen, wenn man bei ausgelasteter Grafikkarte diverse Dinge einfach von der CPU berechnen lässt, oder ist die CPU da einfach viel zu langsam/der Flaschenhals zu groß?
Der 2. Kern liegt ja momentan meistens eh brach und hätte so wenigstens bissal was zu tun
Sowas wird ja versucht. Der Treiber verteilt hier die Berechnungen, die immer schon auf der CPU gelegen haben, auf mehrere Cores (was auch schon nicht ganz einfach ist).
Aber die Grafikkarten sind in ihren speziellen Berechnungen oft um das mehrfache schneller als die CPU, also bringt es auch nichts, zuviel auszulagern.
 
Scheint ja doch ein Stückchen zu bringen, vielleicht gerade so viel, wie durch die niederen Taktraten verloren geht im vergleich zu SingleCore CPUs.
Frage: Kann man das auch auf andere Treiber ausdehnen, beispielsweise auf die Soundtreiber?
 
Theoretisch schon, aber bei Soundtreibern ist die CPU-Last ja sowieso relativ niedrig, also wird man da auch nicht viel merken. Man könnte natürlich, wen Core 0 zu 100% und Core 1 zu 30% ausgelastet ist, die Soundarbeit komplett auf den zweiten Core legen - aber das ist möglicherweise doch Sache des Betriebssystems und passiert vielleicht sowieso schon, bloß keiner merkts, weil die Last eh so gering ist.
 
Theoretisch schon, aber bei Soundtreibern ist die CPU-Last ja sowieso relativ niedrig, also wird man da auch nicht viel merken.[...]

Naja, bei den inzwischen so beliebten Onboard-Sound-Lösungen kann das durchaus so 10 Frames mehr bringen, da diese hauptsächlich in Software abgebildet werden. Insbesondere bei vielen Stimmen und 3D-Sound verursachen die schon mal 15% CPU-Last. Dazu gab es mal einen Artikel auf http://www.3dcenter.de, wenn ich mich recht erinnere.

Ob das Betriebssystem diese Aufgabe automatisch an den zweiten Core delegieren kann, wäre wirklich die Frage, die noch zu klären ist. Aber wenn das passieren würde, hätte dies ja eigentlich auch für den Graphiktreiber gegolten und dort funktioniert wohl es nur, weil man eine Teilaufgabe in einen eigenen Thread gepackt hat. Aber es gibt hier ja ein paar X2 besitzer, die können das ja mal testen.
 
Zurück
Oben Unten