Optimierte MilkyWay@home Applikation

Bestünde die relativ einfache Möglichkeit, eine Auswahlmöglichkeit für die zu nutzende GPU einzubauen?

Bei mir langweilt sich die zweite GPU und das Arbeiten mit aktivem GPU-Client ist zu unrund. Ansonsten klappts völlig unkompliziert, auch die Kombination mit dem CCC macht bei mir keine Probleme.


Auf jeden Fall 'Daumen hoch' für Gipsels Programm.*great*
 
Bestünde die relativ einfache Möglichkeit, eine Auswahlmöglichkeit für die zu nutzende GPU einzubauen?

Bei mir langweilt sich die zweite GPU und das Arbeiten mit aktivem GPU-Client ist zu unrund. Ansonsten klappts völlig unkompliziert, auch die Kombination mit dem CCC macht bei mir keine Probleme.

Auf jeden Fall 'Daumen hoch' für Gipsels Programm.*great*
Danke!

Allerdings ist das leider eine etwas größere Operation. Die GPU-Erkennung ist aber der erste Schritt dahin, das entsprechend aufzubohren. Mit dem Multi-GPU-Support wird es dann recht einfach, auch die crunchende GPU auszwählen (muß ja sowieso z.B. die nicht double precision fähigen aussortieren).
Ob das diese Woche noch was wird, würde ich eher bezweifeln. Nächste Woche bin ich auf einer Tagung in Hamburg und übernächste Woche muß ich meinem Prof eine erste Version meiner Doktorarbeit vorlegen. Die muß ich dann wohl langsam mal aufschreiben *suspect* *lol*
Übernächste Woche gibt es dann auch eine neue Version von AMDs Stream-SDK. Mal sehen was da Neues eingebaut wird. Vielleicht wird dann ja auch die Multi-GPU-Unterstützung einfacher, wenn die bis dahin nch nicht fertig ist.

Was sagt denn bei Dir die GPU-Erkennung zu den zwei GPUs?
 
Ich hatte noch die ältere Version, ohne GPU-Erkennung laufen. *chatt*

Jetzt gibts auch Infos:
Code:
Running Milkyway@home ATI GPU application version 0.19 by Gipsel
CPU: AMD Athlon(tm) 64 X2 Dual Core Processor 4200+ (2 cores/threads) 2.7502 GHz (544ms)
CAL Runtime: 1.3.158
Found 2 CAL devices
Device 0: ATI Radeon HD 3800 (RV670) 512 MB local RAM (831 MB cached + 831 MB uncached remote)
GPU core clock: 670 MHz, memory clock: 829 MHz
320 shader units organized in 4 SIMDs with 16 5-issue VLIW units each supporting double precision

Device 1: ATI Radeon HD 3800 (RV670) 512 MB local RAM (831 MB cached + 831 MB uncached remote)
GPU core clock: 670 MHz, memory clock: 829 MHz
320 shader units organized in 4 SIMDs with 16 5-issue VLIW units each supporting double precision

Calculated about 1.85078e+012 floatingpoint ops on GPU, 6.18221e+007 on FPU.
Calculated about 1.40732e+009 floatingpoint ops on FPU (stars).
WU completed. It took 43.4931 seconds CPU time and 46.757 seconds wall clock time @ 2.75027 GHz.
Bei <avg_ncpus>0.1</avg_ncpus><max_ncpus>1</max_ncpus> sollten doch 20 WUs gleichzeitig auf einem Dual-Core gerechnet werden oder hab ich da was falsch verstanden? Bei mir rechnet immer nur eine WU bei MilkyWay und eine bei POEM...
 
Code:
Running Milkyway@home ATI GPU application version 0.19 by Gipsel
CPU: AMD Athlon(tm) 64 X2 Dual Core Processor 4200+ (2 cores/threads) 2.7502 GHz (544ms)
CAL Runtime: 1.3.158
Found 2 CAL devices
Device 0: ATI Radeon HD 3800 (RV670) 512 MB local RAM (831 MB cached + 831 MB uncached remote)
GPU core clock: 670 MHz, memory clock: 829 MHz
320 shader units organized in 4 SIMDs with 16 5-issue VLIW units each supporting double precision

Device 1: ATI Radeon HD 3800 (RV670) 512 MB local RAM (831 MB cached + 831 MB uncached remote)
GPU core clock: 670 MHz, memory clock: 829 MHz
320 shader units organized in 4 SIMDs with 16 5-issue VLIW units each supporting double precision

Calculated about 1.85078e+012 floatingpoint ops on GPU, 6.18221e+007 on FPU.
Calculated about 1.40732e+009 floatingpoint ops on FPU (stars).
WU completed. It took 43.4931 seconds CPU time and 46.757 seconds wall clock time @ 2.75027 GHz.
Bei <avg_ncpus>0.1</avg_ncpus><max_ncpus>1</max_ncpus> sollten doch 20 WUs gleichzeitig auf einem Dual-Core gerechnet werden oder hab ich da was falsch verstanden? Bei mir rechnet immer nur eine WU bei MilkyWay und eine bei POEM...
Na das sieht doch gut aus, dann funktioniert das also auch mit mehreren GPUs. Danke!

Wenn das mit der avg_ncpus Angabe nicht funktioniert, dann setzt Du wahrscheinlich noch einen alten Client ein. Das wird erst irgendwann ab 6.2 oder 6.3 unterstützt. Ist aber nicht so schlimm, man verliert nur eine, höchstens zwei Sekunden pro WU oder so und muß sich dann wenigstens nicht mit den Bugs des Schedulers der neuen BOINC-Versionen rumschlagen *suspect*
Außerdem wären 20WUs auf einmal für eine 512MB Karte auch schon ein wenig viel ;)
 
Das System läuft so leider sehr un"smooth", weshalb ich MilkyWay nur bei Abwesenheit rechnen lasse.

Sollte mit einem neueren BOINC Manager also klappen, was ich wohl mal austesten werde.


€: Ja, ist offensichtlich etwas älter der BM: 5.10.45
 
Das System läuft so leider sehr un"smooth", weshalb ich MilkyWay nur bei Abwesenheit rechnen lasse.

Sollte mit einem neueren BOINC Manager also klappen, was ich wohl mal austesten werde.

€: Ja, ist offensichtlich etwas älter der BM: 5.10.45
Na mit mehreren WU gleichzeitig, wird das wohl noch etwas "unsmoother", da die GPU-Last etwas steigt (der Durchsatz der GPU steigt aber nicht wirklich wesentlich). Das ist der Fluch der älteren 3800er Karten. Ich habe die App auf maximale Leistung auch mit zukünftigen Karten ausgelegt. Die auf der Karte gestarteten Arbeitspakete sind deswegen für die 3800er vielleicht etwas groß geraten (jeweils knapp 1,2 Millionen Threads :o). Da das die Karte immer komplett für das OS blockiert (geht wohl momentan nicht anders, ist bei CUDA genauso), reicht es dann nur noch für 6 bis 4 Hertz Refreshrate :]
 
Da du ja die Karten erkennst, kannst du doch speziel für die jeweilige Karte etwa kleinere Threads machen oder nicht?*noahnung*
 
Wenn die Shaderanzahl bei den Karten richtig erkannt wird, kann man ja die Anzahl der Threads direkt davon abhängig machen.
 
Da du ja die Karten erkennst, kannst du doch speziel für die jeweilige Karte etwa kleinere Threads machen oder nicht?*noahnung*
Wenn die Shaderanzahl bei den Karten richtig erkannt wird, kann man ja die Anzahl der Threads direkt davon abhängig machen.
Machen kann man viel.
Wenn das mein Projekt wäre und ich der Doktorand da, der den lieben langen Tag nicht sehr viel anderes zu tun hat, wäre das wahrscheinlich schon drin :]

Die Erkennung der Shaderanzahl und der Taktfrequenz habe ich ja aus einem ganz ähnlichen Grund eingebaut. Im Prinzip kann man damit sehr genau vorhersagen, wie lange so ein "Arbeitspaket" genau brauchen wird. Für die Zeit kann ich einfach die CPU freigeben (na so einfach ist das dann auch nicht, muß dafür das Brook-Zeugs modifizieren oder die relevanten Teile nachbauen) und auf das Polling verzichten.
Alternativ könnte man natürlich auch die Anzahl der Threads so einstellen, daß immer 20Hz oder so übrig bleiben (und die CPU trotzdem für die Wartezeit abgeben). Das macht aber mehr Arbeit und wird wenn dann erst später kommen.
 
großes THX an Gipsel.

Bin über Google, auf der Suche nach einem Boinc Client welcher ATI GPU´s unterstützt,hier gelandet. Einfach die 0.19 Version drauf und was soll ich sagen rennt.

BOINC Ver. 6.4.5
ca. 9sec pro WU (Graka 4830)
rechnet immer 1WU da auf der CPU 2WU springehenge laufen.

Auf dem anderen Rechner bekomme ich es aber nicht zum laufen. Interne Graka (780G)

Ist es eigentlich möglich Dein GPU Tool auch auf andere Projekte umzuschreiben? Die Spinhenge Jungs könnten so einen Leistungsschub gut gebrauchen.

Also DANKE für diese geile Tool
 
großes THX an Gipsel.

Bin über Google, auf der Suche nach einem Boinc Client welcher ATI GPU´s unterstützt,hier gelandet. Einfach die 0.19 Version drauf und was soll ich sagen rennt.

BOINC Ver. 6.4.5
ca. 9sec pro WU (Graka 4830)
rechnet immer 1WU da auf der CPU 2WU springehenge laufen.

Auf dem anderen Rechner bekomme ich es aber nicht zum laufen. Interne Graka (780G)

Ist es eigentlich möglich Dein GPU Tool auch auf andere Projekte umzuschreiben? Die Spinhenge Jungs könnten so einen Leistungsschub gut gebrauchen.

Also DANKE für diese geile Tool
Für welches Team rechnest du *suspect* ?
;D
Rein intressehalber ;)
 
wenn er der ist, der laut Boincstat von gestern auf heut 28k bei MW gemacht hat, rechnet er für das team SS08@FH Hannover.

pssst. er ist der einzige in dem team...........
 
ok, wenn sonst keiner fragt......fühlst du dich nicht ein wenig einsam in deinem team.....?
 
Rechne weiter aber ein besseres Team als das hier, wirst du nie finden, ich spreche aus Erfahrung.;D
 
wenn nicht immer diese Wartezeit bei den WU wäre. Manchmal kommen sie super schnell und man hat einige im Task, dann dauert es wieder Minuten bis endlich neue aufschlagen. Kann man das ändern?
.
EDIT :
.

so bin jetzt im Team. Was bedeutet eigentlich im DC der Reiter Kavallerie?
 
Zurück
Oben Unten