Optimierte MilkyWay@home Applikation

NOFX · 23.02.2009

Bestünde die relativ einfache Möglichkeit, eine Auswahlmöglichkeit für die zu nutzende GPU einzubauen?

Bei mir langweilt sich die zweite GPU und das Arbeiten mit aktivem GPU-Client ist zu unrund. Ansonsten klappts völlig unkompliziert, auch die Kombination mit dem CCC macht bei mir keine Probleme.

Auf jeden Fall 'Daumen hoch' für Gipsels Programm. *great*

Gipsel · 24.02.2009

NOFX schrieb:
Bestünde die relativ einfache Möglichkeit, eine Auswahlmöglichkeit für die zu nutzende GPU einzubauen?

Bei mir langweilt sich die zweite GPU und das Arbeiten mit aktivem GPU-Client ist zu unrund. Ansonsten klappts völlig unkompliziert, auch die Kombination mit dem CCC macht bei mir keine Probleme.

Auf jeden Fall 'Daumen hoch' für Gipsels Programm.

Danke!

Allerdings ist das leider eine etwas größere Operation. Die GPU-Erkennung ist aber der erste Schritt dahin, das entsprechend aufzubohren. Mit dem Multi-GPU-Support wird es dann recht einfach, auch die crunchende GPU auszwählen (muß ja sowieso z.B. die nicht double precision fähigen aussortieren).
Ob das diese Woche noch was wird, würde ich eher bezweifeln. Nächste Woche bin ich auf einer Tagung in Hamburg und übernächste Woche muß ich meinem Prof eine erste Version meiner Doktorarbeit vorlegen. Die muß ich dann wohl langsam mal aufschreiben *suspect*

Übernächste Woche gibt es dann auch eine neue Version von AMDs Stream-SDK. Mal sehen was da Neues eingebaut wird. Vielleicht wird dann ja auch die Multi-GPU-Unterstützung einfacher, wenn die bis dahin nch nicht fertig ist.

Was sagt denn bei Dir die GPU-Erkennung zu den zwei GPUs?

NOFX · 24.02.2009

Gipsel schrieb:
Was sagt denn bei Dir die GPU-Erkennung zu den zwei GPUs?

Wo kann ich das nachgucken?

Opteron · 24.02.2009

Da:

Gipsel schrieb:
Hallo Leute!

Gibt mal wieder eine neue Version vom GPU-Client.
Das Update ändert nichts an der eigentlichen App, sondern stellt nach der CPU-Erkennung in der 0.19 jetzt auch eine GPU-Erkennung zur Verfügung (abzulesen bei den task details).

Also bei MW in der Task Übersicht Deines Kontos.

ciao

Alex

NOFX · 24.02.2009

Ich hatte noch die ältere Version, ohne GPU-Erkennung laufen. *chatt*

Jetzt gibts auch Infos:

Code:

Running Milkyway@home ATI GPU application version 0.19 by Gipsel
CPU: AMD Athlon(tm) 64 X2 Dual Core Processor 4200+ (2 cores/threads) 2.7502 GHz (544ms)
CAL Runtime: 1.3.158
Found 2 CAL devices
Device 0: ATI Radeon HD 3800 (RV670) 512 MB local RAM (831 MB cached + 831 MB uncached remote)
GPU core clock: 670 MHz, memory clock: 829 MHz
320 shader units organized in 4 SIMDs with 16 5-issue VLIW units each supporting double precision

Device 1: ATI Radeon HD 3800 (RV670) 512 MB local RAM (831 MB cached + 831 MB uncached remote)
GPU core clock: 670 MHz, memory clock: 829 MHz
320 shader units organized in 4 SIMDs with 16 5-issue VLIW units each supporting double precision

Calculated about 1.85078e+012 floatingpoint ops on GPU, 6.18221e+007 on FPU.
Calculated about 1.40732e+009 floatingpoint ops on FPU (stars).
WU completed. It took 43.4931 seconds CPU time and 46.757 seconds wall clock time @ 2.75027 GHz.

Bei <avg_ncpus>0.1</avg_ncpus><max_ncpus>1</max_ncpus> sollten doch 20 WUs gleichzeitig auf einem Dual-Core gerechnet werden oder hab ich da was falsch verstanden? Bei mir rechnet immer nur eine WU bei MilkyWay und eine bei POEM...

Gipsel · 24.02.2009

NOFX schrieb:

Code:

Running Milkyway@home ATI GPU application version 0.19 by Gipsel
CPU: AMD Athlon(tm) 64 X2 Dual Core Processor 4200+ (2 cores/threads) 2.7502 GHz (544ms)
CAL Runtime: 1.3.158
Found 2 CAL devices
Device 0: ATI Radeon HD 3800 (RV670) 512 MB local RAM (831 MB cached + 831 MB uncached remote)
GPU core clock: 670 MHz, memory clock: 829 MHz
320 shader units organized in 4 SIMDs with 16 5-issue VLIW units each supporting double precision

Device 1: ATI Radeon HD 3800 (RV670) 512 MB local RAM (831 MB cached + 831 MB uncached remote)
GPU core clock: 670 MHz, memory clock: 829 MHz
320 shader units organized in 4 SIMDs with 16 5-issue VLIW units each supporting double precision

Calculated about 1.85078e+012 floatingpoint ops on GPU, 6.18221e+007 on FPU.
Calculated about 1.40732e+009 floatingpoint ops on FPU (stars).
WU completed. It took 43.4931 seconds CPU time and 46.757 seconds wall clock time @ 2.75027 GHz.

Bei <avg_ncpus>0.1</avg_ncpus><max_ncpus>1</max_ncpus> sollten doch 20 WUs gleichzeitig auf einem Dual-Core gerechnet werden oder hab ich da was falsch verstanden? Bei mir rechnet immer nur eine WU bei MilkyWay und eine bei POEM...

Na das sieht doch gut aus, dann funktioniert das also auch mit mehreren GPUs. Danke!

Wenn das mit der avg_ncpus Angabe nicht funktioniert, dann setzt Du wahrscheinlich noch einen alten Client ein. Das wird erst irgendwann ab 6.2 oder 6.3 unterstützt. Ist aber nicht so schlimm, man verliert nur eine, höchstens zwei Sekunden pro WU oder so und muß sich dann wenigstens nicht mit den Bugs des Schedulers der neuen BOINC-Versionen rumschlagen *suspect*

Außerdem wären 20WUs auf einmal für eine 512MB Karte auch schon ein wenig viel

NOFX · 24.02.2009

Das System läuft so leider sehr un"smooth", weshalb ich MilkyWay nur bei Abwesenheit rechnen lasse.

Sollte mit einem neueren BOINC Manager also klappen, was ich wohl mal austesten werde.

€: Ja, ist offensichtlich etwas älter der BM: 5.10.45

Gipsel · 24.02.2009

NOFX schrieb:
Das System läuft so leider sehr un"smooth", weshalb ich MilkyWay nur bei Abwesenheit rechnen lasse.

Sollte mit einem neueren BOINC Manager also klappen, was ich wohl mal austesten werde.

€: Ja, ist offensichtlich etwas älter der BM: 5.10.45

Na mit mehreren WU gleichzeitig, wird das wohl noch etwas "unsmoother", da die GPU-Last etwas steigt (der Durchsatz der GPU steigt aber nicht wirklich wesentlich). Das ist der Fluch der älteren 3800er Karten. Ich habe die App auf maximale Leistung auch mit zukünftigen Karten ausgelegt. Die auf der Karte gestarteten Arbeitspakete sind deswegen für die 3800er vielleicht etwas groß geraten (jeweils knapp 1,2 Millionen Threads

). Da das die Karte immer komplett für das OS blockiert (geht wohl momentan nicht anders, ist bei CUDA genauso), reicht es dann nur noch für 6 bis 4 Hertz Refreshrate

ICEMAN · 24.02.2009

Da du ja die Karten erkennst, kannst du doch speziel für die jeweilige Karte etwa kleinere Threads machen oder nicht? *noahnung*

DanysAhne · 24.02.2009

Wenn die Shaderanzahl bei den Karten richtig erkannt wird, kann man ja die Anzahl der Threads direkt davon abhängig machen.

Gipsel · 24.02.2009

ICEMAN schrieb:
Da du ja die Karten erkennst, kannst du doch speziel für die jeweilige Karte etwa kleinere Threads machen oder nicht?

DanysAhne schrieb:
Wenn die Shaderanzahl bei den Karten richtig erkannt wird, kann man ja die Anzahl der Threads direkt davon abhängig machen.

Machen kann man viel.
Wenn das mein Projekt wäre und ich der Doktorand da, der den lieben langen Tag nicht sehr viel anderes zu tun hat, wäre das wahrscheinlich schon drin

Die Erkennung der Shaderanzahl und der Taktfrequenz habe ich ja aus einem ganz ähnlichen Grund eingebaut. Im Prinzip kann man damit sehr genau vorhersagen, wie lange so ein "Arbeitspaket" genau brauchen wird. Für die Zeit kann ich einfach die CPU freigeben (na so einfach ist das dann auch nicht, muß dafür das Brook-Zeugs modifizieren oder die relevanten Teile nachbauen) und auf das Polling verzichten.
Alternativ könnte man natürlich auch die Anzahl der Threads so einstellen, daß immer 20Hz oder so übrig bleiben (und die CPU trotzdem für die Wartezeit abgeben). Das macht aber mehr Arbeit und wird wenn dann erst später kommen.

stampfkern · 24.02.2009

großes THX an Gipsel.

Bin über Google, auf der Suche nach einem Boinc Client welcher ATI GPU´s unterstützt,hier gelandet. Einfach die 0.19 Version drauf und was soll ich sagen rennt.

BOINC Ver. 6.4.5
ca. 9sec pro WU (Graka 4830)
rechnet immer 1WU da auf der CPU 2WU springehenge laufen.

Auf dem anderen Rechner bekomme ich es aber nicht zum laufen. Interne Graka (780G)

Ist es eigentlich möglich Dein GPU Tool auch auf andere Projekte umzuschreiben? Die Spinhenge Jungs könnten so einen Leistungsschub gut gebrauchen.

Also DANKE für diese geile Tool

De_vil · 24.02.2009

stampfkern schrieb:
großes THX an Gipsel.

Bin über Google, auf der Suche nach einem Boinc Client welcher ATI GPU´s unterstützt,hier gelandet. Einfach die 0.19 Version drauf und was soll ich sagen rennt.

BOINC Ver. 6.4.5
ca. 9sec pro WU (Graka 4830)
rechnet immer 1WU da auf der CPU 2WU springehenge laufen.

Auf dem anderen Rechner bekomme ich es aber nicht zum laufen. Interne Graka (780G)

Ist es eigentlich möglich Dein GPU Tool auch auf andere Projekte umzuschreiben? Die Spinhenge Jungs könnten so einen Leistungsschub gut gebrauchen.

Also DANKE für diese geile Tool

Für welches Team rechnest du *suspect*

?

Rein intressehalber

J-R · 24.02.2009

wenn er der ist, der laut Boincstat von gestern auf heut 28k bei MW gemacht hat, rechnet er für das team SS08@FH Hannover.

pssst. er ist der einzige in dem team...........

stampfkern · 24.02.2009

joop

J-R · 24.02.2009

ok, wenn sonst keiner fragt......fühlst du dich nicht ein wenig einsam in deinem team.....?

ICEMAN · 24.02.2009

Rechne weiter aber ein besseres Team als das hier, wirst du nie finden, ich spreche aus Erfahrung.

stampfkern · 24.02.2009

ja ein wenig. *suspect*

ICEMAN · 24.02.2009

stampfkern schrieb:
ja ein wenig.

Na wie wäre es in einem Team zu sein, wo man absolut aufgehoben ist, wo viele mitmachen und es ab und an mal ein Race gibt?

stampfkern · 24.02.2009

ICEMAN schrieb:
Rechne weiter aber ein besseres Team als das hier, wirst du nie finden, ich spreche aus Erfahrung.

wo muss ich unterschreiben?

De_vil · 24.02.2009

stampfkern schrieb:
wo muss ich unterschreiben?

Reines Teamchange reicht und du bist dabei

Neue Member sind immer coool

Ist ein mega geiles Team hier

Gipsel · 24.02.2009

Und man sitzt an der Quelle, wenn es neue Apps gibt

De_vil · 24.02.2009

Gipsel schrieb:
Und man sitzt an der Quelle, wenn es neue Apps gibt

Das auch

Aber ist sowieso unerträglich mit der 4870 und Boinc *buck*

Lass ich nur laufen wenn ich Musik und ICQ laufen hab

REicht trotzdem für ca 10k täglich

stampfkern · 24.02.2009

wenn nicht immer diese Wartezeit bei den WU wäre. Manchmal kommen sie super schnell und man hat einige im Task, dann dauert es wieder Minuten bis endlich neue aufschlagen. Kann man das ändern?
.
EDIT :
.
so bin jetzt im Team. Was bedeutet eigentlich im DC der Reiter Kavallerie?

TAL9000 · 24.02.2009

stampfkern schrieb:
so bin jetzt im Team. Was bedeutet eigentlich im DC der Reiter Kavallerie?

Willkommen im Team, zur deiner Frage: Schau mal hier http://www.planet3dnow.de/vbulletin/showthread.php?t=287340

TAL9000

Optimierte MilkyWay@home Applikation

Grand Admiral Special

Admiral Special

Grand Admiral Special

Redaktion☆☆☆☆☆☆

Grand Admiral Special

Admiral Special

Grand Admiral Special

Admiral Special

Grand Admiral Special

Vice Admiral Special

Admiral Special

Cadet

Grand Admiral Special

Vice Admiral Special

Cadet

Vice Admiral Special

Grand Admiral Special

Cadet

Grand Admiral Special

Cadet

Grand Admiral Special

Admiral Special

Grand Admiral Special

Cadet

Grand Admiral Special

Ähnliche Themen

Aktuelle Aktionen

Wichtige Links

Redaktion
☆☆☆☆☆☆