Optimierte MilkyWay@home Applikation

Mach mich nicht schwach!Travis hat doch mit einer 9600GT getestet!?
Wo steht das ?

G92 hat kein DP das gibts erst mit dem GT200 Chips, und selbst da ist es grottenschlecht implementiert.

Wenn die das jetzt auf einem G92 laufen lassen wollen, dann muss das irgendein Programmierertrick sein und die unterirdische Leistung wird dann irgendwo zw. C2D und C2Q liegen *chatt*

Oder aber sie verzichten plötzlich auf die doppelte Genauigkeit ... würde mich auch nicht wundern.

ciao

Alex
 
Wer lesen kann ist...
News

CUDA Application Update
May 20, 2009
Looks like I've finally gotten the CUDA application working. I'm in the process of cleaning up the code, and it should be available for you to play around with tonight. It's my first crack at a CUDA application, so it's a bit rough, but currently it's crunching the current stripe 82 WUs in around a minute using a GeForce 9600M GT. I'm sure there's quite a bit more optimization we can to do get it running even faster, as this is the first version and not optimized at all. Part of the reason this has taken so long was that I was doing quite a bit of testing comparing double and single precision math on the GPU. I've come up with some schemes that will allow us to use older graphics cards which don't support double precision math (like the GeForce I've been using); which should let a lot more of our users be able to use the GPU application. More news later when I post the code.
--Travis
 
Wo steht das ?

G92 hat kein DP das gibts erst mit dem GT200 Chips, und selbst da ist es grottenschlecht implementiert.

Wenn die das jetzt auf einem G92 laufen lassen wollen, dann muss das irgendein Programmierertrick sein und die unterirdische Leistung wird dann irgendwo zw. C2D und C2Q liegen *chatt*

Oder aber sie verzichten plötzlich auf die doppelte Genauigkeit ... würde mich auch nicht wundern.

ciao

Alex

Travis hat ja gepostet das eine 9600GT ca. eine Minute brauche würde (wohl auf kosten der genauigkeit), d.h. in 10 Minuten würde die Karte 10 WUs schaffen, ein 3Ghz Quad schafft da derzeit gerade mal 4 WUs.
 
Läuft denn eigentlich der 9.5. (ich habe den 9.4. nicht zum laufen bekommen) unter Vista 64 ? *noahnung*
 
also bei mir läuft es mit dem 9.4er unter vista64, andere hab ich nicht getestet. [unter win2003server ging garnix 8-(]
 
Huhu

kurze Frage mal so mitten hier in rein:

Die rote Fehlermeldung in dem angehängten Bild. Bedeutet diese das ich pro CPU Kern nur 6 Work Units auf Lager haben darf und ich deswegen keine neuen bekomme?
Verzeit meine Unwissenheit, aber ich bin neu im MilkyWay Project.
Da das Project so wenige Units auspuckt hatte ich Hoffnung mir ein " Lager " anlegen zu können, aber scheinbar ist das ja bereits im Vorfeld unterbunden?

LG
Frank
 
Zuletzt bearbeitet:
Kurze Antwort: Ja. MW gibt pro Core nur 6 Wus heraus.
 
Nach ewig langem problemlosen Crunchen [nicht eine einzige WU wurde zerschossen, oder VPU-Recover] schrottet mein System nun jede MW-WU ???

Jetzt kommt der typische Satz: "Ich habe nichts getan"....nach längerem Überlegen kommt dann sowas wie: "..ja da wurden einige Windows-Updates eingepflegt..die letzten Tage", und "seit heute, nachdem ich das Windows6.0-KB948465-X64 [service pack 2 für vista 64] NICHT erfolgreich (aus ungenauen Gründen) installiert habe" funktioniert die MW-App nicht mehr.

Zum System: Vista 64 Sp1 [mit entfernten Sp2] und Catalyst 9.4 - HD4850

Fehlerbeschreibung:
http://milkyway.cs.rpi.edu/milkyway/result.php?resultid=73208711
Code:
<core_client_version>6.6.23</core_client_version>
<![CDATA[
<message>
Unzulässige Funktion. (0x1) - exit code 1 (0x1)
</message>
<stderr_txt>
Running Milkyway@home ATI GPU application version 0.19e by Gipsel
allowing 5 concurrent WUs per GPU
setting minimum kernel frequency to 30 Hz
CPU: Intel(R) Core(TM)2 Quad CPU    Q9650  @ 3.00GHz (4 cores/threads) 3.59982 GHz (245ms)

CAL Runtime: 1.4.255
Found 1 CAL device

Device 0: ATI Radeon HD 4800 (RV770) 512 MB local RAM (remote 1855 MB cached + 1855 MB uncached)
GPU core clock: 625 MHz, memory clock: 993 MHz
800 shader units organized in 10 SIMDs with 16 VLIW units (5-issue), wavefront size 64 threads
supporting double precision

0 WUs already running on GPU 0
Starting WU on GPU 0

main integral, 160 iterations
predicted runtime per iteration is 230 ms (33.3333 ms are allowed), dividing each iteration in 7 parts
borders of the domains at 0 232 464 688 920 1144 1376 1600
0 Kernel Execution : [COLOR="Red"]Failed to create Program[/COLOR]

</stderr_txt>
]]>

Die App läuft ca. 1 Sekunde und springt von 0% auf 100% mit Berechnungsfehler, ich tippe mal auf ein Fehlerhaftes laden der AMD-Dlls, wobei diese aber alle (mit amd und ati-Bezeichnung) vorhanden sind.

So wie gehts nun weiter?
 
Zuletzt bearbeitet:
Die App läuft ca. 1 Sekunde und springt von 0% auf 100% mit Berechnungsfehler, ich tippe mal auf ein Fehlerhaftes laden der AMD-Dlls, wobei diese aber alle (mit amd und ati-Bezeichnung) vorhanden sind.

So wie gehts nun weiter?
Naja das Logische wäre einfach mal den Treiber nochmal zu installieren ... (zuvor natürlich deinstallieren).

Was anderes würde mir nicht einfallen ..

ciao

Alex
 
Hi.

Nein es sind die 3s WU´s und nur bei GPU´s!

http://milkyway.cs.rpi.edu/milkyway/forum_thread.php?id=885#24161

Lg
Maxxx


Nach ewig langem problemlosen Crunchen [nicht eine einzige WU wurde zerschossen, oder VPU-Recover] schrottet mein System nun jede MW-WU ???

Jetzt kommt der typische Satz: "Ich habe nichts getan"....nach längerem Überlegen kommt dann sowas wie: "..ja da wurden einige Windows-Updates eingepflegt..die letzten Tage", und "seit heute, nachdem ich das Windows6.0-KB948465-X64 [service pack 2 für vista 64] NICHT erfolgreich (aus ungenauen Gründen) installiert habe" funktioniert die MW-App nicht mehr.

Zum System: Vista 64 Sp1 [mit entfernten Sp2] und Catalyst 9.4 - HD4850

Fehlerbeschreibung:
http://milkyway.cs.rpi.edu/milkyway/result.php?resultid=73208711
Code:
<core_client_version>6.6.23</core_client_version>
<![CDATA[
<message>
Unzulässige Funktion. (0x1) - exit code 1 (0x1)
</message>
<stderr_txt>
Running Milkyway@home ATI GPU application version 0.19e by Gipsel
allowing 5 concurrent WUs per GPU
setting minimum kernel frequency to 30 Hz
CPU: Intel(R) Core(TM)2 Quad CPU    Q9650  @ 3.00GHz (4 cores/threads) 3.59982 GHz (245ms)

CAL Runtime: 1.4.255
Found 1 CAL device

Device 0: ATI Radeon HD 4800 (RV770) 512 MB local RAM (remote 1855 MB cached + 1855 MB uncached)
GPU core clock: 625 MHz, memory clock: 993 MHz
800 shader units organized in 10 SIMDs with 16 VLIW units (5-issue), wavefront size 64 threads
supporting double precision

0 WUs already running on GPU 0
Starting WU on GPU 0

main integral, 160 iterations
predicted runtime per iteration is 230 ms (33.3333 ms are allowed), dividing each iteration in 7 parts
borders of the domains at 0 232 464 688 920 1144 1376 1600
0 Kernel Execution : [COLOR="Red"]Failed to create Program[/COLOR]

</stderr_txt>
]]>

Die App läuft ca. 1 Sekunde und springt von 0% auf 100% mit Berechnungsfehler, ich tippe mal auf ein Fehlerhaftes laden der AMD-Dlls, wobei diese aber alle (mit amd und ati-Bezeichnung) vorhanden sind.

So wie gehts nun weiter?
 
Jetzt läuft es wieder :o

Mittlerweile bin ich der Meinung das mit meinem System alles Ok ist, und das es an einer bestimmten WU-Serie liegen könnte.

Alle [laut Stichprobe] WUs der Serie ps_sgr_208_3s_1_10386_1244135898_0 werden geschrottet, die WUs der Serie ps_sgr_208_2s_1_2316_1244134635_0 laufen problemlos.

Könnte das einer mit einer ATI-Karte verifizieren? Danke.
.
EDIT :
.

@maxxx80

Danke, hab ich zu spät gesehen ;)
 
Ich habe das gleiche Problem auf einer HD4870, bereits seit gestern sind immer wieder WUs der Serie 3s mit Berechnungsfehler abgrbrochen, aber nach deren Abbruch werden die 2s auch nicht weitergerechnet. Erst nach einem Neustart laufen die Berechnungen der 2s wieder an.
 
Hmm, keine Ahnung was sich da für ein Bug eingeschlichen hat *noahnung*

Die ps_208_3s WUs rechnen mit 3 Streams und nicht mehr nur mit einem oder zwei. Die GPU-App sollte das eigentlich können, aber das wurde mangels passender WU nie getestet. Was noch eigenartiger ist, die Fehlermeldung sieht danach aus, als wenn der CAL-Compiler das erst gar nicht übersetzt bekommt (z.B. wegen Syntax-Fehler im IL-Code für die GPU). Das habe ich eigentlich aber getestet. Werde ich mir wohl mal morgen anschauen müssen. Tut mir leid für die Probleme :-/

Edit:
Irgendwie ist das schon zu spät, habe keinen Plan, woran es liegt. Sieht eigentlich alles gut aus und schmiert nur ab, wenn der Integrationskernel für 3 Streams aufgerufen wird (der aber offline ordnungsgemäß kompiliert wird). Na dann eben morgen (heute).

Edit2:
Als Notlösung gab es aber eine Vorabversion von 0.19f. Die blockiert zumindest nicht mehr weitere WUs, wenn eine ps_sgr_208_3s abschmiert. Daß das passiert ist, war auch ein Bug, allerdings ein sehr einfach zu behebender ;)
Übrigens meldet die App jetzt die GPU-Zeit als offizielle WU-Zeit zurück.

Edit3:
So, Fehler gefunden. Darf ich gar nicht sagen, wie blöd der war. Schnell noch die Ergebnisse getestet, sieht aber soweit gut aus.
 
Zuletzt bearbeitet:
Sieht so aus, als wenn das Problem wirklich gefixed ist. Bei mir laufen die WUs durch.
Die Version 0.19f steht zum Download bereit.

Changelog:

0.19f: 5th Jun 2009
- fixed support for WUs with three streams

0.19f.b: 4th Jun 2009
- does not block other WUs from running when one WU (gracefully) crashes

0.19f.a: 8th Apr 2009
- output of GPU time instead of CPU time as "official" time for the WU
- not public
 
Zuletzt bearbeitet:
Bei mir laufen die WUs auf der 4870 ohne abzuschmieren, leider stellt sich kein Fortschritt ein. Sprich selbst nach 1 Stunde steht da noch 0 % ^^

Ich probiere mal eben die 19f Version.
 
Bei mir laufen die WUs auf der 4870 ohne abzuschmieren, leider stellt sich kein Fortschritt ein. Sprich selbst nach 1 Stunde steht da noch 0 % ^^

Ich probiere mal eben die 19f Version.
Das ist eher das Symptom, daß eine abgeschmierte ps_sgr_208_3s WU die GPU nicht ordnungsgemäß wieder freigibt und somit alle nachfolgenden WUs blockiert. Das hat schon die Version von letzter Nacht behoben. Mit der aktuellen 0.19f sollten jetzt alle WUs laufen.
 
Auch die ps_sgr_208_3s WUs laufen (habe jetzt nur eine auf einer 3870 gefunden):
task details schrieb:
Name ps_sgr_208_3s_2_351455_1244210061_0
Created 5 Jun 2009 13:54:23 UTC
Sent 5 Jun 2009 13:56:55 UTC
Received 5 Jun 2009 15:17:13 UTC
Server state Over
Outcome Success
Client state Done
Exit status 0 (0x0)
Report deadline 8 Jun 2009 13:56:55 UTC
CPU time 98.35938
stderr out <core_client_version>6.2.19</core_client_version>
<![CDATA[
<stderr_txt>
Running Milkyway@home ATI GPU application version 0.19f by Gipsel
allowing 2 concurrent WUs per GPU
CPU: AMD Phenom(tm) 9750 Quad-Core Processor (4 cores/threads) 2.49599 GHz (145ms)

CAL Runtime: 1.3.145
Found 1 CAL device

Device 0: ATI Radeon HD 3800 (RV670) 512 MB local RAM (remote 28 MB cached + 512 MB uncached)
GPU core clock: 860 MHz, memory clock: 720 MHz
320 shader units organized in 4 SIMDs with 16 VLIW units (5-issue), wavefront size 64 threads
supporting double precision

2 WUs already running on GPU 0
No free GPU! Waiting ... 86.6406 seconds.
Starting WU on GPU 0

main integral, 160 iterations
predicted runtime per iteration is 417 ms (33.3333 ms are allowed), dividing each iteration in 13 parts
borders of the domains at 0 128 248 376 496 616 744 864 984 1112 1232 1360 1480 1600
Calculated about 4.94771e+012 floatingpoint ops on GPU, 6.34181e+007 on FPU. Approximate GPU time 98.3594 seconds.

probability calculation (stars)
Calculated about 9.673e+008 floatingpoint ops on FPU.

WU completed.
CPU time: 11.4063 seconds, GPU time: 98.3594 seconds, wall clock time: 278.053 seconds, CPU frequency: 2.49609 GHz

</stderr_txt>
]]>

Validate state Valid
Claimed credit 0.48544887776653
Granted credit 37.115095
application version 0.19
 
Zurück
Oben Unten