Optimierte MilkyWay@home Applikation

Hier mal meine Vergleichswerte StandardApp 0.7 : Optimierte App 0.7

T9500: vorher ca. 3300s/WU
jetzt ca. 1045s/WU

E6400: vorher ca. 4080s/WU
jetzt ca. 1320s/WU

Die Werte für den Q6600 poste ich wenn ich daheim bin und die App ausgetausch hab.

Aber das ist immer noch eine Beschleunigung um den Faktor 3 für meine Kisten.
 
Irgendwer (Crunch3r :]) macht schon sowas Ähnliches. Die WUs werden da ziemlich fix berechnet. Und ob die 64 CPUs in dem System stimmen, zweifle ich doch mal glatt an. Da sind also noch massig Reserven.
Du hast nicht zufällig ein makefile für mich für die linux kompilierung?
configure, make und make install kann ich nämlich noch in die konsole tippen, alles andere ist noch "neu" für mich ;)

edit.
ach quatsch, brauch ich ja noch gar nicht solange ich nicht die "optimierten" quellen habe.
 
Zuletzt bearbeitet:
Irgendwer (Crunch3r :]) macht schon sowas Ähnliches. Die WUs werden da ziemlich fix berechnet. Und ob die 64 CPUs in dem System stimmen, zweifle ich doch mal glatt an. Da sind also noch massig Reserven.

Da hat sich einer nen BOINC-Client selbst kompiliert und schon hat man 64 CPUs...
Ansonsten kauft keine Firma ne Büchse mit 64CPUs und nur 16GB RAM. Statt einem Viertel der CPUs ist da eher 4x soviel angesagt...
 
Athlon 64 4000+ @ 2640 mhz braucht ~970 Sekunden und bekommt 29 Credits.
SSE2-App

Hmm, mein C2D E6300@2800mhz braucht 1170 Sekunden und bekommt 35,5 Credits.
Bin grad nicht sicher ob ich die SSE2-App schon drauf habe oder nicht. Was meint ihr?
 
mein Q6600 auf 2,4GHz braucht 1.173sec für eine Wu und bekommt 35pkt.
Ein Phenom X4 @ 2.57GHz benötigt etwa 900s exakt 885s und bekommt dementsprechend weniger credits. Das Limit läßt mal wieder grüßen.

@Twodee: Siehst Du was ich damit meinte, daß AMDs hier schneller sind? Keine Ahnung, warum das mit der 64Bit stock-App anders war *noahnung* Bei Deiner Version sind die 45nm Core2 aber eine ganze Ecke schneller als die 65nm Teile. Eine Ahnung, woran das liegt?
 
Zuletzt bearbeitet:
Schön das es bei euch geht. Mir zerballert er jede WU noch vor dem Download und nun hab ich die Daily Quota von 220 überschritten *rofl*
 
Schön das es bei euch geht. Mir zerballert er jede WU noch vor dem Download und nun hab ich die Daily Quota von 220 überschritten *rofl*
Dann versuche mal morgen BOINC wirklich komplett zu beenden, d.h. den Manager aus (auch im Tray beenden) und den BOINC-Service über Start -> Systemsteuerung -> Verwaltung -> Dienste beenden (falls Service- oder protected Installation). Dann die .exe und app_info.xml in das Milkyway-Verzeichnis kopieren (nichts umbenennen oder löschen!). Danach BOINC wieder starten. Der Manager sollte dann im Meldungsfenster irgendwas von "anonymous platform" erzählen und die alte .exe automatisch löschen.

Außerdem benutzt Du doch hoffentlich nicht die SSE2-Version auf einem AthlonXP oder so. Aber manchmal ist man ja irgendwie betriebsblind ;)
.
EDIT :
.

Ich bin ja mal gespannt, wann die anderen Teams das mitkriegen *suspect*
Twodees Version ist ja im Prinzip für jedermann verfügbar. Man muß nur den richtigen Link hier im Thread finden.
 
Ich bin ja mal gespannt, wann die anderen Teams das mitkriegen *suspect*
Twodees Version ist ja im Prinzip für jedermann verfügbar. Man muß nur den richtigen Link hier im Thread finden.
Wenn ich den Output der anderen richtig interpretiere war Crunch3r schneller beim Coden und die anderen beobachten entsprechend uns bzw. haben ihre eigenen Leute dran.

TAL9000
 
So ein modifizierter BOINC Client mit CPU Anzahl *= 16 hat aber auch was ;)
 
[MTB]JackTheRipper;3803145 schrieb:
So ein modifizierter BOINC Client mit CPU Anzahl *= 16 hat aber auch was ;)

Das ist kein Problem, wir hatten das im GPUGrid Thread mal, da gibt es in der normalen Boinc Version eine Möglichkeit das einzustellen.
.
EDIT :
.

Man erstellt einfach ein Datei Namens cc_config.xml im Boinc Verzeichnis.

Inhalt

<cc_config>
<options>
<report_results_immediately>1</report_results_immediately>
<max_file_xfers_per_project>8</max_file_xfers_per_project>
<max_file_xfers>16</max_file_xfers>
<ncpus>6</ncpus>
</options>
</cc_config>

Der Parameter "ncpus" gibt die Anzahl der Cores an :w_grins:
.
EDIT :
.

hmmm, stelle gerade fest das es mit dem 6.4.4 Client nicht geht, vielleicht haben die den Parameter wieder raus genommen :(
 
Hier noch mal wie versprochen die Werte für meinen Q6600:

Vorher: ca 3540s/WU
Jetzt: ca. 1130s/WU

Also auch über 3x schneller wie vorher.

Danke Twodee :)
 
Duron 900 6330 Sekunden, 40 Credits, Twodees non-SSE-App
Athlon XP @1150mhz (FSB100) 3900 Sekunden, 40 Credits, Twodees SSE-APP
 
Atom330 HT; XP64, SSE2-Vers.

nm_stripe86, 2,675.33sec, 41,09Credit

nm_stripe82, 5,010.92sec, 39.85Credit

cu JagDoc
 
hmm,
Northwood HT@3.06Ghz - 999sec - 30cr.
Phenom@2.05Ghz - 1130sec - 34cr.
X2@2.3@2,33Ghz - 1130sec - 34cr.

alle liefen mit der SSE2 version.

das der Northwood so schnell war irritiert mich ein wenig.
bisher war noch nie eine wu schneller fertig als auf den beiden anderen rechnern, trotz der mehr Ghz und zumal er ja kein echter mehrkerner ist.
das muss ich mal ein wenig beobachten und mit den verschiedenen versionen testen.

edit:
da muss was faul gewesen sein.
in den results ist die rede von 41cr grantet, die ich aber nicht bekommen habe.
leider quält sich der rechner noch mit ein paar simap rum und Poem und SL laufen ja auch noch mit.
noch so was komisches, das ist der einzige rechner der sich ausreichend mit SL wu eindeckt.
 
Zuletzt bearbeitet:
nm_stripe86_r8_9_1228808847_0_0 > 489sek
nm_stripe82_r8_75_1228808493_0_0 > 760sek
nm_stripe82_r8_79_1228808501_0_0 > 767sek
nm_stripe82_r8_80_1228808502_0_0 > 776sek

Auf einem X4 9550 @ Stock mit der SSE2 ;)
 
nm_stripe86_r8_9_1228808847_0_0 > 489sek
nm_stripe82_r8_75_1228808493_0_0 > 760sek
nm_stripe82_r8_79_1228808501_0_0 > 767sek
nm_stripe82_r8_80_1228808502_0_0 > 776sek

Auf einem X4 9550 @ Stock mit der SSE2 ;)
nicht schlecht ;)
.
EDIT :
.

Lädst Du's vielleicht aus Versehen als ASCII hoch statt als Binary? Passiert ja gerne mal aus Versehen bei FTP-Transfers ;)
mhm, die einstellungen stehen auf auto. ich tippe aber auch auf den ftp-client, hatte vorher einen anderen (testversion) und dieser lief.
 
setze mal deinen workbuffer auf 10 Tage, hast du auch noch andere projekte auf der maschine am start?
hab momentan noch WCG als backup laufen, aber auch deaktivieren bringt nix. den workbuffer hoch setzen funktioniert auch nicht, die meldung "Requesting XYZ seconds of work" geht dann zwar hoch, aber neue WUs gibts trotzdem nicht.
ich hab ihn jetzt einfach mal laufen lassen, und heute morgen hat er sich erstmal die standard-applikation und gleich ein paar WUs gezogen. momentan hat er zwar noch ein paar WUs auf "lager", aber inzwischen bekomme ich schon wieder eine ähnliche meldung:

09.12.2008 14:55:37|Milkyway@home|Sending scheduler request: To fetch work. Requesting 24258 seconds of work, reporting 0 completed tasks
09.12.2008 14:55:42|Milkyway@home|Scheduler request succeeded: got 0 new tasks
09.12.2008 14:55:42|Milkyway@home|Message from server: No work sent
09.12.2008 14:55:42|Milkyway@home|Message from server: (reached per-CPU limit of 8 tasks)

immerhin ist das limit jetzt schon bei 32 WUs, statt der 4 WUs gestern... :]

edit: jetzt hat er sich zwischenzeitlich mal wieder eine WU abgeholt. und jetzt weiß ich auch, was da passiert. scheinbar ist mein 2-tage-bunker schon zu groß, ich bekomme nämlich nicht mehr als 8 WUs pro core gleichzeitig, erst wenn ich eine WU abliefere, gibts wieder eine neue.
 
Zuletzt bearbeitet:
Ich habe jetzt ein paar Standardfunktionen (sin/cos/exp) durch SSE2-Routinen ersetzt und komme mit einem 3.2Ghz 45nm von 722 auf gut 500 Sekunden für die R6-WUs
 
Ich habe jetzt ein paar Standardfunktionen (sin/cos/exp) durch SSE2-Routinen ersetzt und komme mit einem 3.2Ghz 45nm von 722 auf gut 500 Sekunden für die R6-WUs
Vielleicht finde ich heute Abend mal Zeit mir das anzuschauen. Mal sehen, wo ich ohne solche Spielereien lande ;D

PS:
Eigentlich sollte nur exp was bringen. sin/cos werden ja nicht mehr so häufig aufgerufen, oder?
 
Ich habe jetzt ein paar Standardfunktionen (sin/cos/exp) durch SSE2-Routinen ersetzt und komme mit einem 3.2Ghz 45nm von 722 auf gut 500 Sekunden für die R6-WUs

Download? Link? :w_zipfel:
 
Zurück
Oben Unten