Seti und Athlon64 mit SSE2 - 2. Versuch

Nero24 schrieb:
@JoJo4u

falls die 4.19er sources noch verfügbar sind, dann wäre es super, wenn Du die mal optimiert kompilieren könntest. Die liefert nämlich "ab Werk" schon wesentlich höhere Werte, als 4.25 oder 4.27 :o Siehe hier:
http://www.planet3dnow.de/vbulletin/showthread.php?p=2215007#post2215007

Ansonsten: wenn Du wie oben angekündigt den seti-A64-SSE3 client und den AthlonXP client compiliert hast, sollten wir nochmal eine große Newsmeldung hinterher schicken mit den Binaries by JoJo4u :D Die Nachfrage scheint ja da zu sein :)
 
strike41 schrieb:
interessant für uns wäre eine Version für einen normalen Athlon XP mit SSE :)

Die bietet TMR ja schon.

Nero24 schrieb:
Ansonsten: wenn Du wie oben angekündigt den seti-A64-SSE3 client und den AthlonXP client compiliert hast, sollten wir nochmal eine große Newsmeldung hinterher schicken mit den Binaries by JoJo4u :D Die Nachfrage scheint ja da zu sein :)

Nun meine sind auch nur mit der Evalution-Version kompiliert. Ab dem 9.6. sollten sie strengenommen nicht mehr verwendet werden. Wenigtens ist das .NET Studio legal ;) Davor möchte ich aber noch sichergehen dass die Ergebnisse korrekt sind. Siehe http://www.planet3dnow.de/vbulletin/showthread.php?p=2220142#post2220142
 
Hi

Ist die boinc.exe auf nem XP lauffähig???
Gibt ja eigentlich kein 64Bit Boinc.

greetz Mike
 
Jojo4u schrieb:
So nachdem der seti/boinc client jetzt scheinbar rund läuft, wird es Zeit auch die Whetstone/Dhrystone zu erhöhen, sonst kommt am Ende ein kleinerer Claimned Score raus (so weit ich das verstehe). Btw, wäre es für den Score nicht am besten, man compiliert einen arschlahmen SETI und einen sauschnellen BOINC?

Dafür gibt es 3 Versionen, einmal V8.1.024 und dann V8.1.026 mit jeweils /G6 bzw /G7. Beide sind mit /QxW nach SSE2 optimiert. Bitte mal beide gegenüber dem TMR-P3 ausprobieren.

Ich habe auch eine entsprechende Version des Boinc-Managers sowie des Screensavers beigelegt, falls jemand darauf Wert legt.

http://home.arcor.de/jojo4ubin/seti/boinc_4.27_windows_jo-athlon64-sse2_package_1205-1.rar
http://home.arcor.de/jojo4ubin/seti/boinc_4.27_windows_jo-athlon64-sse2_package_1205-2.rar
http://home.arcor.de/jojo4ubin/seti/boinc_4.27_windows_jo-athlon64-sse2_package_1205-3.rar

also ich habe es zwar nicht 100% verstanden mit seti langsam machen und boinc schnell, aber eins hab ich auch bemerkt

und zwar das ich mit dem optimierten P3 clienten weniger credits pro wu bekomme o_O
darf ich fragen warum ????
 
HansD schrieb:
also ich habe es zwar nicht 100% verstanden mit seti langsam machen und boinc schnell, aber eins hab ich auch bemerkt

und zwar das ich mit dem optimierten P3 clienten weniger credits pro wu bekomme o_O
darf ich fragen warum ????

http://boinc.berkeley.edu/credit.php
"In general, the claimed credit is the result's CPU time multiplied by the CPU benchmarks as measured by the BOINC software."
 
danke ^^

naja bei mir waren nur die Granted credits auch weniger ^^''
e
gal hab die 4,19 mit deinem clienten mal laufen ^_^
 
Ich bin gerade auf den 3. Thread auf http://setiweb.ssl.berkeley.edu/ gestoßen... Kann mal jemand bitte dahinposten dass die Version auch nur evalution ist? Ich habe nicht genügend Credits um da zu posten....

Ansonsten ist das mit dem SSE3 nicht so einfach, weil der Intel Compiler bei main()-Methoden eine Prozessorabfrage einbaut. Bis jetzt gibt es 3 Lösungswege:
1. Patchen, wobei ich noch gar nicht weiß wie das geht und im Web finden sich nur spräliche Infos. Ich hab mal den Andreas Stiller von der C't angeschrieben, denn der hat es schon gemacht.
2. Alle Sourcedateien mit einer main() werden nur nach SSE optimiert. Das erscheint mir ein ziemliches Gefrickel.
3. Man ändert die CPUID seiner CPU zumindest gegenüber dem Programm. Das erscheint mir ziemlich radikal

Ich warte mal auf Andreas. Hat ja außerdem noch Zeit - denn wer hat heute schon ein E4-Stepping?
 
@Jojo4u: ich habe jetzt mal alle Benchmarks-Versionen bei mir getestet

zuerst deine drei Versionen

Version ---Whetstone/Dhrystone -------geschätzte Zeit------------ Credits ------> Credits pro Stunde
1) -----------2823/4394-------------------------2:44-----------------------------41,32 --------> 15,11 Credits/h
2) -----------2850/4788-------------------------2:43-----------------------------43,31 --------> 15,94 Credtis/h
3) -----------2911/4567-------------------------2:40-----------------------------41,51 --------> 15,57 Credtis/h

hier die Boinc.exe von Tetsuji Maverick Rai
p3-sse2---2303/5502-------------------------3:22-----------------------------54,78 --------> 16,27 Credits/h

und am ende der Benchmark aus der Version 4.19
4.19--------2380/6513-------------------------3:13-----------------------------59,72 --------> 18,57 Credits/h


ciao
Zero
 
@Zero2Cool

Deine Werte bestätigen im Ungefähren das, was ich mit meinen Experimenten mit dem Athlon XP rausbekommen habe. Irgendwo ist bei mir noch eine Bremse bei den Whet/Dhrystones drin. Da bleib ich mal dran. Bei deinen Experimenten schnitt die mittlere von meinen am besten ab. Das ist die nach dem P3 optimierte Version (/G6) mit SSE2.
Bis jetzt fährt man wohl am besten, indem man die 4.19 mit meinem Clienten rennen lässt.
 
also ich hab deinen clienten mit dem 4.19 boinc jetztlaufen lassen und brauche mit meinem AMD 64 3000+ @2200 MHZ für ein WU so 1:30h. er hat jetzt schon 3 WUs fertig und das 4 ist bei 75 %. die die er hochgeladen hat werden aber bei mit nicht in der liste angezeigt auf der seti seite ???

Zero2Cool schrieb:
mich würde mal interessieren ob dieser A64 so stark übertaktet wurde und/oder ob das am Linux Client liegt.

http://setiweb.ssl.berkeley.edu/show_host_detail.php?hostid=828704

hmm meiner hat auch so rechenseiten von 5800 sec pro Wu geschafft wenn er ncihts zu tun hat, aber ich bekomme nicht so viele punkte wie er -_-
 
HansD schrieb:
also ich hab deinen clienten mit dem 4.19 boinc jetztlaufen lassen und brauche mit meinem AMD 64 3000+ @2200 MHZ für ein WU so 1:30h. er hat jetzt schon 3 WUs fertig und das 4 ist bei 75 %. die die er hochgeladen hat werden aber bei mit nicht in der liste angezeigt auf der seti seite ???

Wurde deinem PC vielleicht eine neue Host-ID zugewiesen?
Guck doch mal am Ende deiner Liste.

@Ulli: ich komme mit meinen 2565 Mhz auch nicht annährend in dessen Nähe.
Mich verwundert aber viel mehr, warum er soviele claimed credits bekommt.
Er benutzt aber eben einen Linux Client :-/
 
Hi
Ein langsamer Seti Klient gepaart mit einem sehr guten Benchmarkergebnis ergibt einen hohen claimed Credit, das ist soweit richtig :) Allerdings wird man dann immer das höchste Ergebnis haben, was so wie das niedrigste Ergebnis wegfällt. Bleiben schließlich wieder nur zwischen 20 und 40 Credits im Durchschnitt.

Die Benchmarkergebnisse sind bis Version 4.19 so hoch, weil ab Version 4.20 ein neues Benchmarksystem eingeführt wurde, was realistischere Ergebnisse liefern sollte. Ich meine, dass Intel mit HT da die meisten Vorteile von hatte.

@Nero
Die CPU ist nicht übertaktet oder? Ich hatte es bei meinem 2400+ @ 2.19ghz (Thoroughbred B -> 2h 35min), dass er bei der Benutzung der FFTW-Version Freezes produzierte. Lag ganz einfach daran, dass der schnellere Klient anspruchsvoller ist und somit die Vcore nicht mehr ganz gereicht hat. Schnell erhöht und alles lief rund.

mfg
aki
 
wenn ich mir so die Zeiten von meinem P4 3.2 angucke,

alt

http://setiweb.ssl.berkeley.edu/results.php?hostid=56765&offset=80

neu

http://setiweb.ssl.berkeley.edu/results.php?hostid=56765&offset=40

schon ein extremer Unterschied, danke an alle auch an

aki für seine linux clienten

und an

Jojo4u

für die Windows Version

und latürnich an Tetsuji Maverick Rai aus Japan

das was mich immer wieder überrascht, der Zusammenhalt der Seti Community, ob da wär aus Japan oder ... kommt, läuft alles super

NULL Probleme

wenn die Politik mal auch so einfach wäre...

mfg
Sir Ulli
 
aki schrieb:
@Nero
Die CPU ist nicht übertaktet oder? Ich hatte es bei meinem 2400+ @ 2.19ghz (Thoroughbred B -> 2h 35min), dass er bei der Benutzung der FFTW-Version Freezes produzierte. Lag ganz einfach daran, dass der schnellere Klient anspruchsvoller ist und somit die Vcore nicht mehr ganz gereicht hat. Schnell erhöht und alles lief rund.
Hi,

nein, die CPU ist nicht übertaktet. Auch die Speicher laufen auf Defaulttakt und -Timings. Primestabil ist er auch un F@H - bekannt als SEHR kritisches Programm in Sachen Stabilität - läuft auch durch. *noahnung*
 
Jojo4u schrieb:
Davor möchte ich aber noch sichergehen dass die Ergebnisse korrekt sind. Siehe http://www.planet3dnow.de/vbulletin/showthread.php?p=2220142#post2220142
Jetzt mal eine kurze Überlegungsfrage: können die Ergebnisse denn überhaupt absolut identisch sein, wenn man SSE/SSE2 statt FPU verwendet? SETI rechnet doch mit Float-Zahlen und diese werden auf dem PC - im Gegensatz zu Integers - nur als mehr oder minder grobe Näherung dargestellt. Allerdings ist die Näherung per FPU besser, als per SSE/SSE2. Die FPU verwendet bis zu 80 Bit Genauigkeit, SSE/SSE2 nur 64-Bit Genauigkeit.

Habe gerade ein FC (Filecompare) mit den result.sah Deines Referenz-Results und des Results der 686-SSE-Version gemacht. Da kommt dann sowas dabei raus:

***** reference_result.sah
<spike>
<peak_power>23.145072937012</peak_power>
<mean_power>1</mean_power>
***** SSE_RESULT.SAH
<spike>
<peak_power>23.144975662231</peak_power>
<mean_power>1</mean_power>
*****

***** reference_result.sah
<spike>
<peak_power>22.104446411133</peak_power>
<mean_power>1</mean_power>
***** SSE_RESULT.SAH
<spike>
<peak_power>22.10440826416</peak_power>
<mean_power>1</mean_power>
*****

***** reference_result.sah
<spike>
<peak_power>23.335069656372</peak_power>
<mean_power>1</mean_power>
***** SSE_RESULT.SAH
<spike>
<peak_power>23.335023880005</peak_power>
<mean_power>1</mean_power>
Hier noch ein paar Vergleiche zwischen Referenz und A64-SSE2:
***** reference_result.sah
<spike>
<peak_power>23.145072937012</peak_power>
<mean_power>1</mean_power>
***** SSE2_RESULT.SAH
<spike>
<peak_power>23.144973754883</peak_power>
<mean_power>1</mean_power>
*****

***** reference_result.sah
<spike>
<peak_power>22.104446411133</peak_power>
<mean_power>1</mean_power>
***** SSE2_RESULT.SAH
<spike>
<peak_power>22.104421615601</peak_power>
<mean_power>1</mean_power>
*****

***** reference_result.sah
<spike>
<peak_power>23.335069656372</peak_power>
<mean_power>1</mean_power>
***** SSE2_RESULT.SAH
<spike>
<peak_power>23.335031509399</peak_power>
<mean_power>1</mean_power>
*****
Die Frage ist doch, ob sich SETI mit 64-Bit Genauigkeit zufrieden gibt?! Wie sieht das denn bei den anderen Rechnerarchitekturen aus? Rechnen die mit 64-Bit oder mit 80-Bit Floatgenauigkeit? Offensichtlich sind die Ergebnisse aber genau genug, denn Berkeley wertet meine WUs ganz normal, nachdem sie mit den Ergebnissen der beiden anderen Teilnehmer verglichen wurden, die die selbe WU gerechnet haben.
 
ich weiß jetzt grad nicht es stand, aber es gibt bestimmte Toleranzen.
Wenn die Werte noch in der Toleranz sind, sollte die WU ohne Probleme angenommen werden.

Aber im großen und ganzen sollte Berkeley ja selber entscheiden ob zwei WUs annährend identisch sind..
 
Zero2Cool schrieb:
Aber im großen und ganzen sollte Berkeley ja selber entscheiden ob zwei WUs annährend identisch sind..
Na, das ist schon klar. Mir geht es nur darum, dass wir nicht wochenlang Zeit und Strom investieren, um so ungenaue Ergebnisse abzuliefern, dass Berkeley sie nicht zählt bzw. nicht verwenden kann. Aber offensichtlich tun sie es. Trotzdem kann es nicht schaden, eine Auge darauf zu haben, ob sich Client-Errors in der Wertungsliste des eigenen Accounts häufen.
 
Nero24 schrieb:
Trotzdem kann es nicht schaden, eine Auge darauf zu haben, ob sich Client-Errors in der Wertungsliste des eigenen Accounts häufen.

Da hast du natürlich Recht.
Bei den 4 Rechnern welche ich bisher mit optimierten Clients betreibe, konnte ich jedenfalls bisher noch keine Client-Error feststellen. Ich will hoffen das es auch so bleibt.
 
Ich weiß gar nicht ob es Sinn macht die Klienten mit SSE, SSE2 usw. zu kompilieren, denn ich meine, dass das vom Seti Code her gar nicht unterstützt wird. Nun weiß ich natürlich nicht wie sehr der Intel Compiler den Code ändert (vektorisiert), um diese Befehlssätze noch hinzuzufügen bzw. irgendwas auszutauschen.

Zu der Genauigkeit würde ich mal sagen, dass die Ergebnisse sowieso immer minimal unterschiedlich sind. Eventuell schon alleine durch andere Betriebssysteme, CPU-Typen oder durch Overclocking. Deshalb gibt es ja die Toleranzen :) Sonst dürfte nur eine 100%ig Übereinstimmung gezählt werden.

Solange der Server die Units für gut befindet mache ich mir keine Gedanken. Es wurde ja auch noch keine Unit als invalid markiert, also kann eine eventuelle Abweichung gar nicht so groß sein.
 
So, hier meine neuesten BOINC Kreationen. Leider nur der 4.27 Client, für den 4.19 ist heute keine Zeit mehr. Kommt aber noch.
Der Witz an der Sache war, dass man die Optimierungen von /O3 auf /O2 und die Platform-Optimierung von /G6 auf /G5 zurückstellen muss. SSE ausschalten war bei mir auch ein wenig schneller. Ich habe aber mal zum testen für euch im 2. Paket SSE2 aktiviert.

http://home.arcor.de/jojo4ubin/seti/boinc_4.27_windows_jo-Pentium_package_1305-1.rar
http://home.arcor.de/jojo4ubin/seti/boinc_4.27_windows_jo-athlon64-sse2_package_1205-4.rar

Bezüglich der Optimierungen vom Intel Compiler zu SSE2/3: Wenn er durchläuft, sieht man öfter man so etwas wie "loop was vectorized". Im SETI-Forum hatte allerdings einer berichtet, dass auf seinem Prescott kein Unterschied zwischen SSE2 und SSE3 feststellbar war.

Andreas Stiller hat übrigens geantwortet: Es ist ein einfaches Ersetzen im der exe, aber er wollte nicht mit Details rausrücken - Betriebsgeheimnis ;)
 
Zero2Cool schrieb:
@Jojo4u: ich habe jetzt mal alle Benchmarks-Versionen bei mir getestet

zuerst deine drei Versionen

Version ---Whetstone/Dhrystone -------geschätzte Zeit------------ Credits ------> Credits pro Stunde
1) -----------2823/4394-------------------------2:44-----------------------------41,32 --------> 15,11 Credits/h
2) -----------2850/4788-------------------------2:43-----------------------------43,31 --------> 15,94 Credtis/h
3) -----------2911/4567-------------------------2:40-----------------------------41,51 --------> 15,57 Credtis/h

hier die Boinc.exe von Tetsuji Maverick Rai
p3-sse2---2303/5502-------------------------3:22-----------------------------54,78 --------> 16,27 Credits/h

und am ende der Benchmark aus der Version 4.19
4.19--------2380/6513-------------------------3:13-----------------------------59,72 --------> 18,57 Credits/h


ciao
Zero


ja ähnliche Ergebnisse, da ich ja zum testen gezwungen wurde

http://www.planet3dnow.de/vbulletin/showthread.php?t=218823

mit BOINC 4,19 und dem optimierten Client von Jojo4u

--- - 2005-05-14 19:45:58 - Running CPU benchmarks
--- - 2005-05-14 19:46:59 - Benchmark results:
--- - 2005-05-14 19:46:59 - Number of CPUs: 1
--- - 2005-05-14 19:46:59 - 1945 double precision MIPS (Whetstone) per CPU
--- - 2005-05-14 19:46:59 - 5334 integer MIPS (Dhrystone) per CPU

mit meinem Athlon 3.200+

mfg
Sir Ulli
 
Zurück
Oben Unten