Optimierte MilkyWay@home Applikation

Habe mal die Seiten von WCG und POEM verglichen, nachdem ich auch Spinhenge dazugenommen habe ging mir ein Licht auf. :]
Die Verantworlichen haben sich sicher was dabei gedacht, als sie nicht mit ihrem System gebrochen haben.

Auf deiner wirklich guten Statspage ist sie nicht, weil du keine Lust hast WCG einzubinden?
Allerdings muss ich sagen, dass mir die 12-stündliche Aktualisierung auf worldcommunitygrid.org genügt. Für die "Trends" schaue ich auf bioncstats.com.

Nun ist es von meiner Seite genug offtopic im Opt-Apps-Thema gewesen. *hust*

öhm nö, wcg läßt sich nicht so wie die anderen projekte einbinden (rpc fehlt), man müßte entweden deren seiten parsen (was absolut umständlich und ineffizient wäre) oder eben das 12h export einbinden. beides macht einfach zu viel arbeit wobei letzteres vom aufwand her gehen würde nur was nützen 12h alte daten.. da können wir ja auch herkömmliche statsseiten verwenden.
 
Ach ja: Twodee, deine SSE2 App ist auf meinem eee (mit Sellerie 900) um einiges langsamer als die alte von Gipsel. Wars eine Gipsel? War es überhaupt eine? Ich weiss es nicht mehr... Auf jeden Fall ist deine aus dem 18er Paket langsamer als *irgendeine* davor.:P

*chatt*

Edit: Oder hab ich nur wieder mal vergessen, den Takt auf 900 zu stellen?! Oh Mann...
 
Zuletzt bearbeitet:
18.12.2008 14:54:00|Milkyway@home|Scheduler request completed: got 31 new tasks

18.12.2008 15:37:09|Milkyway@home|Scheduler request completed: got 31 new tasks

18.12.2008 16:21:03|Milkyway@home|Scheduler request completed: got 31 new tasks


zur info: hatte vorher nur 3 core auf Milkyway laufen

Moin
habe gerade mal ein wenig getestet und festgestellt wenn der Task duration cor. factor unter 0,02 sinkt beginnt er alle wus auf einmal hoch und runter zu laden *chatt*


Edit: was bei nen C2 ca. 300 sec sind
 
Ach ja: Twodee, deine SSE2 App ist auf meinem eee (mit Sellerie 900) um einiges langsamer als die alte von Gipsel. Wars eine Gipsel? War es überhaupt eine? Ich weiss es nicht mehr... Auf jeden Fall ist deine aus dem 18er Paket langsamer als *irgendeine* davor.:P

*chatt*

Edit: Oder hab ich nur wieder mal vergessen, den Takt auf 900 zu stellen?! Oh Mann...

;) die erste App war auch von mir, allerdings war das eine nicht-amd-kompatible version.
 
Das dumme ist, dass die Ergebnisse bei MW ja nur sehr kurz einsehbar sind. Ich konnte lediglich die einsehen, die ich noch mit 900MHz rechnete, dann die den heutigen Tag über mit 630MHz gerechnet wurden und jetzt halt wieder die 900er...

Ist aber auch egal, ob da die eine oder andere schneller ist oder nicht, mehr als Spielkram ist das mit dem eee eh nicht. ;)

Hier ist er, der kleine.
 
Das dumme ist, dass die Ergebnisse bei MW ja nur sehr kurz einsehbar sind. Ich konnte lediglich die einsehen, die ich noch mit 900MHz rechnete, dann die den heutigen Tag über mit 630MHz gerechnet wurden und jetzt halt wieder die 900er...

Ist aber auch egal, ob da die eine oder andere schneller ist oder nicht, mehr als Spielkram ist das mit dem eee eh nicht. ;)

Hier ist er, der kleine.

Du kannst mit ihm immerhin 2000 Credits pro Tag schaffen, oder gelten die Zeiten mit HT, dann wären es gleich 4000 Credits ;)
 
[MTB]JackTheRipper;3813072 schrieb:
Du kannst mit ihm immerhin 2000 Credits pro Tag schaffen, oder gelten die Zeiten mit HT, dann wären es gleich 4000 Credits ;)

Ein Celeron mit HT *suspect* Wäre mir neu :w_grins:
 
Ups, dachte irgendwie automatisch an nen Atom... sorry ;)
 
Ey!

Redet mir nicht den Sellerie schlecht! :[

Ansonsten: Ich hab' das nicht so mit den PPD oder den Milestones oder oder oder...

Die optimierten Clients rechne ich auf dem eee nur, um mal zu zeigen was möglich wäre. Das ist bei MW ja zumindest teilweise angekommen, nur wie man sieht, ist noch erheblich mehr möglich.

Dazu muss ich sagen, dass ich diese Ergebnisse gar nicht vom Projekt verlange, da Gipsel und TwoDee ja nun wirklich fast für jede CPU eine optimale App bringen. Für ein Projekt wäre das eine Nummer zu viel verlangt.

Apropos optimale WU für jede CPU: Ich hoffe ja immer noch auf eine 3DNow! App. :w_feiern:
 
Ey!

Redet mir nicht den Sellerie schlecht! :[

Ansonsten: Ich hab' das nicht so mit den PPD oder den Milestones oder oder oder...

Die optimierten Clients rechne ich auf dem eee nur, um mal zu zeigen was möglich wäre. Das ist bei MW ja zumindest teilweise angekommen, nur wie man sieht, ist noch erheblich mehr möglich.

Dazu muss ich sagen, dass ich diese Ergebnisse gar nicht vom Projekt verlange, da Gipsel und TwoDee ja nun wirklich fast für jede CPU eine optimale App bringen. Für ein Projekt wäre das eine Nummer zu viel verlangt.

Apropos optimale WU für jede CPU: Ich hoffe ja immer noch auf eine 3DNow! App. :w_feiern:
*chatt* scho kom was hast du denn gegen den atom :w_zipfel: ?

...

Mhm zu 3DNow! , was kannes eigentlich? Nutzt es was für MW, bin da garnicht informiert.
 
Naja, wenn einige (ich eingeschlossen) sagen, dass der Celeron eigentlich kein Prozessor sondern eher ein Kurtschluß ist, der dem Mainboard das arbeiten ermöglicht, ...was ist dann ein Atom?!*suspect*

3DNow!? Vektor, Gleitkomma...

Mehr als die Worte sagen kann ich nicht, deren Inhalt ist mir fremd.:w_grins:
 
Naja, wenn einige (ich eingeschlossen) sagen, dass der Celeron eigentlich kein Prozessor sondern eher ein Kurtschluß ist, der dem Mainboard das arbeiten ermöglicht, ...was ist dann ein Atom?!*suspect*

3DNow!? Vektor, Gleitkomma...

Mehr als die Worte sagen kann ich nicht, deren Inhalt ist mir fremd.:w_grins:
Der Spruch ist gut, muss ich mir merken :w_zipfel:

ich hänge bereits an den 3DNow! Intrinsics:

* _m_femms
* _m_from_float
* _m_pavgusb
* _m_pf2id
* _m_pf2iw
* _m_pfacc
* _m_pfadd
* _m_pfcmpeq
* _m_pfcmpge
* _m_pfcmpgt
* _m_pfmax
* _m_pfmin
* _m_pfmul
* _m_pfnacc
* _m_pfpnacc
* _m_pfrcp
* _m_pfrcpit1
* _m_pfrcpit2
* _m_pfrsqit1
* _m_pfrsqrt
* _m_pfsub
* _m_pfsubr
* _m_pi2fd
* _m_pi2fw
* _m_pmulhrw
* _m_prefetch
* _m_prefetchw
* _m_pswapd
* _m_to_float

da gibts einiges, und vorallem brauchbares, nur schimpft mir mein intelcompiler noch ;D
 
da gibts einiges, und vorallem brauchbares, nur schimpft mir mein intelcompiler noch ;D

Ich bin sicher du schaffst das *great*

Eine 3DNow! Version wäre nun wirklich die Krönung :w_grins:

Eine optiemierte für meine beiden PPC Macs wäre ja auch mal toll, die können Altivec ;D
 
Der Intelcompiler kann 3DNow!:w_verwirrt:
nein eben nicht ;D - er tut so als würde er es nicht kennen, obwohl ich eine wrapper-classe von ms verwende. hmpf. evtl muss ich auf diesen verzichten und die ganze drumherum-beschleunigung wegfallen lassen. übrig bleibt eine version, welche per ms-compiler übersetzt ist und mit 3dnow-Intrinsics ausgestattet ist, ähnlich wie meine erste echte SSE2 App.

aber das kann dauern :(
.
EDIT :
.

Ich bin sicher du schaffst das *great*

Eine 3DNow! Version wäre nun wirklich die Krönung :w_grins:

Eine optiemierte für meine beiden PPC Macs wäre ja auch mal toll, die können Altivec ;D

wird aber leider heute nix mehr, um 12:00 ist weihnachtsabschlussessen und danach bin ich im einkaufsstress. aber am WE siehts evtl gut aus, vorallem interessiert mich das jetzt.
das nächste prob ist, das ich derzeit keine amd-kiste mit entwicklungsumgebung im einsatz habe, kann ja 3dnow schlecht auf intel-kisten testen :]
[aber ich hab ja noch so ein phenom1-node rumstehen ;D]
 
Zuletzt bearbeitet:
das nächste pro ist, das derzeit keine amd-kiste mit entwicklungsumgebung im einsatz habe, kann ja 3dnow schlecht auf intel-kisten testen :]
[aber ich hab ja noch so ein phenom1-node rumstehen ;D]
Zum Testen hätte ich ein K6-2 System hier mit dem originalen 3DNow! Befehlssatz (kein Enhanced 3DNow! wie es im Athlon eingesetzt wurde, kein 3DNow! mit ein paar zusätzlichen Befehlen von Enhanced 3DNow! wie in den Plus-Versionen K6-2+/III+). Wenn Du also wissen willst ob's geht, immer her damit :)
 
Zum Testen hätte ich ein K6-2 System hier mit dem originalen 3DNow! Befehlssatz (kein Enhanced 3DNow! wie es im Athlon eingesetzt wurde, kein 3DNow! mit ein paar zusätzlichen Befehlen von Enhanced 3DNow! wie in den Plus-Versionen K6-2+/III+). Wenn Du also wissen willst ob's geht, immer her damit :)

Bedeutet enhanced und dieses 3DNow!+ nicht nur, dass MMX integriert ist, oder gibt es da noch andere Erweiterungen?
 
Bedeutet enhanced und dieses 3DNow!+ nicht nur, dass MMX integriert ist, oder gibt es da noch andere Erweiterungen?
MMX ist sowieso immer integriert bei 3DNow!. 3DNow! basiert auf den acht MMX-Registern. Nur war MMX lediglich eine Ganzzahl-SIMD Einheit, während 3DNow! auch mit Fließkommazahlen umgehen konnte.

Enhanced 3DNow! bzw. 3DNow!+ bedeutet einfach nur, dass ein paar Befehle dazu gekommen sind ggü. dem ursprünglichen 3DNow! Befehlsatz: 5 3DNow! Befehle und satte 19 MMX-Befehle extra gab's für den Athlon, während die Plus-Versionen des K6 nur die zusätzlichen 5 3DNow! Befehle spendiert bekamen.
 
neue Apps gibts von mir heute nicht mehr, finde nix mehr zum quetschen.
Habe ja schon vor ein paar Tagen gesagt, daß bald Ende ist. Ohne daß MW grundlegend am Algo bastelt, ist nicht mehr viel drin, würde ich sagen. Selbst mit handgetuntem SSEx ist nicht viel zu holen, die hot loops bekommt auch der Compiler ganz gut vektorisiert. An dessen Einstellungen habe ich jetzt noch ein wenig Feintuning betrieben (jetzt vektorisiert er auch nur mit SSE2, sprich das ist jetzt auch bei mir praktisch gleichschnell wie SSE3+).
Als vorläufigen Abschluß von meiner Seite noch ein paar Performancewerte für die jeweils schnellste Version:

Code:
[FONT="Courier New"]        CPU                Zeit für WU in s   hochgerechnet auf 3.2GHz
-----------------------------------------------------------------------
C2D 8400 @ 3.0GHz (45nm)        242                   227
C2D 6320 @ 1.86GHz (65nm)       510                   297
Phenom X4 9750 @ 2.57GHz        356                   286
Core i7 920@3.6GHz (HT)         286                   322  [b](8 Threads!)[/b]
Athlon X2 4600+ @ 3.09GHz       417                   403[/FONT]

Ich denke, damit liegen zumindest bei den Core2 und Phenoms die Werte von Twodees und meiner Version in der gleichen Region. Für die X2s oder die CPUs ohne SSE2 könnte die entsprechende handoptimierte Version von Twodee schneller sein, da habe ich nicht so den Überblick. Falls noch Bedarf besteht, kann ich die auch verlinken, falls irgendwem Twodees Versionen nicht genügen :]

PS: Da das Thema in einem anderen Thread aufgeworfen wurde, selbst mit dem Kompilat für exakt eine SSE-Version werden bei bestimmten Funktionen (z.B. exp) trotzdem je nach benutztem Prozessor verschiedene Varianten ausgeführt. Das müßte man noch mal rauspatchen oder irgendwie umgehen, damit jede CPU wirklich die gleichen Mittel zur Verfügung hat. Oder man bastelt sich gleich sein eigenes exp (hat Twodee wohl schon gemacht).
 
AMD X2 Dual 5200+
Vista 32 Bit
SSE3

501 sec
483 sec
502 sec
509 sec
479 sec
498 sec


21.12.2008 12:47:30||[error] Proposed work request 3761781.822401 bigger than max 1047168.000000 *noahnung*
 
Zuletzt bearbeitet:
@twodee eine frage Kann man nicht den freihen compiler verwenden wo nicht von intel programiert wurde?

Hat er bei AMD vor bzw nachteile gegenüber Intelcompiler:w_verwirrt:
Bin da nicht auf dem laufenden stand.
Und soweit ich weis wirt ja von Intelcompiler kein SSE4a befehlsatz unterstützt nur der SSE4.1 von intel der bin ich da auf einem verkerten trip?
 
Zurück
Oben Unten