Projektnews Einstein@Home: New improved Gravitational Wave app & Happy New Year 2024 special

Wenns an der Bandbreite liegen sollte, die 4090 dürfte eigentlich genug haben. Aber egal.
Als ich die zweite Instanz wieder geschlossen hatte, hat sich die Hauptinstanz ein Herz gefasst und meine app_config akzeptiert und rechnet jetzt beides gleichzeitig. Hoffentlich kann ich ihr das wieder austreiben *chatt*
 
Danke fürs ausprobieren des Skriptes :-)
boinc-instancer.sh geht davon aus dass es selbst ausführbar ist, ich vermute das ist bei dir nicht der Fall.
 
Ich weiß, ich bin zu spät zu dieser Party, aber irgendwann musste ich die Dinger auch mal ausprobieren.

Verblüffende Erkenntnis:
Radeon VII (UC 1,55 GHz) gepaart mit 3950X --> 4 parallel (1 CPU + 0,25 GPU) --> Laufzeiten von teilweise bis zu 2 Stunden
RX 5700 XT (UC auf 1,77 GHz) gepaart mit 5950X --> 4 parallel (1 CPU + 0,25 GPU) --> Laufzeit von 1 h, teilweise etwas weniger

Mit 4 WU parallel krieg ich die VII kaum ausgelastet, die 5700XT aber schon. Weshalb RDNA so gut gegen Vega 20 performt, ist eine gute Frage...
- Performance der WUs stark von CPU abhängig --> Zen 3 soviel besser als Zen 2? (der 5950X läuft mit 3,3 GHz mit 28 Rosetta-Wuzen parallel, der 3950X läuft aber mit 3,5 - 3,6 GHz)
- O3AS liegt RDNA einfach besser
- Win vs Linux? 5700XT läuft auf Win, Radeon VII auf Linux MINT

Da die 5700XT mit 100 W vor sich hin läuft, werde ich die hin und wieder mal die Dinger rechnen lassen. Leider ist die Versorgung ja aktuell bescheiden. Aber eine knappe Mio. pro Tag auf der 5700XT mit 90 - 110 W ist aus meiner Sicht ein guter Deal.
 
Ich hab jetzt mal 3 Wochen mit den WUzen rumprobiert und folgende Erkenntnis für die Radeon Karten erlangt:

Die miese Performance der Radeon VII hängt nicht an der Karte selbst, sondern an einem CPU-Limit der WUzen. Die brauchen nämlich nicht einfach nur einen freien CPU-Kern, sondern am besten noch einen, der hoch taktet. Da meine CPUs immer schön andere Projekte rechnen, z. Z. viel Rosetta, wo der Takt allcore (mit SMT natürllich auch) ordentlich runtergeht, reicht ein niedrig taktender Kern nicht aus, um der GPU ausreichend Futter vorzukauen. Das gilt auch bei 3-4 WUzen parallel.

Der 5700XT hat es meistens gereicht, bei 3 WU auf der GPU 3 von 32 Kernen des 5950X zu kriegen. Hin und wieder waren aber auch WUzen dabei, wo die Laufzeit von 40 Min auf 2 h hochging. Insofern hat sich entgegen meinem Beitrag zuvor die 5700XT nicht gut ggü. der Radeon VII geschlagen, sondern die VII ist einfach in Compute deutlich stärker, dass sie nicht ordentlich von der CPU gefüttert wurde.

Habe den 3950X auf 50 % laufen lassen (12 WU Denis und 4 WU Einstein). Laufzeiten der Wuzen gingen von 2h auf 25 Minuten (!) runter (wie gesagt 4 parallel). Somit schafft die VII bei ausreichend Beistand durch CPU 2,4 Mio. Punkte am Tag. Meine 2 anderen VII und die eine Pro rechnen Meerkat und schaffen zusammen bisschen mehr als 3 Mio am tag.

Fürs nächste Einstein Race sollten daher die ganzen VII Besitzer auf O3AS gehen, und die CPU nicht extrem mit anderem Gedöns auslasten. Gilt wsl. auch für die größeren Navi, ist aber nur eine Vermutung.

PS: die 25 Minuten bei 4 parallel kommen von einer auf 1,6 GHz runtergetakteten VII
 
Zuletzt bearbeitet:
Auf Grund deiner Aussage hier wollte ich das auch mal nachgucken ... leider ist es so das die GPU aus Gründen nur eine WU nimmt auch wenn ich 0,33 eintrage ...

Ansonsten ist mit zumindest bei meiner NV ausfgefallen das die WUs zwischendurch ne CPU Pause einlegen wo die GPU garnichts macht ...
Das erklärt vermutlich auch die starke Abhängigkeit von der CPU denn dann steigt die CPU Auslastung für die WU massiv an, OpenCL ist nicht so cool muss ich sagen oder es ist einfach nur schlecht umgesetzt hier ...
Bei den CUDA WUs gibts kein Auslastungsproblem -_-
Sobald ich es geschafft habe mehr als eine WU ans laufen zu bringen werde ich mir das auch nochmal anschauen :)
Doppelposting wurde automatisch zusammengeführt:

Achso, die O3 bringen allerdings schon bei nur einer laufenden WU mehr pro Tag als die MeerKat ...

Meerkat 1,01 Mio
O3 1,15 Mio
Doppelposting wurde automatisch zusammengeführt:

Hat jemand eine Idee warum die Dinger egal was ich mache mit nur einer WU laufen?
Doppelposting wurde automatisch zusammengeführt:

Ich hab es ... BOINC lässt DENIS@HOME laufen ... stoppe ich das Projekt werden sofort 3 WUs berechnet und wenn ich es wieder starte werden die direkt wieder pausiert
Doppelposting wurde automatisch zusammengeführt:

Grausam ... jetzt habe ich einfach 3 Kerne frei gemacht und 0,33 CPU zugewiesen und damit laufen alle 3 WUs aber total bescheuert ... so wie einige Einstellungen in BOINC die ich nicht verstehe
Doppelposting wurde automatisch zusammengeführt:

Also, so viel Credits die auch bringen ... ne 4080 und ne 4060 laufen einfach schlecht ...
Da müssen die echt nochmal ran an die App, immer diese langen CPU Pausen in der Berechnung sind schon komisch und werden ja sonst nicht benötigt ^^
Doppelposting wurde automatisch zusammengeführt:

Also wenn ich das mal so überschlage kommen bei der RTX4080 ~1,6 Mio pro Tag bei ~140W verbrauch raus ... GPU läuft mit 2,8GHz ... ich finde es durchaus komisch das eine WU garnicht soviel weniger bringt als 4 WUs ...
Ich mein das pendelt sich vllt noch ein wenig ein aber ich finde es dennoch grauenhaft schlecht ...
Wie schneiden die RDNA3 GPUs denn so ab?
Doppelposting wurde automatisch zusammengeführt:

Im Laptop ist es nicht ratsam das laufen zu lassen ... dort habe ich sie wieder abgeschaltet da die GPU einfach massiv durch die niedrig taktenden CPU Kerne eingebremst werden ... 4,2GHz reicht nicht bei einer RTX4070 Mobile für eine entsprechende Auslastung ... die Laufzeiten Varieiren von 36-50 Minuten *noahnung*
 
Zuletzt bearbeitet:
Die Problematik mit dem CPU-Limit besteht bei mir NICHT (bzw. weniger) in der Pause bei 49,5 % und 99,5 % sondern in der Phase, in der die GPU aktiv rechnet. DIe GPU könnte schneller rechnen, kriegt aber nicht genug Input von der CPU (wie bei manchen 3d-Shootern in Full HD).
 
Mhm ja bei einer WU hab ich das Problem mit der Auslastung auch aber ab 2 eben immer nur wenn die Pause machen, mit einer WU komme ich nur auf ~60% Auslastung
Aber es nervt dennoch die Pause und die ist nicht gerade kurz ...

Auf dem laptop habe ich das Problem aber auch *noahnung*
Doppelposting wurde automatisch zusammengeführt:

Am liebsten rechne ich eigentlich eh GPU Grid aber die WU versorgung ist grausam
 
Mal zunächst ein kurzer Gegentest mit meiner RX 5700XT@100W auf dem 5950X@87W. 2 WUs parallel und je ein CPU-Thread für eine WU.
22 Threads (mit 8xWCG, 4xAsteroids, 2xClimatePred, 6xSiDock, 2xEinstein) = 3,05GHz = 43min je WU
18 Threads (mit 8xWCG, 2xClimatePred, 6xSiDock, 2xEinstein) = 3,25GHz = 42 min je WU
14 Threads (mit 4xAsteroids, 2xClimatePred, 6xSiDock, 2xEinstein) = 3,35GHz = 37 min je WU
10 Threads (mit 2xClimatePred, 6xSiDock, 2xEinstein) = 3,65GHz = 34min je WU
6 Threads (mit 4xAsteroids, 2xEinstein) = 3,8GHz = 33min je WU
2 Threads (nur mit Einstein) = 4,3GHz = 32min je WU

Die GPU-WUs skalieren hier bei Betrachtung von 22 vs. 2 Threads mit der Taktrate der CPU: 25% schneller bei 25% mehr Takt.
1719227101071.png
 
Zuletzt bearbeitet:
Mal zunächst ein kurzer Gegentest mit meiner RX 5700XT@100W auf dem 5950X@87W. 2 WUs parallel und je ein CPU-Thread für eine WU.
22 Threads (mit 8xWCG, 4xAsteroids, 2xClimatePred, 6xSiDock, 2xEinstein) = 3,05GHz = 43min je WU
18 Threads (mit 8xWCG, 2xClimatePred, 6xSiDock, 2xEinstein) = 3,25GHz = 42 min je WU
14 Threads (mit 4xAsteroids, 2xClimatePred, 6xSiDock, 2xEinstein) = 3,35GHz = 37 min je WU
10 Threads (mit 2xClimatePred, 6xSiDock, 2xEinstein) = 3,65GHz = 34min je WU
6 Threads (mit 4xAsteroids, 2xEinstein) = 3,8GHz = 33min je WU
2 Threads (nur mit Einstein) = 4,3GHz = 32min je WU

Die GPU-WUs skalieren hier bei Betrachtung von 22 vs. 2 Threads mit der Taktrate der CPU: 25% schneller bei 25% mehr Takt.
Anhang anzeigen 55685
In einer sehr ähnlichen Konfig fahre ich auch auf einem Rechner: 5950X @ Eco und 5700XT, so dass sie 100 - 120 W zieht. Einziger Unterschied: die 5700XT rechnet bei mir 3 parallel.

Beobachtung bei mir ist ähnlich: Bei Projekten, die wenig Takt zulassen, liegt die Laufzeit bei 40 - 50 Minuten, bei Projekten mit mehr Takt schaffe ich 40 Minuten. Wenn ich mehr Platz auf der CPU lasse und der Takt noch mehr hochgeht, schafft die Karte das in 30 Minuten. 30 Minuten scheint mir aber die Untergrenze, weil ab da die Auslastung der Karte sehr hoch ist.

Mit einer VII wie gesagt noch viel krassere Verschiebungen, weil die Karte mehr kann.

Edit: erster Post mit 2024er Penta-Orden 8))
 
Zurück
Oben Unten