Einstein@home - allgemeiner Austausch (News, Forenfunde, HowTo, etc.)

Habe es mal kurz getestet.
Egal ob SAM an oder aus, 4 WUs pro GPU laufen in beiden Fällen ca. 11 Minuten.
Vermutlich unterstützt der installierte RadeonPro (Windows) noch kein SAM.
Doppelposting wurde automatisch zusammengeführt:

Der Pro Treiber ist von Oktober, als Voraussetzung für SAM steht der normale Treiber ab der Version 20.11.2 drin. Da muss ich wohl noch auf den nächsten Pro Treiber warten um den zu testen. ^^
 
Zuletzt bearbeitet:
Sagt mal - hat sich bei euch auch seid gestern oder heute die Laufzeit der WUs (FGRPB1...) verändert. Bis gestern liefen die auf der 5700XT bei 2 WU parallel 10 Minuten und 2 - 30 Sekunden. Heute sind es nur knapp über 8 Minuten. Dafür scheinen sie mehr CPU-Last zu verursachen, da die Auslastung nicht mehr kontinuierlich bei 97 - 99 % hängt. Auf der Vega 64 das gleiche Bild: 14 statt 17,2 Minuten und 0,25 CPUs pro WU reichen nun gar nicht mehr aus (haben sie aber bis gestern).

Ansonsten geht bei mir auch viel ins Pending (derzeit 1100 WUs)!
 
Ich hab nen Puffer von zwei Tagen, bisher noch keine Laufzeitänderungen festgestellt.
 
Läuft hier auch schneller. Knapp 9 statt 11,5 Min.
 
Sagt mal - hat sich bei euch auch seid gestern oder heute die Laufzeit der WUs (FGRPB1...) verändert. Bis gestern liefen die auf der 5700XT bei 2 WU parallel 10 Minuten und 2 - 30 Sekunden. Heute sind es nur knapp über 8 Minuten. Dafür scheinen sie mehr CPU-Last zu verursachen, da die Auslastung nicht mehr kontinuierlich bei 97 - 99 % hängt.
Ja. Auf der 1070ti ist die Laufzeit bei den letzten WUs von 12 auf 9 Minuten runtergegangen.
CPU-Last war auf Nvidia schon immer fast 100%, daran hat sich nichts geändert.
Hab aktuell nur einen Mini-Puffer von ca. 10 WUs.
 
Ich habe nochmal den Rechner mit der Vega 64 gecheckt:

Dort wurden heute Nacht bei 4 WUs parallel die WUs im Schnitt nach 12:30 - 12:50 Minuten beendet (gestern hatte ich noch von 14 Minuten berichtet). Bis vor kurzem lag der Schnitt bei leicht über 17 Minuten. Das finde ich einen erheblichen Sprung; es gibt auch weiterhin 3465 Credits/WU.
 
Tolle Sache, jetzt sind die schnellen WUs auch bei mir dran (2 Tage Puffer).
Seitdem sie mit LATeah3001L00* starten, laufen sie auf den V56 3 Minuten schneller (7:xx statt 10:xx).

Hab die app_info.xml für FGRP1G mal mit in den Startpost aufgenommen.
Muss da sonst noch irgendwas wichtiges mit rein?
Doppelposting wurde automatisch zusammengeführt:

Scheint auf Nvidias 20xx und 11xx Serien laufen die neuen WUs nicht, kaum Last und keinen Fortschritt, siehe:
 
Zuletzt bearbeitet:
Meine GTX 1050 profitiert deutlich von den neuen WU.
Vorher 38 Minuten Laufzeit, jetzt 27! :o
 
The other notable difference is that the 'followup stage' now lasts for considerably longer. You should have observed that the previous tasks used to pause at ~89.997% for a second or so and then immediately jump to 100% and finish. The new tasks will now pause for around 20-50 secs at ~89.997% before jumping to 100%. This used to happen all the time in the distant past. It's due to some post-processing that happens after the main crunching stage - hence the name 'followup'. During this time there is some recalculation done in double precision (at least that was the explanation in the past) so the length of time may be variable depending of the double precision capability of your GPU.
Bei mir dauert die Phase von 89.997% auf 100% jetzt gefühlt auch länger. Aktuell 12 Sekunden, zuvor hatte ich das nie gemessen.
In der Zeit frisst die WU dann auch einen vollen Thread.
 
Meine GTX 1050 profitiert deutlich von den neuen WU.
Vorher 38 Minuten Laufzeit, jetzt 27! :o
Meine 1050ti ist nun auch mit 22 Minuten dabei.
Die VII hat noch keinen Treiber. Aber die könnte mit 4 WUs in den Bereich von knapp 2Mio am Tag vordringen...
 
Ja ganz bestimmt. Gibt noch einige resends aus dem alten Batch, danach gehts rund :-)
Meine Vega 56 kommen mit 2x7:30min auch auf 1.33 Millionen Credit pro Karte.

Plus Teams die sich auf Nvidia Power stützen fallen durch den neuen Batch teils aus oder müssen auf die GW WUs ausweichen.
 
Vorher hat meine 5700XT eine einzelne WU in 6:10 gerechnet, nun in 5:40.
Zwei parallel brauchen 7:30. Also so wie Koschis Vega 56. Lohnt sich also das parellele Rechnen. :-)
Ich hab die Karte etwas im Verbrauch gesenkt, kann also auch welche geben, die das schneller rechnen mit der gleiche Karte.
 
Wie viele CPU Anteile lasst ihr auf eine Einstein WU los.? Ich bin geizig und gebe nur 0,5. Die könnten wahrscheinlich noch mehr vertragen, da die Auslastung der GPU immer mal absinkt aber für das letzte Quäntchen noch einen ganzen Thread opfern...
 
Ich ordne immer einen vollen Kern zu.
 
Bei mir ist es ein Thread für eine WU.
 
Frisch gemessen auf RX 5700 bei 2 parallel:
LATeah2049: 11:16, letzte 10% 1-2 Sekunden
LATeah3001: 8:41, letzte 10% 24 Sekunden
 
Ich lasse pro WU per app_config.xml einen Thread frei.
Auf einer Radeon VII des Clusters hatte ich auch 24 Sekunden für die letzte Phase gemessen.

Hatte privat hier ausprobiert ob die gefühlt mit LATeah3001 mehr schwankende Auslastung den Einsatz von 3 WUs parallel rechtfertigt, kam da aber nur noch auf einen Gewinn von +30k Credit po Karte pro Tag, gemittelt aus zu wenigen WUs als das es wirklich aussagekräftig wäre..
 
Das ist unterschiedlich, bei langsamen CPUs ist es durchaus sinnvoll und bei aktivem SMT und parallel laufenden CPU WUs ebenfalls da diese gern mal den GPU WUs die CPU Laufzeit wegfressen (je nachdem wie gut die CPU WUs den Kern auslasten können) und die GPU WUs damit deutlich ausbremsen können, selbst wenn ihnen ein ganzer Thread zugeordnet wurde. Alles schon erlebt.....
 
Bei meinen vorigen Zeiten lief noch WCG nebenbei. Ohne sind nur noch ~7:50 Min.
 
Das klingt nach genau der SMT Problematik die ich ansprach.
Laufen nur CPU WUs eines Projekts ist es egal wie die Rechenzeit des Kerns auf die beiden Threads aufgeteilt wird aber aber bei einem Mix können die Auswirkungen auf GPU WUs erheblich ausfallen weshalb ich dann SMT deaktiviere und der GPU einen ganzen Kern zuteile.
 
hm was habt ihr eigentlich mit 6000 karten für Ergebnisse , im energiesparen habe ich 4 Wus gleichzeitig LATeah3001 401-520sek Laufzeit.
nachdem ich den Speicher auf 2150 mit fast timings gestellt habe sind es 208-300sek je wus.
lg
 
Zuletzt bearbeitet:
Wie viele CPU Anteile lasst ihr auf eine Einstein WU los.? Ich bin geizig und gebe nur 0,5. Die könnten wahrscheinlich noch mehr vertragen, da die Auslastung der GPU immer mal absinkt aber für das letzte Quäntchen noch einen ganzen Thread opfern...
Bei Nvidia immer 1 WU = 1 CPU-Thread.
Bei der VII immer 4 WUs = 4 CPU-Threads. Aber selbst wenn ich weniger als 4 WUs laufen lasse, sond 4 freie Threads das Optimum.
 
Hier mal die Ergebnisse meiner CPU-Beimischungsquoten (bei mir läuft TN Grid parallel auf den CPU-Threads):

RX 5700 XT @ 1760 MHz 0,94 V 125 W mit 2 WUs parallel (FGRP...) + R 7 3700 X @ 3,7 GHz
0,5 CPUs pro WU: 8:20 - 8:40 Min Laufzeit
1 CPU pro WU: 7:30 - 7:45 Min Laufzeit
--> 10 % Zeitersparnis

Vega 64 @ 1470 MHz 0,93 V 160 W (mit 4 WUs parallel) + R 7 2700 non X @ 3,4 GHz
0,5 CPUs pro WU: 12:40 - 14:40 Min Laufzeit
1 CPU pro WU 11:20 - 13:30 Min Laufzeit
--> 10 % Zeitersparnis

Fairerweise hätte man den durchschnittlichen Stromverbrauch der GPU loggen müssen, um Aussagen über die Effizienz zu machen; ich würde aber behaupten, dass die GPU im Schnitt auf gar keinen Fall 10 % mehr Strom gezogen hat.

Für Einstein-Races auf jeden Fall und für normales Crunching mindestens mal empfehlenswert, 1 ganzen CPU-Thread für die neuen Einstein - WUs zu opfern.
 
das lohnt sich mit den kurzen wus ^^
5700XT@2,1 Ghz 4 wus 12:30 min.
240W Fußheizung ^^
 
Milkyway hat das erste Mal seit ich dabei bin keine Separation Runs zum Download. Die armen VII dürfen dann jetzt Pulsare suchen... Aber nur bis MW wieder Nachschub hat!
Doppelposting wurde automatisch zusammengeführt:

Und 200 von 202 WUs im Pending!
 
Zuletzt bearbeitet:
Zurück
Oben Unten