12. Pentathlon 2021 - Einstein@home (Querfeldein)

@Nero24
Mir war sogar ein noch größerer Unterschied in Erinnerung geblieben.
Vielleict hatte AMD zwischenzeitlich bei der 6900XT nachgebessert?
Oder ich habe das einfach nur falsch in Erinnerung gehabt. 🙈
 
Allerdings bekomme ich jetzt keine WUs mehr.
Weil ich welche geschrottet habe?

06.05.2021 18:25:59 | Einstein@Home | update requested by user
06.05.2021 18:26:04 | Einstein@Home | Sending scheduler request: Requested by user.
06.05.2021 18:26:04 | Einstein@Home | Not requesting tasks: don't need (CPU: ; AMD/ATI GPU: )
06.05.2021 18:26:05 | Einstein@Home | Scheduler request completed
06.05.2021 18:26:05 | Einstein@Home | Project requested delay of 60 seconds
 
Sind nachwievor 2 verschiedene Dateien mit unterschiedlichem Ziel.
Mit der app_info.xml kann man zb. optimierte Anwendungen oder Eigenkompilate auf ansonsten nicht unterstützten Plattformen lauffähig machen.
Die app_config.xml ermöglicht es die Anzahl der gleichzeitig laufenden WUs pro Anwendung und Projekt festzulegen oder auch Anwendungen bestimmte Parameter mitzugeben sofern diese das unterstützen (siehe Primegrid).
Doppelposting wurde automatisch zusammengeführt:

Allerdings bekomme ich jetzt keine WUs mehr.
Weil ich welche geschrottet habe?

06.05.2021 18:25:59 | Einstein@Home | update requested by user
06.05.2021 18:26:04 | Einstein@Home | Sending scheduler request: Requested by user.
06.05.2021 18:26:04 | Einstein@Home | Not requesting tasks: don't need (CPU: ; AMD/ATI GPU: )
06.05.2021 18:26:05 | Einstein@Home | Scheduler request completed
06.05.2021 18:26:05 | Einstein@Home | Project requested delay of 60 seconds
Wenn du welche schrottest, fragst du trotzdem nach und dann lehnt der Server dankend ab.
Hier fragt dein Client aber nicht nach Arbeit.

Kann sein dass du on_frac und active_frac in der client_state.xml nach BOINC stop mal auf 0.99 setzen musst, falls du nur gelegentlich rechnest. Das spielt in die Arbeitsanfrage mit rein.
 
Zuletzt bearbeitet:
@gruenmuckel oder Du setzt das Projekt nochmal zurück bzw. machst eine neue, saubere Instanz auf.
Ja, das half. Nun rechnet die Karte. Aber immer noch nur mit einer WU. Obwohl mehrere vorhanden sind.

Das ist der Inhalt der richtigen Datei:
<app_config>
<app>
<name>hsgamma_FGRPB1G</name>
<gpu_versions>
<gpu_usage>0.5</gpu_usage>
<cpu_usage>1.0</cpu_usage>
</gpu_versions>
</app>
</app_config>
Doppelposting wurde automatisch zusammengeführt:

Sind nachwievor 2 verschiedene Dateien mit unterschiedlichem Ziel.
Mit der app_info.xml kann man zb. optimierte Anwendungen oder Eigenkompilate auf ansonsten nicht unterstützten Plattformen lauffähig machen.
Die app_config.xml ermöglicht es die Anzahl der gleichzeitig laufenden WUs pro Anwendung und Projekt festzulegen oder auch Anwendungen bestimmte Parameter mitzugeben sofern diese das Unterstützen (siehe Primegrid).
Doppelposting wurde automatisch zusammengeführt:

Allerdings bekomme ich jetzt keine WUs mehr.
Weil ich welche geschrottet habe?

06.05.2021 18:25:59 | Einstein@Home | update requested by user
06.05.2021 18:26:04 | Einstein@Home | Sending scheduler request: Requested by user.
06.05.2021 18:26:04 | Einstein@Home | Not requesting tasks: don't need (CPU: ; AMD/ATI GPU: )
06.05.2021 18:26:05 | Einstein@Home | Scheduler request completed
06.05.2021 18:26:05 | Einstein@Home | Project requested delay of 60 seconds
Wenn du welche schrottest, fragst du trotzdem nach und dann lehnt der Server dankend ab.
Hier fragt dein Client aber nicht nach Arbeit.

Kann sein dass du on_frac und active_frac in der client_state.xml nach BOINC stop mal auf 0.99 setzen musst, falls du nur gelegentlich rechnest. Das spielt in die Arbeitsanfrage mit rein.
Stimmt. Die Erinnerung stammt aus der Zeit wo man Seti und Milkyway optimierte Apps untergeschoben hat.
 
Hast Du BOINC-Manager (inkl. Hintergrundprozess) beendet nachdem Du die app_config.xml in den Projektordner (nicht in den BOINC-Ordner!) kopiert hattest?

Die app_config.xml heißt auch sicher so und nicht etwa app_config.xml.txt (mit ausgeblendeter Dateiendung by default)?
 
Ohne jetzt ewig rumzusuchen zu müssen, bringen 2 WUs auf einer RX580 was?
 
Meine R9 380X lasse ich mit 2WUs rechnen, das sollte 2 Generationen später auch was bringen. Also: ja.
 
Hast Du BOINC-Manager (inkl. Hintergrundprozess) beendet nachdem Du die app_config.xml in den Projektordner (nicht in den BOINC-Ordner!) kopiert hattest?

Die app_config.xml heißt auch sicher so und nicht etwa app_config.xml.txt (mit ausgeblendeter Dateiendung by default)?
Ja klar. (hoffe ich)...

C:\ProgramData\BOINC\projects\einstein.phys.uwm.edu\app_config.xml

Allerdings hat sich noch ein Problem herausgestellt. So nach 30-45 Minuten gibt's bunte Pixel (eben am Remote-Desktop gesehen) und dann startet der Rechner neu.


Bluescreenview sagt:
050621-10984-01.dmp 06.05.2021 20:31:14 0x00000116 ffff8d0a`10602050 fffff807`508cad00 00000000`00000000 00000000`0000000d dxgkrnl.sys dxgkrnl.sys+262cce x64 ntoskrnl.exe+3f6cf0 C:\WINDOWS\Minidump\050621-10984-01.dmp 16 15 19041 1.454.764 06.05.2021 20:32:15

3 Treiber sind rot markiert.

amdkmdag.sys amdkmdag.sys+aad00 fffff807`50820000 fffff807`54d01000 0x044e1000 0x5f59c615 10.09.2020 08:22:13
dxgkrnl.sys dxgkrnl.sys+262cce fffff807`4a230000 fffff807`4a5d5000 0x003a5000 0x2ff6d99c 02.07.1995 19:38:36
dxgmms2.sys dxgmms2.sys+3d7c3 fffff807`4c2d0000 fffff807`4c3b1000 0x000e1000 0x7f2d77cb 12.08.2037 12:36:59


Die Karte wird etwas über 70°C warm und zocken kann ich ewig bzw. auch Furmark hat kein Problem.

Ich glaube ich werde mal den Treiber wechseln.
Das Netzteil sollte mit 650W (Corsair RM650i) eigentlich über alle Zweifel erhaben sein. Etwas mehr 300W verbraucht die Kiste mit Graka und CPU Crunching. Da dreht noch nicht mal der semipassive Lüfter los.
 
@gruenmuckel Ich kenne diese Pixel bei Einstein, wenn ich zuviele WUs gleichzeitig rechnen will. Fängt meist im Firefox an, wahrscheinlich nutzt der eine GPU-Beschleunigung beim Rendern. Sind es bei dir mehrere?
 
Mhhh, gerade mal eine WU auf Einstein im Boinc-Manager auf meiner untertakteten 5700XT probiert.
05:43
Haut das hin, oder sind die Dinger ohnehin alle völlig unterschiedlich groß....?
Falls es noch nicht beantwortet wurde - die sind alle gleich groß und haben fast auf die Sekunde genau gleiche Laufzeiten. Mit der Karte kannst Du auf jeden Fall auch 2 WUs parallel probieren.
 
@gruenmuckel Ich kenne diese Pixel bei Einstein, wenn ich zuviele WUs gleichzeitig rechnen will. Fängt meist im Firefox an, wahrscheinlich nutzt der eine GPU-Beschleunigung beim Rendern. Sind es bei dir mehrere?
Bis eben nicht. Trat bei einzelner WU auf.
5700 XT 1x WU 4:02 = 242s (okay, zwischen 242s und 316s. https://einsteinathome.org/de/host/12883155/tasks/2/0 )

Gut, nach nem Treiberupdate der Graka rechnet sie nun plötzlich 2 WUs. *buck*

Ich hab jetzt mal alles auf der CPU angehalten und beobachte die Ausgabe von HWMonitor genauestens.
Hmm, Memorytemps bis 96°C. Könnte sogar mal höher gewesen sein. Ich dreh den Lüfter mal manuell hoch. 47% reicht vielleicht nicht.
 
@gruenmuckel
Schräge Absturz mit Bluescreens hatte ich auch schon bei RAM Problemen, z.B. durch einen Defekt oder Überhitzung der RAM Module.
Da Einstein der Karte ordentlich einheizt würde ich vielleicht erstmal dort ansetzen.

Nutzt du dafür Linux oder Windows? Bei Windows könntest du z.B. per hwinfo64 schauen ob die RAM Module vielleicht einen Temperatursensor besitzen.

Der nächste Punkt wäre natürlich das angesprochene Problem beim Multi WU Betrieb, das könnte man recht einfach testen wenn man der GPU nur eine WU zuordnet.

Die Zeitverzögerung an sich spricht für mich aber eher nach einem Temperaturproblem da sich die problematische Komponente erstmal auf die kritische Temperatur erwärmen muss.
 
@sompe Ja stimmt. Ich hab den Lüfter hochgedreht. Nun sinds nicht mehr 96°C Memory bei der Graka. War vielleicht nach Dauerbetrieb auch auf den CPU-Kernen noch höher.
Da ist die Lüfterkurve wohl nicht optimal.

Ja, auch meine RAM-Module haben Sensoren, bleiben aber unter 50°C

 
@gruenmuckel
Wenn ich schon den Afterburner sehe dann muss ich immer daran denken wie eine ältere Version bei einem zu neuen Treiber wegen inkompatibilitäten gern mal Funktionen wie die aurtomatische Lüftersteuerung blockiert hatten und beim 21.4.1 wurde ja wieder einiges verändert.
Nicht das sich dieses Problem wiederholt und die Lüfter der Karte deswegen nicht weit genug aufgedreht werden um andere Komponenten wie VRAM oder Spannungswandler ausreichend zu kühlen.
 
5700XT 2WU Parallel 380s-391s für je 2 WUs
Doppelposting wurde automatisch zusammengeführt:

@gruenmuckel
Wenn ich schon den Afterburner sehe dann muss ich immer daran denken wie eine ältere Version bei einem zu neuen Treiber wegen inkompatibilitäten gern mal Funktionen wie die aurtomatische Lüftersteuerung blockiert hatten und beim 21.4.1 wurde ja wieder einiges verändert.
Nicht das sich dieses Problem wiederholt und die Lüfter der Karte deswegen nicht weit genug aufgedreht werden um andere Komponenten wie VRAM oder Spannungswandler ausreichend zu kühlen.
Der war vorher aus.
Ich hatte eigentlich gar nichts getweakt.
 
@gruenmuckel
Ich persönlich nutze ihn nicht und weiss deshalb auch nicht wie weit er sich in das System eingräbt damit mögliche Veränderungen der Einstellungen auch erhalten bleiben. Bei so großen Veränderungen im Treiber Paket würde ich ihn wegen der Probleme in der Vergangenheit aber lieber vom System schmeissen bis es eine offiziell kompatible Version gibt und erstmal schauen ob sie dann verschwunden sind.
 
R9 290X bei 2 Wu ca 1440s hat jemand Vergleichswerte?
 
R9 380X mit 920s bei 2 WUs. Hast du deine beim Verbrauch gestutzt? 1 CPU bei 0.5 GPU hab ich eingestellt.
 
06.05.2021 21:49:56 | Einstein@Home | Project has no jobs available
06.05.2021 21:50:59 | Einstein@Home | (reached daily quota of 512 tasks)


*admin*

Na dann morgen wieder. :(
Kann ich mir ab 00:00 neue WUs ziehen ober erst ab 2:00 Uhr (UTC+2 unserer Zeitzone?)
 
Wurden durch die Abstürze zu viele fehlerhafte WUs rausgehauen?
Mir war nur ein normales Limit von ca. 2500 WUs in Erinnerung geblieben.
 
Wurden durch die Abstürze zu viele fehlerhafte WUs rausgehauen?
Mir war nur ein normales Limit von ca. 2500 WUs in Erinnerung geblieben.
Ich hab 149 mit Error weil die durch die falsche Config Datei wohl geschrottet wurden. Stehen auf "timed out" auf der Einstein-Statspage.

Und noch eine Seltsamkeit: Egal wie ich die Prozentwerte von "Prozessorkernen" und "Prozessorzeit" im BM einstelle: Sobald ich was auf der CPU rechne wird von Einstein nur noch eine WU berechnet. Ich versteh's nicht. Sowas ging doch früher irgendwie intuitiver.
 
Und noch eine Seltsamkeit: Egal wie ich die Prozentwerte von "Prozessorkernen" und "Prozessorzeit" im BM einstelle: Sobald ich was auf der CPU rechne wird von Einstein nur noch eine WU berechnet. Ich versteh's nicht. Sowas ging doch früher irgendwie intuitiver.
Wenn die CPU zu viel zu tun hat und der BM meint, die wird nicht rechtzeitig fertig, kann es passieren, dass nur noch eine WU oder auch gar keine mehr auf der GPU läuft. Dazu reicht es oft, dass nur der Puffer zu hoch eingestellt ist.
 
Zuletzt bearbeitet:
ggf hast du zuviele CPU WUs drauf und wenn das CPU Projekt aktiv ist geht der BOINC Manager in den Panikmodus und versucht die CPU WUs zuerst fertig zu bekommen und denkt er kann eben bei Einstein CPUs sparen. Die über app_config.xml eingestellte 1.0 CPU pro WU wird ja primär beim Scheduling berücksichtigt.
 
Zurück
Oben Unten