Neue WUs bei LHC@Home!

Warten wir mal eine WU ab was die ausgibt...
 
Ok ich sag bescheid ;)
Doppelposting wurde automatisch zusammengeführt:


Sollte aber geklappt haben, ich habe die Tasks 3 mal neugestartet, also BOINC und somit stehen am Anfang noch die Warnungen mit der Effizienz drin, der letzte Neustart beinhaltet die Warnung aber nicht mehr ;)
vielen Dank @koschi und @WhiteFire
 
Zuletzt bearbeitet:
Wer ATLAS und Theory native rechnet sollte folgende Zeilen noch mit in die /etc/systemd/system/boinc-client.service aufnehmen:
Code:
MemoryAccounting=true
IOAccounting=true
BlockIOAccounting=true
CPUAccounting=true

Andernfalls gehen die vom Script /sbin/create-boinc-cgroup erzeugten cgroups nach einiger Zeit wieder verloren. Theory native bricht dann kurz nach dem Start ab.
 
Theory native vs. ATLAS native vs. CMS vBox

Code:
koschi@frickelbude:~$ get_validated "https://lhcathome.cern.ch/lhcathome/results.php?hostid=10609806&offset=0&show_names=0&state=4&appid=13"
0 20 40 60 80 - download complete. Calculating...
Application:                     Theory Simulation
CPU:           AMD Ryzen 9 3900X 12-Core Processor
OS:                Linux Ubuntu Ubuntu 20.04.2 LTS
Results fetched:                                94
Average duration (s):                       3349.3
Average credit:                              46.88
Number of reported cores:                       24
Per core per day:                             1204
Per system per day:                          28896

koschi@frickelbude:~$ get_validated "https://lhcathome.cern.ch/lhcathome/results.php?hostid=10609806&offset=0&show_names=0&state=4&appid=14"
0 20 - download complete. Calculating...
Application:                      ATLAS Simulation
CPU:           AMD Ryzen 9 3900X 12-Core Processor
OS:                Linux Ubuntu Ubuntu 20.04.2 LTS
Results fetched:                                 9
Average duration (s):                      35630.7
Average credit:                             383.49
Number of reported cores:                       24
Per core per day:                              920
Per system per day:                          22080

koschi@frickelbude:~$ get_validated "https://lhcathome.cern.ch/lhcathome/results.php?hostid=10609806&offset=0&show_names=0&state=4&appid=11"
0 20 - download complete. Calculating...
Application:                        CMS Simulation
CPU:           AMD Ryzen 9 3900X 12-Core Processor
OS:                Linux Ubuntu Ubuntu 20.04.2 LTS
Results fetched:                                 6
Average duration (s):                      48408.3
Average credit:                             491.40
Number of reported cores:                       24
Per core per day:                              835
Per system per day:                          20040

Ich werd erstmal Theory machen, da kommen immer mal wieder welche rein, die laufen nicht ewig lange, verbrauchen wenig Speicher und Bandbreite.
Bei CMS habe ich das Problem dass die mir hunderte von WUs schicken (die ja jeweils 12h laufen). Ob die da die GFLOPS pro WU zu niedrig angesetzt haben oder bei mir der dcf nicht passt, ich weiß es nicht, nervt auf jeden Fall.
 
Es gibt wieder Sixtracks - Dank an MrBad für den Hinweis *great* - und eine neue Anwendung: ATLAS in long

Bildschirmfoto vom 2021-03-20 10-24-18.png
 
@erde-m Danke für die Info!
Im LHC-Forum hab ich zu den Atlas long Betas noch nix gelesen.
1616244003793.png
Für den ganzen Netzwerktraffic, den man als Overhead bei den nativen Atlas hat, dann nur <2h Berechnung auf 8 Cores - da ist das eine gute Idee mit der long simulation, wenn das dann eine längere Laufzeit ergäbe.
 
Die long enthalten 1000 statt 200 Simulationen und sollten dementsprechend länger laufen...
ATLAS native unterstützt kein suspend/resume, die starten dann entweder intern neu oder brechen ab und gehen auf 100%, reboots wollen dann wohlüberlegt sein...
 
Wer ATLAS und Theory native rechnet sollte folgende Zeilen noch mit in die /etc/systemd/system/boinc-client.service aufnehmen:
Code:
MemoryAccounting=true
IOAccounting=true
BlockIOAccounting=true
CPUAccounting=true

Andernfalls gehen die vom Script /sbin/create-boinc-cgroup erzeugten cgroups nach einiger Zeit wieder verloren. Theory native bricht dann kurz nach dem Start ab.
Ich verstehe nur Bahnhof ... habe aber aktuell das Problem das ich heute 4 LHC WUs bekommen habe die abgebrochen wurden und das obwohl singularity und cvmfs laufen ...
Liegt es an dem was du sagst?


das ist eine der 4 WUs ich hab Nachschub erst mal ausgeschaltet ...
 
Eher was ich in meinem letzten Post beschrieb. Deine Beispiel-WU wurde pausiert und dann nach einer halben Stunde neu gestartet, die erste halbe Stunde war also für die Katze...

Falls du eigentlich eine der vier error WUs meintest

Der Fehler findet sich im Log der WU:
Code:
[2021-03-21 17:31:25] Checking for CVMFS
[2021-03-21 17:31:25] Probing /cvmfs/atlas.cern.ch... Failed!
[2021-03-21 17:31:25] Probing /cvmfs/atlas-condb.cern.ch... Failed!
[2021-03-21 17:31:26] Probing /cvmfs/grid.cern.ch... Failed!
[2021-03-21 17:31:26] Probing /cvmfs/cernvm-prod.cern.ch... Failed!
[2021-03-21 17:31:26] Probing /cvmfs/sft.cern.ch... Failed!
[2021-03-21 17:31:26] Probing /cvmfs/alice.cern.ch... Failed!
[2021-03-21 17:31:26] cvmfs_config probe failed, aborting the job

Läuft denn cvmfs bei dir? Ist da irgendwas in der Config verloren gegangen?

cvmfs_config probe muss für diese CVMFS mounts OK zurückliefern, eher brauchst du keine neuen WUs versuchen.
 
Ach mist .... ich bin in der Zeile verrutscht .... ja ne muss ich dann noch mal nach gucken
Allerdings habe ich seit der letzten funktionierenden WU nichts geändert aber sei es drum, da werd ich mal schauen was da los ist, bin mal gespannt.
Er hat letztens nen Update vom cvmfs gemacht aber das war schon am 15. oder 16. und danach sind ja noch enige WUs problemlos berechnet worden :/
 
Also er gibt mir tatsächlich jetzt wieder failed aus ...
Da ICH aber nichts geändert habe weiß ich auch nicht wo ich suchen soll ...
Ich hab Singularity schon deinstalliert und neu isntalliert ... jetzt würde mir ja fast nur noch bleiben cvmfs neu zu installieren, ich mein ich weiß ja jetzt wie es geht theoretisch aber es ist schon reichlich komisch das es von einem auf den anderen Tag nicht mehr geht allerdings hab ich auch andere Änderungen fest gestellt ...

ich hatte das Problem das meinen Windows im Grub nicht mehr angezeigt wurde ... allerdings steht es jetzt auf ein mal wieder drin was an sich ja gut ist aber ich hab trotzdem jetzt das Problem das ich LHC nicht wieder ans laufen bekomme ^^

Aber vllt hab ich mit der Weile aber auch am Linux so viel herum gefummelt das es Zeit wäre das mal einmal alles sauber zu installieren ^^
Wenn bis heute Abend keiner ne Idee hat woran es liegen könnte würde ich das mal in Angriff nehmen ...
 
Singularity sollte damit nichts zu tun haben, guck einfach mal nach der cvmfs Konfiguration (default.local), ob die noch die entscheidenden Punkte enthält, nach letztem Änderungsdatum oder so, vielleicht bei nem update überschrieben?
 
singularity hat damit bei arch leider sehr wohl was zutun ohne das läuft es nicht ...
Lässt sich aber nicht mehr installieren da scheint irgendwas nicht so zu klappen wie es soll kp damit ist LHC mal wieder raus ... ich werd einfach neu installieren und alles von vorne noch mal sauber drauf bügeln und hoffen das es danach geht ...
Obwohl ich gestehen muss das ich die schnauze langsam voll habe davon -_-
 
Singularity ist der Containermanager, nutzt aber das CVMFS. Geht letzteres schon auf die Bretter, kann auch Singularity da nichts tun, du musst dir also dein cvmfs anschauen.
Aktuell läuft übrigens wieder Sixtrack, falls du Lust auf LHC Punkte ohne Stress hast.
 
Mir geht es eher darum das es läuft wenn ich es nutzen will ... meist laufen maximal 1-2 LHC WUs nebenher ;)
Aber wie gesagt Manjaro hat eh einige Fehler drin die total sinnlos sind, ich installier vllt heute oder sonst morgen mal neu und mach das ein wenig clean ... ich hab auf dem System ja viel probiert bis alles lief und nun mach ich es einmal schick ... ich hoffe es läuft danach dann auch problemlos :P
Werde aber mal Garuda Linux testen was Manjaro ähnlich ist aber vllt mit xfce keine Probleme beim booten hat so wie Manjaro :P
 
So, nach unzähligen fehlgeschlagenen Versuchen Manjaro ans laufen zu bringen mit xfce und das sogar mit der aktuellen Version hab ich aufgegeben ...
LDM funktioniert bei mir bei Manjaro einfach nicht ....

Gut hab ich mir Garuda Linux besorgt ... hat nen paar Eigenheiten bei xfce ... ich kann irgendwie keine anderen themes hinzufügen aber egal ich werd mich dran gewöhnen denke ich.

BOINC, Squid und cvmfs laufen und damit dann eben auch LHC, hoffentlich bleibt es auch so :P

Leider kann man die LHC nicht pausieren, ich habe versucht das aus der Beschreibung einzubinden allerdings kennt arch einige Befehle nicht ...
Daher leider aktuell raus bis ich Lust und Zeit habe mich damit zu beschäftigen :P
 
Zuletzt bearbeitet:

Neue Physik am Teilchenhorizont?​

In der FAZ ist Heute ein Artikel über die Messung von Zerfällen von B-Mesonen am CERN erschienen.
Für die, die den original Artikel lesen möchten.
 
Habe ich heute Morgen schon gelesen. Eindrucksvoll fand ich die Grafik darunter, wie die Anlage eigentlich aufgebaut ist und welche Ausmaße sie hat. Das hat es für mich noch mal bisschen greifbarer gemacht, was ist das für ein Riesenprojekt ist.
Von der Teilchenphysik hab ich nur Bahnhof verstanden*kopfkratz
 
@erde-m
Für den ganzen Netzwerktraffic, den man als Overhead bei den nativen Atlas hat, dann nur <2h Berechnung auf 8 Cores - da ist das eine gute Idee mit der long simulation, wenn das dann eine längere Laufzeit ergäbe.

Die long enthalten 1000 statt 200 Simulationen und sollten dementsprechend länger laufen...
Die ersten WUs der Atlas native long Betas stehen zur Berechnung bereit. Ich hab die erste zu 50% nun durch und bin bereits bei >2h (8 Kerne).
Ergebnis: nach 6h auf 8 Kernen gabs 235 Punkte. :-/
 
Zuletzt bearbeitet:
Wer ATLAS und Theory native rechnet sollte folgende Zeilen noch mit in die /etc/systemd/system/boinc-client.service aufnehmen:
Code:
MemoryAccounting=true
IOAccounting=true
BlockIOAccounting=true
CPUAccounting=true

Andernfalls gehen die vom Script /sbin/create-boinc-cgroup erzeugten cgroups nach einiger Zeit wieder verloren. Theory native bricht dann kurz nach dem Start ab.

Ich hab das manuell in die Datei geschrieben weil es über die Befehle in der Wiki bei mir nicht ging, irgendwas von keine Berechtigung und das obwohl ich es als root versucht habe.
Ich hoffe die funktionieren trotzdem!?

Ich musste nämlich mal wieder Linux neu installieren ... irgendwie sind die ganzen Arch Abwandlungen bis jetzt eher instabil gewesen ... Manjaro kann man aktuell nicht mal nen USB Stick erstellen und Garuda hat sich nach und nach selber abgeschossen ^^
Jetzt probiere ich es gerade mit ArcoLinux xD
 
Nun, ohne konkrete Fehlermeldung bleibt nur die Glaskugel und Hoffnung.

Wenn zb. in /sys/fs/cgroup/freezer/boinc oder /sys/fs/cgroup/memory/boinc Dateien angelegt sind, dann sollte es eigentlich funktionieren.
 
Gibt keine Fehlermeldungen ^^
Wollte wissen ob es ein Problem ist wenn ich es händisch dort eintrage aber hab es dann gemacht wie immer nach dem try and error Prinzip :P
Doppelposting wurde automatisch zusammengeführt:

gibt wohl einen Fehler xD

Code:
× boinc-client.service - Berkeley Open Infrastructure Network Computing Client
     Loaded: loaded (/etc/systemd/system/boinc-client.service; enabled; vendor preset: disabled)
     Active: failed (Result: exit-code) since Wed 2021-05-26 14:43:30 CEST; 2min 36s ago
       Docs: man:boinc(1)
    Process: 3044 ExecStartPre=/bin/sh -c /bin/chmod +x /sbin/create-boinc-cgroup && /sbin/create-boinc-cgroup (code=exited, status=1/FAILURE)
    Process: 3086 ExecStopPost=/bin/rm -f lockfile (code=exited, status=0/SUCCESS)
        CPU: 42ms

Mai 26 14:43:30 BigBoyLinux sh[3082]: chown: Zugriff auf '/sys/fs/cgroup/cpuset/boinc/cpuset.cpus' nicht möglich: Datei oder Verzeichnis nicht gefunden
Mai 26 14:43:30 BigBoyLinux sh[3082]: chown: Zugriff auf '/sys/fs/cgroup/cpuset/boinc/cpuset.mems' nicht möglich: Datei oder Verzeichnis nicht gefunden
Mai 26 14:43:30 BigBoyLinux sh[3083]: chmod: Zugriff auf '/sys/fs/cgroup/cpuset/boinc/cpuset.cpus' nicht möglich: Datei oder Verzeichnis nicht gefunden
Mai 26 14:43:30 BigBoyLinux sh[3083]: chmod: Zugriff auf '/sys/fs/cgroup/cpuset/boinc/cpuset.mems' nicht möglich: Datei oder Verzeichnis nicht gefunden
Mai 26 14:43:30 BigBoyLinux sh[3084]: chown: Zugriff auf '/sys/fs/cgroup/freezer/boinc/freezer.state' nicht möglich: Datei oder Verzeichnis nicht gefunden
Mai 26 14:43:30 BigBoyLinux sh[3085]: chmod: Zugriff auf '/sys/fs/cgroup/freezer/boinc/freezer.state' nicht möglich: Datei oder Verzeichnis nicht gefunden
Mai 26 14:43:30 BigBoyLinux systemd[1]: boinc-client.service: Control process exited, code=exited, status=1/FAILURE
Mai 26 14:43:30 BigBoyLinux systemd[1]: boinc-client.service: Failed with result 'exit-code'.
Mai 26 14:43:30 BigBoyLinux systemd[1]: Failed to start Berkeley Open Infrastructure Network Computing Client.
Mai 26 14:44:46 BigBoyLinux systemd[1]: /etc/systemd/system/boinc-client.service:25: Unknown section 'LHC'. Ignoring.
Doppelposting wurde automatisch zusammengeführt:

Der Witz ist, über Terminal lässt sich BOINC also nicht starten ... wenn ich BOINC aber über das Startmenü starte läuft es ohne Fehler ...
 
Zuletzt bearbeitet:
@koschi
Hast ne Ahnung was da los ist?
 
Wenn du BOINC nicht über service startest, wird womöglich das systemd Konfigurationsfile für BOINC nicht gelesen und daher /sbin/create-boinc-cgroup nicht aufgerufen.

/etc/systemd/system/boinc-client.service, Zeile 25 kann er nicht interpretieren, da muss ggf. ein # hin um das LHC zu auszukommentieren.

Ansonsten hab ich wenig Ideen wieso da Teile der cgrous fehlen und chmod gegen diese fehlschlägt.
Du könntest aber am Ende des Skriptes ein exit 0 hinzufügen, dann läuft das zumindest "erfolgreich" durch und der BOINC Start kann weiter gehen. Kann sein dass die Pausierung der WUs dann ggf. noch nicht klappt, musst du mal ausprobieren.
 
Mhm also ich hab gerade mal im BOINC Manager auf Pause gedrückt und kurz gewartet und es wird auch nach ca 20-30 Sekunden alles Pausiert ... keine Ahnung was ich dazu jetzt sagen soll :P
Doppelposting wurde automatisch zusammengeführt:

Ich habe jetzt mal wieder das original genommen, beim nächsten Neustart gucke ich mal ob man immernoch pausieren kann ...
 
Zurück
Oben Unten