RNA@home: P3D vs SETI.Germany

Status
Für weitere Antworten geschlossen.
also ich habe auf all meinen Rechnern auch keine Probleme WUs zu bekommen :)
aber ne Frage hätte ich dafür mal.
was muss ich tun um die Statistiken auf Seite 1 sehen zu können. Ich sehe da nur die beiden nicht so schönen warning - login needed Bildchen *noahnung*
 
ARGH da hab ich mir ja eine richtige schöne erkältung aufgesackt 8-(.

da kann der kasten wenigstens durchcrunchen *buck*

ich geh mich mal wieder hinlegen fussball geht ja auch bald los :|
 
Jetzt habe ich es endlich geschafft.:-[
Bin dann auf leichten Umwegen auch bei und helfe für ein paar Tage.
 
Gibts eine ungefähre Zeit, ab wann man mit Windows x64er CMC-WUs rechnen kann? Stunden, Tage, Wochen?^^ Und kann es nicht so eingerichtet werden, dass nur "kurze" WUs an die Windowsrechner gehen? Gibt ja genug, die zwischen 2 und 4 bis 6 Stunden laufen und da ist die Gefahr eines Abschusses nicht so groß...
Dass nur "kurze" WUs an Windows-Rechner gehen kann leider nicht eingerichtet werden. Natürlich können wir die CMCALIBRATEs auch an Windows-64 ausgeben, vorausgesetzt es meckert keiner, wenn dann mal eine WU ohne Checkpoints 200 Std. oder mehr benötigt... *suspect*

Ich habe jetzt einen Sucher, der liegt bei 25% ->ist aber schon 11:45 am suchen... Und das ohne Checkpoints... Ob das mal gut geht... *buck*
Das ist in der Regel kein Problem, auch bei >90 Std. nicht. ;)

Mal eine Idee: Man könnte überlegen, das Race inkl. der Neuzugänge (Poland) bis zu einem bestimmten Termin nächste Woche zu unterbrechen. Inzwischen laden wir die Kanonen auf dem Server und dann könnt ihr wieder angreifen. Ich denke fast, das wäre das Beste, damit das ganze ordentlich Spass macht. Im Moment tröpfeln ein paar WUs herunter und keiner kann damit wirklich zufrieden sein...

Michael.
 
Ich finde die Idee nicht schlecht - würde eine Absprache der Teams bedeuten (gentlemen's agreement) => ein Fall für die Obergurus!
 
Da hängt SETI.G. wohl zu sehr an ihrem Terminplan und bevor wir das hier durchgeboxt haben... :D

@Michael H.W. Weber

Du kennst meinen Rechner nicht, der läuft wochenlang durch, aber dann stürzt er aus unerfindlichen Gründen unvermittelt einfach mal ab.
 
Im Moment enspannt sich doch die Situation wie ich finde, auf 2 von 3 rechnern habe ich streptococcus pyogenes WUs die mit 74h angegeben sind, an denen hat man eine weile zu knabbern ;)
 
Mal eine Idee: Man könnte überlegen, das Race inkl. der Neuzugänge (Poland) bis zu einem bestimmten Termin nächste Woche zu unterbrechen. Inzwischen laden wir die Kanonen auf dem Server und dann könnt ihr wieder angreifen. Ich denke fast, das wäre das Beste, damit das ganze ordentlich Spass macht. Im Moment tröpfeln ein paar WUs herunter und keiner kann damit wirklich zufrieden sein...

Michael.
Warum setzt ihr nicht einfach "tasks in process" niedriger?
Sollte erstmal das Ganze etwas beruhigen.

cu JagDoc
 
Jetzt abzubrechen ist ungut. Da wird hinterher gemuckter das gebunkert wurde.
 
So, jetzt haben alle Rechner genug WUs. Morgen nur noch den Kühler auf dem AMD Sys Tauschen damit es erträglich ist nachts,
 
Ich beschwere mich nicht, da sind gerade 40 und 30 Stunden Teile am rechnen:)
 
2 von 4 Kernen haben momentan zu tun bei mir. Ansonsten die Meldung...no work sent
 
Also ich könnte schon noch ein paar Wus gebrauchen...im Moment ist nur eine aktiv...der andere Core langweilt sich etwas...und ich hab angst das sich das DIE verzieht...wegen der ungleichen Wärmebelastung der beiden Kerne *buck*
Cybered
 
Also ich könnte schon noch ein paar Wus gebrauchen...im Moment ist nur eine aktiv...der andere Core langweilt sich etwas...und ich hab angst das sich das DIE verzieht...wegen der ungleichen Wärmebelastung der beiden Kerne *buck*
Cybered
Da hilft nur das du den Kühler genau immer über den einen heißen Kern justierst. Die Abwärme des Kühlers musst du dann auf den anderen Kern lenken.;)
 
Da hilft nur das du den Kühler genau immer über den einen heißen Kern justierst. Die Abwärme des Kühlers musst du dann auf den anderen Kern lenken.;)


Windoof switcht doch eh immer zwichen den Kernen oder ist die WU auf einem festgebunden ??? *lol*
 
Dann muss er seinen Kühler auch switchen.:P
.
EDIT :
.

Boa, bin leer gelaufen. Und nun? Wer hat sich meine WUs gekrallt?8-(
 
Dass nur "kurze" WUs an Windows-Rechner gehen kann leider nicht eingerichtet werden. Natürlich können wir die CMCALIBRATEs auch an Windows-64 ausgeben, vorausgesetzt es meckert keiner, wenn dann mal eine WU ohne Checkpoints 200 Std. oder mehr benötigt... *suspect*
kk, dachte nur, da es ja anscheinend ne Abfrage gibt "Wenn OS = Linux x64 dann sende cmcalibrate sonst fehler" hätte man sie vllt. modifizieren können ala "Wenn OS = Linux x64 dann sende lange cmcalibrate sonst wenn OS = Win x64 dann sende möglichst kurze cmcalibrate sonst fehler"
Die Möglichkeit die WUs nach wahrscheinlicher Länge sortieren zu können, scheint ja angesichts der Bilder anscheinend gegeben zu sein.

Und der von mir zitierte Beitrag klang so, als ob es sowieso in Planung wäre die CMCs auch an Windows x64 zu schicken.

Ne Frage: Bedeutet Checkpoint, dass das Programm beendet werden kann oder, dass es überhaupt pausiert werden kann, wenn die CPU-Leistung die in BOINC eingestellte Grenze überschreitet?

@Fränkis Welle: Hehe, ich hab noch 2 Jobs mit 00:00:59 und 00:01:38 Laufzeit, die jetzt laufen. *buck* Naja, fallte ich weiter Proteine für Rosetta. :D
 
Zuletzt bearbeitet:
kk, dachte nur, da es ja anscheinend ne Abfrage gibt "Wenn OS = Linux x64 dann sende cmcalibrate sonst fehler" hätte man sie vllt. modifizieren können ala "Wenn OS = Linux x64 dann sende lange cmcalibrate sonst wenn OS = Win x64 dann sende möglichst kurze cmcalibrate sonst fehler"
Die Möglichkeit die WUs nach wahrscheinlicher Länge sortieren zu können, scheint ja angesichts der Bilder anscheinend gegeben zu sein.
Leider ist genau dies nicht möglich. Die Bilder sind eine von uns nachträglich durchgeführte Auswertung aller Minisimulationsläufe. Mit der BOINC-Serversteuerung hat das nicht das Geringste zu tun. Wir haben aber David Adnerson auf dem diesjährigen BOINC-Workshop in London gebeten, eine laufzeitabhängige WU-Steuerung einzuführen.

Und der von mir zitierte Beitrag klang so, als ob es sowieso in Planung wäre die CMCs auch an Windows x64 zu schicken.
Das ist richtig und in der Tat geplant. Ich bin mir momentan nur nicht sicher, ob ich die vielen neuen User gleich am Anfang mit Monster-WUs auf im Schnitt instabileren Systemen vergraulen möchte.

Ne Frage: Bedeutet Checkpoint, dass das Programm beendet werden kann oder, dass es überhaupt pausiert werden kann, wenn die CPU-Leistung die in BOINC eingestellte Grenze überschreitet?
RNA World bietet nur für Linux-x32 Checkpointing an. Für diese Maschinen gibt es aber keine CMC WUs. Das hängt mit der RAM-Lastigkeit einiger WUs zusammen. Checkpoints zu haben bedeutet, die Kiste nach Belieben an- und abschalten zu können, ohne bis dahin berechnete Zwischenergebnisse zu verlieren. Wenn Du bei RNA World in BOINC "leave application in memory" aktiviert hast (und das ist ZWINGEND nötig für dieses Projekt), kannst Du zwei Dinge tun, ohne Deine Zwischenergebnisse zu verlieren: Erstens kannst Du einen RNA World Task pausieren und ohne Verluste wieder resumen. Zweitens kannst Du den Rechner in den Hibernation Mode versetzen und nach Reboot läuft die RNA World WU dort weiter, wo sie unterbrochen wurde. Das ist ganz hübsch, wenn man auf derselben Kiste z.B. noch Linux hat und dann dort was anderes machen will.
Wenn die Option "leave application in memory" nicht gesetzt ist und Du mehr als ein BOINC-Projekt zur selben Zeit betreibst, bei denen die Applikationen dann sagen wir mal alle 60 Minuten wechseln, dann startet RNA World jede WU, die länger als 60 Minuten Laufzeit hat beim Applikationswechsel neu, d.h. solche WUs landen in einer Endlosschleife und werden irgendwann wegen Überschreiten der Abgabefrist vom System gelöscht. Dies gilt übrigens für alle BOINC-Projekte, die kein Checkpointing besitzen.

Und vielleicht noch mal am Rande erwähnt: Für uns DC-Unterstützer ist Checkpointing eigentlich eine Selbstverständlichkeit. Das Problem ist, dass Applikationen, die nicht gezielt für den Einsatz in DC-Umgebungen entwickelt wurden, fast nie ein Checkpointingfeature besitzen. Leider. Vor allem bei Hochdurchsatzanwendungen im wissenschaftlichen Bereich ist das der Fall. Da ist jedes Rausschreiben von Zwischenergebnissen einfach nur Overhead. So ist das auch der Fall bei RNA World. Worum wir uns deshalb bemühten - und das gelang leider nur für Linux-x32 - war der Ansatz, den gesamten Arbeitsspeicher in regelmässigen Intervallen auf die Platte zu klatschen und hiervon sozusagen im Fall eines Abschaltens bzw. Absturzes durch Neuladen "zu zehren". Ähnlich also wie das Prinzip der Hibernation Modes. Ziel war und ist die Idee eines universellen Checkpointings, die ich letztes Jahr auf dem BOINC-Worksop in Barcelona vehement vertreten habe. Das Problem ist, dass man dazu böse ins System eingreifen muss und wir natürlich einsehen, dass User einem DC-Projekt dies bei aller Liebe und Vertrauen gewiss nicht gerne genehmigen. Was wir im Moment verfolgen ist ein Ansatz, wo unser Projekt in BOINC in einer VM läuft. Das System dazu wird vom CERN entwickelt, allerdings kommen die leider seit ca. 1 Jahr nicht so recht in die Puschen, primär wohl wegen Personalmangel. Die hatten auch ganz anders damit vor, wurden dann aber wohl anlässlich meiner Quengeleien letztes Jahr hellhörig, dass man hiervon auch in anderem Kontext profitieren könnte. :D Da treten natürlich wieder andere Probleme auf, wie z.B. die Grösse der VM (aktuell wohl 800 MB, der Prototyp läuft endlich und wurde in London gerade vorgestellt), dann der ca. 7%ige Geschwindigkeitsverlust, usw. Es gibt aber Lösungsansätze (ein Torrent in BOINC für das Peer-2-Peer Austauschen des VM-Images zum Beispiel) und alternative Methoden. Das mal so als Hintergrundinformation im Zusammenhang mit Checkpointing haben oder nicht haben.

Michael.
 
Zuletzt bearbeitet:
Danke Michael für deine ausführliche Erklärung und deinen Support hier! *great*

Ich denke eine Unterbrechung wäre nicht so dienlich, zumal das ja eh kein offizielles Race ist.
Wir versuchen einfach ein bisschen weniger zu nörgeln. ;)

Ich an deiner stelle würde allerdings die Monster WUs gerade jetzt für Windows freigeben, so viele Testsysteme auf einem Haufen bekommst du so schnell nicht wieder.
UND die User können hier auch direkt ihre Fragen loswerden.
 
Man könnte ja in BOINC einen Schalter für unsere 24/7 Cruncher einbauen. Die Monster-WUs werden dann nur an diese verteilt oder BOINC fragt seine eigene Laufzeit ab. Wenn Laufzeit > als 7 Tage dann Monster-WU.

Ich sehe schon ein, dass es keinen Sinn macht Gelegenheitscrunchern wie mir, die nur den Hauptrechner crunchen lassen solche Monster-WUs zu geben.
 
Status
Für weitere Antworten geschlossen.
Zurück
Oben Unten