WCG THOR Challenge 2020

Sporadisch sind bei mir auch mal einzelne MCM nach so ca. 4 min Rechenzeit defekt.

Jetzt ist der Epyc wohl in Ungnade gefallen.
In der 2. Instanz hat er nicht mal die halbe Anzahl der WUs des 3900x bekommen und WCG meldet trotz einer Menge fertig gemeldeter WUs "....too many runnable tasks..." *motz*
So brauche ich 2-3 Instanzen pro Tag
 
Ich bekomm nur 1070 Wuzen für den 7V12 - reicht für knapp 15h
 
ok manchma sind auch 16h (je nach Wuzen-Sorte)
 
Die 128 Threads des 7V12 mit Nominaltakt (real sogar minimal höher) sind für WCG scheinbar zu fleißig.
Mich verwundert das der 3900x bei gleichen Einstellungen deutlich mehr WUs bekommt (mind. 0,5 Tage plus 4,5 Tage zusätzlich) bei nicht mal 20% der Thread-Anzahl *kopfkratz
 
Bei mir ist auf dem 3960X auch bei ca. 950-1050 WUs irgendwann schluss. Die reichen bei voller Beladung mit SCCs auch nur knappe 18 bis maximal 20 h. Heute morgen ist die 5. Instanz eröffnet worden. *great*
 
Sporadisch sind bei mir auch mal einzelne MCM nach so ca. 4 min Rechenzeit defekt.

Jetzt ist der Epyc wohl in Ungnade gefallen.
In der 2. Instanz hat er nicht mal die halbe Anzahl der WUs des 3900x bekommen und WCG meldet trotz einer Menge fertig gemeldeter WUs "....too many runnable tasks..." *motz*
So brauche ich 2-3 Instanzen pro Tag
Hier würde mich interessieren ob es an den WUs liegt oder ob dein Wingman keine Probleme hat.

Zumindest bei mir habe ich noch keine defekten MCM gesehen. Kann natürlich auch sein dass ich nur WUs aus einen anderen Batch habe allerdings habe ich im Forum auch noch nichts darüber gelesen.
 
Sorry, muss mich korrigieren, das waren wohl MIPs. Zumindest werden keine MCM mehr als Error angezeigt, eventuell zu lange her. :-[
 
MIPs habe ich einige mit Error und MCM aktuell eine von mehreren Hundert (wurde nach 20 Sekunden abgebrochen). Die Fehler bei MIP habe ich viel öfter und auch auf 2 von 3 Rechnern.
 
Schau mal nach ob sich die Lage verbessert wenn RAM und Spannungswandler besser gekühlt werden.
Eines von beiden sorgte seinerzeit für Berechnungsfehler weil der RAM (Trident Z) auf dem Threadripper Board zu warm wurde. Ein anderes mal vertrug ein Projekt die ständige Drosselung durch den zu heißen Spannungswandler nicht. Waren halt recht kompakte Systeme.
 
Das betrifft aktuell eher mein 3950X-System. Dort liegt der RAM bei 45 Grad und die Spaas bei 75 - 80 Grad. Zudem wird Fehler ausgewiesen, obwohl gar nicht gerechnet wurde (keine Laufzeit - siehe Foto)
1603989928708.png
 
45 °C kommen mir etwas hoch vor.
Boote das System mal durch und lasse mal einen Propeller über den RAM pusten.
Beim Spannungswandler ist ein gutes Anzeichen das extern angeordnete Throttling, welches z.B. mit der Sensor Anzeige von hwinfo64 ausgelesen werden kann. Die Temperatur selbst hilft nicht ganz so viel da es unterschiedliche Wandler Designs gibt die unterschiedlich viel abkönnen.
 
MIP bricht hier unter Linux auch bei Stockeinstellungen sofort ab. Unter Windows laufen die problemlos durch. Woran das liegt, konnte ich auch noch nicht feststellen.
 
45 °C für RAM ist doch in Ordnung. Zudem hab ich im ITX-Kästchen keinen Platz im den RAM anzupusten. Habe es seitlich von Gehäusewand versucht, hat aber nix gebracht. Würde aber - wie gesagt - die RAM-Temperatur ok finden. PROCHOT EXT und sonstiges Throttling zeigt "No" an. Da wurde nicht gebremst. Meine MIP-Errors sind unter Windows.

Auf dem 2. System gibt's das auch sporadisch; auch als der RAM dort noch kühler war. Würde daher eher davon ausgehen, dass das am Projekt liegt!
 
Zu MIP gibt es zumindest Foreneinträge zu dem Problem.
Daher würde ich erst einmal davon ausgehen dass es "normal" ist:

Ich habe den Thread allerdings nicht gelesen vielleicht stehen da ja hinweise drin wie man es beheben oder reduzieren kann.
Ja, scheint ein Projekt issue zu sein. Eine Lösung richtige wird dort nicht beschrieben. Nur Spekualtionen wie "man soll BOINC anhalten, bevor man runterfährt", etc.
 
Hi
also mit XMP only laufen meine rams auch unter 40grad bei WCG aber mit optimierte Timings haben sie so 45grad bei WCG MCM OPC.
lg
 
Zuletzt bearbeitet:
Danke fürs Raussuchen von dem Forenbeitrag, Stiwi. Das war mir noch garnicht bekannt. Erklärt aber, warum ich auf meinem Arch auch Probleme habe.
Naja, solange genug SCC auf Lager sind, soll es mich nicht stören.
 
Die 128 Threads des 7V12 mit Nominaltakt (real sogar minimal höher) sind für WCG scheinbar zu fleißig.
Mich verwundert das der 3900x bei gleichen Einstellungen deutlich mehr WUs bekommt (mind. 0,5 Tage plus 4,5 Tage zusätzlich) bei nicht mal 20% der Thread-Anzahl *kopfkratz
Ich frage mich, ob das mit dem Boinc-Benchmarking (Epyc weniger Punkte pro Core) und der - bis vor 2 Jahren - unglaublichen Anzahl von 128 und mehr Threads in Zusammenhang steht. Boinc hat unter Windows da ja auch Probleme...wobei das wohl mehr Windows verursacht

Ich habe jetzt 2 Instanzen parallel am Laufen mit jeweils 50% CPU-Benutzung. Am Start mache ich natürlich Benchmark und lade mit 100% die Instanzen nacheinander. Wenn beide voll sind gehe ich auf 50% Nutzung.
 
Zuletzt bearbeitet:
Benchmarke mal eine Instanz mit 10% erlaubte Cores. Dann boostet das nochmal den Benchmark wegen Coreboost *mogel*
 
Wollte gerade noch ein paar SSC nachfassen, bekomme sie aber nicht runtergeladen.
Hat sonst noch jemand Probleme damit?
Im Netzwerk habe ich nichts gesperrt.
 
Bei mir hängen die Wuzen beim Hochladen auf mind. 2 Rechnern. Könnte daher an den Projektservern liegen!
 
Ich bekomme auf 2 Rechnern auch keine WUs komplett runtergeladen.
Scheint auch so ziemlich alle Unterprojekte zu betreffen. *kopfkratz *noahnung*
 
Momentan ist sehr viel Last auf den WCG Servern !?! Ich merke es beim Up und Download aber auch die Serverreaktionszeiten sind heftig.

Ich geh davon aus da läuft was Großes - dürfte heftig werden in der 5. Woche der Challenge
 
Zurück
Oben Unten