9. Pentathlon 2018 - PrimeGrid (Querfeldein)

OpenCL geht nur GFN , und die sind schlechter in der Ausbeute.
Und wie viel schlechter genau?

Also ich habe die PPS Sieve, weil die laut Startpost am meisten bringen.
Und die laufen auf der GTX1050ti mit CUDA 15 Minuten.
Wenn 2 von den GFN per OpenCL in der gleichen Zeit fertig werden, dann könnten ja trotzdem mehr Punkte bei rauskommen.

Wie ist denn das cr/h Verhältnis zwischen ppssieve und gfn ?
 
Ich habe bei der Vega von 3 gegengerechneten WUs 1 Berechnungsfehler

Soll das so, oder ist wieder irgendwas nicht stabil?
 
Einfach erstmal weiter rechnen, wer weiss wo der Berechnungsfehler her kam.
Solange sie vereinzelt auftreten würde ich das ignorieren.
 
Bin noch ein gebranntes Kind aus Hawaii-Zeiten, da waren bei jedem 50% oder so falsch :/
 
Allerdings hält sich die Laufzeit auch in Grenzen. Wenn bei 10 WUs mehr als eine fehlerhaft ist würde ich mir erst Sorgen machen. ;)
 
War jetzt von 16 validierten die einzige kaputte, scheint zu passen

~200 warten auf Validierung, automatischer Bunker ist echt was geiles :D
 
Ja stimmt schon, gute 90% meiner Einfahr WUs waren ebenfalls im Pending gelandet, da sieht man mal wieder wie sich alle einbunkern. *buck*
 
Ja stimmt schon, gute 90% meiner Einfahr WUs waren ebenfalls im Pending gelandet, da sieht man mal wieder wie sich alle einbunkern. *buck*

Von den 82 Primeln die ich gestern gegen 23 Uhr rausgelassen habe um aufzumunitionieren waren direkt 8 gut geschrieben. Irgenwann waren es dann 12. In den letzten 8 Stunden wurde keine weitere gutgeschrieben...

Ich hoffe deren Validator ist bulletproof.
 
Ich habe derzeit 4 gültige bei 67 ausstehenden WUs. *buck*
Es würde mich nicht wundern wenn der Server zuuuufällig am 13.5. zwischen 2 und 4 Uhr nicht mehr erreichbar wäre. ;)
 
Ich hab mal die ersten 50 von der RX460 hochgeladen und 150 neue eingelagert.
Der wär sonst heute Abend schon fertig gewesen.
Bei mir wurden allerdings gut die Hälfte schon validiert.
Eigentlich wollte ich nur 100 haben, aber der war so schnell mit mit dem download, dass ich nicht rechtzeitig die Tür schließen konnte. Da werden wohl noch 50 übrig bleiben, die nicht mehr berechnet werden können.
 
Gerade mal ein paar Experimente gemacht, bei mir ist Primegrid langsamer wenn ich 0.66 statt 0.25 Ryzen-Threads zuweise :D

0.5 Threads ist zwar ~30 Sekunden schneller als 0.25 Threads, aber die fand ich bei Numbers besser aufgehoben

Außerdem sind 3 WUs für eine wassergekühlte, also nicht ins Temp-Limit des Ref-Kühlers rennende, Vega 64 einfach zu wenig, kaum Geschwindgkeitsgewinn pro WU zu 4 WUs
 
Bei mir laufen 4 WUs mit je 0,5 Prozessoren recht geschmeidig neben den Universe WUs und das trotz SMT Einsatz.
Vielleicht hat die Karte ja dadurch einen ganzen Kern für sich. :)
 
Hast du noch die 290X?
 
Auch....gemeint war aber meine Referenz Vega64 @ Stromspar Profil.
 
Na gut, wie es mit Stromsparprofil aussieht weiß ich nicht, meine darf sich +50% PT genehmigen wenn sie denn unbedingt möchte :D
 
Ach ich hatte für mich entschieden das es für mich reicht weil sich die Mehrleistung der anderen Profile in Grenzen hält, die Taktfrequenz halbwegs stabil bleibt anstatt immer mit Anlauf in das Temperatur Limit zu rennen und sich die Lautstärke des Kühlers in Grenzen hält.

Ich meine das System mit der Karte (ca. 19 Minuten WU Laufzeit) + einem Ryzen 1700 und zusätzlichen einem 2400G System auf Vollast schlägt aktuell mit ca. 460W auf der Steckdosenleiste an.

Als Stromfresser habe ich da noch was ganz anderes am laufen was mir eine üble Stromrechnung bescheren wird. *g*
 
Ich kann wirklich smarte Netzteile empfehlen, die Effizienz und Stromverbrauch per Software anzeigen.
 
Ach passt schon.
Mit der Steckdosenleiste kann ich nach dem Penta auch andere Sachen messen und kann im Vorbeigehen drauf schauen. ;D
 
Ich kann wirklich smarte Netzteile empfehlen, die Effizienz und Stromverbrauch per Software anzeigen.
Geht vermutlich nur mit Windows, oder?
Noch besser wäre ein eigenes Display für die Frontblende.
 
Deswegen würden die mir auch nichts bringen. Zumal ich genaue Messgeräte da habe.
 
Mir kam ein wenig komisch vor, dass meine 280x eher scheller ist als meine RX 480.
Also habe ich doch mal die app_config ausprobiert, erst hatte ich die nicht verwendet, da GPU-Z 100% Last anzeigte.
Aber die Zeiten sind wohl vorbei wo man sich noch darauf verlassen konnte.

Hier also mal die Ergebnisse:

RX 480 1.0 CPU 1.0 GPU = ~13min = 100% Leistung
RX 480 0.1 CPU 0.5 GPU = ~18,5min = 140% Leistung
RX 480 0.3 CPU 0.3 GPU = ~27,5min = 142% Leistung
(0.3 = 0.33)
Das ganze werde ich jetzt auch mal auf meiner 750Ti auch mal probieren, auch hier wurden 100% angezeigt.

Okay die 750Ti kann kaum zulegen:

750Ti 1.0 CPU 1.0 GPU = ~27,5min =100% Leistung
750Ti 0.1 CPU 0.5 GPU = ~53 min = 104% Leistung
 
Ja das ist aus vielerlei Sicht ein Problem die optimale Leistung rauszuholen aber eines ist durchaus absehbar. Mit zunehmender Leistung der Karte wird es schwieriger die Leistung abzurufen.

SMT kann bei gleichzeitig laufenden CPU und GPU WUs die GPU WU deutlich ausbremsen.
Das sehe ich beispielsweise gerade bei meinem Cruncher. Obwohlich jeder GPU einen ganzen Kern/Thread zugeordnet habe steigt die Rechenzeit von ca. 7,5 Minuten auf ca. 13 Minuten sobald Rosetta auf dem Prozessor läuft. Das wirkt sich bei der Konfig natürlich auch erheblich auf den Strombedarf des Systems aus denn es frisst durch die Ausbremsung deutlich weniger Strom. Wenn das Projekt aktiv ist werde ich deshalb SMT abschalten. Aktuell ist mir das relativ egal da der Bunker ohnehin nicht reicht.

Aber ich sehe auch immer wieder das im Verlauf der GPU WU Auslastungslücken entstehen. Bei einer Mehrfachbelegung der GPU kann man diese natürlich wieder stopfen. Dadurch laufen die einzelnen WUs dann zwar ein Stück langsamer, es werden aber mehr fertig. Dadurch kommt am Ende dennoch deutlich mehr raus.

Ein weiterer Punkt ist auch das ich schon öfters den Effekt hatte das der voreingestellte CPU Bedarf nicht gerecht hatte (was ebenfalls bei zusätzlicher CPU Last auffällt) oder vergleichsweise langsame Kerne die schnellen GPUs nicht ausreichend füttern konnten. Gerade für den letzterer Punkt ist eine Mehrfachbelegung der GPU wieder interessant da die WUs nur allso oft nur einen Kern nutzen konnten. Laufen allerdings 2 WUs auf der GPU dann kann man damit wieder einen weiteren Kern anzapfen.


Wie man sieht ist es relativ kompliziert wenn man beides gleichzeitig auf dem System laufen lassen und dabei eine Ballance zwischen beiden finden will denn eines ist relativ sicher, ein deutlicher Einbruch bei den GPU WUs kostet in der Zeit mehr Credits als man mit den CPU WUs erwirtschaften kann.
 
Und wie viel schlechter genau?

Also ich habe die PPS Sieve, weil die laut Startpost am meisten bringen.
Und die laufen auf der GTX1050ti mit CUDA 15 Minuten.
Wenn 2 von den GFN per OpenCL in der gleichen Zeit fertig werden, dann könnten ja trotzdem mehr Punkte bei rauskommen.

Wie ist denn das cr/h Verhältnis zwischen ppssieve und gfn ?

Seh mal bei WUprop nach.
Sieve wird besser vergütet weil keine Primzahlen gefunden werden können.
Und die GFN belasten die GPU noch mehr und damit die Wahrscheinlichkeit von Rechenfehlern , vor allem bei gleichzeitigen Berechnungen mehrerer WUs.
 
Ich versuche gerade das Projekt für meine 290x einzurichten und was man da rausholen kann ist schon erschreckend. Bei der 1:1 Konfig mit SMT und Rosetta auf der CPU lief die WU ca. 15 Minuten. Jetzt habe ich es mit 1:0,5 Config probiert und die Laufzeit fiel auf ca. 14 Minuten und es wurden in der gleichen Zeit 2 WUs fertig. Die GPU Auslastung lag dabei weitestgehend bei 100%. Ich denke ich kann bei der Config bleiben. :)
 
Zurück
Oben Unten