Einstein@home - allgemeiner Austausch (News, Forenfunde, HowTo, etc.)

Aus einem GPU-Bastelprojekt war noch ein Paket Wärmeleitpad Alphacool Eisschicht 17 W/mk übrig.
Dachte es wäre eine super Idee, dass, statt Wärmeleitpaste, für den TR-Kühler zu nehmen.
Totaler Blödsinn. Hat mich aber trotzdem ein Bündel Nerven gekostet, dass heraus zu finden.
Jetzt läuft die Kiste ohne Panik-Shutdown. Mal sehen wie weit der Rechner mit den 3 Vega64 in der Top-System-Liste kommt.

@Koschi, wenn Du wüßtest was letzte Woche in der Calinstraße los war, dann war das Problem mit der WU-Versorgung noch das Kleinste. ;-)
Ich sach nur: Einmal mit Profis arbeiten. *rofl*
 
Zuletzt bearbeitet:
Laufen die Karten aktuell mit 1x WU je GPU?
Wieviel CPU lässt du dafür frei?
 
2 WUs je GPU.
Pro WU ein CPU-Kern.

Bei 2 der Karten läuft der VRAM mit 1050 MHz.

System3.jpg

Sabroe_SMCs Vega64 wird nach wie vor als Vega56 bezeichnet. *noahnung*

FAKE NEWS!!!! ;D
 
Zuletzt bearbeitet:
Ja ich hatte da irgendwie nen Denkfehler, natürlich sind es 2 WUs pro GPU...
Bissl über 3 Millionen Credit pro Tag sollten da möglich sein.
Ich bin mit der Vega 56 bei 375 Sekunden mit einer WU, bei 660 Sekunden mit 2 WUs @ 935MHz Speichertakt und 160W.
 
Ich glaube ich hatte mich mit meinem Cruncher mal daran versucht und die WUs laufen lange, die CPU Auslastung ist hoch und die GPU Auslastung gering.
 
@Koschi Danke für das Script aus dem Einstein Forum, mein Ryzen 3 PRO 2200GE knuspert jetzt auch via OpenCL*clap*
 
Danke für die Rückmeldung *great*

Welche Distribution?
 
Kann jemand mit der Fehlermeldung was anfangen?

Code:
Stderr output

<core_client_version>7.16.3</core_client_version>
<![CDATA[
<message>
process exited with code 69 (0x45, -187)</message>
<stderr_txt>
13:03:07 (5054): [normal]: This Einstein@home App was built at: Jan 16 2017 08:09:16

13:03:07 (5054): [normal]: Start of BOINC application '../../projects/einstein.phys.uwm.edu/hsgamma_FGRPB1G_1.18_x86_64-pc-linux-gnu__FGRPopencl1K-ati'.
13:03:07 (5054): [debug]: 1e+16 fp, 6.7e+09 fp/s, 1572771 s, 436h52m50s82
command line: ../../projects/einstein.phys.uwm.edu/hsgamma_FGRPB1G_1.18_x86_64-pc-linux-gnu__FGRPopencl1K-ati --inputfile ../../projects/einstein.phys.uwm.edu/LATeah1063L05.dat --alpha 1.41058464281 --delta -0.444366280137 --skyRadius 5.526880e-07 --ldiBins 30 --f0start 436.0 --f0Band 8.0 --firstSkyPoint 0 --numSkyPoints 1 --f1dot -1e-13 --f1dotBand 1e-13 --df1dot 2.512676418e-15 --ephemdir ../../projects/einstein.phys.uwm.edu/JPLEPH --Tcoh 2097152.0 --toplist 10 --cohFollow 10 --numCells 1 --useWeights 1 --Srefinement 1 --CohSkyRef 1 --cohfullskybox 1 --mmfu 0.1 --reftime 56100 --model 0 --f0orbit 0.005 --mismatch 0.1 --demodbinary 1 --BinaryPointFile ../../projects/einstein.phys.uwm.edu/templates_LATeah1063L05_0444_25543091.dat --debug 1 --device 0 -o LATeah1063L05_444.0_0_0.0_25543091_0_0.out
output files: 'LATeah1063L05_444.0_0_0.0_25543091_0_0.out' '../../projects/einstein.phys.uwm.edu/LATeah1063L05_444.0_0_0.0_25543091_0_0' 'LATeah1063L05_444.0_0_0.0_25543091_0_0.out.cohfu' '../../projects/einstein.phys.uwm.edu/LATeah1063L05_444.0_0_0.0_25543091_0_1'
13:03:07 (5054): [debug]: Flags: X64 SSE SSE2 GNUC X86 GNUX86
13:03:07 (5054): [debug]: glibc version/release: 2.31/stable
13:03:07 (5054): [debug]: Set up communication with graphics process.
boinc_get_opencl_ids returned [0x1830ba8 , 0x7f9d4612bbc0] 
Using OpenCL platform provided by: Mesa
Using OpenCL device "AMD NAVI10 (DRM 3.36.0, 5.5.6-1-default, LLVM 9.0.1)" by: AMD
Max allocation limit: 5153960755
Global mem size: 6442450944
OpenCL compiling FAILED! : -11 . Error message: fatal error: cannot open file '/usr/lib64/clc//gfx1010-amdgcn-mesa-mesa3d.bc': No such file or directory

OpenCL device has no FP64 support
OpenCL compiling FAILED! : -11 . Error message: fatal error: cannot open file '/usr/lib64/clc//gfx1010-amdgcn-mesa-mesa3d.bc': No such file or directory

Couldn't compile OpenCL kernels (error: 1)
initialize_ocl returned error [2006]
OCL context null
OCL queue null
Error generating generic FFT context object [5]
13:03:07 (5054): [CRITICAL]: ERROR: MAIN() returned with error '5'
FPU status flags: 
mv: der Aufruf von stat für 'LATeah1063L05_444.0_0_0.0_25543091_0_0.out' ist nicht möglich: Datei oder Verzeichnis nicht gefunden
mv: der Aufruf von stat für 'LATeah1063L05_444.0_0_0.0_25543091_0_0.out' ist nicht möglich: Datei oder Verzeichnis nicht gefunden
mv: der Aufruf von stat für 'LATeah1063L05_444.0_0_0.0_25543091_0_0.out' ist nicht möglich: Datei oder Verzeichnis nicht gefunden
mv: der Aufruf von stat für 'LATeah1063L05_444.0_0_0.0_25543091_0_0.out' ist nicht möglich: Datei oder Verzeichnis nicht gefunden
mv: der Aufruf von stat für 'LATeah1063L05_444.0_0_0.0_25543091_0_0.out' ist nicht möglich: Datei oder Verzeichnis nicht gefunden
mv: der Aufruf von stat für 'LATeah1063L05_444.0_0_0.0_25543091_0_0.out.cohfu' ist nicht möglich: Datei oder Verzeichnis nicht gefunden
mv: der Aufruf von stat für 'LATeah1063L05_444.0_0_0.0_25543091_0_0.out.cohfu' ist nicht möglich: Datei oder Verzeichnis nicht gefunden
mv: der Aufruf von stat für 'LATeah1063L05_444.0_0_0.0_25543091_0_0.out.cohfu' ist nicht möglich: Datei oder Verzeichnis nicht gefunden
mv: der Aufruf von stat für 'LATeah1063L05_444.0_0_0.0_25543091_0_0.out.cohfu' ist nicht möglich: Datei oder Verzeichnis nicht gefunden
mv: der Aufruf von stat für 'LATeah1063L05_444.0_0_0.0_25543091_0_0.out.cohfu' ist nicht möglich: Datei oder Verzeichnis nicht gefunden
mv: der Aufruf von stat für 'LATeah1063L05_444.0_0_0.0_25543091_0_0.out.cohfu' ist nicht möglich: Datei oder Verzeichnis nicht gefunden
mv: der Aufruf von stat für 'LATeah1063L05_444.0_0_0.0_25543091_0_0.out.cohfu' ist nicht möglich: Datei oder Verzeichnis nicht gefunden
13:03:18 (5054): [normal]: done. calling boinc_finish(69).
13:03:18 (5054): called boinc_finish

</stderr_txt>
]]>

Es handelt sich um nen Rechner mit openSUSE Tumbleweed. GraKa ist ne 5600XT, aber eine RX480 und HD5450 laufen auch nicht.

Hauptproblem scheint mir zu sein: OpenCL device has no FP64 support

Hat jemand eine Idee, wie das unter Linux hinzubekommen ist?

Gruß
Ritschie
 
Gibt es die Datei /usr/lib64/clc//gfx1010-amdgcn-mesa-mesa3d.bc ?
Etwas merkwürdig erscheint mir der Doppelslash // im Pfad.
 
Auf meinem Rechner mit der Radeon VII gibt es den Ordner /usr/lib64/ auch nicht, trotzdem läuft Einstein mit OpenCL. Ich habe aber nur das OpenCL-Paket installiert, nicht den ganzen AMD-Treiber.
 
Ich brauche mal ein bißchen Unterstützung, auf Grund 9 Monate Abwesenheit wegen Seti.

Mit meinen Einstellungen kann etwas Hinten und Vorne nicht stimmen, weil ich mit 4x Vega 64 und 1x Vega 56,
nur einen Output von ~ 400T Punkte habe.

Unter dem Reiter "Projekt" hatte ich die GPU-Auslastung für BRPG und FGRPG auf 0,5 und für GWG auf 0,33 gestellt.
Laut amdgpu-utils lag die Auslastung damit bei ~ 50% und der GPU-Takt war so bei ~ 800 MHz.

Um in diese Sache Grund rein zu bekommen, habe ich die GPU-Auslastung auf 1,0 gestellt,
und per amdgpu-utils den GPU-Takt auf 1.630 MHz bzw. für die Vega 56 auf 1590 MHz festgenagelt.
 
Welche CPU? Ich würde erstmal jeder WU einen Kern reservieren.
 
Einmal 2700X und einmal 1950X.

Das System hatte von sich aus jeweils 0,9 Kerne pro WU gekrallt.
 
Mir war auch so, als ob Einstein bei AMD-GPUs mindestens einen Kern bekommen sollte. Also probier ruhig mal 2 Threads pro WU freizulassen.
 
Ich habe jetzt erstmal die Gravitational Wave search O2 Multi-Directional GPUs in den Projekteinstellungen abgewählt.
Jetzt sieht der Output schonmal besser aus.
 
Gerade mal geschaut, ich hab bei mir nur die Gamma-ray pulsar binary search #1 (GPU) erlaubt.
2 parallel brauchen ca. 400-450s.
Da sehen die beiden Cluster-Rechner mit Vega-GPUs ja eigentlich ganz gut aus.
Im Zweifel lag es wirklich nur an den O2, die bekommen ja nur 1000 cr. statt 3450.
 
@thorsam
Jetzt wo du es sagst glaube ich mich zu erinnern dass dieses Unterprojekt eine ziemlich schlechte GPU Auslastung hatte weshalb ich es nur beim multi WU Einsatz aktivieren würde. Da ich damit bei meinem Cruncher aber massive Probleme hatte habe ich es abgewählt.
 
Ja die Gravitationswellensuche läuft noch eher schlecht auf den GPUs, der Gewinn gegenüber CPU ist meiner Meinung nach den Aufwand nicht wert.
 
Die Gamma rays laufen jetzt als Seti-Ersatz auf der iGPU des J1900. ;D Super.

150.000s auf einer uralt Intel HD-Grafics. macht im Schnitt pro tag 2k Credits. So viel gabs bei Seti nicht. Da hatte ich 3 Wuzen/d und mit etwas Glück um die 300Cr.
Und Stunden gibt das für Wuprop. :D
 
Zuletzt bearbeitet:
Ich habe mich einfach Mal dazu entschlossen etwas Einstein zu rechnen.
Scheint ja mit 2 GB RAM pro WU den kompletten Arbeitsspeicher zu genehmigen. Beim anderen PC mit nur 32 GB RAM nutzen 32 WUs jeweils 1 GB RAM.
Und eine RX560 rechnet mit.
 
Einstein zusammen mit Rosetta war bei mir eine saudumme Idee. Einstein wollte 5-6GB RAM haben und die Rosettas auch jeweils 1,3GB.
Dabei ist der reale RAM-Bedarf von Einstein dann gar nicht so hoch gewesen, ich hab extra mal die vollen 4 Minuten lang die RAM-Auslastung einer WU in TOP beobachtet. Das blieb weit unter 1GB.
 
Also auf PC 1 besitze ich ja durch eure Empfehlungen 64 GB RAM für bis zu 32 Tasks -> hierbei nutzt Einstein bei der Gravitational Wave search O2 Multi-Directional Anwendung bei mir laut top 2 GB RAM pro Tasks, außer bei den Gamma WUs, da sind es nur 700 MB Pro WU, ich weiß jetzt nur nicht wie viele Gammas er gerade berechnet, die sparen ja dann auch noch etwas RAM, wobei ich vom RAM noch ein wenig Frei habe. Ich sehe unter free -h dass ich von den rund 64 GB RAM 55 GB RAM belegt habe, also ein wenig Luft ist noch da! :D

Auf PC 2 mit nur zwei RAM Steckplätzen konnte ich nur 32 GB RAM Verbauen, dort ebenfalls 32 Tasks Einstein, gleiche Anwendung ->Gravitational Wave search O2 Multi-Directional<- dort bekommt jede WU interessanter Weise nur 1 GB RAM zugewiesen. Scheinbar passen sich die Anwendung dynamisch an die PC gegebenheiten an.

Mir ist auch aufgefallen, dass der in den ersten 16 Minuten 4% Fortschritt angezeigt hatte, danach sprang er wieder zurück auf 0,5% und die Berechnungen sind immer noch zugange und hat schon mindestens 6-8 Stunden hinter sich und es soll noch mindestens 10 Stunden dauern, wobei der dort immer mehr nach oben korrigiert. Dauern die WUs 24 Stunden? :D Also bekommen die WUs feste Zeitvorgaben so wie bei Rosetta?. Scheinbar passt sich die Anwendung sehr dynamisch an die Gegenebenheiten an.

Interessant finde ich auch, dass der Computer mit mehr RAM einen höheren Fortschritt anzeigt, als der mit dem weniger RAM, obwohl beide ja die selbe CPU haben. Es wird jedoch nicht in die SWAP Partition geschrieben.

--- Update ---

Wow, nachdem die Gamma WUs fertig wurden, hatte der Computer nun alle 32 Threads mit Gravitational Wave in Arbeit, damit ist nun tatsächlich der komplette 64 GB große Arbeitsspeicher restlos ausgebucht worden, der hat sogar die komplette SWAP Partition belegt. 3 Gamma WUs berechnet er allerdings noch, sehe ich gerade in top, denn BOINC lade ich besser nicht mehr. :D

--- Update ---

Oh, der Computer mit 32 GB RAM ist nach etlichen Stunden erst zur Hälfte fertig, wo der mit 64 GB RAM so gut wie fertig ist und teilweise auch schon welche fertig gestellt hat. Also da scheint Einstein auf möglichst viel Arbeitsspeicher angewiesen zu sein.
 
Zuletzt bearbeitet:
Zurück
Oben Unten