AMD-Grafikkarten unter Linux: Treiber, OpenCL, BOINC, amdconfig und headless per ssh

Hmm, über pip habe ich noch nie was installiert, das ist bei mir irgendwie kaputt und ich hatte noch nicht das zwingende Bedürfniss da länger zu forschen.

Ich hab das idR. von github gezogen:

Die ganze pip Geschichte ist neuer, geht sicher auch, braucht es aber auch nicht.
Zusätzlich musst du nur noch das Kernelfeature amdgpu.ppfeaturemask=0xfffd7fff wie in der Einleitung beschrieben aktivieren, Neustart, dann läuft das.
 
Mal sehen, wird meine Sonntagsaufgabe sein.
 
Das habe ich gemacht. Wie gehts weiter?

Next, add the rickslab-gpu-utils repository:
wget -q -O - https://debian.rickslab.com/PUBLIC.KEY | sudo apt-key add -
echo 'deb [arch=amd64] https://debian.rickslab.com/gpu-utils/ eddore main' | sudo tee /etc/apt/sources.list.d/rickslab-gpu-utils.list
sudo apt update

Then install the package with apt:
sudo apt install rickslab-gpu-utils


Von wo aus muss ich

pip3 install rickslab-gpu-utils

denn ausführen? Wenn ich das vom gleichen Terminal ausmache, sagt mir das Fenster:

Der Befehl 'pip3' wurde nicht gefunden, kann aber installiert werden mit:
sudo apt install python3-pip
 
Meinem Verständnis nach lässt sich das Tool mitlerweile über mindestens 3 Wege installieren, git clone direkt von GitHub, obiges apt repository und dann über pip.

https://pypi.org/project/rickslab-gpu-utils/ empfiehlt apt und pip Installation, du solltest aber nur eine davon brauchen.
Wenn du sudo apt install rickslab-gpu-utils schon ausgeführt hast, brauchst du sudo apt install python3-pip nicht mehr.
Doppelposting wurde automatisch zusammengeführt:

Hat jemand den 20.45er Treiber Mit Vega oder Navi schon mal bei Milkyway getestet?

Habe damit soeben einen Abbruch mit folgendem Fehler bekommen:
Error creating command queue (-6): CL_OUT_OF_HOST_MEMORY
Error getting device and context (-6): CL_OUT_OF_HOST_MEMORY

Erinnert mich an die Milkywayversuche mit Mesa/Clover OpenCL und ROCm. Der neue Treiber nutzt ja nun wohl auch die ROCm statt PAL OpenCL Implementierung, vermutlich kann Milkyway damit einfach nicht.
 
Zuletzt bearbeitet:
Hmm, über pip habe ich noch nie was installiert, das ist bei mir irgendwie kaputt und ich hatte noch nicht das zwingende Bedürfniss da länger zu forschen.

Ich hab das idR. von github gezogen:

Die ganze pip Geschichte ist neuer, geht sicher auch, braucht es aber auch nicht.
Zusätzlich musst du nur noch das Kernelfeature amdgpu.ppfeaturemask=0xfffd7fff wie in der Einleitung beschrieben aktivieren, Neustart, dann läuft das.
An der Änderung der grub Datei scheitere ich leider auch. Ich habe sie zwar gefunden, aber sie lässt sich nicht ändern. Habe auch sudo vi grub laufen lassen. Da kriege ich eine Fehlermeldung, mit swap file (vermutlich habe ich doch eine andere Version erstellt, aber es ist nur eine da).

So blöd, wie mit Linux habe ich mich lange nicht an einem Rehcner gefühlt!
 
du solltest das zb. auch mit sudo nano /etc/default/grub öffnen können, der Editor ist für Einsteiger ein wenig zugänglicher.
Ansonsten gern mal die ganze Fehlermeldung kopieren / screenshot, dann lässt sich das besser diagnostizieren.
 
Ich rufe immer den editor gedit mit sudo auf, dann kann man sich gemütlich durch die Dateistruktur klicken.
Wenn ich irgendwo vi lese, dann ersetze ich das lieber immer durch einen grafischen Editor. Ich sehe einfach keinen Sinn darin, mit vorsintflutlicher Technik zu arbeiten. ;)
 
Zum Glück gibt es dafür gvim ^^
 
Ja, es gibt viele. Aber da ich ausschließlich Ubuntu nutze, nehme ich einfach den mitgelieferten Editor.
 
Es ist vorsintflutlich vi als vorsintflutlich zu bezeichnen.
Zeigt nur, dass man sich nicht damit beschäftigt hat.
Ich nehme allerdings für den Alltag nano auch lieber.
Die wichtigtsten Kommandos bei vi zu kennen rettet allerdings sicher sehr oft vor unnötigen Neuinstallationen.
Gilt übrigens auch für sed. Damit sollte man sich ebenso beschäftigen.
 
Ich rufe immer den editor gedit mit sudo auf, dann kann man sich gemütlich durch die Dateistruktur klicken.
Wenn ich irgendwo vi lese, dann ersetze ich das lieber immer durch einen grafischen Editor. Ich sehe einfach keinen Sinn darin, mit vorsintflutlicher Technik zu arbeiten. ;)
vi gibt's überall, die Kisten auf Arbeit haben nix anderes, musste mich also damit beschäftigen und habe mich damit arrangiert :-)
 
Hat jemand den 20.45er Treiber Mit Vega oder Navi schon mal bei Milkyway getestet?

Habe damit soeben einen Abbruch mit folgendem Fehler bekommen:
Error creating command queue (-6): CL_OUT_OF_HOST_MEMORY
Error getting device and context (-6): CL_OUT_OF_HOST_MEMORY

Erinnert mich an die Milkywayversuche mit Mesa/Clover OpenCL und ROCm. Der neue Treiber nutzt ja nun wohl auch die ROCm statt PAL OpenCL Implementierung, vermutlich kann Milkyway damit einfach nicht.

Mit Thorsams 6900XT und dem offiziellen Treiber 20.45 bricht die WU ebenfalls ab, gleicher Fehler.
 
Gerade eben neu gebootet, da grinst mich ein Kernel-Error von wegen AMD...dpkms oder so an. Toll.
Aber das System läuft trotzdem noch. GPU bleibt ohnehin erstmal aus.
 
Der Befehl 'pip3' wurde nicht gefunden, kann aber installiert werden mit:
sudo apt install python3-pip
Wie koschi schon sagte, es gibt viele Möglichkeiten die Utils zu installieren.
Bei meinem Link war ich davon ausgegangen, dass Du diesen Hinweis nicht bekommst.

Also einfach eine Konsole aufmachen und 'sudo apt install python3-pip' ausführen.
Danach 'sudo apt install rickslab-gpu-utils'

Mit 'gpu-mon' öffnet er folgende Ansicht. Mit 'sudo gpu-pac --execute_pac' kannst Du Einstellungen vornehmen, und abspeichern.
gpu-mon.pnggpu-pac.png
 
Also ist rickls-abs der Nachfolger von amdgpu-utils. Sieht zumindest exakt gleich aus.
Oder wollte AMD ihren Namen zurück?
 
Die Tools unterstützen jetzt auch Nvidia, daher hat er den Namen wohl geändert.
 
Du kannst Fragen fragen. :)
Ricks Lab hat er sich meiner Meinung nach immer genannt.
 
Meine Frau blockiert gerade die Tastatur, weil sie Fotobuch erstellt (das kann Stunden dauern). Eine Tastatur und ein Bildschirm für 2 Rechner?

ich will diesen Quatsch endlich zum Laufen bekommen. At stock hat die Vega 64 310 Sekunden bei 1 WU und 640 Sekunde bei 2 WU gebraucht. Ich nehme an, dass ich ins Power oder Templimist gelaufen bin, 1,2 V, wenn 0,95 und 5% weniger Takt auch reichen ist echt unnötig. Gut zu sehen, dass das Tool auch Monitoring hat, dann erübrigt sich meine spätere Frage nach einem Linux Pendant zu HWInfo
Doppelposting wurde automatisch zusammengeführt:

YEAH BABY. Nach dieser ganzen (Achtung: schlechter Wortwitz) Sudo-Maso-Aktion hat es endlich geklappt. Vega läuft jetzt auf 1 V mit 190 W (statt 1,2V mit 240 W) und Speicher-Clock von 1020 Mhz (statt 945 Mhz). Mal gucken, was Einstein dazu sagt!

Ich DANKE euch echt für eure Geduld mit mir. Muss mir das hier alles aufschreiben, weil das 2 anderen Rechnern auch noch droht!
 
Zuletzt bearbeitet:
Schmeiß mal nochmal alles weg mit dem Uninstaller und zieh dir folgendes Paket:


Das installierst du auf der Kommandozeile mit sudo dpkg -i ~/Download/amdgpu-ocl_20.40-1147286.deb, idR. sollte es ja im Downloadverzeichnis landen.
Anschließend installierst du nur noch drei weitere Pakete:
sudo apt install ocl-icd-libopencl1 clinfo boinc-client-opencl

Im Anschluss rufst du clinfo auf und solltest deine GPU auch schon sehen. Nach einem Neustart von BOINC erkennt auch BOINC die GPU.


5.4 vs. 5.6 hatte mich auch verwirrt. Ich vermute der AMDGPU-PRO Treiber bringt den AMDGPU Stand vom Linux Kernel 5.6 mit. Sonderbar dass die non pro Installation trotzdem was kompilieren will. Kommt das über --headless? Laut docs bringt --headless amdgpu-pro OpenCL, hmpf...

Versuch es mal bitte mit dem Archiv von meiner Seite...
Sollte der gleiche Weg auch mit einem 2400G klappen?
Oder eher nicht, weil APU und älter?
 
Ja sollte auch auf dem 2400G mit seinen Vega Kernen klappen!
Doppelposting wurde automatisch zusammengeführt:

Mit meiner V56 bin ich im Schnitt wohl bei knapp unter 11 Minuten für 2 WUs, da musst du mit der V64 drunter :-)
Ggf. je WU einen Kern frei lassen.
 
Zuletzt bearbeitet:
ich bin mit 3 WUs bei 14 Minuten, d.h. 4,67 Minuten pro WU. Du bist bei 5,5 Minuten pro WU.

Die ganzen WUs von heute Nacht sind hochgeladen und viele davon bestätigt. D.h. trotzt stärkerem Undervolting bis jetzt alles richtig, da der Rest im Pending und bisher nichts falsch ist. Ich stelle den laufenden Rechner jetzt ins kühle Schlafzimmer und mache einen Tag-Test. Erneutes UV hat nach Reboot auch wieder funktioniert; so lässt es sich arbeiten:-)

Danke nochmal!!!
 
Jo alles klar, ich hatte die 8xx Sekunden als Schwankungen durch zu hohe CPU Last gedeutet. Mit 3 WUs passt das natürlich :-)
 
Hat den Treiber 20.45 sonst schon mal jemand ausprobiert?

Mit den 6900XT gabs da die wirresten Probleme, Milkyway geht auf der 6900XT und auch auf der Vega nicht mehr und heute Nacht hat mein Linux dann im clinfo und BOINC die GPU verloren und zahlreiche WUs geschrottet. Sowas hatte ich auf meinem Desktop mit früheren Treibern noch nie erlebt.
Nach einem Neustart ist die Karte wieder da. Eine Chance bekommt der Treiber noch, ansonsten gehe ich zurück auf 20.40.
 
Zurück
Oben Unten