AMD-Grafikkarten unter Linux: Treiber, OpenCL, BOINC, amdconfig und headless per ssh

Hau weg die Dinger und zieh dir FGRP1G (Gamma-ray pulsar binary search #1 (GPU)) WUs, die laufen besser und sollten in unter einer Stunde durch sein.
Mehr zu Einstein gern auch in den Einsteinthread verlegen :-)
 
Zuletzt bearbeitet:
Heute habe ich mal versucht, auf dem letztens installierten Ubuntu, was sich wundersamerweise den 5.8er Kernel geholt hatte, den AMD-Treiber zu installieren. Weder 20.40 noch 20.45 wollten arbeiten. Immer wieder dkpms-Fehler oder so.
Das .deb Paket, was hier einzeln für OpenCL verlinkt war, klappte immerhin.
Dann wollte ich den Boinc-Ordner von der alten SSD rüberkopieren, aber damit startet Boinc dann nicht. Zugriffsrechte sollten passen, die waren beim ersten Versuch nicht mitkopiert worden, beim 2. Mal dann doch.
Aber der Fehler, dass beim ersten Start immer ein leeres Fenster kam und ich erst ein neues Boinc-Fenster zum Verbinden mit dem Manager öffnen musste, ist nun permanent mit allen Fenstern.
Also wieder runter die ganze Sch... , M.2-SSD ausbauen, und noch mal alles einzeln manuell neu installieren, diesmal ohne Netzwerkkabel, damit der Kernel alt bleibt.
Dann ist eben der ganze extra-Kram weg und ich werde mich auf die normalen Projekte beschränken, die einfach laufen, ohne dass man was frickeln muss, z.B. nur sixtrack bei LHC.
Wenn dann mal wieder ein unpassender Kernel installiert wird im Hintergrund, dann wird halt kurzerhand neu installiert oder ein Image zurückgebügelt und jegliche updates unterbunden. Ist ja kein produktives System.
 
Heute mal schnell Ubuntu Mate 20LTS installiert, das hier verlinkte OpenCL-Paket (.deb) dazu und bisher läuft Einstein problemlos. Es ist allerdings auch noch der alte 5.4.42er Kernel von der Installations-ISO drauf.
Spannend wirds, wenn es mal ein update gibt. Da mach ich aber vorher lieber ein backup.
 
Freut mich dass das reine OpenCL Extrakt wenigstens tut :-)

Im Cluster hatte ich neulich einfach den 5.8er Kernel entfernt und den 5.4er installiert, mit dem rerelease des amdgpu Treibers klappte auch die Installation. Hab natürlich nicht aufgeschrieben was ich nu genau gemacht hab. --no-dkms wird bestimmt darunter gewesen sein...
 
Heute mal schnell Ubuntu Mate 20LTS installiert, das hier verlinkte OpenCL-Paket (.deb) dazu und bisher läuft Einstein problemlos. Es ist allerdings auch noch der alte 5.4.42er Kernel von der Installations-ISO drauf.
Spannend wirds, wenn es mal ein update gibt. Da mach ich aber vorher lieber ein backup.
Also ich hab seit ca. 2 Jahren die gleichen OpenCL Treiber von AMD drauf und es tut, auch über zig Kernel hinweg. ;)
 
Mein Pro4750G(Prime B550M-A) hat mit koschi`s OCL Paket Mikyway gerechnet, allerdings erst nachdem ich
Kernel 5.8 installiert hatte, auf dem anderen Prime B550M-A mit 3900X und Radeon Vll wollten die
GPU Utils erst nicht korrekt laufen, erst mit dem Kernel 5.8 funktionierten sie korrekt(Mint 20.1).
 
Habe in meinem Micro-Cruncher eine R7 250 (2 GB DDR3) = GCN 1.0 drin. Eigentlich nur, weil die im Leerlauf so schön sparsam ist.
Wollte aber doch mal ausprobieren, ob ich sie unter Ubuntu 20.04 zum crunchen bewegen kann.
Installiert wurde automatisch der freie Radeon Treiber. Der enthält kein Open CL und BOINC erkennt daher keine Graka.
Über "sudo apt install mesa-opencl-icd" wurde dann das Mesa Open CL Paket installiert und nach einem BOINC-Neutsart wurde die Graka erkannt und hat auch brav eine Einstein WU berechnet.
Allerdings lohnt sich der Stromaufwand (ca. 65 Watt) nicht, Laufzeit ca. 109 Minuten. Die integrierte Vega in meinem 3500u ist mehr als doppelt so schnell (wenn keine CPU WUs gerechnet werden) und das bei max. 15 Watt.
Werde auch noch mal Milkyway in den nächsten Tagen probieren.
 
MilkyWay ... na da bin ich ja mal gespannt @Krümel das läuft bei mir nämlich nicht ^^
Alles andere klappt mit MESA aber MilkyWay halt nicht aber ich hab auch ne RNDA2 Karte
 
So heute hat AMD den neun AMDGPU Pro Treiber rausgehauen, 20.50 und was soll ich sagen ... ich nutze ja nur den OpenCL Teil davon ... aber MilkyWay geht immer noch nicht :P
 
Letztendlich wird sich Milkyway bewegen müssen und ihre Anwendung auf den aktuellen Stand bringen müssen bzw. gegen aktuelles OpenCL bauen oder sowas. Die Karten die nur mit Treiber 20.45 und neuer laufen werden ja zunehmend mehr, da hilft dann Kopf in Sand stecken seitens des Projektes wenig.
Dass das zeitnah geschieht bezweifle ich aber :-(
 
Ja gut, was will man als Besitzer einer neuen Karte groß machen ausser es mit jedem Update des Treibers erneut zu testen ^^
Unterm Strich ist es halt nicht mein Problem und mir ehrlich gesagt auch egal ... solange das Projekt im Penta nicht dran kommt ... meine GPU läuft nur in Pentazeiten mit sonst nicht :)
Aber ich mag es halt wenn es funktioniert ... dann muss man nicht erst fummeln wenn man es braucht :D
 
Wie zuerwarten funktioniert auch bei meiner Combo Milkyway nicht. :cry:
 
Oh, SuSE, mein Beileid :-D


(Späßchen, aber das könnte knifflig werden...)
So, irgendwas muss da kaputt sein. Es läuft.
Eine Einstein Test WU ist durch. Gamma-ray in 210 Sekunden. Mal sehen was die Validierung sagt.
Und schups kam auch die erste WCG G WU. Auch hier mal die Validierung abwarten.


@WhiteFire

das sieht nach Mesa/Clover aus, richtig?


Jetzt muss nur noch die Erkennung vom BM funktionieren
Code:
GPU detection failed: process exited with status 193: Unkown error 193
Ich komme da nicht weiter *admin*

Code:
System:    Kernel: 5.4.0-71-generic x86_64 bits: 64 compiler: gcc v: 9.3.0 Desktop: Cinnamon 4.8.6
           wm: muffin dm: LightDM Distro: Linux Mint 20.1 Ulyssa base: Ubuntu 20.04 focal

Graphics:  Device-1: AMD Vega 10 XL/XT [Radeon RX Vega 56/64] driver: amdgpu v: kernel
           bus ID: 83:00.0 chip ID: 1002:687f
           Display: x11 server: X.Org 1.20.9 driver: amdgpu,ati unloaded: fbdev,modesetting,vesa
           resolution: 2560x1440~60Hz
           OpenGL: renderer: Radeon RX Vega (VEGA10 DRM 3.35.0 5.4.0-71-generic LLVM 11.0.0)
           v: 4.6 Mesa 21.0.1 direct render: Yes

Weder amdgpu-pro-20.50-1234664-ubuntu-20.04 noch amdgpu-pro-20.40-1147286-ubuntu-20.04 oder Koschis OpenCL-Extract können Boinc dazu bringen die Graka zu erkennen. Boinc hatte ich auch schon deinstalliert und wieder installiert nachdem der AMD-Treiber installiert war...

Im Boinc-Forum bin ich auch nicht fündig geworden *noahnung*

Hat jemand von Euch eine Idee?
@erde-m zeigt clinfo die Karte an?
 
Davor hat ich den normalen Mesa aus dem Repo.
Jetzt hab ich den GPU-PRO SLE von der AMD Seite installiert. Er hat zwar etwas gemeckert und etwas gutes zureden gebraucht, weil ich die Beta 15.3 von Suse drauf habe und der Treiber für die SLE 15.2 ist.

WCG ist validiert. Einstein noch am warten.

Code:
Davor:
Mesa-libOpenCL - Mesa OpenCL implementation 20.2.4-57.12
libOpenCL1 - OpenCL ICD Binding 2.2.11-6.27
libclc - OpenCL C programming language library 0.2.0+git.20180915-bp153.1.14

In BOINC
OpenCL: AMD/ATI GPU 0: AMD Radeon RX 5700 XT (NAVI10, DRM 3.39.0, 5.3.18-52-default, LL (driver version 20.2.4, device version OpenCL 1.1 Mesa 20.2.4, 8192MB, 8192MB available, 6720 GFLOPS peak)
libc: GNU libc version 2.31

Und jetzt mit dem 20.50 er GPU Pro in BOINC:
OpenCL: AMD/ATI GPU 0: Navi 10 [Radeon RX 5600 OEM/5600 XT / 5700/5700 XT] (driver version 3224.0 (HSA1.1,LC), device version OpenCL 2.0, 8176MB, 8176MB available, 10752 GFLOPS peak)
libc: GNU libc version 2.31
 
super, danke!

@Ritschie
hast du deine GPU schon lauffähig bekommen?
 
@koschi
clinfo bringt Fehlermeldung:*kopfkratz
: CommandLine Error: Option 'polly' registered more than once!
LLVM ERROR: inconsistency in registered CommandLine options
 
hmm, eine der 6900XT von Thorsam ließ sich im weiter entfernten Slot auch immer nicht so recht erkennen, clinfo stürzte dann mit segfault ab. Einzeln im ersten Slot aber kein Problem :-(
Kannst du mal tauschen?
 
Kein Problem, sind noch 4 freie Slots ;) , PCIE2 fällt ist kein voller 16er Slot.
Mal sehen was PCIE3 meint....
Doppelposting wurde automatisch zusammengeführt:

Es bleibt dabei ...
Code:
: CommandLine Error: Option 'polly' registered more than once!
LLVM ERROR: inconsistency in registered CommandLine options
Abgebrochen (Speicherabzug geschrieben)
 
Zuletzt bearbeitet:
@Ritschie
hast du deine GPU schon lauffähig bekommen?
Meinst Du die 5600XT? Nein, hab's ehrlich gesagt gar nicht erst versucht.

Vielleicht mag ja @MagicEye04 mal hier berichten, wie er den AMDGPU-PRO zum Laufen bekommen hat und was für die Leap-Beta für Klimmzüge nötig waren?! (wobei ich es eher mit der Leap 15.2 versuchen würde).

Gruß
Ritschie
 
Mit Suse hab ich schon seit über 20 Jahren nichts mehr probiert. Sorry.

Mit Ubuntu hatte ich den PRO früher auf mehreren Systemen installiert gehabt nach AMDs Anleitung - also Startbefehl und fertig. In letzter Zeit habe ich einfach nur noch das 20.40er OpenCL-Paket genommen.

Bei Ubuntu musste man höllisch aufpassen, dass Ubuntu, Treiber und Karte in einer kompatiblen Version zueinander passten. Im Zweifel gabs von AMD immer nur Treiber für die LTS-Versionen und mit zu neuen Karten musste man dann eben warten, bis die nächste LTS rauskam. Zumindest meine RX460 konnte ich damals mit 16.04LTS nicht nutzen, 18.04LTS gabs noch nicht und für 17.04 gabs keinen AMD-Treiber.

Und wenn gar nichts mehr ging, dann wurde das System halt platt gemacht. Das sind ja alles keine produktiven Rechner und außer Boinc läuft da nix. Das ist schnell neu installiert.
 
Ja, ich versuch es am Wochenende noch einmal auf der zweiten Platte nach zu stellen. Davor muss ich allerdings die Subraumscanner und Deflektoren neu ausrichten. Denn es gab zwischenzeitlich Probleme mit einer Quantenverfliefachung der Karte auf den Sensoren von BOINC.
Dannach klappt es vielleicht ohne größeres zureden.
 
Teilerfolg beim Thema Leih-Vega56 :)
Ich habe die Graka jetzt in den 5950 gesteckt. Zwar alles knirsch vom Platz und Powerbudget her, aber es funktioniert und durch UV dürfte es mit dem 850W Enermax auch klappen.

Jetzt muss ich Boinc nur noch die Nutzung der 2. Karte beibiegen (und eventuell die Doppelerkennung abgewöhnen)

Code:
Mi 21 Apr 2021 14:24:50 CEST |  | OpenCL: AMD/ATI GPU 0 (ignored by config): Radeon RX Vega (driver version 3180.7 (PAL,HSAIL), device version OpenCL 2.0 AMD-APP (3180.7), 8176MB, 8176MB available, 11397 GFLOPS peak)
Mi 21 Apr 2021 14:24:50 CEST |  | OpenCL: AMD/ATI GPU 1: AMD Radeon VII (driver version 3180.7 (PAL,HSAIL), device version OpenCL 2.0 AMD-APP (3180.7), 16368MB, 16368MB available, 13832 GFLOPS peak)
Mi 21 Apr 2021 14:24:50 CEST |  | OpenCL: AMD/ATI GPU 2 (ignored by config): Radeon RX Vega (driver version 3180.7 (PAL,HSAIL), device version OpenCL 2.0 AMD-APP (3180.7), 8176MB, 8176MB available, 11397 GFLOPS peak)
Mi 21 Apr 2021 14:24:50 CEST |  | OpenCL: AMD/ATI GPU 3: AMD Radeon VII (driver version 3180.7 (PAL,HSAIL), device version OpenCL 2.0 AMD-APP (3180.7), 16368MB, 16368MB available, 13832 GFLOPS peak)

Und jetzt Ihr:
In welcher Config muss ich suchen?
Dual-GPU hatte ich bisher nicht in Nutzung *buck*
 
<use_all_gpus>1</use_all_gpus>
in
cc_config.xml
 
Zurück
Oben Unten