AMD-Grafikkarten unter Linux: Treiber, OpenCL, BOINC, amdconfig und headless per ssh

Wird leider im Wiki nicht angegeben wo man den Wert auslesen kann.

printf "0x%08x\n" $(cat /sys/module/amdgpu/parameters/ppfeaturemask)

0x00ffffff
Warum auch immer spuckt er da bei mir immer mal wieder andere Werte aus.

In /sys/class/drm/card0/device findet man die ganzen config Dateien für den Treiber.

Es muss alles passen Kernel Version zur Corectrl Version und der richtige Wert. Ist ein bischen tricky.

Corectrl.jpg
 
Zuletzt bearbeitet:
Ich vermute mal es liegt am Treiber.

Die Karte ist ja schon etwas älter und nutzt noch den radeon-Treiber - leider noch nicht den neueren amdgpu-Treiber.
 
Zuletzt bearbeitet:
Da der Thread hier etwas allgemeiner ist, als der über Leap, frage ich mal hier in die Runde:

Hardware: Ryzen 3900x, 64 GB RAM, Vega56, Tumbleweed KDE

clinfo gibt mir zur Grafikkarte folgendes aus:

NULL platform behavior
clGetPlatformInfo(NULL, CL_PLATFORM_NAME, ...) Clover
clGetDeviceIDs(NULL, CL_DEVICE_TYPE_ALL, ...) Success [MESA]
clCreateContext(NULL, ...) [default] Success [MESA]
clCreateContext(NULL, ...) [other] Success [POCL]
clCreateContextFromType(NULL, CL_DEVICE_TYPE_DEFAULT) Success (1)
Platform Name Clover
Device Name Radeon RX Vega (VEGA10, DRM 3.40.0, 5.11.16-1-default, LLVM 12.0.0)
clCreateContextFromType(NULL, CL_DEVICE_TYPE_CPU) No devices found in platform
clCreateContextFromType(NULL, CL_DEVICE_TYPE_GPU) Success (1)
Platform Name Clover
Device Name Radeon RX Vega (VEGA10, DRM 3.40.0, 5.11.16-1-default, LLVM 12.0.0)
clCreateContextFromType(NULL, CL_DEVICE_TYPE_ACCELERATOR) No devices found in platform
clCreateContextFromType(NULL, CL_DEVICE_TYPE_CUSTOM) No devices found in platform
clCreateContextFromType(NULL, CL_DEVICE_TYPE_ALL) Success (1)
Platform Name Clover
Device Name Radeon RX Vega (VEGA10, DRM 3.40.0, 5.11.16-1-default, LLVM 12.0.0)

ICD loader properties
ICD loader Name OpenCL ICD Loader
ICD loader Vendor OCL Icd free software
ICD loader Version 2.3.0
ICD loader Profile OpenCL 3.0


Soweit so gut. Darktable geht. Boinc erkennt die GPU, beginnt auch damit zu rechnen, der Balken wächst und irgendwann nach etwa 2 min verwirft er die Anzeige und zählt nur noch die Zeit hoch aber nicht weiter runter und der Balken ist wieder bei 0.
Entferne ich pocl als Paket, gibt es unmittelbar Berechnungsfehler.
AMDGPU-Pro erzeugt sinnlos vollflächige Artefakte auf dem Desktop nach Installation. Egal ob legacy, pal oder rocm.
Unter Windows geht es.

Insgesamt ist das dieses Jahr sehr Voodoo-behaftet.
Beim 1700X-Rechner mit der RX480 auf Tumbleweed XFCE läuft es mit dem AMGGPU-Pro, mit dem FX-8120 und der RX470 nicht.
War jetzt schon soweit, die SSD vom 1700X zu klonen und im FX-PC einzusetzen, aber auch da kommt es dann zu Berechnungsfehlern. Die RX470 im 1700X-Rechner macht aber was sie soll.
Scheint also irgendwie mit Bulldozer zusammenzuhängen, denn selbst unter Leap auf dem Opteron-System, gehts nicht. Dort aber die Vega und die R7 250X. Immer die selben Pakete.
 
Habe leider keine entsprechende Hardware hier um auch mal zu testen. Kein FX und keine Vega. Und Opterons sind auch gerade aus.
Aber mit dem Voodoo muss ich dir zustimmen. Das ist dieses Jahr wieder mal sehr spannend.
 
Habe jetzt beide RX4x0-Maschinen mit Ubuntu 20.04.2 LTS bestückt und den AMDGPU-Pro installiert...läuft sofort ohne weitere Anpassungen.
 
welchen AMDGPU-Pro sollte man nehmen aktuell?
 
Da kann man nur allgemein antworten: Einen der zur GPU und zum Linux passt.
 
Tom hatte während des Pentathlon geschrieben das er Probleme hatte mit 21.10 hat und deswegen auf 20.40 zurück ist.

Konnte ja sein das es irgendwo mittlerweile sich eine Version als "brauchbarer" herausgestellt hat.

Also probiere ich es mit der neusten, mal schauen was raus kommt
 
Mittlwerweile geht auch der 20.45er nicht mehr bei mir.
Daher werde ich demnächst mit einem rocm Experiment beginnen.
 
Big Navi irgendwas aktuelles >= 20.45, GCN 3, Polaris und Vega bis Radeon VII den 20.40er.
Navi selbst weiß ich nicht, könnte aber auch noch mit 20.40 laufen.
 
Auf der VII und Ubuntu 20.04.?LTS läuft bei mir der 20.40 OpenCL-Teil problemlos.
Mit dem 20.45 wollte entweder Einstein oder Milkyway nicht mehr arbeiten und der Versuch des Entfernens schlug auch Fehl->Neuinstallation.

RX460 und Ubuntu 20.04.2LTS sind ebenfalls mit dem OpenCL_20.40 unterwegs.

Allgemein sollte man sich bei Ubuntu von den Nicht-LTS-Versionen fern halten und bei einer älteren GPU sollte es auch ein älteres Ubuntu sein + der dann ebenfalls etwas ältere Treiber.
Als ich die RX460 neu hatte, gab es für mich keinen Weg, die zusammen mit dem Ryzen1700 zu betreiben. Der Ryzen wollte das damals neueste Ubuntu17.x und der AMD-Treiber, der die RX460 unterstützte, war nur bis Ubuntu16 funktionabel.
 
Hm, auch bei einem downgrade auf 20.40 funktioniert einstein jetzt nicht mehr bei mir.
Möglicherweise arbeitet diese alte opencl-amd Version nicht mit der bei mir installierten mesa Version 21.1.1-1 zusammen.
Werde mir wohl doch rocm antun müssen.
 
Bei Mesa zusammen mit AMD Open CL wollte bei mir auch nichts laufen.
Ich hatte den Rechner kürzer Hand platt gemacht (läuft nur Boinc drauf) und dann nur den 20.40 installiert. Damit lief bisher alles (Milkyway habe ich allerdings noch nicht getestet).
 
mesa brauche ich ja, sonst habe ich keinen Xorg-Desktop mehr.
 
Ah, OK, ich habe den Standart Ubuntu Desktop.
 
Ich habe endlich ein Programm gefunden, um mir die GPU-Auslastung anzeigen zu lassen.
Radeontop funktioniert mit meiner Combo (Ubuntu 20.04 und RX560D samt OpenCL-Extrakt aus dem 20.40 AMD-Pro Treiber).
Funktioniert allerdings nur mit Admin-Rechten.
 
rickslab-gpu-utils ist mMn. besser ->https://github.com/Ricks-Lab/gpu-utils
sudo apt install rickslab-gpu-utils
Code:
tal9000@tal9000-i5-2320-RX460:~$ gpu-chk
Using python 3.8.5
           Python version OK. 
Using Linux Kernel 5.8.0-53-generic
           OS kernel OK. 
Using Linux distribution: Ubuntu 20.04.2 LTS
           Distro has been Validated. 
AMD: amdgpu version: 21.10-1247438
           AMD driver OK. 
python3 venv is installed
           python3-venv OK. 
rickslab-gpu-utils-env available
           rickslab-gpu-utils-env OK. 


tal9000@tal9000-i5-2320-RX460:~$ gpu-ls
Detected GPUs: AMD: 1
AMD: amdgpu version: 21.10-1247438
AMD: Wattman features enabled: 0xffff7fff
1 total GPUs, 1 rw, 0 r-only, 0 w-only

Card Number: 0
   Vendor: AMD
   Readable: True
   Writable: True
   Compute: True
   GPU UID: None
   Device ID: {'device': '0x67ef', 'subsystem_device': '0xa460', 'subsystem_vendor': '0x1787', 'vendor': '0x1002'}
   Decoded Device ID: Baffin [Radeon RX 460/560D / Pro 450/455/460/555/555X/560/560X]
   Card Model: Advanced Micro Devices, Inc. [AMD/ATI] Baffin [Radeon RX 460/560D / Pro 450/455/460/555/555X/560/560X] (rev cf)
   Display Card Model:  Baffin RX 460/560D
   PCIe ID: 01:00.0
      Link Speed: 5.0 GT/s PCIe
      Link Width: 8
   ##################################################
   Driver: amdgpu
   vBIOS Version: 113-BAFFIN_PRO_1605
   Compute Platform: OpenCL 1.2 AMD-APP (3224.4)
   GPU Type: PStates
   HWmon: /sys/class/drm/card0/device/hwmon/hwmon0
   Card Path: /sys/class/drm/card0/device
   System Card Path: /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0
   ##################################################
   Current Power (W): 11.230
   Power Cap (W): 50.000
      Power Cap Range (W): [0, 75]
   Fan Enable: 0
   Fan PWM Mode: [2, 'Dynamic']
   Fan Target Speed (rpm): 1518
   Current Fan Speed (rpm): 1518
   Current Fan PWM (%): 28
      Fan Speed Range (rpm): [0, 3200]
      Fan PWM Range (%): [0, 100]
   ##################################################
   Current GPU Loading (%): 0
   Current Memory Loading (%): 2
   Current GTT Memory Usage (%): 1.014
      Current GTT Memory Used (GB): 0.029
      Total GTT Memory (GB): 2.866
   Current VRAM Usage (%): 2.526
      Current VRAM Used (GB): 0.051
      Total VRAM (GB): 2.000
   Current  Temps (C): {'edge': 28.0}
   Critical Temps (C): {'edge': 94.0}
   Current Voltages (V): {'vddgfx': 1012}
      Vddc Range: ['800mV', '1150mV']
   Current Clk Frequencies (MHz): {'mclk': 300.0, 'sclk': 752.62}
   Current SCLK P-State: [2, '760Mhz']
      SCLK Range: ['214MHz', '1800MHz']
   Current MCLK P-State: [0, '300Mhz']
      MCLK Range: ['300MHz', '2000MHz']
   Power Profile Mode: 1-3D_FULL_SCREEN
   Power DPM Force Performance Level: auto

gpu-mon macht eine schöne Tabelle mit Aktualisierung
 
Zuletzt bearbeitet:
gpu-mon funktioniert sogar über ssh(ohne Admin-Rechte), nur das verändern der Werte funktioniert nicht über ssh
zum anzeigen kann man auch sudo cat /sys/kernel/debug/dri/0/amdgpu_pm_info nehmen.
 
CPU-X hat auch einen Reiter für die GPU. Temp, Taktung, Auslastung, Verbrauch und Speicherlast.

Ist so ziemlich bei jeder Distri mit dabei.
 
Hm, für mein Ubuntu ist es weder dabei noch wird als als installirbar gefunden. :(
 
Unter Mint lässt sich cpu-x installieren.
 
Zuletzt bearbeitet:
Falls es noch nicht bekannt ist:
Ein einfaches Skript zum ändern der GPU Werte. Habe ich gesucht weil mir bei meinen eigenem Post auffiehl das die RX460 50Watt als Power Limit hat. Keine Ahnung wie ich das hinbekommen hatte, aber irgendwie ist das nun Fix im GrakaBios drin...

@herby44
cpu-x nett, hab auf meine Install Liste mit dabei gepackt, zum schnellen Check sehr schön.

@MagicEye04
ricks-amdgpu-utils package Ist seit 26.10.19 in den Standard Archiven von Ubuntu enthalten. Alternativ geht der weg über PyPi
Code:
pip3 install rickslab-gpu-utils
oder Git Clone

Clone the repository from GitHub with the following command:
Code:
git clone https://github.com/Ricks-Lab/gpu-utils.git
cd gpu-utils
Initialize your rickslab-gpu-utils-env if it is your first time to use it. From the project root directory, execute:
Code:
python3.6 -m venv rickslab-gpu-utils-env
source rickslab-gpu-utils-env/bin/activate
pip install --no-cache-dir -r requirements-venv.txt
You then run the desired commands by specifying the full path:
Code:
./gpu-mon
 
Hat zufällig noch Jemand das Problem, dass die Farben mit Ubuntu/Radeon deutlich anders aussehen als unter Windows oder mit Nvidia? Das grün hier im Forum ist mit Radeon z.B. eher hellgrün, mit Nvidia oder Windows dunkelgrün.

In beiden Fällen (RX460 und VII) habe ich den Standard-Treiber von Ubuntu20LTS drauf und nur das OpenCL-Paket von AMD noch nachinstalliert.
 
Leider noch ein kleines Linux-AMD-GPU-Problem:

Am vierten Rechner erkennt BOINC die GPU nicht. Verbaut ist eine 5700XT. OS ist Linux Mint 20.4.1

Ich habe Koschis openCL Extrakt installiert. OpenCL ist auch da, nur die GPU nicht.

clinfo wirft folgendes aus:
Number of platforms 1
Platform Name AMD Accelerated Parallel Processing
Platform Vendor Advanced Micro Devices, Inc.
Platform Version OpenCL 2.1 AMD-APP (3180.7)
Platform Profile FULL_PROFILE
Platform Extensions cl_khr_icd cl_amd_event_callback cl_amd_offline_devices
Platform Host timer resolution 1ns
Platform Extensions function suffix AMD

Platform Name AMD Accelerated Parallel Processing
Number of devices 0

NULL platform behavior
clGetPlatformInfo(NULL, CL_PLATFORM_NAME, ...) AMD Accelerated Parallel Processing
clGetDeviceIDs(NULL, CL_DEVICE_TYPE_ALL, ...)
clCreateContext(NULL, ...) [default] No devices found in platform
clCreateContextFromType(NULL, CL_DEVICE_TYPE_DEFAULT) No devices found in platform
clCreateContextFromType(NULL, CL_DEVICE_TYPE_CPU) No devices found in platform
clCreateContextFromType(NULL, CL_DEVICE_TYPE_GPU) No devices found in platform
clCreateContextFromType(NULL, CL_DEVICE_TYPE_ACCELERATOR) No devices found in platform
clCreateContextFromType(NULL, CL_DEVICE_TYPE_CUSTOM) No devices found in platform
clCreateContextFromType(NULL, CL_DEVICE_TYPE_ALL) No devices found in platform

ICD loader properties
ICD loader Name OpenCL ICD Loader
ICD loader Vendor OCL Icd free software
ICD loader Version 2.2.11
ICD loader Profile OpenCL 2.1

Das Gesamtsystem wiederum schein die GPU zu erkennen. Der Befehl

lspci -nnk | grep -i VGA -A2

wirft folgendes aus:
0a:00.0 VGA compatible controller [0300]: Advanced Micro Devices, Inc. [AMD/ATI] Navi 10 [Radeon RX 5600 OEM/5600 XT / 5700/5700 XT] [1002:731f] (rev c0)
Subsystem: Advanced Micro Devices, Inc. [AMD/ATI] Navi 10 [Radeon RX 5600 OEM/5600 XT / 5700/5700 XT] [1002:0b36]
Kernel driver in use: amdgpu
 
5700XT und neuer wird von dem alten Geraffel leider nicht unterstützt
 
Zurück
Oben Unten