App installieren
How to install the app on iOS
Follow along with the video below to see how to install our site as a web app on your home screen.
Anmerkung: This feature may not be available in some browsers.
Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden.
Du solltest ein Upgrade durchführen oder ein alternativer Browser verwenden.
Du solltest ein Upgrade durchführen oder ein alternativer Browser verwenden.
E555user
Grand Admiral Special
★ Themenstarter ★
- Mitglied seit
- 05.10.2015
- Beiträge
- 2.360
- Renomée
- 1.007
Die Hölle friert zu: AMD bringt einen Compiler
für AI als Open Source ...
...allerdings handelt es sich bei Peano LLVM um ein Xilinx-Projekt und es ist deshalb vielleicht nicht mehr ganz so revolutionär.
PCMasters.de hat einen wie ich finde sehr guten Artikel dazu:
AMD Peano Open-Source-LLVM-Compiler für Ryzen-KI-Prozessoren vorgestellt
AMD hat heute den Peano Open-Source-LLVM-Compiler vorgestellt, der speziell für die Ryzen-KI-NPUs entwickelt wurde. Diese Ankündigung ist ein wichtiger Schritt für AMD, um die Leistung und die Fähigkeiten von KI-Workloads auf Consumer-Prozessoren zu verbessern. Eingesetzt werden kann Peano mit...
und natürlich auch Phonronix
Stephen Neuendorffer von Xlinx verweist darauf, dass der Compiler nur für einzelne Cores im Array mit LLVM compilieren kann. Für das gesamte NPU Array braucht es dann MLIR-AIE. Den Link hat er selbst aber falsch gesetzt.
Zuletzt bearbeitet:
E555user
Grand Admiral Special
★ Themenstarter ★
- Mitglied seit
- 05.10.2015
- Beiträge
- 2.360
- Renomée
- 1.007
Bei TechPowerUp glaubt man bei AMD einen strategischen Wandel in Richtung Software-Unternehmen zu erkennen.
Es soll von AMD-Vertretern erklärt worden sein, dass für Ryzen AI und die Instinct Serie im KI-Einsatz ein Kulturwandel bei AMD stattfinden soll um in den nächsten 3-5 Jahren auch im Bereich Software auf die Kunden zuzugehen und das Angebot und Image von AMD zu verändern.
www.techpowerup.com
Die Beschreibungen erinnern an die frühen Jahre der Zen-Gerenartionen. Gerade die EPYC-Sparte hatte über das Top-Management regelmässig betont, dass man in der Entwicklung genau den Kunden (gemeint waren wohl Hyperscaler) zugehört hat um die Hardware weiterzuentwickeln.
In den künftigen Softwareangeboten will man nun den grossen AI-Playern mit kombinierten Software-Hardware-Lösungen entgegenkommen.
Kommentar:
Mit dem Personalwachstum der letzten Jahre hat sich das Engagement für Software bereits deutlich gesteigert. Es bleibt ein Moving-Target, es braucht ein ständiges Engagement. Was fehlt ist die durchgängige Sichtbarkeit und Orientierung zu angebotenen Lösungen genaso wie die zuverlässige Verfügbarkeit in breitem Support für die angebotene Hardware. Es muss aus Sicht eines Entwicklers viel einfacher werden die eigenen Projekte auf AMD-Hardware anzupassen. Es fehlt nach wie vor eine klare Linie bei GPUopen oder im Marketing rund um Radeon-Features und den Software-Partnern im Gaming. Ob das mit AI dann später auch für AMD insgesamt besser klappt wird sich zeigen.
[automerge]1720636469[/automerge]
passend dazu die News zur übernahme von Silo AI
wccftech.com
Es soll von AMD-Vertretern erklärt worden sein, dass für Ryzen AI und die Instinct Serie im KI-Einsatz ein Kulturwandel bei AMD stattfinden soll um in den nächsten 3-5 Jahren auch im Bereich Software auf die Kunden zuzugehen und das Angebot und Image von AMD zu verändern.
AMD is Becoming a Software Company. Here's the Plan
Just a few weeks ago, AMD invited us to Barcelona as part of a roundtable, to share their vision for the future of the company, and to get our feedback. On site, were prominent AMD leadership, including Phil Guido, Executive Vice President & Chief Commercial Officer and Jack Huynh, Senior VP &...
Die Beschreibungen erinnern an die frühen Jahre der Zen-Gerenartionen. Gerade die EPYC-Sparte hatte über das Top-Management regelmässig betont, dass man in der Entwicklung genau den Kunden (gemeint waren wohl Hyperscaler) zugehört hat um die Hardware weiterzuentwickeln.
In den künftigen Softwareangeboten will man nun den grossen AI-Playern mit kombinierten Software-Hardware-Lösungen entgegenkommen.
They are now talking to the major software companies, like Microsoft, Adobe and OpenAI, to learn what their plans are and what they need from a future hardware generation.
Kommentar:
Mit dem Personalwachstum der letzten Jahre hat sich das Engagement für Software bereits deutlich gesteigert. Es bleibt ein Moving-Target, es braucht ein ständiges Engagement. Was fehlt ist die durchgängige Sichtbarkeit und Orientierung zu angebotenen Lösungen genaso wie die zuverlässige Verfügbarkeit in breitem Support für die angebotene Hardware. Es muss aus Sicht eines Entwicklers viel einfacher werden die eigenen Projekte auf AMD-Hardware anzupassen. Es fehlt nach wie vor eine klare Linie bei GPUopen oder im Marketing rund um Radeon-Features und den Software-Partnern im Gaming. Ob das mit AI dann später auch für AMD insgesamt besser klappt wird sich zeigen.
[automerge]1720636469[/automerge]
passend dazu die News zur übernahme von Silo AI
AMD Adds Rolls-Royce To Its Customer List By Buying AI Firm For $665 Million
Chip designer AMD expanded its customer base in the AI industry today after announcing its takeover of Europe's largest private artificial intelligence lab Silo AI. The transaction is worth $665 million, and since it's all cash, AMD might have to rely on debt to finance the deal. Silo is an AI...
Zuletzt bearbeitet:
sompe
Grand Admiral Special
- Mitglied seit
- 09.02.2009
- Beiträge
- 16.180
- Renomée
- 2.616
- Mein Laptop
- Dell G5 15 SE 5505 Eclipse Black
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 7 7800X3D
- Mainboard
- MSI MPG X670E CARBON WIFI
- Kühlung
- Wasserkühlung
- Speicher
- 32GB DDR5-6000 CL36
- Grafikprozessor
- AMD Radeon RX 6900 XT
- Display
- 1x 32" LG 32UD89-W + 1x 24" Dell Ultrasharp 2405FPW
- SSD
- Samsung SSD 980 PRO 1TB, Crucial MX500 500GB, Intel 600p 512GB, Crucial T705 4TB
- HDD
- Western Digital WD Red 2TB, 3TB, 8TB
- Optisches Laufwerk
- LG GGC-H20L
- Soundkarte
- onboard
- Gehäuse
- Thermaltake Armor
- Netzteil
- be quiet! Dark Power Pro 11 1000W
- Betriebssystem
- Windows 10 Professional, Windows 7 Professional 64 Bit, Ubuntu 20.04 LTS
- Webbrowser
- Firefox
Ich denke eher weniger das es darum geht die Hardware nach den Anfürderungen der Software zu entwickeln sondern eher die Schnittstellen für den Zugriff der Software auf die Hardware zu liefern und sich mehr um die Optimierung der Software auf die Hardware zu konzentrieren, also genau das womit die Konkurrenz ihre Hardware puscht.
Bleibt nur zu hoffen das sie dies nicht ebenfalls nutzen um die Konkurrenz künstlich zu behindern um sich selbst einen künstlichen Vorteil zu verschaffen.
Bleibt nur zu hoffen das sie dies nicht ebenfalls nutzen um die Konkurrenz künstlich zu behindern um sich selbst einen künstlichen Vorteil zu verschaffen.
Yoshi 2k3
Admiral Special
- Mitglied seit
- 18.01.2003
- Beiträge
- 1.456
- Renomée
- 246
- BOINC-Statistiken

- Mein Laptop
- Apple Mac Book Pro 14" 2023
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 7800X3D
- Mainboard
- ASUS PRIME X670E-PRO WIFI
- Kühlung
- Watercool Heatkiller IV
- Speicher
- 64 GB Team Group DDR5-6400 (2x 32 GB)
- Grafikprozessor
- Nvidia Geforce RTX 4090 FE
- Display
- Nixeus NX-EDG27
- Soundkarte
- SMSL SU-9 USB DAC
- Gehäuse
- Caselabs SM8
- Netzteil
- FSP Hydro Ti Pro 1000W
- Betriebssystem
- Windows 11 Pro
- Webbrowser
- Firefox
- Schau Dir das System auf sysprofile.de an
Computerbase berichtet auch über dieses Event im Juni:
www.computerbase.de
Neue Strategie: AMD will auch ein Software-Unternehmen werden
AMD mangelt es an Software, das ist nicht neu. Jetzt wagt der Konzern den Umbruch, in Zukunft steht die Software im Fokus.
Yoshi 2k3
Admiral Special
- Mitglied seit
- 18.01.2003
- Beiträge
- 1.456
- Renomée
- 246
- BOINC-Statistiken

- Mein Laptop
- Apple Mac Book Pro 14" 2023
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 7800X3D
- Mainboard
- ASUS PRIME X670E-PRO WIFI
- Kühlung
- Watercool Heatkiller IV
- Speicher
- 64 GB Team Group DDR5-6400 (2x 32 GB)
- Grafikprozessor
- Nvidia Geforce RTX 4090 FE
- Display
- Nixeus NX-EDG27
- Soundkarte
- SMSL SU-9 USB DAC
- Gehäuse
- Caselabs SM8
- Netzteil
- FSP Hydro Ti Pro 1000W
- Betriebssystem
- Windows 11 Pro
- Webbrowser
- Firefox
- Schau Dir das System auf sysprofile.de an
E555user
Grand Admiral Special
★ Themenstarter ★
- Mitglied seit
- 05.10.2015
- Beiträge
- 2.360
- Renomée
- 1.007
Kernel-Driver für XDNA sollte helfen den/die Coprozessoren populär zu machen. Allerdings stehen bei Puristen ggf. die notwendigen Firmware-Binaries für die einzelnen Cores im Weg. Ich bin gespannt ob und wie bald eine Art MESA für NPUs entsteht. Die Ansätze von Intel und AMD scheinen doch arg unterschiedlich und am Ende wollen für AI-Tasks auch GPU und CPU mitverwendet werden können.
Yoshi 2k3
Admiral Special
- Mitglied seit
- 18.01.2003
- Beiträge
- 1.456
- Renomée
- 246
- BOINC-Statistiken

- Mein Laptop
- Apple Mac Book Pro 14" 2023
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 7800X3D
- Mainboard
- ASUS PRIME X670E-PRO WIFI
- Kühlung
- Watercool Heatkiller IV
- Speicher
- 64 GB Team Group DDR5-6400 (2x 32 GB)
- Grafikprozessor
- Nvidia Geforce RTX 4090 FE
- Display
- Nixeus NX-EDG27
- Soundkarte
- SMSL SU-9 USB DAC
- Gehäuse
- Caselabs SM8
- Netzteil
- FSP Hydro Ti Pro 1000W
- Betriebssystem
- Windows 11 Pro
- Webbrowser
- Firefox
- Schau Dir das System auf sysprofile.de an
Das ist ein interessanter Gedankengang. Dass diese Art von Treiber grundsätzlich im "accel"-Subsystem des Kernels beheimatet sind bzw sein werden, ergibt ja auf jeden Fall Sinn. Ist das nicht ursprünglich auch von Intel/Habana Labs eingebracht worden? Wie man daraus einen kompletten Softwarestack macht, bleibt definitiv spannend. Wobei es vermutlich auch nicht "schlimm" wäre, wenn die Hersteller alle unterschiedliche Ansätze verfolgen würden.
Am Ende ist es vielleicht eher eine strategische denn eine technische Entscheidung. Gegen wen muss man sich positionieren, um Erfolg zu haben? Ist es eher Intel vs. AMD oder x86 vs. ARM?
Am Ende ist es vielleicht eher eine strategische denn eine technische Entscheidung. Gegen wen muss man sich positionieren, um Erfolg zu haben? Ist es eher Intel vs. AMD oder x86 vs. ARM?
E555user
Grand Admiral Special
★ Themenstarter ★
- Mitglied seit
- 05.10.2015
- Beiträge
- 2.360
- Renomée
- 1.007
Aus Hot Chips 2024 eine XDNA2 Folie aus dem Vortrag zu Zen5 und StrixPoint.

Eine gute Übersicht über die AMD/Xilinx basierte AI-Lösungen gab es in der Hot Chips 2024 Session 5 durch Tomai Knopp AMD.
XDNA2 ist eine Variante der auch in Versal verwendeten AI Engines für maschinelles lernen, AIE-ML v2. Es ist die zweite Generation der AIE-ML Architektur bzw. die dritte AI Architektur von AMD/Xilinx überhaupt.

Eine gute Übersicht über die AMD/Xilinx basierte AI-Lösungen gab es in der Hot Chips 2024 Session 5 durch Tomai Knopp AMD.
XDNA2 ist eine Variante der auch in Versal verwendeten AI Engines für maschinelles lernen, AIE-ML v2. Es ist die zweite Generation der AIE-ML Architektur bzw. die dritte AI Architektur von AMD/Xilinx überhaupt.
Zuletzt bearbeitet:
E555user
Grand Admiral Special
★ Themenstarter ★
- Mitglied seit
- 05.10.2015
- Beiträge
- 2.360
- Renomée
- 1.007
GitHub - amd/xdna-driver
Contribute to amd/xdna-driver development by creating an account on GitHub.
Nachtrag: Linux 6.14 was released on Monday, 24 Mar 2025.
Linux_6.14 - Linux Kernel Newbies
Summary of the changes and new features merged in the Linux kernel during the 6.14 development cycle
kernelnewbies.org
Zuletzt bearbeitet:
E555user
Grand Admiral Special
★ Themenstarter ★
- Mitglied seit
- 05.10.2015
- Beiträge
- 2.360
- Renomée
- 1.007
Alveo V70 (basierend auf Versal VC2802) wurde ohne Nachfolger eingestellt.
Products Affected
The products affected include all standard part numbers. Any associated SCDs are also affected.
Table 1: Alveo V70 Accelerator Cards Affected
Part Number Replacement Part
A-V70-P16G-PQ-G No direct replacement
A-V70-P16G-PQG-206 No direct replacement
Key Dates and Ordering Information
• Final orders (LTB) for Alveo V70 cards will be accepted until May 24, 2025, subject to material availability.
• An order remaining open on or after May 24, 2025, will be deemed Non-Cancellable, Non-Returnable (NCNR).
• Final deliveries (LTS) for Alveo V70 cards must occur on or before August 24, 2025.
• Return Material Authorizations (RMA) for replacement devices due to quality issues will be accepted until November 24, 2025.
Zuletzt bearbeitet:
Complicated
Grand Admiral Special
- Mitglied seit
- 08.10.2010
- Beiträge
- 5.096
- Renomée
- 511
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 7 3700X
- Mainboard
- MSI X570-A PRO
- Kühlung
- Scythe Kama Angle - passiv
- Speicher
- 32 GB (4x 8 GB) G.Skill TridentZ Neo DDR4-3600 CL16-19-19-39
- Grafikprozessor
- Sapphire Radeon RX 5700 Pulse 8GB PCIe 4.0
- Display
- 27", Samsung, 2560x1440
- SSD
- 1 TB Gigabyte AORUS M.2 PCIe 4.0 x4 NVMe 1.3
- HDD
- 2 TB WD Caviar Green EADS, NAS QNAP
- Optisches Laufwerk
- Samsung SH-223L
- Gehäuse
- Lian Li PC-B25BF
- Netzteil
- Corsair RM550X ATX Modular (80+Gold) 550 Watt
- Betriebssystem
- Win 10 Pro.
Ein weiterer Softwareschritt:
wccftech.com
AMD Intros "SD 3 Medium", The World's First BF16 NPU Model Designed For XDNA 2 AI NPUs, Offer Reduced Memory Footprint & Faster Text-To-Image Gen
AMD launched the world's first BF16 model for XDNA 2 NPUs, SD 3 Turbo, and makes for faster and uncompromised text-to-image AI generation.
E555user
Grand Admiral Special
★ Themenstarter ★
- Mitglied seit
- 05.10.2015
- Beiträge
- 2.360
- Renomée
- 1.007
ja, den Blog hatte ich schon zu Amuse zitiert.
Das per AMD-Blog vorgestellte Update auf Amuse 3.1 vom 21 Juli 2025 bringt optimierte NNs für diverse Hardwarekonfigurationen. Vorallem kann erstmals die NPU in XDNA-2 APUs hoch optimiert genutzt werden. Hierfür wird für Stable-Diffusion 3.0 ein BF16 NN unter der Bezeichnung SDXL Turbo für schnelles Inferencing und SD 3.0 Medium model für bessere Qualität angeboten. Die RAM-Anforderungen an...
Mit BF16 hat AMD eine Lösung den RAM-Verbrauch trotz guter Inferencing-Qualität niedrig zu halten. Man darf gespannt sein wie die kommenden XDNAx Generationen bzw. Versal AI-ML Chips sich weiterentwickeln.
Das per AMD-Blog vorgestellte Update auf Amuse 3.1 vom 21 Juli 2025 bringt optimierte NNs für diverse Hardwarekonfigurationen. Vorallem kann erstmals die NPU in XDNA-2 APUs hoch optimiert genutzt werden. Hierfür wird für Stable-Diffusion 3.0 ein BF16 NN unter der Bezeichnung SDXL Turbo für schnelles Inferencing und SD 3.0 Medium model für bessere Qualität angeboten. Die RAM-Anforderungen an...
Mit BF16 hat AMD eine Lösung den RAM-Verbrauch trotz guter Inferencing-Qualität niedrig zu halten. Man darf gespannt sein wie die kommenden XDNAx Generationen bzw. Versal AI-ML Chips sich weiterentwickeln.
E555user
Grand Admiral Special
★ Themenstarter ★
- Mitglied seit
- 05.10.2015
- Beiträge
- 2.360
- Renomée
- 1.007
Fundstück aus Jul. 2024, paar XDNA2 NPU Folien auf der 2ten Seite
www.servethehome.com
Man sollte die Info aus dem HotChips 24 Vortrag zur Versal-Engine im Hinterkopf behalten.
XDNA2 und Ryzen AI-300 haben die gleiche HW-Engine, beide unterstützen das von Microsoft/Meta entwickelte MX9 und MX6 als spezifische Block Floating Point Datentypen, während AVX10.2 die Varianten E5M2 and E4M3 unterstützen soll.
en.wikipedia.org
Mikroexponenten (MX) Datentypen unterstützen flexible Quantisierungen mit kleinen Exponenten. Die Zahl in der Bezeichnung gibt die durchschnittliche Bitlänge an. Während MX9 mit FP32 vergleichbare Ergebnisse erzielt erhält man mit MX6 zu FP8 vergleichbare Ergebnisse, jeweils mit geringerem Speicher- und Bandbreitenbedarf. https://arxiv.org/pdf/2302.08007
Architecture Trifecta AMD Zen 5 RDNA 3.5 and XDNA 2
AMD's architecture trifecta of announcements include the Zen 5 CPU cores, RDNA 3.5 GPU, and XDNA 2 NPU enhancements
Man sollte die Info aus dem HotChips 24 Vortrag zur Versal-Engine im Hinterkopf behalten.
XDNA2 und Ryzen AI-300 haben die gleiche HW-Engine, beide unterstützen das von Microsoft/Meta entwickelte MX9 und MX6 als spezifische Block Floating Point Datentypen, während AVX10.2 die Varianten E5M2 and E4M3 unterstützen soll.
Block floating point - Wikipedia
Mikroexponenten (MX) Datentypen unterstützen flexible Quantisierungen mit kleinen Exponenten. Die Zahl in der Bezeichnung gibt die durchschnittliche Bitlänge an. Während MX9 mit FP32 vergleichbare Ergebnisse erzielt erhält man mit MX6 zu FP8 vergleichbare Ergebnisse, jeweils mit geringerem Speicher- und Bandbreitenbedarf. https://arxiv.org/pdf/2302.08007
Zuletzt bearbeitet:
E555user
Grand Admiral Special
★ Themenstarter ★
- Mitglied seit
- 05.10.2015
- Beiträge
- 2.360
- Renomée
- 1.007
Die Frage NPU vs. GPU bleibt ungelöst. Es scheint dass auch weiterhin AMD mit seinen Partnern keine eindeutige Strategie für KI-Beschleuniger hat.
Vielleicht könnte sich zumindest das Coding-Modell etwas annähern.
Vielleicht könnte sich zumindest das Coding-Modell etwas annähern.
Zu dem Neural Array gibt es im Netz einige falsche Kommentare. Wenn man sich das Video genau ansieht und die dazugehörigen Folien sollte aber klar sein, dass alle Dual-CUs innerhalb einer Shader-Engine künftig untereinander verknüpft sind um AI Operationen gemeinsam abarbeiten zu können.
Ich vermute es wird spezielle Register für den Übertrag der Werte geben und zusätzliche Ops, die für AI nützlich sind.
Gemäss der im Video verwendeten Grafik könnte man von 8 DualCUs bzw. 16 CUs in einer Shader-Engine ausgehen. Die Bezeichnung als Array könnte ein Hinweis auf einen Aufbau für die...
Ich vermute es wird spezielle Register für den Übertrag der Werte geben und zusätzliche Ops, die für AI nützlich sind.
Gemäss der im Video verwendeten Grafik könnte man von 8 DualCUs bzw. 16 CUs in einer Shader-Engine ausgehen. Die Bezeichnung als Array könnte ein Hinweis auf einen Aufbau für die...
vinacis_vivids
Admiral Special
- Mitglied seit
- 12.01.2004
- Beiträge
- 1.799
- Renomée
- 314
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 9 7950X 16C/32T
- Mainboard
- ASUS ProArt X670E-CREATOR WIFI
- Kühlung
- Arctic Liquid Freezer II 360 RGB
- Speicher
- HyperX Fury 64GB DDR5 6000Mhz CL30
- Grafikprozessor
- Sapphire Nitro+ RX 7900 XTX 24GB
- Display
- LG 5K HDR 10bit 5120x2160@60hz
- SSD
- Samsung SSD 980Pro 2TB
- Soundkarte
- Creative Soundblaster ZXR
- Gehäuse
- Cougar DarkBlader X5
- Netzteil
- InterTech Sama Forza 1200W
- Tastatur
- Cherry MX-10.0 RGB Mechanisch
- Maus
- Razer Mamba
- Betriebssystem
- Windows 11 Education Pro
- Webbrowser
- Google Chrome
- Internetanbindung
- ▼1000 Mbit
PS6-iGPU hat schon sehr viele CUs, vermutlich 54CU mit moderner RDNA5 uArch, so dass die NPU für kleinere Datenquants nicht mehr unbedingt gebraucht werden. Die RDNA5 CUs können kleine Datenquants (fp8, int8, fp6, int6, fp4, int4) durch die WMMA Struktur.
Die NPU mit XDNA2 uArch halte ich bei mobilen SoCs für sinnvoll bzw. sinnvoller, also für Notebooks, Handhelds, Tablets und Smartfones. Da hilft die Energieeinsparung mehr als bei stationärer Konsole oder dGPU am Desktop.
Im mobilen Bereich ist die Einsparung von Daten durch kleinere quantisierte Modelle noch interessanter, weil dadurch auch Kosten gespart werden.
Andererseits kann AMD optional die NPU auch in AM5 CPUs (APUs) mit wenig CUs (2-16) einbauen um die Leistungsfähigkeit in ONNX, LLM usw. insbesondere für CNNs und Transformer zu verbessern. Das ginge dann so Richtung "AI-PC" im Sinne von Jack Huynh.
Amuse und LM-Studio stehen ja heute schon Parade dafür.
Was Spieler angeht, wird FSR4.5 oder FSR5 wahrscheinlich die XDNA2 NPU erst nutzen können. Hoffentlich dann schon mit fp6 / int6 mit kleineren CNNs oder Transformers.
Die NPU mit XDNA2 uArch halte ich bei mobilen SoCs für sinnvoll bzw. sinnvoller, also für Notebooks, Handhelds, Tablets und Smartfones. Da hilft die Energieeinsparung mehr als bei stationärer Konsole oder dGPU am Desktop.
Im mobilen Bereich ist die Einsparung von Daten durch kleinere quantisierte Modelle noch interessanter, weil dadurch auch Kosten gespart werden.
Andererseits kann AMD optional die NPU auch in AM5 CPUs (APUs) mit wenig CUs (2-16) einbauen um die Leistungsfähigkeit in ONNX, LLM usw. insbesondere für CNNs und Transformer zu verbessern. Das ginge dann so Richtung "AI-PC" im Sinne von Jack Huynh.
Amuse und LM-Studio stehen ja heute schon Parade dafür.
Was Spieler angeht, wird FSR4.5 oder FSR5 wahrscheinlich die XDNA2 NPU erst nutzen können. Hoffentlich dann schon mit fp6 / int6 mit kleineren CNNs oder Transformers.
E555user
Grand Admiral Special
★ Themenstarter ★
- Mitglied seit
- 05.10.2015
- Beiträge
- 2.360
- Renomée
- 1.007
Das ist ein interessanter Gedankengang. Dass diese Art von Treiber grundsätzlich im "accel"-Subsystem des Kernels beheimatet sind bzw sein werden, ergibt ja auf jeden Fall Sinn.
Da habe ich dann über XDC2025 das hier gefunden - NPU Treiber in Mesa, Anfänge schon 2023.
A long overdue update
Cannot believe it has been years since my last update here! There are two things that I would like to tell people about: The first is that I...
Er hat neue Treiber für Rockchip SoCs und ARM Ethos bestätigt, in 2026 H1 und H2 soll jeweils eine weitere Architektur folgen.
Zuletzt bearbeitet:
Complicated
Grand Admiral Special
- Mitglied seit
- 08.10.2010
- Beiträge
- 5.096
- Renomée
- 511
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 7 3700X
- Mainboard
- MSI X570-A PRO
- Kühlung
- Scythe Kama Angle - passiv
- Speicher
- 32 GB (4x 8 GB) G.Skill TridentZ Neo DDR4-3600 CL16-19-19-39
- Grafikprozessor
- Sapphire Radeon RX 5700 Pulse 8GB PCIe 4.0
- Display
- 27", Samsung, 2560x1440
- SSD
- 1 TB Gigabyte AORUS M.2 PCIe 4.0 x4 NVMe 1.3
- HDD
- 2 TB WD Caviar Green EADS, NAS QNAP
- Optisches Laufwerk
- Samsung SH-223L
- Gehäuse
- Lian Li PC-B25BF
- Netzteil
- Corsair RM550X ATX Modular (80+Gold) 550 Watt
- Betriebssystem
- Win 10 Pro.
Naja, der Semicustom für Sonys Konsole ist ein schlechtes Beispiel für AMDs Strategie. Die stellen sich zusammen was sie wollen aus dem IP-Baukasten, dafür ist ja Semicustom da.Die Frage NPU vs. GPU bleibt ungelöst. Es scheint dass auch weiterhin AMD mit seinen Partnern keine eindeutige Strategie für KI-Beschleuniger hat.
Ähnliche Themen
- Antworten
- 2
- Aufrufe
- 759
- Antworten
- 90
- Aufrufe
- 4K
- Antworten
- 1
- Aufrufe
- 132