11 How to fix WHEA_UNCORRECTABLE_ERROR? (bluadige Hennakepf!)

X_FISH

Grand Admiral Special
Mitglied seit
03.02.2006
Beiträge
4.619
Renomée
2.370
  • BOINC Pentathlon 2017
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2019
  • SETI@Home Wow!-Event 2019
  • BOINC Pentathlon 2020
  • THOR Challenge 2020
  • BOINC Pentathlon 2021
  • BOINC Pentathlon 2022
  • BOINC Pentathlon 2023
  • BOINC Pentathlon 2024
Microsofts Ansatz:


Leider bringt das nicht ganz so viel.

Hardware:

Das Basissystem war schon etwas älter (Ryzen 5 1600), Upgrade erfolgte letztes Jahr (vor ziemlich genau 12 Monaten), die Grafikkarte war eine GeForce GTX 1060.

Der Prozessor wurde durch einen Ryzen 5 5600 ersetzt, die Grafikkarte wurde gleichzeitig durch eine 3060 ersetzt. Kühler: Noctua NH-U12.

Board: https://www.gigabyte.com/Motherboard/GA-AB350-Gaming-rev-1x#kf (BIOS: F51h - Feb 09, 2023 ist installiert, es gibt aber noch zwei neuere Varianten)

RAM: 16 GB Corsair (es war ein Upgrade auf 32 GB drin, dies lief aber nicht stabil). Ich meine es war ein 3000er Kit mit 2x 8 GB.

Gehäuse: Pure Base 600 (Glasseitenteil, bei Hitze abgenommen).

Probleme:

BSOD mit WHEA_UNCORRECTABLE_ERROR.

RAM-Kit wurde damals nicht erkannt, Umtausch von mutmaßlich defektem Kit brachte kurzzeitig Lösung, dann waren wieder Abbrüche da. Der RAM wurde dann zunächst getauscht.

Ich hatte den Rechner damals nach dem Zusammenbau (Juni 2023) mit BOINC getestet, auch die Graka durfte ein wenig rechnen. Es lief soweit alles stabil. Bis dann der RAM zu zicken angefangen hat.

Lösungen?

Das Netzteil ist schon älter (BeQuiet, über 600 Watt IIRC, genaue Bezeichnung unbekannt). Aber kann das überhaupt eine mögliche Ursache sein?

PS: »bluadige Hennakepf« <- schwäbischer Ausdruck von Unzufriedenheit.
 
Zuletzt bearbeitet:
Wenn du Glück hast, finden sich in der Ereignisanzeige weitere Informationen, welches Gerät die WHEA-Fehler verursacht. eventvwr.msc > Anwendungs- und Dienstprotokolle > Microsoft > Windows > Kernel-WHEA. Mit der ermittelten Device ID hast kann man (sofern nötig) im Gerätemanager suchen, welches Gerät dahintersteckt. In aller Regel sind es irgendwelche PCIe-Geräte; das kann auch gern eines auf dem Board sein, z.B. Netzwerk oder USB-Controller.
 
Habe jetzt mal den PC-Besitzer (ist nicht meine Kiste) die Treiber aktualisieren lassen. Hat leider nicht viel gebracht.

Gebe den Tipp weiter, hoffe auf einen Screenshot.
Doppelposting wurde automatisch zusammengeführt:

Die Screenshots:

signal-2024-07-31-213016_002.jpeg
signal-2024-07-31-213016_003.jpegsignal-2024-07-31-213309_002.jpeg

Das habe ich jetzt geschickt bekommen...
Doppelposting wurde automatisch zusammengeführt:

Gerade noch mal nachgefragt, weil es bei mir anders aussieht: ist Windows 10, nicht 11... 8)
 
Zuletzt bearbeitet:
Infoupdate:

Ein Treiberupdate für den Onboard-Sound hat zumindest schon mal Aussetzer beim Ton beseitigt. Das ursprüngliche Problem besteht weiter.
 
Habe jetzt mal den PC-Besitzer (ist nicht meine Kiste) die Treiber aktualisieren lassen. Hat leider nicht viel gebracht.
Wenn ich die "Guid" und "Keywords" aus dem Screenshot google, komme ich u.a. zu diesem Forum:

Da wurde der Chipsatztreiber als Fehlerursache ausgemacht. Auf der Homepage von Gigabyte sind nur recht alte Versionen verfügbar. Wenn die nicht funktionieren, direkt bei AMD nach den aktuellen gucken.

Das BIOS würde ich aufgrund von Sicherheitslücken auch in jedem Fall updaten. Der 5600 braucht mind. AGESA V2 1.2.0.B. Vielleicht reicht das schon. Bei Gigabyte sind die BIOS-Versionen mit einem Buchstaben am Ende eine Beta. So auch die installierte F51h.
 
Also ich würde auch als allererstes das BIOS updaten.
DDU ausführen im abgesicherten Modus, alle AMD und NVIDIA Treiber runter hauen.

Danach erst Chipsatz, dann nVidia Treiber installieren.

ggf. noch über gigabyte die treiber updaten lassen für sound und lan, dabei ggf. auch noch auf den Herstellerseiten nach aktuelleren Versionen schauen.

Wenn er dann noch BSOD's erzeugt, RAM-Test mittels Boot-CD und HDD/SSD auf Fehler überprüfen. Mehr kann man eigentlich nicht mehr machen, außer mal Windows neu installieren (geht ja auch aus Windows heraus).

Sollte alles nicht helfen, geht nur noch Test durch Hardwaretausch.

Grüße
Christian
 
WHEA Errors gingen leider oftmals auf defekte CPU zurück. :(
Oftmals hilft es aber erst einmal die Stromspareinatellungen im BIOS zurück zu nehmen.
 
Ich mußte bei meinen damaligen GTX970 vs. 290X Tests schonmal die Erfahrung machen das der Wechsel von der Redeon zur Geforce problemlos ging aber beim Wechsel von der Geforce zur Radeon erstmal die Treiber vom System geputzt und der Treiber der Radeon neu installiert werden mußte, so als wenn sich der Geforce Treiber irgendwo in das System eingräbt wo er den Treiber der Radeon stört, zumindest wenn wie bei mir die Geforce aus dem System genommen wurde.
 
Das habe ich jetzt geschickt bekommen..
Wichtig wären die Inhalte der einzelnen Einträge des Eventlogs im Bereich WHEA. Darin steht (hoffentlich), welche Device ID (bzw. welches Gerät) die Fehler verursacht.
 
@sompe

nVidia wurde mit nVidia ersetzt. Das lief dann ja stabil. Die Probleme mit dem BSOD kamen jetzt erst. Die RAM-Inkompatibilität (Corsair mit Corsair ersetzt) war direkt nach dem Umbau Juni 2023.

@Dalai
Ich konnte nicht nachschauen, hatte keinen Zugriff per AnyDesk. Habe daher nur das bekommen, was via Handy geschickt wurde. Leider. :(
 
Dann bleibt ja eigentlich nur noch Mainboard oder Netzteil.
 
Ich warte noch auf ein Feedback bezüglich »habe das BIOS aktualisiert«. Steht noch immer aus. :(
 
Statusupdate:

Das Netzteil wurde jetzt getauscht. Seit dem schon mal keine Abstürze mehr.

Der neue RAM (vor einem Jahr gekauft) wird trotzdem nicht vom Board akzeptiert. Ich habe erneut zum BIOS-Update geraten. Das soll nun am morgigen Samstag kommen.

In den Logdateien wurde jetzt vom Eigentümer gestöbert: schon vor dem Wechsel von CPU und Grafikkarte waren die gleichen Fehler regelmäßig geloggt worden, die auch jetzt gelesen werden können. Die Frage ist und bleibt was schiefgegangen ist. Der Wechsel der NVME auf welcher Windows installiert ist, wird vom Eigentümer gerade überdacht (ist mutmaßlich von 2019, laut Samsung Software aber fehlerfrei).
 
Update zum Update:

Der Rechner lief rund 11 Stunden problemlos seit heute Vormittag durch. Inklusive surfen, YT-Videos und schließlich auch ein paar Spiele spielen (Cyberpunk z.B.). Also erst mal geglaubt das der Netzteiltausch die Lösung war.

Seit 30 Minuten zeigt er wieder das alte Verhalten: BSOD bzw. Neustarts etwa alle 3 Minuten.

Die SSD auf welcher Windows 10 installiert ist hat laut Crystaldisk noch 90% (5 Jahre alt).

RAM ist noch immer das Kit, welches früher schon stabil lief.

Ich bin ratlos.
 
In den Logdateien wurde jetzt vom Eigentümer gestöbert: schon vor dem Wechsel von CPU und Grafikkarte waren die gleichen Fehler regelmäßig geloggt worden, die auch jetzt gelesen werden können.
was sagen denn die Logs???? mal verschieden Stresstests durchgeführt. Ram einzeln. cpu einzeln. Gpu einzeln, usw. Mal einfach das gehäuse offen gelassen, aus versuchszwecken?
 
was sagen denn die Logs???? mal verschieden Stresstests durchgeführt. Ram einzeln. cpu einzeln. Gpu einzeln, usw. Mal einfach das gehäuse offen gelassen, aus versuchszwecken?
Er kommt gar nicht mehr an die Logs, weil die Kiste sich alle 3 Minuten neu startet (oder früher).

Seitenteil ist permanent weg, Zimmer im EG auf der Nordseite (also recht kühl).

Die Neustarts kommen jetzt ohne jegliche besondere Last, es wird einfach nur Windows gestartet - um dann abzuschmieren.
Doppelposting wurde automatisch zusammengeführt:

»Screenshot« von seiner SSD:

temp.jpg

Letzte Zeile: 137B Einträge (hex) -> 4987 Einträge (dezimal). Klingt jetzt nicht so prickelnd? Die geschriebenen 80 TB auf einer 500 GB ebenfalls nicht so gut...
 
Zuletzt bearbeitet:
Was ist mit dem BIOS Update?

Dann mal nur einen RAM Riegel ausprobieren. Wenn das Problem bleibt, den anderen alleine testen. Vielleicht ist einer davon im laufe des letzten Jahres übern Jordan gegangen. Hatte ich schonmal.

Sollte es an der SSD liegen, hast du die Möglichkeit, ihm die Platte zu klonen? Habe ich mit AOMEI Backupper (Download, Anleitung beachten!) mehrfach erfolgreich gemacht. Die m.2 als zweite Platte und das Ersatzlaufwerk in einem anderen Windows-System einbauen und dann die Klonfunktion nutzen. Dabei aufpassen, nicht das Hostsystem zu überschreiben, sprich: Laufwerksbuchstaben nicht verwechseln.
 
Was ist mit dem BIOS Update?
Das ist drauf, das war das Wortspiel mit dem »Update zum Update«. Hätte noch »BIOS« vor das zweite »Update« schreiben sollen...

Dann mal nur einen RAM Riegel ausprobieren. Wenn das Problem bleibt, den anderen alleine testen. Vielleicht ist einer davon im laufe des letzten Jahres übern Jordan gegangen. Hatte ich schonmal.
Die Vorgeschichte beim neuen RAM: Der wurde schon nach dem Kauf nicht erkannt (nur einer von zwei Riegeln, ansonsten fuhr die Kiste nicht hoch). Also wurde getauscht.

Was ich dann mehrere Monate lang nicht erfahren habe: auch die getauschten Riegel haben nicht funktioniert.

Sollte es an der SSD liegen, hast du die Möglichkeit, ihm die Platte zu klonen? Habe ich mit AOMEI Backupper (Download, Anleitung beachten!) mehrfach erfolgreich gemacht. Die m.2 als zweite Platte und das Ersatzlaufwerk in einem anderen Windows-System einbauen und dann die Klonfunktion nutzen. Dabei aufpassen, nicht das Hostsystem zu überschreiben, sprich: Laufwerksbuchstaben nicht verwechseln.
Als Datengrab sind HDD verbaut. Auf der SSD war nur das Windows auf der einen und Spiele auf der anderen Partition. Die »eigenen Dateien« liegen bewusst nicht auf C:.

Von da her: es wäre nur Windows und Steam was flöten gegangen ist. Eine neue M.2 stand sowieso an, ich hatte zu einer PCI-E 3.0 kompatiblen mit 2 TB geraten. Mehr kann das Board sowieso nicht (B350).

Daher ist der Ansatz nun: Windows neu installieren, dann weitersehen.

Ich glaube inzwischen an einen (zusätzlichen) Defekt des Boards. Wieso sollte sonst der RAM (noch immer) nicht gehen?
 
Lass die m.2 doch PCI-e 4.0 können. Kostet das gleiche und sollte doch noch ein neues Board fällig werden, könnte das genutzt werden. Nicht, dass man den Unterschied im Normalbetrieb bemerken würde *buck*
 
Lass die m.2 doch PCI-e 4.0 können. Kostet das gleiche [...]
100% Zuschlag ist für mich nicht das Gleiche. :D

Oder habe ich etwas übersehen? 3.0 kosten pro TB etwa 55 Euro, 4.0 pro TB etwa 110 Euro.
 
Ich noch mal...
Schau mal bei HWLuXX im Forum.
Die WHEA Errors liefen (fast immer) auf eine defekte CPU hinaus.
 
Das wäre unschön, ist kein Intel Gen 13 sondern ein Ryzen.

Und laut dem Besitzer des Rechners waren im fehlerprotokoll schon mit der alten CPU Fehler abgelegt. Also doch noch ein Hinweis auf das Board?
 
Das kann gut sein, ich mußte auch schonmal die Erfahrung machen das es Inkompatibilitäten zwischen einem Mainboard und der CPU geben kann.

Bei mir war es ein Biostar B550M-SILVER und ein AMD Ryzen 7 PRO 4750G mit dem es massive Stabilitätsprobleme gab die selbst den Tausch gegen das gleiche Modell bestehen blieben, wenn auch in weniger starker Form.
Diesen hatte ich danach Testweise mit dem Ryzen 7 5700G eines anderen Rechners getauscht und seither laufen der 4750G auf einem Gigabyte GA-AB350N-Gaming WIFI und der 5700G auf dem B550M-SILVER völlig problemlos.

Es kann also durchaus sein das sich Komponenten ganz einfach nicht vertragen, will man in dem Fall das Mainboard ausschließen dann wäre es empfehlenswert auf ein ganz anderes CPU Modell zu wechseln.
 
Wegen dem 5600er macht es ohnehin Sinn das B350 Board nicht mehr zu verwenden.

Habe mal nach gebrauchten Alternativen bei Kleinanzeigen gesucht, da kann man gleich neu kaufen. Wegen 20 € kauft man sich kein Board ohne Blende, ohne Karton und ohne Garantie.
 
Beim Board Wechsel besteht meiner Erfahrung nach meist das Problem das danach Windows neu aktiviert werden muss. Es kann also nicht schaden sich darauf schonmal vorzubereiten.

Ein Beispiel für einen definitiven CPU Fehler ist allerdings der FX-8800P in meinem alten Laptop.
Der rebootet hin und wieder selbst und spuckt dann folgenden WHEA Error aus:
Schwerwiegender Hardwarefehler.

Komponente: AMD Northbridge
Fehlerquelle: Ausnahme bei der Computerüberprüfung
Fehlertyp: Fehler durch HyperTransport-Watchdog-Zeitüberschreitung
Prozessor-ID: 0

Die Detailansicht dieses Eintrags beinhaltet weitere Informationen.

Das ist aber längst nicht das einzige Problem welches das Gerät hat.
Die d.GPU ist ausgefallen wodurch nur noch die IGP nutzbar ist und das Touchpad fällt gern mal aus und läßt sich dann nur mit einem Reboot oder dem Schlafmodus wieder erwecken. Es muss also dafür nochmal neu initialisiert werden.
 
Zurück
Oben Unten