Sporadische Fehler sind die schönsten Fehler

Nero24

Administrator
Teammitglied
Mitglied seit
01.07.2000
Beiträge
24.066
Renomée
10.446
  • BOINC Pentathlon 2019
  • BOINC Pentathlon 2020
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2021
Ein Bluescreen, verursacht vom Grafiktreiber oder einer seiner Komponenten, muss nicht immer die Grafikkarte als Schuldigen haben. Auch die Grafikkarte wird mit Daten aus dem RAM und vom Prozessor gefüttert und wenn die Müll liefern, gibt's eben nen BSOD. So weit, so klar.

Aber der Fall, mit dem sich kürzlich ein User hilfesuchend an mich wandte, war wirklich "einzigartig" und hat mich 2 Monate (!) lang beschäftigt. Das war so zeitaufwändig, da die Fehler sich nicht "auf Befehl" reproduzieren ließen. Hier bei mir auf der Streckbank traten die Probleme überhaupt nicht auf. Das System bestand sämtliche Tests mit Prime95, Memtest86+, Furmark Stabilitätsloop, etc. ohne Probleme. Beim User jedoch lief das System manchmal 5 Tage ohne Probleme durch, manchmal war nach 5 Minuten Schluss. Der User hatte immer wieder sporadisch BSODs vom Grafiktreiber oder zurückgesetzte Displaytreiber; manchmal beim Spiel, manchmal beim Scrollen im Browser, die meiste Zeit aber eben nicht.

Mit der Zeit hatte ich die komplette Palette durch:

- Eventlog analysiert => außer dem Fehler selbst keine Auffälligkeiten
- Andere Grafikkarte probiert, die in einem anderen System erwiesenermaßen fehlerfrei läuft => Fehler bleiben
- System offen zwecks optimaler Kühlung => Fehler bleiben
- BIOS-Update und alles auf Default => Fehler bleiben
- Stärkeres Netzteil probiert => Fehler bleiben
- Speicher getestet, alles ok => Fehler bleiben
- Speicher trotzdem testweise getauscht, die in einem anderen System erwiesenermaßen fehlerfrei laufen => Fehler bleiben
- Speicher entschärft (Takt/Timings) => Fehler bleiben
- Speicher nur ein Modul => Fehler bleiben
- Frisches Windows 7 x64 statt "vermülltes" Win XP x86 => Fehler bleiben
- Alle möglichen Treiber-Versionen probiert => Fehler bleiben
- System insgesamt entschärft (FSB, Kern, Timings runter, Speedstep off, VCore/VDIMM hoch, etc.) => Fehler bleiben
- andere Steckerleiste probiert => Fehler bleiben
- komplett ohne Peripherie probiert => Fehler bleiben
- Mainboard getauscht => Fehler bleiben

Und ob's was gebracht hat, wurde wie gesagt jeweils immer erst nach einigen Tagen deutlich, da die Fehler derart sporadisch auftraten, dass sie nicht klar zu reproduzieren waren.

Nach zwei Monaten ist mir der Geduldsfaden gerissen und ich habe kurzerhand die gesamte Plattform getauscht, weil's auch dem User natürlich langsam auf den Senkel ging und ich ehrlich gesagt auch nicht mehr wusste, was ich sonst noch hätte probieren können. So ging die alte Plattform mit Intel Core 2 Quad, ASUS P5Q und 2x 2 GB DDR2-800 in Rente und ein AMD FX, ASUS M5A97 Pro und 2x 4 GB DDR3-1866 zogen in sein System ein, das ansonsten unverändert blieb. Seitdem sind die Fehler weg! Obwohl die alten Komponenten für sich jeden meiner Stabilitätstests überstanden haben, war das System in der Praxis nicht stabil. Entweder eine Inkompatibilität oder ein elektrischer Verschleiß irgendeiner Komponente. Was es letztendlich nun genau war, wird ein Geheimnis bleiben müssen *noahnung* Aber manchmal hilft eben nur noch die Holzhammer-Methode, wenn man mit Logik und feingliedrigem Sezieren nicht mehr weiter kommt.

"Wunderbar" ist in so einem Fall natürlich, dass man all die Stunden, die man dafür ver(sch)wendet hat, einem Privat-Mann gar nicht in Rechnung stellen kann. Das fällt dann unter "persönliches Engagement"... *buck*

Was war denn Eure verrückteste Fehlersuche? :)
 
Ähnliche Geschichte mit allen möglichen Tests und nahezu purer Verzweiflung.

Der Fehler lag letztendlich daran Microsoft&Logitech Tastatur+Maus mit einem bestimmten MSI Board verwenden zu wollen. Egal ob teure G15 oder billige 15€ Tastatur. Wenn auf dem Gerät und MS oder Logitech Schriftzug war ging nix. Wir hatten halt verschiedene in der Werkstatt und der olle PC stand immer mal an nem anderen Platz. damit wurde letztendlich alles durchgetestet was gerade rumlag.

Irgendwer kam damals auf die Idee einfach mal was von den NoName Eingabegeräten anzuschließen und siehe da, alles lief bestens.

So was hatte ich zuvor nie erlebt und danach auch nie wieder.
 
Auf Arbeit einen Rechner gebaut....damals einen der ersten P4 mit 64Bit-Erweiterung....ein ziemliches High-Endsystem der >1000€-Klasse.
Zusammengebaut und dann ging es ans Installieren von Windows....auf den Knopf gedrückt, Rechner geht an->alle Lüfter laufen, aber wilde Piepsorgie, die keinem Symptom zuordenbar war, und kein Bild.
Alle Kabel geprüft, und wieder probiert->selbes Verhalten.
Andere Grafikkarte probiert->selbes Verhalten.
Also Mainboard aus dem Gehäuse geschraubt und "freifliegend" probiert->selbes Verhalten.
Dann habe ich gesehen, daß ein Katalog quer auf der Tastatur lag und ~die Hälfte aller Tasten permanent gedrückt waren.^^
 
Ich würde darauf tippen, dass die CPU einen weg hatte...

Aber die CPU bei so einem alten System zu tauschen, macht nicht wirklich viel Sinn, so dass es unterm Strich besser ist, die 'Holzhammermethode' zu nehmen...

Hier muss ich sagen, dass ich wohl relativ früh den Gedanken in den Kopf des Users, für den ich den PC prüfen sollte, gesetzt hätte, dass der Rechner geupdatet werden müsse, da sich der Fehler nicht rekonstruieren lässt.

Mit Pech ists auch einfach nur irgendein blöder korrodierter Kontakt oder aber eine Feder, die nicht mehr stark genug ist (im LGA Sockel oder in 'nem Slot)...
 
hallo

ich hatte auch ein intel sys hier mit den core2 und selber fehlerbeschreibung wich habe jedoch von xp auf vista und win7 hatt ales nichts gebracht
auch die sachen getauscht und so weiter jetz liegt das ding keller rum

ich glaube langsam das es die cpu schrot fehlerhaft ist *noahnung*
 
Tachchen ;)

Ich hatte ein ähnliches Problem wie Schwarzmetaller ...

Ein Kumpel rief mich an, ob ich mal vorbeikommen könnte und mal nach dem Rechner seine Mutter schauen würde.

Als erstes ist mir aufgefallen, das das noch ein alter Sockel A Rechner mit einem Athlon Xp 2400+ war ... 512 MB DDR1 Ram .. Grafikkarte kann ich dir gar nicht sagen ... ich glaube das war eine von den Anfangstagen der FX 5xxx Serie ...
Naja alles in allem habe ich schon die Augen gerollt, weil es sich eigentlich nicht mehr wirklich Lohnt an solchen alten Systemen nach etwas zu machen ...
Man will aber seinen Horizont erweitern und nun habe ich an die Fehlersuche gemacht:

Rechner an ... keine 3 Sekunden später ging das Piepkonzert los ... Naja, kein BIOS-Kompendium dabei, also wusste ich die Codes nicht zu deuten ... Also 0 Methode

Alles Geräte ab(außer Maus und Tastatur"weil schnurlos set" & zwecks BIOS unn so ^^) >> selbe in Grün ... Ram umgesteckt(durch alle 4 Bänke) >>> selbe in Grün ... Kabel alle geprüft >>> immernoch ... Kontake überprüft >>> nicht gebraucht ... BIOS RESET >>> immernoch das selbe ... Maus &Tastatur ab und siehe da, es ging weiter bis er mir meldete das kein System geladen werden kann ... Das grenze den Fehler ein ... Platte dran und zack für der Rechner hoch ... Also mit Schalter wieder aus ... Maus & Tastatur drann >>> PIEPKONZERT ...

Jetzt dachte ich das Set war im Arsch, aber weit gefehlt .. durch blöden Zufall habe ich gesehen, dass die Leuchte vom Tastaturempfänger blinke ...

Da hat sich doch tatsächlich eine Taste in der Tastatur verklemmt oder verklebt ... und das war der grund weswegen der Rechner nicht wollte ... Welche Taste das war kann ich leider nicht sagen ... Die haben das Set weggeschmissen und sich ein neues Geholt ... Seit dem habe ich nie wieder was von denen gehört ...

Manchmal steckt der Teufel doch im Detail ^^
 
Hallo,

manchmal liegt es vielleicht auch gar nicht am PC. Vor ca. 4 Jahren hatte eine Arbeitskollegin auch sporadische Abstürze (Windows XP). Mal mit BSOD's mal ohne. Also geschraubt, geprüft, gewechselt... - Problem nicht behoben!

Auffällig war, dass die Abstürze sehr häufig kurz nach einem Druckjob passierten. Druckertreiber??? Auch durch andere Versionen ersetzt - das Problem blieb. Wieder Ratlosigkeit.

Dann habe ich noch mal unter den Schreibtisch geschaut. Das einzige was ich sah, war ein Papierkorb und der Trafo ihres Druckers.

Dann erinnerte ich mich das Thema Induktivspannung und auftretende Magnetfelder.

Und siehe da - Trafo weg - Problem weg.

Ich vermute, wenn der Drucker durch einen Druckjob aus dem Stand-by geholt wurde und der Trafo richtig Leistung brachte, die Magnetfelder so stark wurden und die Halbleiter verwirrten. Anders kann ich es mir nicht erklären.

Also, munter bleiben!
 
Da füge ich auch mal ne kleine Erfahrung hinzu.

Hatte ein System aufgebaut, aber aufgrund der zu lauten Geräusche von der OnBoard Soundkarte, habe ich das Mainboard eingeschickt...
Habe nie ein repariertes zurück erhalten, aber das Board gefiel mir.
Nunja, sowas werde ich wohl nie wieder tun, aber ich habe mir das selbe Board bei ebay ersteigert <- ein fataler Fehler.

Das Board "lief", aber mit Krücken. (ein DFI LanParty DK 790FXB-M2RSH)
Sobald eine Grafikkarte in den ersten PCIe Slot eingesetzt wurde, lief irgendwas gründlich schief.
Die Zeit innerhalb des PCs lief in vielfacher Geschwindigkeit, ein kurzer Druck auf eine Taste wurde mehr als 10 mal angenommen, eine Passworteingabe war unmöglich.
Gelegentlich lief das System auch mal stabil, die Grafikkarte lief im besagten Slot statt der erwarteten x16 nur mit x4.
Ein Slot-wechsel half nur begrenzt, das BIOS war nur sporadisch erreichbar und das belegen einiger bestimmter FAN-Anschlüsse resultierte im selben Problem.

Einen Defekt vom optischen her konnte man nicht entdecken.
Meine Vermutung ist, dass sich die Northbridge (auf dem Board, PCIe Anbindung) irgendwann mal überhitzt hatte und somit ein paar "Leitungen" sich querstellten.
Für mich bedeutet das, dass man keine Mainboards bei ebay kaufen sollte, die gut fürs Übertakten sind, auch wenn man nicht Übertakten möchte.
 
Ich hatte (habe?) auch so ein Problem. Bei mir wars wohl ein Kombifehler aus RAM+Grafikkarte.

Habe jetzt nach Speichertausch und höher drehenden GraKa-Lüfter keine Probleme mehr, nur 2 Abstürze als ich vergaß den Graka-Lüfter einzustellen.

Allgemein haben solche vertrackten Probleme wohl mehrere Ursachen. Nur das Symptom ist blöderweise wohl gleich -> Absturz. In Neros Fall muss es schlussendlich ja das Mainboard gewesen sein, eventuell war die Leitpaste auf der Northbridge zu alt (wichtig, da dort früher ja noch der Speicherkontroller war) - oder halt ein echter Alterungsdefekt irgendwo anders.
Edit: Sehe gerade erst, dass auch das Mainboard getauscht wurde. Da würde mich dann interessieren, welcher RAM verwendet wurde. Der getestete, gute, oder wieder der Originalspeicher? Oder auch die Grafikkarte .. da gibts zZt ja gehäufte Meldungen, dass einige ATIs komisch laufen. Interessant nun, dass das bei mir ein Intel System war, bei Nero auch, und es nun im AMD System funktioniert ... eventuell gibts da kleinste Timing-Unterschiede mit Intel-Chipsätzen, bzw. schlechtere Kompatibilitätstests auf Intel allgemein, seit AMD ATi übernommen hat? Wäre mal interessant, aber da man das Problem sehr schlecht nachstellen kann, wohl auch sehr schlecht zu recherchieren.
 
@Opteron:
Original-Grafikkarte war eine NVIDIA GeForce GTX 550, gegengetestet wurde mit einer ATI Radeon HD 4650.
Original-RAMs waren 4x Mushkin DDR2-800, gegengetestet wurde mit 2x Samsung DDR2-800
Original-Board war ein ASUS P5Q, gegengetestet wurde mit einem ASUS P5A.

Wenn ich mir das im Nachhinein alles so überlege, denke ich fast, dass Blutengel_6_6_6 recht hat: es muss die CPU gewesen sein! Das ist die einzig relevante Komponente, die wir nicht getauscht hatten vor dem kompletten Plattform-Tausch.

Allerdings wäre das in meinen 20 Jahren PC-Schrauberdarsein die erste CPU, die ohne Fremdeinwirkung (abgebrochenes Die bei Kühlermontage ohne Heatspreader oder Extrem-OC) einfach so kaputt gegangen wäre. Zudem mag man an einen CPU-Defekt fast nicht denken ob der extrem sporadisch auftretenden Fehler. Bei einer defekten CPU müsste das System praktisch sofort abschmieren, wenn die defekte Einheit bemüht wird. *noahnung*
 
Die schönste Geschichte war immer noch folgende:

Mein Rechner lief damals mit einem X2 3800+ unter Wasser - wochenlanges 24/7 Rendering, Gaming, etc. etc. kein Problem.

Mein bester Freund der immer Pech mit Hardware jeglicher Art hat kam zu Besuch da sein Rechner wieder mal defekt war um schnell was bei mir auszudrucken.

Bei betreten des Arbeitszimmers spürte mein Rechner der wochenlang stabil lief auf vier Meter Abstand die Präsenz meines Kumpels und kapitulierte mit einem Blue Screen.
 
Meine lustigste Fehlersuche betrifft meinen vorherigen Rechner.
AsRock Conroe945G-DVI
Core2Duo E4600
4GB-Ram
Div. Platten
2 optische Laufwerke
keine Grafik
Logitech-Usb-Keyboard
Microsoft Bluetooth IntelliMouse

Der Rechner stammt aus 2007 oder 2008. Lief jahrelang einwandfrei. Das erste Problem war das die MS Bluetooth Tastatur nicht korrekt ging. Die war noch fast neu und auf einmal ging die Leertaste nicht so richtig flink. Egal ob man fest draufgedrückt hat, oder normal beim 10-Finger-schreiben. Hab die Tastatur dann ausgemustert, aber Maus und USB-Receiver behalten. (Die Tastatur hatte ich nochmal offen, es scheint irgendwie an der Kontaktmatte zu liegen, aber ich konnte es nicht dauerhaft fixen...).
Nun gut. Jahre später (Mitte 2010), ging irgendwann ein Front-USB-Port nicht mehr. Naja, vielleicht mal mit nem Stick verrutscht, oder der Sohnemann hat was reingesteckt. Keine Ahnung. Kein großes Problem.
Später ging dann auch irgendwann der zweite Front-USB nicht mehr. Die hinteren waren noch i.O. Im Geräte Manager tauchte ein fehlerhaftes USB-device auf. Ich dachte daran, dass es vielleicht durch den vermuteten Kurzschluß den entsprechenden USB-Port auf dem Port abgeschossen hat und hab die Meldung Meldung sein lassen.
Naja, das Gehäuse ist von 2001, vielleicht Altersschwäche. (Die Front-USB-Ports haben noch einzelne Stecker für jede Ader...)
Bin dann irgendwann auf Windows 7 umgestiegen von Windows Vista und hatte null Probleme (außer die USB-Fehlermeldung). Manchmal popte diese Fehlermeldung vom USB auch hoch, aber da alle USB-Geräte einwandfrei gingen, habe ich mir das einfach gefallen lassen. Dadurch, dass der Nachwuchs noch sehr klein war, hatte ich andere Prioritäten...

Nach einer Weile wollte ich dann auf den SSD-Zug aufspringen und hab mich von den angegebenen Leistungsdaten der OCZ Vectrex 3 MAXIOPS begeistern lassen. Nach den ersten Preissenkungen schlug ich also bei der 120 GB-Variante zu und ersetzte meine Systemplatte durch die SSD.
Windows frisch installiert und das Drama war perfekt. Unregelmäßige BSODs. Klar, ist ja OCZ. In den Foren tauchten die Fehlermeldungen auf und ich war mittendrin. Hab jedes Update mitgemacht und manchmal dachte ich, es hätte sich gebessert. Aber ich wurde doch jedes Mal wieder eines besseren belehrt. Speicher getauscht. Netzteil getauscht. Keine Verbesserung.
Hab mir natürlich auch entsprechend in den Hintern gebissen. Die SSD war immer schnell, aber mit den Abstürzen war ich nicht so zufrieden. Meine Frau war natürlich auch regelmäßig begeistert, wenn ihre gerade in Erstellung befindlichen längern Emails weg waren und sie wieder von vorne anfangen musste...
Ne Weile hält man das ja durch, aber irgendwann muss was passieren.
Also neues System gebaut.
ASRock Z68 PRo3-M
Intel Core i5 2500k.
4 GB Ram die ich mal so günstig irgendwo gesehen hatte, dass ich sie einfach schon liegen hatte, "für den nächsten Rechner".
Und natürlich neues Gehäuse, wegen der defekten USB-Ports

Der ganze Rest wurde weiterverwendet. Platten wurden reduziert 1 SSD+1 2TB Platte. 2 DVD-Brenner. Das gute alte Floppy. Keyboard und Maus.

Neuer Rechner, altes Problem... Unregelmäßig BSOD. Keine Fehler im Geräte-Manager. Alle Treiber immer wieder aktualisiert. (Ich glaub der Intel-Grafiktreiber hatte mehrere Updates).
In der Zwischenzeit kam irgendwann das Firmware-Update 2.15 für die SSD. Endlich wurde eingeräumt, dass die Firmware fehlerhaft war, und jetzt sollte alles gut werden....
Pustekuchen!!!
Immer noch BSODs. Manchmal zwei am Tag, manchmal 1 Woche gar nix...
Was hab ich diese SSD verflucht, aber ich hab >200 € dafür gezahlt, und die Leistung an sich fand ich auch immer spitze...
Speicher rausgeschmissen und neu rein (16 GB; was ne Verschwendung); Netzteil quergetauscht. Nix...
Und dann kam Tag X. Der neue Rechner war schon wieder 3 Monate alt. Nun ging die Maus nicht mehr. Batterien gewechselt, tot. Okay. Ist der Kram halt über die Wupper.
Alte Maus rausgekramt. Auch Funk aber nix Bluetooth. Läuft. Einwandfrei. Weiter geht's.

Nach 1 Woche meine Frau gefragt: Sag mal wie oft ist der Rechner in den letzten Tagen abgeschmiert. Antwort: Keine Ahnung, kann mich nicht erinnern...
Nach 2 Wochen wieder...Wieder nix...
Seither ist der Rechner nie wieder abgeschmiert (<6 Monate).

Dieser verlixte BT-USB-Receiver....Ich hatte immer mal wieder auch andere Mäuse dran, aber der Receiver ist immer am Rechner geblieben...

Irgendwann bin ich auch auf den Trichter gekommen, den alten Rechner nochmal aus dem Keller zu holen. Musste mal neu aufsetzen, da ich die Systemplatte ja im neuen Rechner übernommen habe...
Einwandfrei. Alles geht. Null Probleme. Sogar die Front-USB-Ports gehen. Der Rechner hat den alten Athlon 64 3000+ bei meinen Schwiegereltern abgelöst.

Ente gut alles gut. Meine Schwiegereltern haben einen neuen Rechner. Ich hab nen neuen Rechner (dessen Power ich ungefähr 1 Mal im Quartal ausnutze, aber auch dann mit der Power des alten auskommen würde).
Ich baue meine Rechner seit 1997 selbst. Früher auch gerne mal jeden Monat irgendwas neu rein und raus. Hab auch diverse für andere Leute gebaut. Selten Probleme mit Hardware gehabt. Das Thema hat mich echt Nerven gekostet...

Danke für das Thema!!!
 
Der BT Receiver - nicht schlecht! Da kann ich nur noch mit einem ähnlichen Erlebnis 2001 einigermaßen mithalten, als ein CAPI-Treiber für eine Telekom-Telefonanlage :o sporadisch zu BSOD führte. *buck*
 
Zurück
Oben Unten