Dell CERC: Array failed

HAARP

Commodore Special
★ Themenstarter ★
Mitglied seit
16.08.2004
Beiträge
409
Renomée
12
Tag.

Ich hab hier einen Server mit einem Dell CERC 1.5/6ch Controller auf dem ich letzte Woche 4 nagelneue Samsung F3 Eco Platten installiert habe mit jeweils 1TB. (davor liefen dort ältere Platten jahrelang problemlos) Das ganze läuft als RAID10 und sollte nur als Backuprechner dienen.
Das ganze lief einige Tage problemlos. Nur letztens komme ich in den Serverraum und bekomme ein ohrenbetäubendes Piepsen zu hören. Bildschirm dran und sehe IO-Fehler auf dem Array, gefolgt vom unweigerlichen Kernel Panic.
Beim Rebooten das selbe Gepiepse, gefolgt von einem Hinweis des Controllers, dass das Array "failed". Um genau zu sein, scheinen beide RAID1, die unter dem RAID0 liegen, zu failen. Nirgendwo im Controllerbios finde ich weitere Infos warum dies passiert ist oder wie ich es wieder aufbauen kann ohne alle Daten zu verlieren.

Hat einer ne Idee was hier los ist? Es kann doch nicht sein, dass mehrere brandneue Samsungs zum gleichen Zeitpunkt den Geist aufgeben?
 
Könnte vielleicht der gleiche Fehler sein, den die Platte auch mit der SB850 hat.

Eventuell bringt das Firmware Update für die Samsung Besserung.
 
Das ist kein SATA 600 Controller ...

Wird vermutlich daran liegen das die Platte länger als 8Sekunden nicht geantwortet hat, als sie versuchte einen Sektor zu beheben (was gar nicht so abnormal sein muss). Normalerweise sollte sie innerhalb 8sek. Meldung an den Controller geben damit dieser versucht den Fehler zu beheben. Tut sie das nicht, setzt sie der Controller offline.

Und da eine F3 nicht für den RAID Betrieb vorgesehen ist, deaktivieren die Hersteller diese Zeitspanne einfach. Früher konnte man es bei vielen Platten noch nachträglich einschalten aber heute sagen die Hersteller, kauf dir einfach ne RAID Version die um 50% teurer ist. 8-(

Für WD heisst das Tool WDTLER und bei Samsung heisst das Feature CCTL. Das einzige mir bekannte inoffizielle Tool für Samsung ist HDAT2 und kann SMART Parameter verändern.

Anscheinend kann auch smartctl die Werte ändern (aber wohl nicht dauerhaft?)
http://forums.storagereview.com/index.php/topic/28333-tler-cctl/
 
Zuletzt bearbeitet:
Sobald man rebootet sind die Einstellungen wieder weg, habe es mal für meine Hitachies probiert. Die Zeit beträgt sogar nur 7 Sekunden, bzw. Werksseitig so bei den RE-Platten eingestellt.
 
Danke für die Hinweise! Ich werd das Ding am Montag mal außeinanderrupfen und ein Linux mit Software-RAID neu drauflegen. Das kommt mit jeder Art Platte dar :]
 
hab mal eben bei meinen platten im linux sw-raid tler aktiviert mittles smartctl. musste dafür aber erstmal die neuste version ausm svn ziehen, da die versionen von ubuntu 10.04 und gentoo es noch nicht unterstützen.
bei
Code:
# /usr/local/sbin/smartctl -i /dev/sdd
smartctl 5.40 2010-05-13 r3108 [x86_64-unknown-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Caviar Green family
Device Model:     WDC WD10EAVS-00D7B1
Serial Number:    WD-------------------
Firmware Version: 01.01A01
User Capacity:    1.000.204.886.016 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   8
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Sat May 15 17:16:45 2010 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
klappt das setzen der werte also. getestet, obs tatsächlich beachtet wird, hab ich nicht. auch noch nie probs mit gedroppten platten gehabt.
 
richtig. es ging mir nur um das modell und die firmware-version der platte, da es bei wd ja scheinbar nicht bei allen exemplaren einer serie funktioniert. die anzeige der tler/cctl/erc fällt hier genauso knapp aus, wie die anderem im netz zu findenden. wenn dus sehen möchtest:
Code:
# /usr/local/sbin/smartctl -l scterc /dev/sdd
smartctl 5.40 2010-05-13 r3108 [x86_64-unknown-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

SCT Error Recovery Control:
           Read:     70 (7.0 seconds)
          Write:     70 (7.0 seconds)
nichts spektakuläres
 
Zurück
Oben Unten