Flex-RAID anstatt RAID5?

Die Theorie ist klar, in der Praxis ists aber einen Blitzschlag am Tag des Lottogewinns herbeireden ... was besonders witzig ist angesichts der Systeme über die wir hier reden.

Wer aus Langeweile wöchentlich nen Rebuild anschiebt, Warnungen ignoriert und dazu noch einen RAIDpool betreibt in dem Platten stecken die nichtmal für Dauerbetrieb ausgelegt sind gehört nunmal bestraft. Im Normalgebrauch jedoch wird man aber bei korrekter Nutzung und Konfiguration ein derartig hinterlistiges Plattensterben selbst bei billigen Consumerplatten nicht häufiger erleben als den 6er im Lotto.

Aber vielleicht bin ich ja der Lottogewinner mit meinem Sorgloserlebnis und ich hab jahrelang nur die Medienberichte ignoriert, die vom großen Plattensterben in RAID 5 Systemen berichteten *noahnung* ... Angesichts der vielen HDD-Generationen die schon sowohl beruflich als auch privat durch meine Server gingen ein wahres Wunder.
 
Das genaue Gegenteil kann ich berichten.
Sowohl im SOHO-Bereich bei mir als auch bei diversen Kunden sind Raid5 System mit großen Platten von permanenten rebuilds betroffen.
Zumindest nach ca 3-4 Jahren Betrieb.

z.B.: Bei 2 Stk. 16-fach Raid 6 Systemen sind schon 8 Platten ausgetauscht.
Was 8x rebuild bedeutet.
Bei einem Rebuild ist schon mal ne 2. Platte eingegangen Dank Raid 6 Glück gehabt.
1x pro Woche läuft ein Scrub, was wieder ein volles Lesen bedeutet.
10^14 lässt grüßen ;)
 
Der Rebuild-Prozess ist bei den meisten RAID-Leveln schon ein ziemlicher Stress für die HDDs. Ähnlich einer langwierigen Defragmentierung. Die Gefahr, dass sie während dessen ausfallen sehe ich durchaus als erhöht an. Aber wenn man sich vergegenwärtigt, dass eigentlich alle RAID-Level von der Konzeption lediglich die Ausfallzeit bei einem Defekt verkürzen und nicht die Datensicherheit steigern sollen, ist das ein Umstand mit dem man leben kann.
 
Aber wenn man sich vergegenwärtigt, dass eigentlich alle RAID-Level von der Konzeption lediglich die Ausfallzeit bei einem Defekt verkürzen und nicht die Datensicherheit steigern sollen, ist das ein Umstand mit dem man leben kann.

Diese Einstellung nutzt dir aber leider nichts, wenn alle Daten weg sind dank Raid 5.
 
Also ich sehe meine Daten nicht auf dem Spiel stehen, wenn eines meiner Arrays ausfallen sollte. Jedenfalls den Großteil nicht. Es geht schließlich nur der Stand seit dem letzten Backup verloren. Bei Datenbank-Servern mag das anders aussehen, aber im Heimbereich ist ein Verlust der letzten Stunden verkraftbar. Dass kein RAID-Level ein Backup ersetzt, sollte jedenfalls unumstritten sein. Aber vielleicht kann ich da gar nicht mehr mitreden. Ich habe nur noch zwei Arrays am Laufen und beide zählen nicht wirklich. Das eine ist ein RAID-1 in einem Dual Socket 370 System, welches noch auf Ultra160 SCSI basiert. Und das andere steckt im NAS. Dort wird ebenfalls Mirroring betrieben, aber wirklich große Eingriffsmöglichkeiten hat man dabei nicht.
 
Ich hatte schon viele Platten die Tod waren ohne auch nur das geringste in den SMART Werten zu zeigen.

Hatte ich bei Consumerplatten erst ein einziges mal mit WD, sonst immer und das waren sehr viele.
Wenn natürlich der Motor nicht mehr angeht, dann nützt SMART auch nichts.
Aber bei Sektoren- oder CRC Fehler ist es sehr verlässlich. Man muss die Werte aber auch lesen können, die Thresholds vom Hersteller sind sinnlos.

---------- Beitrag hinzugefügt um 15:31 ---------- Vorheriger Beitrag um 15:20 ----------

Die Theorie ist klar, in der Praxis ists aber einen Blitzschlag am Tag des Lottogewinns herbeireden ... was besonders witzig ist angesichts der Systeme über die wir hier reden.

Wer aus Langeweile wöchentlich nen Rebuild anschiebt, Warnungen ignoriert und dazu noch einen RAIDpool betreibt in dem Platten stecken die nichtmal für Dauerbetrieb ausgelegt sind gehört nunmal bestraft. Im Normalgebrauch jedoch wird man aber bei korrekter Nutzung und Konfiguration ein derartig hinterlistiges Plattensterben selbst bei billigen Consumerplatten nicht häufiger erleben als den 6er im Lotto.

Aber vielleicht bin ich ja der Lottogewinner mit meinem Sorgloserlebnis und ich hab jahrelang nur die Medienberichte ignoriert, die vom großen Plattensterben in RAID 5 Systemen berichteten *noahnung* ... Angesichts der vielen HDD-Generationen die schon sowohl beruflich als auch privat durch meine Server gingen ein wahres Wunder.

Wenn man den Inhalt der Disk wenig bis gar nicht nutzt und keine Scrubs macht, dann ist das gar nicht so unwahrscheinlich das man Probleme erst viel später feststellt wenn bereits 2 Disks Probleme haben weil man man nie die entsprechenden Sektoren abgefahren hat. Die Disks drehen sich aber trotzdem permanent weiter.

Und je älter die Disks, desto häufiger fallen die aus. Manche Serien liegen bis zu 30%.

Auch TLER kann zum Problem werden wenn die Disk der Meinung ist das sie erstmal ewig lang suchen muss aber der Controller sie schon nach 7sek rauswirft. Da reicht dann schon ein einzelner Sektor und der Controller will von der Disk nichts mehr wissen. Passiert das bei 2 Disks, ist alles zu spät bei RAID5. Selbst wenn auf den 2 Platten nur 1 Sektor kaputt ist und der Großteil der Daten noch lesbar gewesen wären.

Und nicht zu vergessen das ein RAID gegen Plattenausfall schützt aber nicht wenn der Controller plötzlich wirre Daten schreibt oder der Speicher defekt ist.
 
Zuletzt bearbeitet:
Einzelne Platten die mal sterben sind nix neues vor allem bei PerformanceRAIDs die öfter mal n Rebuild haben wegen hohem Verschleiss. Aber der Fall das ein Rebuild eine weitere HDD bzw. das RAID zerschossen hat ist mir noch nie untergekommen und ich hab auch in meinem beruflichen Umfeld noch nix von einem derartigen Ausnahmefall gehört. Totalverlust der Arrays kam mir nur zweimal in ner Farm unter, einmal Hardwarefehler eines Controlllers, einmal bei ner Expansion wo heut noch keine Sau weiss was schief lief.

Im Privatbereich laufen mehrere arrays in mehreren Maschinen (Server, Workstation und SpieleHTPC). Da ist dann wirklich alles anzutreffen: Linux Software RAID 1 und 5. Intel ICH StripSets und IntelController Mirror, das ganze auf (Veloci-)Raptoren, RAID- und Eco-Consumerplatten. und auch wenn ich ne ordentliche Herde an HDD ständig am Laufen hab, so sind doch HDDausfälle extrem selten und haben mir nie Angst gemacht.

Wie schon zigfach erwähnt wurde, RAID ist halt keine BackupMethode sondern in erster Linie ein Mittel der Verfügbarkeits- und Performancesteigerung. Vor RAID5 gar noch zu warnen als ob es Platten vernichten würde ist schon arg paranoid. Wer wirklich glaubt das er als Privatanwender die Grenzen einer Consumerplatte durchbricht, dem sei nicht daran gehindert die für Dauerbetrieb ausgelegten RAIDeditions zu verwenden, wobei die für den gewöhnlichen Verbraucher der nichtmal 24/7-Server hat auch schon Overkill sind.
 
Zuletzt bearbeitet:
Wenn Du schon etliche Terabyte verloren hast wegen Raid 5, dann setzt Du es auch nicht mehr ein wenn es ein Raid 6 gibt, welches mit ein wenig Mehraufwand deutlich mehr Sicherheit gibt.
 
Bis Du etliche TB mit einem RAID 6 verlierst, dann nur noch den guten ollen Spiegel einsetzt, der natürlich auch nicht unsterblich ist ... und irgendwann lernst halt das HDD Verschleissgegenstände sind und einzelne RAIDs keine Backups ersetzen, sondern nur für Verfügbarkeit und Performance erfunden wurden.

Womit wir dann wieder beim Thema Sinnhaftigkeit angelangt wären und dem Punkt das ihr Technologien unverständlicherweise immer auf Basis einer viel zu engen persönlichen Definition eurer Ansprüche hin aburteilt anstatt auf Basis von Sinnhaftigkeit je Verwendungsfall. Es gibt einen einfachen Grund für die Verbreitung von RAID 5 ... RAID 6, hot spares, etc. sind Overkill für viele Fälle bzw. einfach nicht mehr machbar mit gegebenen Mitteln und rechtfertigen ndemzufolge nicht den Mehraufwand eines soclhen Upgrades der Redundanz... so einfach!
 
Wieso unterstellst Du dass wir alle keine Backups machen?
Schrieb ich das irgendwo?

Eine Festplatte mehr ist als Aufwand nicht gerechtfertigt? *rofl*

Warum verallgemeinerst Du Deine Ansprüche bzw. Deine Nichtansprüche?

Oftmals ist, speziell im Heimbereich ein Backup aller Daten mit vertretbarem Aufwand nicht machbar.
Wie willst Du 10 und mehr TB Sichern? Was ist das denn für ein Aufwand? Welche Mittel sind da gerechtfertigt?

Spare Platten dienen nur der Bequemlichkeit bzw. Abwesenheitsüberbrückung denn Rebuildausfälle können sie ja nicht verhindern.
Da kann ich sie gleich als Raid 6 oder Triple Parity mitlaufen lassen.
 
Bei RAID ist es natürlich auch wichtig das man den Status der Platten überwacht, grade Smart wird von Privatanwendern sträflich vernachlässigt. Ausfälle kündigen sich oft schon frühzeit an.

Zugegebenermaßen es gibt nur eine einzige wissenschaftliche Studie dazu, aber die belegt genau das Gegenteil - dass der Großteil der Platten die einen Totalausfall hinlegen ohne SMART Hinweise das zeitliche segnen. Gut da kommen noch andere Faktoren wie Temperatur, Lebensdauer etc. dazu.

Ich möchte hier auch lediglich ein paar Punkte zur Diskussion anregen, Fakt ist aber tatsächlich dass ein RAID beim Rebuild in vielerlei Hinsicht besonders belastet und anfällig ist.
 
...besonders belastet und anfällig ist.

Was auch keiner anzweifelt.

Jedoch gehts um hinreichende Redundanz und Overkill bei meiner Argumentation. Ein einfaches 5er sichert ab vor dem Ausfall einer Platte, was mit recht hoher Wahrscheinlichkeit jeden irgendwann mal betrifft, wobei es aber bei Kapazitätsausnutzung, Kosten (Gehäuse/Platte/Controller/Strom) und Belastung fürs System (Strom/CPU-last/Wärme/Lautstärke) punkten kann.

Da kommt dann Kontra aus der absoluten Nieschenecke bzw. dem BigBusiness, wie zB 10TB unwiderbringliche Daten (welche Privatperson bzw. welches Kleinunternehmen hat sowas?! FYI ne Filmsammlung und die Mitschnitte der Lieblingsserie sind kaum unwiderbringliche Daten), Sonderfall das eine weitere Platte beim Rebuild aussteigen könnte und was hier sonst noch paranoiderweise angebracht wird um RAID 5 als veraltet und unzumutbar hinzustellen.

Ein RAID 6 oder andere "advanced" Level, bzw. Späße wie HotSpares bereithalten, haben durchaus ihren Platz in der IT, aber sind einfach nur Overkill für eine Tonne von Anwendungsfällen und Nutzer.

Wie einige hier immer Argumentieren ist vergleichbar mit Leuten die den Sinn eines VW Polo in Frage stellen, weil ein VW Passat doch soviel mehr kann. Kommt mal wieder rauf auf den Teppich, ist nicht falsch ein RAID 6 zu erwähnen mit all seinen Vorzügen, aber es ist falsch anzunehmen es würde ein RAID 5 absolet oder unzumutbar machen.
 
Zuletzt bearbeitet:
Vor RAID5 gar noch zu warnen als ob es Platten vernichten würde ist schon arg paranoid.

Wer behauptet sowas?

Und wenn du noch kein RAID5 hast ausfallen sehen, dann hast du einfach noch nicht genug Erfahrung.

---------- Beitrag hinzugefügt um 10:42 ---------- Vorheriger Beitrag um 10:36 ----------

Zugegebenermaßen es gibt nur eine einzige wissenschaftliche Studie dazu, aber die belegt genau das Gegenteil - dass der Großteil der Platten die einen Totalausfall hinlegen ohne SMART Hinweise das zeitliche segnen. Gut da kommen noch andere Faktoren wie Temperatur, Lebensdauer etc. dazu.

Da ist natürlich die Frage wie oft man die Logs überhaupt anguckt? Bei einem Monitoring sollte alle 5min. der Status der Disks geprüft werden und auch entsprechende Mails verschickt werden wenn die Disk nicht erreichbar ist und das RAID z.B. auf degraded steht. Die Frage ist, ob ein Privatanwender einen Ausfall einer Disk überhaupt mitbekommt wenn ein Controller keine Töne von sich gibt.

Daheim hab ich für meine Videos auch kein Backup, deswegen habe ich was sicheres genommen: ZFS
 
Wer behauptet sowas?

Und wenn du noch kein RAID5 hast ausfallen sehen, dann hast du einfach noch nicht genug Erfahrung.
...

Die Behauptung kam nunmal so rüber als mir jemand einreden wollte dass ein Rebuild derart das Risiko für weiteres Plattenversagen hochtreiben würde, dass es unverantwortlich sei noch RAID 5 einzusetzen / zu empfehlen, wenns doch das RAID 6 gibt was mich vor diesem Horroszenario schützt ;)

Mit der Erfahrung kann natürlich sein, bin erst seit circa 14 Jahren in der IT-Branche und hab wohl einfach all die Panik und Firmenpleiten durch RAID5versagen immer ignoriert ... oder die Leute in meinem Umfeld wussten einfach was sie tun in ihren Sicherungsstrategien ... wer weiss ... Woran es letztendlich liegt das ich und der Markt so ein RAID 5 noch immer in Betracht ziehen für eine Tonne von Anwendungen wird wohl für immer ein Rätsel bleiben.

Könnte natürlich sein, dass es einen riesigen Markt für die Lücke zwischen gar keiner Redundanz und einer doppelt und dreifachen gibt. Aber das ist wohl nur eine dreiste Spekulation meinerseits und ihr habt natürlich recht mit eurer RAID6 Argumentation.
 
Und ich habe insgesamt glaube ich schon 3x RAID5 sterben sehen. Die ersten 2 waren noch Netware, da wars in einem Fall der Controller. Wobei diese Konstrukte damals mit SCSI noch empfindlicher waren, da ja mehrere Disk an einem Kabel hingen! Da brauchte nur was mit der Terminierung nicht stimmen und schon hatte man Müll. Wobei diese externen SCSI Terminatoren häufig nur eine begrenzte Lebensdauer hatten.
Der neueste Fall war eine EMC Storage mit FC angebunden, wo der Link am Brocade Switch für einen kurzen Moment unterbrochen wurde. Das hat schon gereicht das sich die NTFS Partitionen auf der VMFS Partition sich eine schleichende Datenkorruption eingefangen haben und eine VM nach der anderen wegen kaputtem MBR abgeraucht ist.
Da da natürlich auch deine Reputation leidet falls man beteiligt ist, wählt man dann doch lieber sicherere Methoden.
 
Sorry, aber Deine Beispiele klingen nicht gerade danach, als ob die Schäden mit einem anderen RAID-Level vermeidbar gewesen wären.

Wenn die Daten schon als Müll geschrieben werden wegen Hardwarefehlern, kann Dir auch kein RAID mehr helfen. RAID an einem Controller ist dazu da den Plattenausfall zu kompensieren, wenn Deinerein Controllerfehler und Terminierungsprobleme hatte musst halt über redundante Controller und getrennte Plattenarrays nachdenken ... hat aber nicht wirklich was damit zu tun ob nun ein RAID 5 / 6 / whatever daran hängt.
 
Das es was mit dem RAID Level zu tun hat, habe ich auch nicht explizit behauptet. Aber du tust so als wären RAID5 der Weißheit letzter Schluss und unzerstörbar.
Und ohne RAID oder z.B. mit ZFS zerschiesst es einem bestehende Daten nicht so leicht. Weil RAID das FS nicht kennt und dann alles zumüllt. Bei ZFS mit COW wird ständig in neue Blocks geschrieben, nicht die alten überschrieben und ZFS kennt die Checksums sämtlicher Dateien. Im Ernstfall z.b. bei Controller defekt, tretet ZFS auch alle Disks raus aber nachdem man den Controller gewechselt hat (und das kann auch ein anderer sein), kann man alle Platten wieder zum bestehenden Pool mounten und hat zumindest wieder die Dateien vor dem Problem.

Recht interessant übrigens auch:
http://de.wikipedia.org/wiki/RAID#Statistische_Fehlerrate_bei_gro.C3.9Fen_Festplatten
Der Rebuild eines RAID 5-Arrays aus drei 500 GB großen Consumer-Laufwerken (1 TB Nutzdaten) wird im Schnitt in 92 von 100 Fällen erfolgreich sein, wenn nur URE-Fehler betrachtet werden.

Oder lustig auch wenn man mehrere Platten der selben Serie mit fortlaufenden Nummern hat.
 
Zuletzt bearbeitet:
Ich überlege gerade, ob ich mein RAID im Dual Socket 370 System ausweiten sollte. Mehr als Spielerei, als aus praktischem Nutzen. Mein Controller beherrscht RAID-3 und RAID-5 in Hardware. Ich vermute RAID-5 überfordert die Rechenleistung des Controllers. Es ist ein Mylex AcceleRAID 160 von IBM. Dieser setzt auf eine Kombination aus Intel i960 (100MHz) und QLogic QLA-10160 gepaart mit 16MB ECC-RAM. Das war damals schon ein Entry-Level HBA. Ich verwende ihn nur deswegen, weil er ohne PCI-X auskommt und ihm ein 32-Bit PCI-Slot reicht. Eine Adaptec AHA-2940UW steckt ebenfalls noch im System, dient jedoch nur der Anbindung externer Geräte, wie dem Scanner. Ist ein RAID-3 weniger fordernd? Und kann man bei einem RAID-3 festlegen, welche Festplatte für die Paritätsinformationen dienen soll? Wäre es sinnvoll dafür eine 15K HDD zu verwenden, wenn die Festplatten für die Nutzdaten nur 10.000rpm haben? Oder hat man diese Wahl nicht? Laut Wikipedia bildet die Paritätsplatte bei RAID-3 jedenfalls den Flaschenhals.
 
nein Raid 3 ist nicht weniger fordernd die Prüfsumme muss gebildet werden bei 3 und bei 5.
 
nein Raid 3 ist nicht weniger fordernd die Prüfsumme muss gebildet werden bei 3 und bei 5.
Und es wird derselbe Algorithmus verwendet oder ist er bei RAID-5 komplizierter, weil die Informationen über das gesamte Array verteilt werden? Da fällt mir ein ich müsste auch einmal die Firmware meines Mylex AcceleRAID 160 updaten. Davor habe ich mich bisher gedrückt, weil man die Firmware mehrteilig einspielen muss. Obendrein passt sie nicht auf eine einzelne Diskette. Da sehe ich Schwierigkeiten schon vorprogrammiert. Es wäre jedoch die passende Gelegenheit dies endlich in Angriff zu nehmen. Für den Notfall habe ich noch weitere AcceleRAID 160 gehortet. *buck*
 
Flaschenhals ist bei Dir sicher nicht der Mylex beim Prüfsummenbilden sondern der PCI Bus.
Der Algo müsste eigentlich der gleiche sein nur hat nicht verteilt.
Ich denke nicht dass es komplizierter ist bei linear verteilten LBAs dazwischen immer eine Prüfsumme zu setzen oder das auf einer Disk zu tun.
 
Ich habe mir gerade einen Satz Hitachi UltraStar 15K300 (HUS153073VL3800) für mein geplantes RAID5 besorgt und bin erschrocken, wie leise sie arbeiten. Selbst wenn man sie mit dem AS SSD Benchmark quält sind sie kaum aus der Reserve zu locken. Da ist meine Samsung HD204UI/Z4 (SATA, 7.2K) in einem externen Gehäuse deutlich lauter bei Zugriffen. Dafür sind die 15K300 nicht die schnellsten. Aber das kann daran liegen, dass ich sie mit einer Adaptec 19160 auf einem Board mit ATi SB600 und Windows 7 gebencht habe. Ich musste leider die Adaptec 19160 nehmen, weil es meine einzige SCSI Card mit Windows 7 Treibersupport ist und dieses OS ist als einziges zur Zeit auf meinem derzeitigen Testsystem installiert.

Ich dachte jedenfalls zuerst die UltraStar 15K300 wären kaputt. Ich habe gar kein Anlaufgeräusch gehört wie sonst. Da müssen eindeutig Flüssiglager verbaut sein. Kugellager bekäme man nicht so leise. Und dann erhitzen sich die 15K300 im Betrieb kaum. Ich glaube eine aktive Kühlung wie ich sie gerade für sie eingerichtet habe wäre sogar überflüssig. Das sind richtig geniale Festplatten. So etwas von flüsterleise für SCSI Verhältnisse. Nicht zu vergleichen mit zum Beispiel einer Seagate Cheetah 15K.4. Jedenfalls meine 72.8GB Version mit Single Platter/Dual Head Interieur.

Ich musste nur leider feststellen, dass der Stapel mit den Mylex AcceleRAID 160, die als Ersatz dienen sollen, alle eine BBS Firmware haben. Und das lässt sich ohne passendes Mainboard nicht rückgängig machen, weil man es nicht bis in den EzAssist (Alt+R) schafft. Denn dorthin muss man gelangen, um eine nonBBS Firmware zu laden. Nicht wirklich durchdacht. IBM hätte diese Funktion lieber nicht in das BIOS für die RAID Erstellung, sondern in den zweiten BIOS Part gepackt, der sich um das Booten von SCSI Laufwerken kümmert. Dieses lässt sich auf einem inkompatiblen Mainboard weiterhin mit Alt+M aufrufen. Nur hilft das wie gesagt leider nicht weiter. So ein Pech. Und ich merke es erst nach Jahren. *buck*
 
Zuletzt bearbeitet:
Hallo zusammen... ich habe hier schon länger nicht mehr gepostet.
Mein Snapshotraid läuft seit Jahren wunderbar und ich wollte nur mal aus Neugier fragen, ob jemand evtl. neue Software ausprobiert hat und was es darüber zu schrieben gibt?

Meine Erfahrungen, die ich jetzt auf Win8.1 gesammelt habe sind pure Begeisterung, u.A. weil Windows es inzwischen scheinbar endgültig und sehr zuverlässig gelernt hat, Laufwerke, die nicht benötigt werden auch WIRKLICH auszuschalten.
So kann man inzwischen perfekt die Vorteile von SnapshotRAIDs ggü. RAID5 auskosten: es läuft inwzischen wirklich nur noch das EINE Laufwerk, auf dessen Daten man gerade auch wirklich zugreifen muss und nicht wie im RAID5 immer alle Platten...
 
Zuletzt bearbeitet:
Weiterhin läuft das SnapshotRAID... :)
Wer hat Neuigkeiten zu berichten?
 
Ich habe mit snapraid schon zweimal jeweils eine defekte Festplatte restoren können. Läuft jetzt seit über drei Jahren in meinem Server mit 5 Festplatten (4 Daten, 1 Parity).
 
Zurück
Oben Unten