Intern: Sonnenuntergang auf dem grünen Planeten

Legenden halten sich lange, unter Reiser ist mir persönlich noch nie was verschwunden, aber egal wir haben so und so auf ext3 gesetzt.
Oh, das mit der Legende erzaehl bitte mal Bekannten von mir, die Millionen von Files in ein reiserfs kopiert haben, und danach sich ueber Meldungen der Applikation wunderten, das bestimmte Files nicht mehr da waren. Und das via ls auch bestätigen konnten ...
 
Naja ... dazu sage ich aber nur: Mit Vergleichen waere ja aufgefallen, das die Lizenzbedingungen so sind: Security Patches ja, Driver Patches ja, Availability Patches nein. Ist ja nun nicht so, das Sun das erst im Nachgang gesagt hat ...

Sehr viel mehr last, auf sehr viel groesseren Sytemen ... ausserdem Ihr seid da auf eine ziemlich gemeine Tretmine gelaufen was den einen Patch angeht ... wenn ich mir die interne Doku dazu durchlese, muessen einige Bedingungen erfüllt sein, damit das System paniced ..
Also jetzt mal Klartext, um welchen Patch gehts denn da jetzt.

In Neros news steht, dass *der* Patch getestet wurde, dass System aber trotzdem abstürzte. Ergo, Du redest von nem andrem ?
Mit einem (welchen auch immer) Patch, sollte ja alles Laufen :)

Edit:
Danke für die "underpatched" Erklärung :)

ciao

Alex

P.S: Auf was läuft eigentlich heise z.Zt. ? Ich denke die haben auch gut Last ^^
 
Bevor jetzt hier das große Sun-Solaris-c0t0d0s0 Bashing losgeht: Wäre dieser dämliche Kernel-Bug nicht gewesen, oder wäre er in realistischer und absehbarer Zeit behebbar gewesen, wären wir auch mit Sicherheit bei Solaris geblieben. Das Problem war nur eben, dass sämtliche frei verfügbare Patches bereits eingespielt waren, zusätzlich noch Patches die nicht frei verfügbar waren aber man uns hat zukommen lassen. Vom Standpunkt eines Solaris Service Plans aus war das System underpatched, korrekt. Vom Standpunkt eines kostenlosen Solaris war das System hingegen overpatched. Und trotzdem trat der Fehler nicht reproduzierbar, aber regelmäßig auf. Vor allem tomturbo hat sich den A.... aufgerissen, um unter Solaris alles gewünscht zum laufen zu bringen. Die letzten Tage vor dem letzten Absturz habe ich durchgehend an der Konfiguration von Munin verbracht, damit auch unter Solaris der allseits beliebte Live-Puls wieder vorhanden ist. Wir wollten mitnichten aufgeben. Bis auf diesen einen Bug waren wir mit Solaris sehr zufrieden - was die Leistung angeht war es einfach phänomenal. Aber.....

Irgendwann ist ein Punkt erreicht, an dem man das Vertrauen in das installierte System verloren hat. Von unserer Seite aus hat sich die Situation so dargestellt, dass wir bereits zwei unterschiedliche (!!!) Patches eingespielt hatten, die das Problem hätten beheben sollen. Theoretisch. Praktisch hat sich absolut nichts geändert, spätestens nach drei Tagen lag das ganze System wieder flach vor uns, die MySQL Tabelle musste manuell repariert werden und die Seite war für mehrere Minuten nicht errreichbar. Im schlimmsten Fall hätten wir Datenverlust zu befürchten, wobei ich mal denke, dass uns ZFS hier den Hals soweit frei gehalten hat.

Jörg, was haben wir für Garantien, dass der Patch in OpenSolaris behoben ist? Falls es wirklich der mutex Fehler sein sollte, auf den du uns hingewiesen hast, dann sollte der auch mit dem Patch behoben worden sein, den wir über unsere Quellen beziehen konnten. Dieser Fehler ist angeblich seit _57 in OpenSolaris ebenfalls behoben - aber wenn die Fehlerbehebung genauso "gut" ist wie mit dem Patch, dann wäre das auch äußerst nutzlos gewesen. Wir haben uns ernsthaft überlegt, ob wir nicht Open Solaris eine Chance geben sollen - haben uns dann aber aufgrund der Unsicherheit ob dieses Fehlers dagegen entschieden.

Letzten Endes ist es, wie Nero24 gesagt hat - wir verabschieden uns von Solaris mit einem lachenden und einem weinenden Auge. Wenn das System wirklich stabil gelaufen wäre, wäre das einer der performantesten Server da draußen. Die Konfiguration des ganzen war zwar ein übles Gefrickel (sprecht tomturbo doch mal auf den aktuellen gcc an, oder mich auf Apache ;)), aber es lief. Es lief verdammt gut und zwischen den Abstürzen so unglaublich schnell, dass man meinen könnte, der Server stünde nie unter Last. 50-70 Apache-Anfragen pro Sekunde hat das Teil mit einem Wimpernschlag verarbeitet, ohne dabei auch nur geringste Anzeichen von Auslastung oder gar Schwäche zu zeigen. Das einzige, was Last erzeugt hat, war das noch ohne Cache laufende mod_fcgid (PHP5) - das wäre aber innerhalb einiger Tage auch behoben gewesen, dann wäre die Last vermutlich auf Null gesunken. Aber es hat nicht sollen sein. Wenn zwei Patches, die laut Beschreibung wirklich wie die Faust auf's Auge zu unserem Problem passen, den Fehler nicht beheben können, dann können wir uns auch nicht darauf verlassen, dass es vielleicht ein anderer Patch löst, oder dass eventuell unter Open Solaris dieser Fehler nicht auftritt. Wir mögen ein sehr seltener Fall mit diesem Problem sein, davon gehe ich sogar ganz fest aus. Nicht umsonst hat sich Solaris in der Unix-Welt einen unkaputtbaren Ruf erworben. Aber wir hatten eben irgendwo irgendwie Pech und einen nicht ohne weiteres behebbaren Fehler. Ich jedenfalls trauere Solaris hinterher, und ich weiß, dass tomturbo und Nero24 dies mit mindestens einem Auge ebenfalls tun.

Jörg: Auch von meiner Seite aus nochmal vielen Dank für deine Hilfe und deine Mühen. Ich wünschte, sie hätte uns zu einem stabil laufenden Server verholfen.

mj
 
Jörg: Auch von meiner Seite aus nochmal vielen Dank für deine Hilfe und deine Mühen. Ich wünschte, sie hätte uns zu einem stabil laufenden Server verholfen.

Ja. Ich hätte mir auch gewünscht. Aber ich nutze das jetzt als Punkt, um intern eine Diskusion starten zu koennen, wie ich sie ja in meinem Blog schon als Idee dargelegt habe ... da ich noch unter 5 Postings bin, kann ich gerade mal nicht verlinken ;)

Garantien gibt es leider keine. Man steckt nicht in der Hardware drin. Man muesste sich die Crashdumps nehmen, und vollständig durchanalysieren. Was hat eigentlich der letzte Crashdump bei $C angezeigt ?

Da ist ja der Grund warum viele Firmen ohne Wartungsvertrag keine Systeme durch die Tür lassen. Dann ists naemlich ein "Problem anderer Leute" ....
 
Ja. Ich hätte mir auch gewünscht. Aber ich nutze das jetzt als Punkt, um intern eine Diskusion starten zu koennen, wie ich sie ja in meinem Blog schon als Idee dargelegt habe ... da ich noch unter 5 Postings bin, kann ich gerade mal nicht verlinken ;)
Schreib einfach hxxp statt http. Dann kann mans nicht klicken, aber copy & paste gibts ja auch noch ;-)

ciao

Alex
 
Sowas wie perpendicular recording sind da noch böhmische Dörfer.
Das stimmt doch gar nicht. Perpendicular Recording gibt es bei der Seagate Cheetah 15K.5 seit rund einem Jahr.

Siehe: http://www.zdnet.de/news/hardware/0,39023109,39142924,00.htm

EDIT: Und zum Wechsel des Bertriebssystems meine ich, dass der Wechsel von Solaris weg der einzige gangbare Schritt zur Zeit war. Sich an ein als untauglich für den Einsatzzweck erwiesenes Betriebssystem krampfhaft zu klammern, wäre auch reichlich unvernünftig gewesen. Wobei ich mich frage ob nicht OpenBSD ein noch besserer Ersatz gewesen wäre als Gentoo Linux. Für mich als einfachen Nutzer spielt es jedoch keine Rolle, welches Betriebssystem auf dem Server läuft, denn im Regelfall bekommt man davon herzlich wenig mit. Hauptsache ist, dass Forum ist stets mit ausreichender Geschwindigkeit zu erreichen und dies ist gerade der Fall. Ich würde soweit gehen und behaupten, dass es gerade so schnell läuft, wie schon lange nicht mehr. Vielen Dank an alle Beteiligten dafür, die soviel Arbeit in dieses Projekt gesteckt haben, um Planet 3DNow! am Laufen zu halten.
 
Zuletzt bearbeitet:
Ich hätte mir jedoch OpenBSD als Ersatz gewünscht. Wobei es für mich als einfachen Nutzer jedoch keine Rolle spielt, welches Betriebssystem auf dem Server läuft, denn im Regelfall bekommt man davon herzlich wenig mit.
OpenBSD ist unter SMP nicht so sehr der Bringer. Und wir haben schließlich 4 Cores zu versorgen :)
FreeBSD war aber durchaus kurz in der Diskussion, aber letztendlich wurde es doch wieder aus Zeitgründen Linux, weil dort die Installationen am kürzesten sind.

lg
__tom
 
xfs hat zwar gute 'Prospektdaten' das es aber in der Praxis, zumindest bei mir, nicht hält.
Vorallem wird es mit der Zeit unerkärlicherweise immer langsamer, ich habe es als root Dateisystem mit einem gentoo-portage-tree im Einsatz und manchmal dauert ein normales 'ls' schon 30 sek bis es da ist :[
Geschweige denn von einem upgrade des portage-trees welcher unter reiser ca 10x schneller ist.
Soweit ich das sagen kann, wird es nicht langsamer, sondern ist von Anfang an deutlich langsamer als ext3, insbesondere bei vielen kleinen Dateien wie im portage-tree. Das haben ja auch meine Tests gezeigt.

Auch nicht sonderlich bewährt hat sich xfs auf einem Riesendateisystem mit 1,4 TB und relativ wenigen aber großen Dateien. Es fühlt sich einfach langsam an.
Das kann ich leider mangels passender Hardware nicht testen. Sobald das möglich ist, werde ich es aber mal durchnehmen.

Bei einem Stromausfall sind mal Dateien verschwunden. Auf einem Parallelsystem mit ext3 ist das nicht passiert (Hatte den selben Stromausfall ;) ) wie ein rsync dann bewies....
Bei Stromausfall gehen immer die Daten verloren, die noch nicht weggeschrieben sind. Allerdings glaube ich mich da an einen Bug in XFS zu erinnern, welcher das noch verschärft hatte. Das scheint aber mittlerweile behoben zu sein. Ich hatte schon öfters mal nen abrupten Halt meines Laptops, ohne das mir dabei Daten abhanden gekommen sind. Ganze Dateien dürfen allerdings nicht verschwinden, das wäre wirklich ein riesiger Bug.
 
Legenden halten sich lange, unter Reiser ist mir persönlich noch nie was verschwunden, aber egal wir haben so und so auf ext3 gesetzt.
Oh, das mit der Legende erzaehl bitte mal Bekannten von mir, die Millionen von Files in ein reiserfs kopiert haben, und danach sich ueber Meldungen der Applikation wunderten, das bestimmte Files nicht mehr da waren. Und das via ls auch bestätigen konnten ...
Das kann ich auch bestätigen - schleppe ReiserFS noch als "Altlast" aus der Zeit als ich Suse eingesetzt hatte auf meinen Datenplatten herum und hab das nur bislang aus Zeitmangel und teilweise wohl auch Faulheit nich geändert. Verschwundene Dateien erlebe ich da öfter mal - v.a. bei mp3s und Bildern. Den unter Kubuntu neu in ext3 angelegten Partitionen (dieselben Platten am selben Sil 0680er IDE-Controller) is dieses Phänomen hingegen vollkommen fremd!
Ob die Dateien wohl neben Hans Reisers verschwundener Frau liegen *kopfkratz *chatt* (SCNR)

Aber wie auch immer - erstmal ein
GANZ GROSSES DANKESCHÖN ans Serverteam *great**great**great*
Neben eurem Einsatz finde ich v.a. auch das schnelle Einsehen und Zugeben des Fehlers, es mal mit Solaris zu probieren, bewundernswert - soviel Einsicht, Fähigkeit zur Selbstkritik und Mut, das auch öffentlich zuzugeben, findet man grad unter Admins nämlich nich so besonders oft ;)

Und noch was: Das Ganze is mal wieder ein Glied in der Beweiskette, dass die vielgescholtene "Frickelware" Linux in grundlegenden Dingen proprietärer Software überlegen is 8)
 
Zuletzt bearbeitet:
Jetzt ohne mich ins offene Messer zu stürzen... was ist eigentlich mit Windows? ;D Würde das nicht funzen?
 
Und noch was: Das Ganze is mal wieder ein Glied in der Beweiskette, dass die vielgescholtene "Frickelware" Linux in grundlegenden Dingen proprietärer Software überlegen is 8)

Sagen wir mal proprietärer freier Software. Ich denke mit Supportvertrag wird es besser.
Allerdings zeigt das auch, dass man als Nicht Vollprofi beim jeweiligen System besser doch auf bekanntes zurückgreift. Da kann dann auch Windows die beste Alternative sein.

mÖÖÖp Azi, beide das gleiche Buh-Wort zur selben Zeit... ;)
 
Bei Stromausfall gehen immer die Daten verloren, die noch nicht weggeschrieben sind. Allerdings glaube ich mich da an einen Bug in XFS zu erinnern, welcher das noch verschärft hatte. Das scheint aber mittlerweile behoben zu sein. Ganze Dateien dürfen allerdings nicht verschwinden, das wäre wirklich ein riesiger Bug.
Das war leider nicht während des Schreibens, sondern einfach so, auf den Server hatte zu dieser Zeit keiner zugegriffen :o
In weiser Voraussicht hatte ich einen 2. Spiegelserver mit anderem Dateisystem eingerichtet ;D

lg
__tom
 
Jetzt ohne mich ins offene Messer zu stürzen... was ist eigentlich mit Windows? ;D Würde das nicht funzen?
*messeraufklapp* ;D Wir ham doch nen GRÜNEN Planeten und keinen BLAUEN - "Windoof wurde beendet, um die Hardware nicht zu beschädigen. Es ist ein Fehler an wegthzjukutrmtntsgejuilö9754ol8ix0000 aufgetreten. Bereits wenn sie diesen Bildschirm zum ersten Mal zu sehen bekommen, sollten sie Linux installieren." *baeh*
 
Zuletzt bearbeitet:
EDIT:
Ja, Deinen Vorschlag zur Basis Support Unterstütztung gegen Banner für die Community finde ich gut.

Dieses Modell kann ich auch nur befürworten !

Btw: hat eBay da nicht irgend so ein "powered by sun" (oder so ähnlich) seit geraumer Zeit auf der Startseite stehen ?

Grade mal geschaut...ist jetzt aber irgendwie grade net zu sehen..hmm war aber definitv da...(*aufderarbeitnichtsogenaunachschauenkönn*)

Wie auch immer, die Performance des Servers hier ist okay für mich, auch mit Linux.
.
EDIT :
.

*messeraufklapp* ;D Wir ham doch nen GRÜNEN Planeten und keinen BLAUEN - "Windoof wurde beendet, um die Hardware nicht zu beschädigen. Es ist ein Fehler an wegthzjukutrmtntsgejuilö9754ol8ix0000 aufgetreten. Bereits wenn sie diesen Bildschirm zum ersten Mal zu sehen bekommen, sollten sie Linux installieren." *baeh*

Würde bestimmt auch mit Server2k3 laufen.
Kann man ja automatisch alle 24h rebooten lassen, dann müsste es auch damit funzen :-)
Aber da muss man dann auch wieder Lizenzgebühren zahlen !
 
Das war leider nicht während des Schreibens, sondern einfach so, auf den Server hatte zu dieser Zeit keiner zugegriffen :o
In weiser Voraussicht hatte ich einen 2. Spiegelserver mit anderem Dateisystem eingerichtet ;D

lg
__tom

Sicher, dass nicht irgendein Programm die Dateien geöffnet hatte? Es gab mal das Problem, dass Dateien beim Absturz beschädigt wurden, obwohl sie nicht geschrieben wurden. Hatte ich selber ein paar mal gehabt. Das sollte aber längst ein Fall für die Akten sein.
 
Sicher, dass nicht irgendein Programm die Dateien geöffnet hatte? Es gab mal das Problem, dass Dateien beim Absturz beschädigt wurden, obwohl sie nicht geschrieben wurden. Hatte ich selber ein paar mal gehabt. Das sollte aber längst ein Fall für die Akten sein.
Ich bin mir sicher.
Denn der Server ist Monate ohne Aktivität im Rack vor sich hin gelaufen.
Und dann waren plötzlich Dateien weg.
 
Daher haben wir am zurückliegenden Wochenende in einem weiteren (und hoffentlich für lange Zeit letzten) Frankfurt-Aufenthalt Solaris 10 wieder vom Server geworfen und ein aktuelles Gentoo-Linux AMD64 installiert.

Warum kein Linux wie SLES9/10 oder einen Red Hat - Clon (CentOS, Scientific Linux oder White Box Linux.) ??
 
An Red Hat hab ich scho vor n paar Tagen gedacht als der letzte Crash war - v.a. gäbs da doch auch n Cluster Filesystem (GFS)...
 
Zuletzt bearbeitet:
*messeraufklapp* ;D Wir ham doch nen GRÜNEN Planeten und keinen BLAUEN - "Windoof wurde beendet, um die Hardware nicht zu beschädigen. Es ist ein Fehler an wegthzjukutrmtntsgejuilö9754ol8ix0000 aufgetreten. Bereits wenn sie diesen Bildschirm zum ersten Mal zu sehen bekommen, sollten sie Linux installieren." *baeh*

Öhm was hat das mit der Farbe zu tun :>
Windows Server 2003 Standard reicht ja nun wirklich, und vlt würden die Lizenzkosten ja von MS übernommen. Naja egal :)
 
Danke für eure Ausdauer und Geduld die Ihr in das Projekt steckt.

Und wir faulen Säcke hier ( ;-) ) dürfen nun die Früchte eurer Arbeit geniessen! :)


(für euch gilt.. ausser Spesen nix gewesen? )
 
Öhm was hat das mit der Farbe zu tun :>
Joke nich kapiert? ;)

Aber im Ernst: Da gehts ja v.a. auch um Sicherheit - oder würdeste gern von nem kompromitierten Boot nen Trojaner auf deinen (ich vermute mal unter Win laufenden) Rechner bekommen?!? :o
 
Zurück
Oben Unten