[Users-discuss] [mur users] Ceph - Datenpool

moki at verweigert.at moki at verweigert.at
So Dez 8 09:27:56 CET 2024


DANKE!
lg
ch

Zitat von "Wolfi | NOC - mur.at" <noc at mur.at>:

> Liebe mur.ats,
>
> *vorab*: die Webserver sind wieder online!
>
>
> *zum Hintergrund* oder eine Schauergeschichte: Die neuen Festplatten  
> sind eine Katastrophe! Das Beschreiben mit Daten ging noch ganz gut  
> und wir haben somit keine Unregelmäßigkeit beim Tausch der Platten  
> gemerkt. Beim Lesen der Daten reagierte der Speicher plötzlich  
> extrem langsam. Das war letzte/vorletze Woche - der erste Moment an  
> dem ihr bemerkt hattet, dass eure Webservices langsam bis extrem  
> langsam reagierten. Unser Warnsystem schlug auch an. Wir suchten den  
> Fehler und bemerkten die Trägheit der Platten. Also: Platten wieder  
> raus! Aber zuerst mussten die Daten, die wir schon darauf  
> geschrieben hatten nochmal ausgelesen und auf die anderen  
> Feltplatten zurückverteilt werden. Tja. Da begann dann der richtige  
> Schlamassel: Die Lesegeschwindigkeit der Platten war katastrophal!  
> Eure Webseiten wollten ausgelesen und dargestellt werden, die Daten  
> von den neuen Platten wollten gleichzeitig gelesen werden um sie  
> wieder auf die alten Platten umzuverteilen - es war der blanke  
> Horror - und eure Webseiten standen still. Und dann noch die  
> kompromittierten Festplattenabbilder! Und wenn sich ein Service  
> aufgrund der langen Wartezeiten aufgehängt hatte - wir konnten uns  
> nicht einmal im System einloggen um die Services wieder hoch zu  
> fahren. Fünf Minuten Wartezeit um einen simplen Ordnerwechsel  
> durchzuführen. Wir konnten nur zusehen wie der Speicher-Cluster  
> Daten schaufelt (oder einzelne Sandkörner hinüberträgt).
>
> Bis gestern Mittag hat sich der Ceph-Cluster wieder stabilisiert.  
> Aber immer noch lagen Daten auf den neuen, sau langsamen  
> Festplatten. Irgendwann, wussten wir, müssen wir die Daten wieder  
> auf schnellere Platten kopieren. Eine stundenlange Kopiererei und  
> keine Ahnung wie sich das ganze System verhält. Also entschlossen  
> wir uns die Daten auf die lokalen Datenträger der Server zu  
> kopieren. Insgesamt ca. 4TB an Daten (4.000GB). Ist jetzt nicht sooo  
> viel, aber bei der Lesegeschwindigkeit die wir erreichten, haben wir  
> zeitweise für 5GB eine halbe Stunde gebraucht. Also, so dachten wir,  
> beginnnen wir um 20:00 (nach euren und unseren Dienstschlüssen),  
> falls das Lesen der Daten die Websiten wieder langsamer macht. Bis  
> Mitternacht werden wir dann schon fertig. Dachen wir. Jetzt ist es  
> zwölf. Mittags - viele kreative Ideen (Daten aus den Backups holen,  
> mit externen Festplatten arbeiten, paralell Daten kopieren, nur  
> einzelne Container kopieren ...) später.
>
>
> *Und jetzt?*
>
> Ist die Bereitschaft und der Telefondienst vorbei.
>
>
> *Warum*
>
> schreibt das noc das alles? Weil es auch eine Art Kunst ist. Und  
> weil es übernachtig ist.
>
>
> *Und weiter? *
>
> Vier von neun neuen SSDs Platten (vieeeeel schneller als HDDs) sind  
> schon unterwegs. Außerdem haben wir eine Investitionsförderung  
> eingereicht mit der wir den Ceph neu aufbauen wollen. Ein Ceph  
> Server kommt dazu, statt HDDs SSDs, statt geteilten 2Gbit Netzwerk  
> 40Gbit dem Ceph dediziert. Und ein HA Cluster. Wir freuen uns schon  
> drauf!
>
>
> *Wichtig!*
>
> Am Sonntag in der Nacht werden wir die letzte große Partition eines  
> Webservers auf einen Server lokal ablegen! Wir erwarten, dass sich  
> ein paar Websiten in dieser Zeit (fünf Stunden lang) nur langsam  
> laden lassen.
>
>
> Entschuldigt bitte die Ausfälle! Wir hoffen mit Jahresende wieder  
> ruhig schlafen zu können.
>
>
> gute Nacht aus dem noc!
>
> Ralph & Wolfi
>
>
> -- 
> / NOC - mur.at
>   / Network Operation Center / Systemadministration
>  / +43 (0)681 816 45 308
> / Di-Fr 12:00-14:00 (Support)


-- 
christian mokricky
1090 Wien, Liechtensteinstraße 42/6
T: +43 699 10971183
-----------------------------------

Petition Asyl für Kriegsdienstverweiger*innen unterstützen!  
https://verweigert.at/index.php/2024/06/10/petition-unterzeichnen/


Mehr Informationen über die Mailingliste Users-discuss