PBXes (http://www1.pbxes.com/forum/index.php)
- Deutsch (http://www1.pbxes.com/forum/board.php?boardid=1)
-- Fehler (http://www1.pbxes.com/forum/board.php?boardid=4)
--- RE: Zuverlässigkeit des Systems (http://www1.pbxes.com/forum/threadid.php?threadid=1256380544)


Posted by dgerber on 24.10.2009 at 12:35:

Achtung Zuverlässigkeit des Systems

Zitat:
Original von i-p-tel
Es gab einen Festplattenausfall im Rechenzentrum Nürnberg, wo bereits vor drei Wochen zwei Festplatten ausgefallen waren.


Irgendwie vermag mich diese Begründung für einen weiteren (mehrstündigen!) Ausfall in diesem Monat nicht so recht zu überzeugen:
Heute hat doch jeder Billigst-Server ein RAID, das dafür sorgt, dass das System eben gerade bei einem Festplattenausfall weiter läuft.
Die etwas teureren Server haben dann sogar noch eine Hot-Plug - Funktion, bei der man die neue Festplatte während des laufenden Server-Betriebs austauschen kann.

Sind das jetzt ketzerische Gedanken? Oder kann mich jemand aufklären - vielleicht stelle ich mir alles viel zu einfach vor Augen rollen

Wohlgemerkt: Ich unterstele hier nicht, dass PBXes billige Server einsetzt - aber gerade deshalb bin ich so erstaunt!

Weitere - für mich SEHR WICHTIGE Frage: Wie geht es mit der Zuverlässigkeit hier weiter? Die DNS-Geschichte wurde ja bereits erörtert - jetzt kommt die Festplatten-Geschichte... verwirrt
Für meine Kunden hat der Spass schon seit einiger Zeit aufgehört und ich muss mich bei jedem Ausfall wieder irgendwie erklären, weshalb das System, welches ich empfohlen und verkauft habe, schon wieder ausgefallen ist.

Danke für eine konkrete Stellungnahme!

Liebe Grüsse
Dominik Gerber


Posted by i-p-tel on 24.10.2009 at 16:02:

RE: Zuverlässigkeit des Systems

In dem von Ihnen zitierten Beitrag werden im folgenden Verfahren genannt, um die Zuverlässigkeit zu erhöhen. Haben Sie diese bereits berücksichtigt?

Ich habe Ihre beiden Accounts "dgerber" und "fuchsag" nun vom im Sommer neu hinzugekommenen, sehr leistungsfähigen, aber auch zweimal ausgefallenen Server www1 auf den bewährten www3 verschoben.

Unser Sicherheitskonzept basiert auf Redundanz mehrerer Systeme. Nur im Nürnberger Rechenzentrum setzen wir Festplatten-RAID ein (Software-RAID). Dort sind die Server standardmäßig damit ausgerüstet. Wenn das Monitoring einen Server-Ausfall bemerkt, werden alle bezahlten Accounts auf einen anderen Server umgeschaltet.


Posted by dgerber on 24.10.2009 at 17:03:

RE: Zuverlässigkeit des Systems

Vielen Dank fürs verschieben der beiden Accounts auf den www3!

Ich finde das Prinzip mit dem Umschalten der Accounts auf einen anderen Server ansich clever. Trotzdem habe ich nun noch zwei Fragen:

1. Warum ist denn am vergangenen Freitag die Umschaltung erst nach ca. 4 Stunden erfolgt? (Ausfall ca. 5h und Umschaltung auf www5 gegen 9.30h)?

2. Wenn Sie sagen, in Nürnberg existiere ein RAID - warum sind denn gerade beim www1, der meines Wissens auch in Nürnberg steht (Nürnberg-Alt in der Statistik rechts im GUI) die Festplattenausfälle mit langer Down-Time zu beklagen?

P.S. Werde mir die Verfahren, um die Zuverlässigkeit zu erhöhen noch genauer ansehen.


Posted by i-p-tel on 26.10.2009 at 10:53:

Lampe RE: Zuverlässigkeit des Systems

Die beiden von Ihnen angesprochenen Punkte sind genau die, an denen wir nach den Störungen gearbeitet haben. Da diese sehr selten und nun erstmalig aufgetreten sind, waren sie in der Software noch unberücksichtigt geblieben.

Powered by: Burning Board Lite 1.0.2 © 2001-2004 WoltLab GmbH
English translation by Satelk