Verfügbarkeit bei Hardwareausfall - Erste Überlegungen für eine Failover-Lösung

[PROLOG]

Ich habe diese Woche Urlaub, meine Frau muss arbeiten. Draußen wartet eigentlich ein Gartenhaus darauf endlich aufgebaut zu werden, aber das Wetter spielt nicht ganz mit. Also widme ich mich doch einem der schönen Dinge des Lebens, die mir meine vier Wände und die Garage bieten…


In diesem Thread hatte ich einst das Thema „High Availability“ (HA) mit QNAP angesprochen. Um ehrlich zu sein: HA war meinerseits von erster Sekunde an völlig falsch formuliert, denn zu einem HA Setup gehört durchaus noch viel mehr als ich eigentlich erreichen wollte.

Meine Intention war es lediglich mich auf den Ausfall eines QNAP vorzubereiten und die Dienste, insbesondere den Zugriff auf die Daten schnellstmöglich wiederherstellen zu können. Natürlich habe ich Backups angelegt, die zumindest den Dateizugriff auf den letzten Stand ermöglichen würden, doch in der Praxis wäre dies eher ein Fallback als ein Failover, wie ich es gerne hätte. RedDiabolo hatte in dem Thread mitgeteilt, wie er es anstellt.

Eher ein Workaround als ein QNAP-Feature wie ich es mir erhofft hatte, aber einen Versuch ist es allemal wert.

Der Grund weshalb ich es gerne etwas „komfortabler“ als ein Fallback haben möchte ist folgender:

Wäre ich der alleinige User des NAS, so stellt es für mich kein Problem dar, mit Daten aus dem Backup zu arbeiten und mich entsprechend selbst zu verwalten, sprich einen Überblick darüber zu haben, welche Daten später wieder in das Haupt-System zurück müssen, auch weiß ich, wie ich den Zugriff auf die Backupdaten überhaupt erst erlange. Anderen Usern müsste dies erst mal erklärt werden, Programmpfade müssten unter Umständen angepasst werden. Bis das erledigt ist stünde, zumindest bei vielen Usern, bestimmt schon ein neu erworbenes NAS zur Verfügung ohne dass ich die Möglichkeit gehabt hätte mir das defekte Gerät einmal anzuschauen. Außerdem bin ich „Gebrauchtkäufer“, mir ist also ein bisschen daran gelegen abwarten zu können, bis ich irgendwo ein adäquates Angebot finde, anstatt nun überstürzt ein neues Gerät kaufen zu müssen. Ob und für wen sich ein entsprechendes Failover lohnt muss natürlich jeder für sich entscheiden, ich zumindest höre jetzt schon das Gezausel meiner Liebsten, wenn ausgerechnet bei einem NAS-Ausfall dringend mit den Daten gearbeitet werden muss. Da stehe ich dann doch lieber als Held da, der es ermöglicht hat trotz Totalausfall ohne nennenswerte Ausfallzeiten weiterarbeiten zu können… außerdem würde es den ganzen Spaß den ich hier mit Netzwerk und QNAP treibe ein für alle Mal rechtfertigen ;-)


In diesem und den nachfolgenden Artikeln möchte ich meine Überlegungen teilen, aufzeigen wie ich mein Failover eingerichtet habe und - so gut es geht ohne mein Haupt-System zu sehr zu beeinträchtigen - testen wie es in der Praxis funktioniert. Ob man das Verfahren nachher als Failover bezeichnen darf oder ob es nur eine Form eines Fallbacks darstellt, sei erstmal dahingestellt.


Natürlich erheben meine Artikel keinen Anspruch auf Vollständigkeit, es ist also durchaus möglich dass es komfortablere Möglichkeiten gibt die ich nicht gesehen habe.

Im Nachfolgenden spreche ich von „Haupt-System“, welches das produktive NAS darstellt mit dem normalerweise gearbeitet wird. Das „Failover-System“ ist jenes welches für den Failover-Betrieb eingerichtet werden soll.



[MÖGLICHKEITEN UND ALTERNATIVEN]

Ich möchte einen zweiten QNAP als Failover haben, das kostet Geld, klar. Aber welche Alternativen habe ich?

Da wäre die Möglichkeit mir ein zweites Gerät gleichen Typs ins Lager zu stellen und im Ernstfall einfach mit den bestehenden HDD in Betrieb zu nehmen. Das Kostet auch Geld, vermutlich sogar mehr, außerdem wäre das Gerät nach einigen Jahren veraltet, wenn ich die „Chance“ habe gleich auf ein aktuelleres System umzusteigen. Und wenn die HDD mit dem NAS ebenfalls übern Jordan gehen? Dann hab ich gar nix außer Backups!

Da ich ja schon ausgeschlossen habe so lange mit einem Backup zu arbeiten, scheint mir die einzige Möglichkeit einen weiteren QNAP in Betrieb zu nehmen, was mir zusätzlich den Vorteil verspricht gegebenenfalls weitere Funktionen auszuüben; so könnte ich darauf neben meinem regulären Backup noch einen weiteren Datenbestand als Backup vorhalten.



[DIE WUNSCHLISTE]

Um es nochmal kurz zusammenzufassen:

Ich möchte erreichen, dass bei einem Totalausfall des Haupt-Systems, bei dem auch die HDD betroffen sein könnten, innerhalb kürzester Zeit ein System bereitsteht mit dem man möglichst an der Stelle weiterarbeiten kann, an dem das Haupt-System seine Arbeit verweigert hat. In meinem Fall daheim liegt der Fokus auf Verfügbarkeit der Daten und eines DLNA Servers.

  • Möglichst aktuelle Verfügbarkeit des Datenbestands
  • Möglichst aktuelle Verfügbarkeit der laufenden Dienste
  • Möglichst aktuelle Verfügbarkeit der User samt Berechtigungen
  • Möglichst aktuelle Verfügbarkeit der ursprünglichen Freigaben
  • Möglichst schnelle Übernahme durch das Failover-System, sehr gerne automatisiert
  • Möglichkeit das Failover-System nicht ständig in Betrieb zu haben
  • Möglichst einfache Wiederherstellung geänderter Daten am ersetzten Haupt-System

[DIE REALITÄT]

  • Möglichst aktuelle Verfügbarkeit des Datenbestands
    Hier bietet sich zunächst ein Sync-Job oder die Verwendung von Snapshots an, dies sollte das kleinste Problem darstellen. Ein aktiver Sync würde den aktuellsten Datenbestand ermöglichen, das Failover-System müsste aber ständig laufen.
  • Möglichst aktuelle Verfügbarkeit der laufenden Dienste
    Das wäre bei mir nur der DLNA Server und SMB. Die ebenfalls vorhandenen und sporadisch laufenden VM muss ich auf dem Failover nicht zwingend haben, würde aber kein Problem darstellen. Andere Dienste müssten zunächst entsprechend eingerichtet werden, möglicherweise sogar mit der Möglichkeit Konfiguration oder Datenbestände zu exportieren bzw. zu sichern.
  • Möglichst aktuelle Verfügbarkeit der User samt Berechtigungen
    Hier setzt QNAP bereits den Rotstift an: Es ist zwar die Möglichkeit gegeben User manuell zu exportieren, leider aber ohne die entsprechenden Berechtigungen. Ein automatischer Export ist ebenfalls nicht möglich, aber immerhin kann ich die User samt PW direkt manuell übernehmen, die Berechtigungen muss ich manuell vergeben. Zumindest ist das der Stand mit Boardmitteln, den ich sehe.
  • Möglichst aktuelle Verfügbarkeit der ursprünglichen Freigaben
    Dieser Punkt ist abhängig davon, ob mit einem Sync oder Snapshot gearbeitet wird, dazu später mehr. Ohne manuelle Eingriffe ist aber auch hier nichts möglich, letztlich muss man sich an dieser Stelle überlegen, was man bei Ersteinrichtung und Inbetriebnahme manuell einstellen möchte und welcher Aufwand bei der jeweiligen Konfig höher ist.
  • Möglichst schnelle Übernahme durch das Failover-System, sehr gerne automatisiert
    Wie schnell das Failover die Aufgaben des Haupt-Systems übernehmen kann hängt von der Konfig ab: Habe ich viele User oder viele Shares, und was ändert sich häufig? Arbeite ich mit Snapshots oder Sync? Eine Automatisierung ist zumindest mit Boardmitteln nicht möglich, ich könnte mir hier aber ein Script vorstellen, welches die Verfügbarkeit des Haupt-Systems überwacht und bei Bedarf die „Failover-Konfig“ lädt. Selbstredend, dass der nachfolgende Wunsch damit ausgeschlossen ist, sofern man nicht noch ein anderes Gerät mit dem erforderlichen Monitoring einrichtet.
  • Möglichkeit das Failover-System nicht ständig in Betrieb zu haben
    Klar ist das möglich, es schränkt jedoch die Aktualität der verfügbaren Daten ein und erlaubt keine automatische Übernahme der Funktion, sofern dies überhaupt realisierbar ist.
  • Möglichst einfache Wiederherstellung geänderter Daten am ersetzten Haupt-System
    Hier sollte HBS3 seiner Funktion gerecht werden und ein einfaches und schnelles Failback erlauben. Wie gut das in der Praxis funktioniert und wie viel Disziplin bei der Arbeit mit dem Failover eventuell erforderlich ist, wird der Test zeigen.

Der erste Blick macht klar: Ohne ständige Pflege und das erstmalige „aufwändige“ Einrichten des Failover Systems ist hier nichts zu machen. Ich habe hier einen kleinen Vorteil, denn bei mir wird weder an Usern noch an den Shares oder entsprechenden Berechtigungen viel verändert. Die Ersteinrichtung dürfte damit für die nächsten Jahre einen aktuellen Stand aufweisen. Sollte ein User zwischendurch mal sein Passwort geändert haben, nunja, dann wird es eben zurückgesetzt, ich denke das stellt keinen Beinbruch dar.



[DIE AUSWAHL DES FAILOVER-GERÄTS]

Ich habe das Glück, dass mir ein paar QNAP zur Verfügung stehen und mich frei entscheiden kann, welches ich für diesen Zweck verwende. Das Hauptsystem ist übrigens ein TVS-473/16G.


TS-219P II (512M) – internes Backupsystem

Das Ding ist so alt und schwach auf der Brust, dass ich es allein deshalb nicht als Failover verwenden will. Außerdem ist es meine erste Backup-Instanz, die will ich nicht für solche Zwecke missbrauchen, schließlich kann bei dem Wechsel zum oder vom Failover auch etwas schiefgehen.


TS-131P (1G) – externes Backupsystem (Sync)

Nicht das kräftigste Gerät, aber relativ aktuell und für meine Zwecke ausreichend. Über Snapshots brauche ich hier nicht nachdenken, aber immerhin steht das Teil woanders, was im Falle von Diebstahl oder Naturgewalten einen Vorteil hat. Da ohnehin ein Sync auf das Gerät läuft, entscheide ich mich es entsprechend vorzubereiten, im Ernstfall müsste ich es nur aus dem Nachbarort holen.


TS-453A/8G – steht einfach nur da (eigentlich spiele ich hier aktuell mit dem Snapshot-Vault)

Ein mehr als würdiges Gerät für das Unterfangen, darauf werde ich die Variante mit Snapshots ausprobieren, der Grundstein ist ja schon gelegt.
Sollte der Wunsch bestehen auch meine VM in das Failover zu integrieren, wäre auch das mit diesem Gerät möglich, wenn auch mit ein paar Leistungseinbußen.


Im Falle einer Neuanschaffung wird deutlich: Das Gerät für das Failover muss nicht zwingend ein High-End Gerät sein oder dem entsprechen, was als Haupt-System eingesetzt wird. Mit ein paar Abstrichen kann hier auf ein günstiges Modell zurückgeriffen werden, eben abhängig davon, was das Failover alles übernehmen soll. An dieser Stelle werden sicherlich ein paar Stimmen laut, denn wenn man mit Abstrichen lebt, ist grundsätzlich auch für mein Verständnis kein Failover vorhanden, sondern ein Fallback. Mir geht es aber nicht um alle Leistungen, die mein TVS-473 erbringen kann und teilweise auch erbringt, sondern um die Funktionen des NAS, die ich bei Totalausfall weiterhin zur Verfügung stellen möchte. Daher kann ich für mich ruhigen Gewissens sagen, dass dies eine Failover-Lösung wird, da sie im Gegensatz zum Fallback auf vorhandene Backups deutlich komfortabler wird und weniger Einschränkungen mit sich bringen wird.


Nachdem die ersten Überlegungen abgeschlossen sind soll es mit der Einrichtung der Sync-Variante auf dem TS-131P losgehen. Klingt fast danach, als ob das Gerät mit eingerichtetem Sync bereits weitgehend für den Failover-Einsatz vorbereitet ist. Ganz so einfach ist das aber nicht, es müssen ein paar Kleinigkeiten beachtet werden.

Da ich schon einen Großteil des Artikels fertiggestellt habe und weiß, dass er ziemlich lang würde, erfolgt das in einem separaten Artikel.

Kommentare 2

  • Zitat von tiermutter

    Es ist zwar die Möglichkeit gegeben User manuell zu exportieren, leider aber ohne die entsprechenden Berechtigungen. Ein automatischer Export ist ebenfalls nicht möglich

    Ein automatisches Exportieren bzw. Sichern von Benutzern ist mit einem Domänen Controller möglich. Hier müsste sogar das automatische Abgleichen mit einen zweiten Backup- oder sekundären Domänen Controller möglich sein.


    Für vollautomatisches Failover sind QNAP NAS nicht wirklich ausgelegt. Sind ja NAS und keine Server. Mit Server funktioniert dies sehr gut, kostet aber auch eine oder zwei Kleinigkeiten mehr.

    • Zitat von Mavalok2

      Ein automatisches Exportieren bzw. Sichern von Benutzern ist mit einem Domänen Controller möglich.

      Das klingt interessant, zumindest wenn man viele User hat bei denen dann auch immer mal Änderungen eintreten...

      Zitat von Mavalok2

      Für vollautomatisches Failover sind QNAP NAS nicht wirklich ausgelegt. Sind ja NAS und keine Server.

      Die Entwicklung von QNAP scheint aber immer mehr in die Sparte "Server" rutschen zu wollen. Für mich wäre das zumindest mal ein sinnvolles Feature neben dem, was QNAP sonst so rausbringt. Vielleicht etwas speziell, aber so abwegig fände ich es nicht. Natürlich nicht, denn ich wünsche mir sowas ja auch ;)