Schnelles Storage für Veeam gesucht

  • Hallo zusammen,


    ich plane gerade neue Server und Storage für unser Netz. Als primäres Storage wird es ein Dell SC 7020 werden (rund 80 TB Flash in Tier 1; Rest NL-SAS 7,2k in Tier 3).


    Mir geht es jetzt noch um ein performantes Storage für die Datensicherung mit Veeam (eventuell direkt per iSCSI mit der Veeam VM verbunden). Dell hat diesbezüglich eine Data Domain für 190 k€ angeboten, was ich absolut übertrieben finde.


    In den nächsten 5 Jahren erwarten wir Datenmengen (überwiegend DICOM Bilder) zwischen 150 und max 300 TB.


    Mir stellt sich die Frage ob ich das mit QNAP abdecken kann. Eventuell mit einem ES1686dc (wegen dem QES Betriebssystem mit Komprimierung und Deduplizierung).


    Server und Storage Systeme sollen über 2 Switche mit je 100 GBit/s pro Port verbunden werden (Dell oder Melanox SN2100). QNAP bietet 40 GBit/s Karten an, welche mit dem Switch kompatibel sind.


    Könnt Ihr mir hier zu etwas raten? Auf was sollte ich achten? Welche Geräte und Konfigurationen würden passen?


    Wie könnte die Konfiguration aussehen? Wäre es möglich, das mit vielen 16 TB Platten und ein paar schnellen M2 Flash als Cache abzubilden?


    Ich würde mich über Ratschläge und eventuell sogar Erfahrungsberichte freuen.


    Im Voraus vielen Dank.


    Freundliche Grüße

    Michael

  • Ui du willst die also alle lange vor Ort vorhalten.


    Das würde gehen, was jedoch in der Praxis von den Bandbreite wirklich vom Storage auf das BU NAS verwendet wird kann ich dir nicht sagen aber das QSFP wird sicherlich nicht limitieren wenn du dahinter einen LAG oder sogar vPC hängst.


    Bei uns lagern etwa 100GB Daten vor Ort und der Rest wandert dann in ein Langzeitarchiv.


    Meist wird da rein geschrieben, nur selten müssen Studien hier wieder abgerufen werden.

    Dann dauert es jedoch ein wenig, aber die sind dann einige Jahre alt.

    Da muss man dann auch nicht adhoc dran kommen können.



    Ob der SSD Cache was bringt ist fraglich.

    Bei einem ZFS Dateisystem ist der als Index aber unersetzlich.

    Wenn die Kiste das anbietet setze das am besten ein.

  • Ich nehme kaum an, das das rein privat genutzt wird ;).

    Auch wenn Dell, NetApp oder andere Hersteller teurer sind, der Support ist dort der Erfahrung nach deutlich besser als bei QNAP.

    Auch das sollte man bedenken, vor allem, wenn es sich um eine länger zu nutzende geschäftliche Investition handelt.


    Gruss

  • Bei uns lagern etwa 100GB Daten vor Ort und der Rest wandert dann in ein Langzeitarchiv.

    Und das Langzeitarchiv ist dann nicht vor Ort?


    Also m.W. gibt es auch bei Langzeitarchiven einen Ansatz von mehreren Speicherorten. Ob die dann MultiTier sind, weiß ich nicht.

    Ui du willst die also alle lange vor Ort vorhalten.

    Klingt nach dem Unterschied bzw. Arbeitsteilung zwischen einem Zentrum für die Bildgebung und einem Behandlungszentrum für langjährige Therapien. Hätte vermutet, dass bei ersterem größere Datenmengen häufig entstehen, die aber schnell ins Archiv können, während bei letzteren die Entstehung der Datenmenge geringer ist, dafür die Vorhaltedauer und wiederholte Nutzung dieser Daten über längere Zeiträume der Therapien benötigt wird.

    Mir stellt sich die Frage ob ich das mit QNAP abdecken kann. Eventuell mit einem ES1686dc (wegen dem QES Betriebssystem mit Komprimierung und Deduplizierung).

    Keine Ahnung. Soweit ich einige Kenndaten verstanden habe, bezweifle ich, dass dies von der Stange funktionieren kann, und habe meine Zweifel, ob da QNAP eine sinnvolle Lösung darstellt. Für eine Teilfunktionalität kann da vielleicht von QNAP etwas genutzt werden. Aber für die Hauptfunktionalität scheinen mir richtige Server ein angemessenerer Ansatz. Schonmal QNAP Projektgeschäft nach einer Einschätzung gefragt?

    Könnt Ihr mir hier zu etwas raten? Auf was sollte ich achten? Welche Geräte und Konfigurationen würden passen?

    Damit habe ich keine Erfahrung. Soweit ich es verstehe, gibt es da auch noch rechtliche Anforderungen (samt Compliance), bei dieser Art von Daten. Da wäre m.E. u.a. Hardware-RAID statt Software-RAID zu bevorzugen. Und wo werden die Daten verschlüsselt? Oder reichen andere Zugriffssicherungen aus und wird auf Verschlüsselung verzichtet?

    Wie könnte die Konfiguration aussehen? Wäre es möglich, das mit vielen 16 TB Platten und ein paar schnellen M2 Flash als Cache abzubilden?

    Was meinst Du hier mit Cache?


    Bei diesen Datenmengen und Volumina würde ich eher an MultiTier Storagekonzepte denken und können solche Datenträger in einem solchen Konzept Verwendung finden. Abstrakt betrachtet ist m.E. MultiTier Storage auch eine Art von Caching. QNAP verwendet unterschiedliche Begriffe und sagt, dass lässt m.W. nur eine Konfiguration von Datenträgern als MultiTier oder Cache zu, nicht oder nur sehr eingeschränkt kombinierbar. Ob diese Einschränkungen im gehobenen Enterprise-Segment auch gelten, weiß ich nicht.

    Auch wenn Dell, NetApp oder andere Hersteller teurer sind, der Support ist dort der Erfahrung nach deutlich besser als bei QNAP.

    Wobei ich mich frage, ob hier nicht besser ein Dienstleister ins Boot geholt werden soll, der sich mit dieser Branche, rechtlichen Rahmenbedingungen und Sicherheitsanforderungen gut auskennt. Wenn ich an die Sicherheitsvorfallmeldung vor einigen Monaten zurück denke, bei der Bilder u.a. aus Arztpraxen und Laboren aus Niedersachsen offen im Internet standen. Der Hardwareherstellersupport ist wichtig für die Dimensionierung und bestimmte Reaktionszeiten. Aber für den laufenden Betrieb, das Aufsetzen und die Konfiguration wird vermutlich anderer Support mit Branchenkenntnissen wichtiger sein, gerade was den Aspekt der Sicherheit anbelangt. Der Fragesteller verfügt dabei ja auch über technisches Know-How, sodaß er daran auch mitwirken kann und nicht alles Dritten überlassen braucht, sondern eher ergänzend und beratend und möglicherweise als Unterstützung für Reaktionszeiten in bestimmten Situationen, so mein Eindruck. Und wenn ich schon den Namen diesen Betriebssystems bzw. Variante lese, erwägt der Fragesteller, sein System selbst zusammen zustellen, und sich nicht auf vorgefertigte Lösungen zu beschränken, falls ich dies nicht mißverstanden habe.

    Einmal editiert, zuletzt von chef1 ()

  • Hallo zusammen, vielen Dank für die Antworten.

    Wir sind ein medizinisches Unternehmen, welches Radiologie und Teleradiologie für eine große Zahl an Kliniken anbietet.

    Unsere Patienten- und Bilddaten sind dabei alle zentral in unserer Zentrale gespeichert (Zugriff nur über gesicherte verschlüsselte MPLS- und teilweise VPN Zugänge möglich).


    Bei diesem Thema soll es nur um das Storage gehen, auf dem die Backups liegen (und welches ausschließlich mit Veeam verbunden wird).


    Das andere Storage auf dem unsere produktiven Daten liegen, wird wohl auf einem Dell SC 7020 liegen (ein Tier mit Flash-Speicher und ein Tier mit NL-SAS Platten für die älteren Daten).


    Dell hat mit dieser Anforderung (ausschließlich Backup) bislang eine Data Domain für 190 k€ und ein ME404 Storage angeboten. Ersteres ist meiner Einschätzung nach viel zu teuer für das erste Backup und zweiteres besitzt weder Deduplizierung noch Inline-Kompimierung. Mein technischer Dell-Berater hat mir noch keine Alternative zu diesen 2 Möglichkeiten anbieten können.


    Da ich gelesen habe, das QNAP mittlerweile Veeam-zertifizierte Geräte anbietet (z.B. QNAP ES1686dc), stelle ich mir die Frage ob diese die Backups schnell genug entgegen nehmen und sicher aufbewahren können.


    Parallel gibt es noch ein weiteres Storage (neben dem Produktiv- und dem Backup-System) auf dem Offline-Versionen der virtuellen Maschinen liegen (Desaster Recovery). Um das soll es aber gerade auch nicht gehen.

  • Dell hat mit dieser Anforderung (ausschließlich Backup) bislang eine Data Domain für 190 k€ und ein ME404 Storage angeboten. Ersteres ist meiner Einschätzung nach viel zu teuer für das erste Backup

    Zu Preisen kann ich mich nicht äußern. Habe nichts mit derartigen Anforderunden zu tun. Wenn Deine Einschätzung nach dies zu teuer sei, und diese Einschätzung nicht lediglich ein Bauchgefühl ist, dann kann es sein, dass die angebotene Lösung vielleicht mehr bietet, als Du benötigst. Was ist denn eine Data Domain bei Dell Storage?

    Wir sind ein medizinisches Unternehmen, welches Radiologie und Teleradiologie für eine große Zahl an Kliniken anbietet.

    So etwas war bereits eine von zwei naheliegenden Vermutungen, selbst wenn die Kunden nur größere medizinische Versorgungszentren wären, in großer Anzahl.

    Bei diesem Thema soll es nur um das Storage gehen, auf dem die Backups liegen (und welches ausschließlich mit Veeam verbunden wird).

    Wobei ich empfehle, eine Verschlüsselung der Daten dazwischen zu schalten, bevor die nicht-produktiven Daten ins Backup fließen.

    stelle ich mir die Frage ob diese die Backups schnell genug entgegen nehmen und sicher aufbewahren können.

    Was meinst Du mit schnell genug entgegen nehmen? Und was mit sicher aufbewahren?

    In den nächsten 5 Jahren erwarten wir Datenmengen (überwiegend DICOM Bilder) zwischen 150 und max 300 TB.

    Das hier ist ein erwartetes Datenvolumen, ohne Angabe zu derzeitigem Datenvolumen. Es ist keine Datenrate. Welches Volumen muss derzeit in welcher maximalen Zeit bewältigt werden für Backup? Und welches Volumen muss in 5 Jahren voraussichtlich in der gleichen Maximalzeit bewältigt werden?


    Wenn der Anwendungsfall ausschließlich Backup ist, dann sollte es doch Lösungen geben, die Warteschlangen (Queuing) verwenden, um Geschwindigkeitsunterschiede zwischen verschiedenen Systemen abzufedern. Soweit ich verstanden habe, sind ES2486dc und ES1686dc wohl die leistungsfähigsten Lösungen, die QNAP im Sortiment hat. Ich würde vermuten, dass HP, Dell EMC und einige andere mit Lösungen mit mehr Flash, mehr Hauptspeicher, Hardware-RAID und schnelleren NICs mit unterschiedlich großen Netzwerkpuffern im Sortiment haben, wenn das Angebot von QNAP nicht ausreicht und der Durchsatz der Engpunkt sein sollte.


    Beim Thema Sicherheit gibt es verschiedene Aspekte und Bedeutungen. Einige dieser Bedeutungen werden gerne dadurch realisiert, dass die Daten vor der entsprechenden Ablage verschlüsselt werden, am besten so, dass für den späteren Zugriff auf einen Datensatz nicht das gesamte Backup eingelesen werden braucht. Welchen Zeitraum sollen welche dieser Backups absichern, in Abgrebnzung zu Archiven? Damit meine ich nicht ausschließlich Langzeitarchive. TierN in MultiTier Storage ist aus meiner Sicht ebenfalls ein Archiv, ohne den Anforderungen von Langzeitarchiven genügen zu müssen. Je näher diese Anforderungen in Richtung Langzeitarchiv gehen, desto mehr Randbedingungen kommen hinzu, um auch nach längeren Ruhezeiten noch auf ältere Datensätze zugreifen zu können. Dies hat auch mit Metadaten, Datenformaten und Begleitdokumentation zu tun, was leider nicht jeder Verantworliche oder Durchführende im Blick hat. (Habe am ehesten mit Langzeitarchiven gelegentlich beruflich zu tun.) Und Flash-Speicher assoziiere ich eher nicht mit langzeitstabilen Archiven, können aber für Tier1 oder Tier2 interessant sein, und ist daher eine Konzeptfrage, keine Technologiefrage, wobei diese Aspekte eben nicht ganz unabhängig sind.

    zweiteres besitzt weder Deduplizierung noch Inline-Kompimierung.

    Habe keine Erfahrung mit Deduplizierung. Daher weiß ich nicht, welche Varianz an Randbedingungen dabei existieren, insbesondere hinsichtlich Latenzen und Puffern.

  • Wenn ich an die Sicherheitsvorfallmeldung vor einigen Monaten zurück denke, bei der Bilder u.a. aus Arztpraxen und Laboren aus Niedersachsen offen im Internet standen.

    Das war eine kleine Praxis mit einem Speedport Router, sorry wer so ein Schrott in so einer Umgebung einsetzt!


    Hier geht es um eine ganz andere Hausnummer!


    Hier geht es um einen HD Pool der als Backup Ziel für die Umgebung dient, bevor es auf Band beschrieben wird.

    Ich hoffe ihr habt noch Bänder, denn wenn alles aktive um die Ohren fliegt, ist ein Offlinebackup das einzige was da ist um wieder hoch zu kommen.


    Was gibt QNAP denn bei dem Modell an, was es als Storage kann?

    Da kannst du dich in etwa dran orientieren.



    Das Langzeitarchiv ist bei uns nicht im Standort, das ist extern und so gesichert dass hier alle DICOM Daten allen Vorschriften bezüglich personenbezogene Patientendaten, geschützt gelagert werden.

    Zudem sind die über einen Caching Modus mit ein wenig Vorlauf jederzeit wieder abrufbar, will mal ein Patient nach 9,5 Jahren doch noch einen CD mit seinen Bildern haben.

  • Das war eine kleine Praxis mit einem Speedport Router, sorry wer so ein Schrott in so einer Umgebung einsetzt!

    Gab es da nicht mehrere Praxen und Labore mit mehr als einer Million Datensätzen, die groß durch die Medien gingen?


    Eher nur in der Fachpresse zu lesen ist, dass es Sicherheitsempfehlungen für Arztpraxen und medizinische Labore gibt, und Studien und Untersuchungen, dass weder diese noch gleichwertig andere in beachtlichem Umfang noch nicht umgesetzt sind.

    Ich hoffe ihr habt noch Bänder, denn wenn alles aktive um die Ohren fliegt, ist ein Offlinebackup das einzige was da ist um wieder hoch zu kommen.

    In wie weit Bänder bei solchen Datenvolumina die beste Wahl sind, kann ich nicht einschätzen. Unabhängig von der Wahl des Datenträgers stimme ich aber zu, dass ein Offlinebackup für diesen Fall wesentlich ist. Und dass in der Vergangenheit auch getestet wurde, dass dieses Backup korrekt ist.

    will mal ein Patient nach 9,5 Jahren doch noch einen CD mit seinen Bildern haben.

    Da weiß aber noch nicht jeder Mediziner und jeder Patient Bescheid. Habe erst diese Woche einen Patienten begleitet, der einen Arzt auf solch ein Bild ansprach und einen Ausdruck meinte. Und der Arzt hatte keine Möglichkeit für solch einen Ausdruck und verwies auf einen anderen Ansprechpartner seiner medizinischen Einrichtung. Er nannte CD als Alternative und äußerte Bedenken, dass der Patient dieses Bild dann sehen könne. Da mischte ich mich ins Gespräch ein und informierte Arzt und Patient, dass sie sich darum keine Sorgen machen bräuchten, da ich Software habe, um solche medizinischen Bilder zu lesen und darzustellen. Habe ich schon erfolgreich mit Röntgenbildern eines anderen Patienten mit diesem zusammen auf seinem Computer gemacht. Und sind die gesetzlichen Aufbewahrungsfristen für solche Patientendaten nicht 30 Jahre? Dann kann ja nicht darauf vertraut werden, dass 20 Jahre alte Computer und älter noch betriebsfähig seien. Ist dafür aber glücklicherweise gar nicht erforderlich.

    Was gibt QNAP denn bei dem Modell an, was es als Storage kann?

    Diese Frage verstehe ich nicht ganz. Und was ich da gelesen habe, ist einerseits beeindruckend, andererseits fraglich, in wie weit die benannte Teststellung was ausreizt. Als Orientierung ist es sicher sinnvoll. Wenn es beim Fragesteller darauf ankommt, scheint es mir bei diesen Datenvolumina sinnvoll, eine eigene Teststellung zur Evaluierung aufzubauen bzw. von Anbietern aufbauen zu lassen. Das könne dann auch Fragen zu Latenzen und Dimensionierung von Puffern besser beantworten. Trunking wird z.B. unterstützt. Habe keine Ahnung, wie wichtig für diesen Anwendungsfall eine Synchronisierung der Datenpakete ist hinsichtlich Latenzen auf höherer Speicherebene.

  • Zu Preisen kann ich mich nicht äußern. Habe nichts mit derartigen Anforderunden zu tun. Wenn Deine Einschätzung nach dies zu teuer sei, und diese Einschätzung nicht lediglich ein Bauchgefühl ist, dann kann es sein, dass die angebotene Lösung vielleicht mehr bietet, als Du benötigst. Was ist denn eine Data Domain bei Dell Storage?


    Die DataDomain ist ein Storage, welches besonders gute Leistungen bei der Online Kompression und Deduplizierung bietet. Dadurch soll sich bei geringerem Platzbedarf eine sehr schnelle Sicherung ergeben.

    Link: https://www.delltechnologies.c…owerprotect-dd-series.htm


    Wobei ich empfehle, eine Verschlüsselung der Daten dazwischen zu schalten


    Ja, die Backups werden durch Veeam verschlüsselt.


    Was meinst Du mit schnell genug entgegen nehmen?


    Aufgrund der Datenmenge sollten das Backup-Storage einigermaßen schnell sein. Da wir aktuell dabei sind, große Datenmengen erstmalig zu migrieren (aktuell geht es um fast 90 TB CT- und MRT-Bilder), bin ich selbst noch überfragt, was für Geschwindigkeiten das Backup in Zukunft leisten muss.


    Das hier ist ein erwartetes Datenvolumen, ohne Angabe zu derzeitigem Datenvolumen. Es ist keine Datenrate. Welches Volumen muss derzeit in welcher maximalen Zeit bewältigt werden für Backup? Und welches Volumen muss in 5 Jahren voraussichtlich in der gleichen Maximalzeit bewältigt werden?


    In 5 Jahren werden wir rund 300 TB Daten insgesamt haben (grob geschätzt). Aktuell sind es rund 50 TB (demnächst + ~90 TB). Das steigt allerdings nicht linear an, sondern hat auch damit zu tun, das wir Daten unserer Standorte nach und nach in ein zentrales System migrieren.


    Wenn der Anwendungsfall ausschließlich Backup ist, dann sollte es doch Lösungen geben, die Warteschlangen (Queuing) verwenden, um Geschwindigkeitsunterschiede zwischen verschiedenen Systemen abzufedern. Soweit ich verstanden habe, sind ES2486dc und ES1686dc wohl die leistungsfähigsten Lösungen, die QNAP im Sortiment hat. Ich würde vermuten, dass HP, Dell EMC und einige andere mit Lösungen mit mehr Flash, mehr Hauptspeicher, Hardware-RAID und schnelleren NICs mit unterschiedlich großen Netzwerkpuffern im Sortiment haben, wenn das Angebot von QNAP nicht ausreicht und der Durchsatz der Engpunkt sein sollte.


    Hier fehlt mir halt leider die Erfahrung. Die QNAP ES1686dc ist scheinbar das hochwertigste System von QNAP und noch immer recht günstig (im Vergleich z.B. zur Dell Data Domain). Hier würde es meinem Budget gut tun, wenn das System für das Backup die nächsten 5 Jahre reichen würde. Mangels Erfahrung, würden mir Eure Erfahrungsberichte und Einschätzungen helfen.


    Habe keine Erfahrung mit Deduplizierung. Daher weiß ich nicht, welche Varianz an Randbedingungen dabei existieren, insbesondere hinsichtlich Latenzen und Puffern.


    Ich leider auch nicht. Ein Freund von mir betreibt allerdings eine Data Domain in seinem Unternehmen und ist davon begeistert. Er hat aber mit rund 20 TB doch ganz andere Anforderungen wie wir.


    Das war eine kleine Praxis mit einem Speedport Router, sorry wer so ein Schrott in so einer Umgebung einsetzt!


    Unglaublich, was manche Ärzte diesbezüglich anstellen =O


    Dabei ging es wohl um kleinere Praxen ohne eigene IT. Wir haben eine kleine 5 - 6 Mann IT-Abteilung und machen einiges für die Sicherheit... (teilweise auch mit externen Dienstleistern)


    Und sind die gesetzlichen Aufbewahrungsfristen für solche Patientendaten nicht 30 Jahre?


    Bei Aufnahmen von Kindern sind es 30 Jahre.


    Ich möchte unsere Daten innerhalb der Aufbewahrungsfristen ständig verfügbar haben (ältere Daten halt über langsame 7,2k NL-SAS Platten im letzten Tier).

    Auch wenn man diese alle x Jahre auf neue Systeme migrieren muss und es einige Kosten verursacht (wir haben alle Daten 3-fach gespeichert), hat es doch einige Vorteile (die meiner Meinung nach überwiegen).
    Das ist mit dem primären Storage (Dell SC 7020) aber gut gelöst.

    Einmal editiert, zuletzt von vtcn05 ()

  • ch möchte unsere Daten innerhalb der Aufbewahrungsfristen ständig verfügbar haben (ältere Daten halt über langsame 7,2k NL-SAS Platten im letzten Tier).

    Auch wenn man diese alle x Jahre auf neue Systeme migrieren muss und es einige Kosten verursacht (wir haben alle Daten 3-fach gespeichert), hat es doch einige Vorteile (die meiner Meinung nach überwiegen).

    Welche Vorteile sind das denn?


    Wie oft werden Daten älter 5 Jahre wirklich zugegriffen?


    Sind diese Zugriffe dann Notfälle bei der es auf Minuten/Stunden ankommt?


    Ich kenne aus unseren Standorten daher nur das Prinzip, PACS selbst für frische Daten und dann geht es auf den Archiv Server rüber, der im Hintergrund dann länger nicht benötigte Daten ins Telepax weiterschieb.


    Mir ist auch keine Beschwerde eines Radiologen bekannt, das er auf Altdaten mal ein wenig warten musste.

    Aber dafür 500TB und mehr direkt aktiv vorzuhalten finde ich vom Kosten Nutzen einfach ein wenig übertrieben.


    Du musst ja exorbitant mehr Daten 3 fach vorhalten, das kostet bei der Anschaffung und Dimensionierung und beim Betrieb wegen Strom und Kühlung.

    Nur um ein paar mal pro Jahr, Daten direkt anzeigen zu können die 5 oder mehr Jahre nicht mehr verwendet worden sind.

    Ich meine in dem Ramen bewegt sich das Cache in unseren Standorten.