Clients

Infrastructure & Storage

BIT verabschiedet sich vom Tape

Das BIT geht neue Wege in der Datensicherung. Dank einer cleveren Backup-Methode schrumpft der benötigte Speicherplatz um durchschnittlich 75 Prozent. Solche Werte erreicht man nur mit der Umstellung vom klassischen Backup-Medium Magnetband auf die teureren Harddisks. Unter dem Strich resultieren dennoch tiefere Gesamtkosten.

Abschied vom Tape: Disk ersetzt Magnetband als Backup-Medium. Bild: BIT

Es ist eine fast unvorstellbare Menge an Daten, die das BIT für sich und seine Kunden sichert: Ende Juni 2011 waren es bereits gegen acht Petabyte Backupdaten, also mehr als acht Millionen Gigabyte. Das BIT speicherte diese Daten bislang auf Magnetbandkassetten, dem in Rechenzentren nach wie vor sehr verbreiteten Backup-Medium.

Jede Nacht laufen im BIT über 10 000 automatisch gesteuerte Backup-Jobs: Von allen tagsüber geänderten oder neu erstellten Daten wird für alle Fälle eine Sicherungskopie auf Band erstellt, und dies gleichzeitig an zwei Standorten. Hierfür stehen in den Rechenzentren des BIT insgesamt sieben Tape-Roboter mit 170 Laufwerken. Die Backups sind auf über 12 000 Bandkassetten (sog. Cartridges) gespeichert, von denen jede bis zu zwei Terabyte Daten fasst.

Aufeinandergestapelt ergäben diese Kassetten einen Turm, dreimal so hoch wie das Berner Münster. Und der Turm würde stetig weiterwachsen: Jedes Jahr um etwa 50 Prozent. Dieses enorme Datenwachstum verursacht erhebliche Kosten. Eine Magnetband-Kassette kostet ca. 180, ein Laufwerk rund 20 000 Franken. «Und mit den Kosten wächst auch der Kundendruck auf den Gigabyte-Preis», weiss Stefan Kälin, Bereichsleiter Storage im BIT. «Gleichzeitig werden die Zeitfenster für Backups bei der steigenden Datenflut immer kleiner».

Software erkennt wiederkehrende Muster

Die Lösung für dieses Problem, mit dem viele grosse Rechenzentren zu kämpfen haben, heisst im Storage-Jargon Dedup. Dedup ist ein Kürzel für (Daten-)Deduplikation und meint einen Prozess, der redundante, also mehrfach vorkommende Daten identifiziert, bevor sie auf das Backup-Medium geschrieben werden.

Eine entsprechende Software erkennt in den Datenblöcken wiederkehrende Muster und sichert redundante Blöcke nur ein Mal, was auch die Backupzeit stark verkürzt. Jeden Datenblock (die kleinste in einem Zugriff les- oder schreibbare Einheit) referenziert die Storage-Software auf die zugehörigen Datenobjekte (Dateien), sodass bei Bedarf das vollständige Objekt problemlos wie derhergestellt werden kann.

Viel weniger Speicherplatz nötig

Durch die Deduplikation sind – je nach Art der Daten – enorme Datenverdichtungen möglich, man kann also deutlich mehr Daten pro Gigabyte Speicherplatz sichern. Allerdings funktioniert die Deduplikation nicht auf dem klassischen Backup-Medium Magnetband, sondern nur auf Harddisks. Doch bei letzteren ist der Gigabyte-Preis immer noch markant höher als auf Kassette.

«Ein Wechsel von Tape zu Disk lohnt sich dann, wenn der Kostenvorteil durch die Deduplikation den höheren Gigabyte-Preis der Disk-Speicher mindestens wettmacht», rechnet Stefan Kälin vor. Dabei spielt auch eine Rolle, auf welche Art Harddisks – SATA oder SAS – die deduplizierten Backup-Daten geschrieben werden: Laufwerke mit SAS-Schnittstelle speichern etwa doppelt so schnell wie SATA-Disks, sind aber gut drei Mal so teuer.

Unabhängig von der Schnittstelle bieten Disks gegenüber Tape den Vorteil, dass sie beim Schreiben und Lesen von Daten sofort verfügbar sind. Eine Bandkassette hingegen muss immer zuerst vom Tape-Roboter aus der Library genommen und ins Laufwerk geschoben werden, bevor man die Daten schreiben oder lesen kann (siehe Videolink). Für Disk-Laufwerkespricht auch, dass sie weniger mechanische Teile enthalten und dadurch sehr zuverlässig sind.

Um auf Grundlage handfester Zahlen entscheiden zu können, führte das Storage-Team des BIT 2010 ein Proof of Concept durch. Hierzu wurde in der Shared Services Zone (SSZ) des BIT während einiger Wochen die Datensicherung – zusätzlich zur regulären Sicherung auf Band – testhalber nach der Deduplikationsmethode auf Disks durchgeführt. Dabei stellten die Fachleute des BIT die günstigeren SATA- den schnelleren SAS-Disks gegenüber. Wie sich zeigte, wurde die Mindestanforderung an die Schreibgeschwindigkeit von 200 MB/s auch mit den langsameren SATA-Disks deutlich überschritten. Gleichzeitig gibt es dank der Deduplikation viel weniger Daten zu schreiben: Im Durchschnitt erreichte das BIT-Storage-Team im Rahmen des Proof of Concept eine Dedup-Rate von 75%, d.h. die geschriebene Datenmenge schrumpfte um drei Viertel.

Tiefere Kosten ab dem zweiten Jahr

Softwareseitig entschied sich das BIT für die PureDisk-Lösung von Veritas. PureDisk ist eine Zusatzfunktion der Backup software NetBackup, die im BIT bereits seit mehr als zehn Jahren im Einsatz ist. Dadurch musste keine grundlegend neue Lösung in das komplexe Backup-Umfeld eingeführt, sondern lediglich die Deduplizierungs-Option der bestehenden NetBackup-Lösung hinzu gekauft werden.

Gemäss der im Proof of Concept erstellten Wirtschaftlichkeitsanalyse bleiben die Gesamtkosten im ersten Jahr des Wechsels auf Disk und Deduplikation in etwa gleich hoch, da die Softwarekosten höher ausfallen und die TapeLösung durch ein Diskspeichersystem ersetzt werden muss. Doch bereits im zweiten Betriebsjahr der PureDisk-Lösung werden sich die Kosten merklich reduzieren.

«Dabei gehen wir von einem unveränderten Datenwachstum von jährlich 50 Prozent aus», betont Stefan Kälin. «Doch da wir für das Backup der deduplizierten Daten künftig viel weniger Diskspace benötigen, sinken die Hardware- und Wartungskosten drastisch.» Ab dem zweiten Betriebsjahr haben diese Kosten bei der Disk-/Dedup-Lösung einen Anteil von ca. 50%, während Hardware und Wartung bei der Tape-Lösung beachtliche 90% der Gesamtkosten ausmachten.

Höhere Stabilität, weniger Störungen

Die gemessenen Diskplatz-Einsparungen sowie die Zahlen der Wirtschaftlichkeitsanalyse überzeugten die Leitung des Betriebszentrums, die dem Wechsel auf PureDisk Ende 2010 zustimmte. Seither ist das Storage-Team des BIT daran, die neue Lösung flächendeckend umzusetzen. Zwei Diskspeichersysteme Hitachi AMS 2500 wurden beschafft und an den Primär- und Sekundärstandorten des BIT im Raum Bern installiert. Bereits heute lässt sich sagen, dass sich die Stabilität der Datensicherung durch die Backup-to-Disk-Lösung entscheidend erhöht hat. Stefan Kälin: «Die Anzahl der Störungen wurde durch den Wegfall von physischen Bandkassetten nachweislich reduziert.»

Der Wechsel zur neuen Lösung läuft nach Plan: Das Backup der SSZ-Netzzone ist komplett auf PureDisk umgestellt «und läuft wie ein ‹Örgeli›», so Kälin. Der Dedup-Faktor hat sich auf durchschnittlich 1:6 verbessert, d.h. auf einem GB Diskspace lassen sich sechs GB Daten sichern.

Damit nicht genug: Als nächstes ist die KomBV-Umgebung (Bundesverwaltungsnetz) an der Reihe. Die File-System-Backups (Linux, Unix, Windows) sind bereits umgestellt. Aufgrund ihrer Datenstruktur konnte hier gar ein Dedup-Faktor von 1:17 erreicht werden, auf einem GB Diskspace finden also 17 (!) GB Daten Platz. Ab Ende Jahr werden auch die SQL- und Oracle-Backups mit der PureDisk-Lösung gesichert. 2012 werden die grossen Fileserver der Büroautomation in Angriff genommen und im Verlauf des Jahres 2013 wird die Datensicherung vollständig auf PureDisk umgestellt sein.

Und was geschieht mit dem Kassetten-Turm? Eine spezialisierte Firma übernimmt die ausgemusterten Tapes und führt sie einer sicheren und ökologischen Vernichtung zu.



Your contact

Contact us for more information!

Roger Hegglin
CEO

Send message