Tiering für Objektspeicher

Storage Tiering ist ein Konzept, das in der IT seit Jahrzehnten bekannt ist. Mittels Storage Tiering werden Daten anhand vorgegebener Kriterien zwischen unterschiedlichen Speicherklassen verlagert. Eine Speichermanagement-Software, die nach dem Prinzip des Information Lifecycle Management (ILM) arbeitet, verschiebt beispielweise Dateien, auf die längere Zeit nicht zugegriffen wurde, auf einen langsameren, aber kostengünstigeren Storage. Während viele Kunden die Vorteile in ihrer SAN- oder NAS-Umgebung nutzen, blieben Objektspeicher bisher außen vor.

Grundsätzlich sind Objektspeicher für große Datenmengen ausgelegt. Die Kosten pro TB sind meist sehr attraktiv. Dies wird durch den Einsatz vieler großer Festplatten in einer hohen Dichte und mit einer effizienten Erasure Codierung erzielt. Oft sind pro Knoten 50 bis 70 Festplatten verbaut, die jeweils über 8 bis 12 TB Kapazität verfügen. Im Sommer 2019 stellte Cloudian eine gemeinsame Plattform mit Seagate vor, die 96 x 16 TB Festplatten umfasst. Dies entspricht 1,5 PB auf lediglich 4 Höheneinheiten. Dementsprechend beginnt eine sinnvolle Einstiegsgröße in der Regel im dreistelligen TB-Bereich. Doch in Zeiten von Big Data, Analytics und IoT füllen sich Objektspeicher rasch.

Mit dem steigenden Datenvolumen auf Objektspeichern stellt sich die Frage, ob aktive und inaktive Objekte in der gleichen Speicherklasse abgelegt werden sollten. Die Hyperscaler machen es vor und bieten ihren Kunden eine Auswahl unterschiedlichster Klassen und ein automatisches Übertragen per Lifecycle Policy.

Will man seine eigene Cloud um eine zweite Speicherklasse erweitern, so lautet die erste Frage, wohin mit den inaktiven Objekten? Ein SAN/NAS-Storage besteht aus SSDs und Festplatten mit unterschiedlichen UpM-Werten (z. B. 15.000, 10.000, 7.200). Festplatten mit 7.200 UpM bilden dabei bereits die Basis der Objektspeicher. Vor diesem Hintergrund wird folglich eine Speichertechnologie gesucht, die für die Speicherung von inaktiven Daten wirtschaftlicher ist als große 7.200 UpM Festplatten. Sieht man vom mittlerweile beendeten LTO-8 Patentstreit zwischen Fujifilm und Sony ab, sind Tapes gut verfügbar. Sie bieten hohe Kapazität zum günstigen Preis und erscheinen auch in Hinblick auf eine langfristige Roadmap vielversprechend. Aktuell lassen sich auf LTO-8 Medien unkomprimiert 12 TB unterbringen. Mit IBM TS1160 Laufwerken lassen sich 20 TB auf den 3592 Medien speichern. LTO-9 steht bereits vor der Tür und wird bis zu 24 TB pro Cartridge aufnehmen.

Thomas Thalmann, Geschäftsführer von PoINT Software & Systems, erläuterte in seinem Vortrag auf dem StorageForum in Leipzig im November 2019, weshalb sich Tape als Objektspeicher für große Datenmengen empfiehlt, und was bei der Integration in eine hierarchische Speicherinfrastruktur zu beachten ist. Ein Mitschnitt des Vortrags ist hier verfügbar.

Die zweite Frage lautet: Wie schreibt man Objekte auf Tape?

Weil Objektspeicher keine direkte Anbindung für Tape Libraries bieten, könnte man auf die Idee kommen, mittels Softwaretools die Objekte zunächst in ein File System zu kopieren und von dort aus auf Tape zu verlagern. Hier ist aber Vorsicht geboten, denn es droht Informationsverlust: Gerade aufgrund der Einschränkungen von File Systemen werden doch Objektspeicher so interessant.

Verlagern Sie keine Daten von Objektspeichern in ein File System.

  • Begrenzte Metadaten
  • Begrenzter Zeichensatz
  • Begrenzte Länge des Dateinamens
  • Begrenzte Pfadlänge
  • Begrenzte Versionierung
  • Begrenzte praktische Anzahl an Dateien
  • Overhead durch Verwaltung der Datei- und Ordnerstruktur

Aus all diesen Einschränkungen lässt sich folgern: Das Format muss beibehalten werden. S3-Objekte mit ihren Metadaten und Versionen müssen S3-Objekte bleiben.

Es führt jedoch ebenso wenig zum gewünschten Ergebnis, ein File System mit einer S3-Anbindung zu versehen.

Setzen Sie keinen S3 Service auf ein File System.

  • Erfordert viel Speicherplatz für Staging (vor Schreiben auf Tape)
  • Unnötiger File System Layer, der Performance kostet
  • Komplexität und Verwaltungs-Overhead

In diesem Zusammenhang lohnt sich ein Blick auf die Entwicklung von Ceph. Früher wurde als Storage-Backend der sog. FileStore genutzt, sodass Objekte in einem XFS File System gespeichert wurden. Rückblickend lässt sich feststellen: „it was simply the wrong tool for the job“. So schreibt hingegen BlueStore direkt auf Block Devices und verzichtet auf den Umweg.

Die Komplexität wird dann besonders deutlich, wenn die File System Problematik um die Verlagerung auf Tape ergänzt wird.

Das PoINT Archival Gateway, kurz PAG, ist ein Software-basierter und hoch performanter S3 Objektspeicher, der Daten auf Tape speichert. Durch die hohe Skalierbarkeit unterstützt PAG Transferraten von mehr als 1 PB pro Tag. Die Datensicherheit wird durch Erasure Coding sichergestellt.

Viele festplattenbasierte Objektspeicher bieten eine Tiering-Funktionalität, um Daten automatisch via S3 zu einem Cloud Provider zu verlagern. Über eine solche Tiering Funktionalität wird das PoINT Archival Gateway angebunden, um inaktive Daten von der ersten festplattenbasierten Speicherklasse auf die zweite Tape-basierte Speicherklasse zu verlagern.


Wir freuen uns auf Ihr Feedback zum PoINT-Blog und zu diesem Beitrag. Kontaktieren Sie uns unter info@point-blog.de.