Forschungsdatenmanagement und sichere Langzeitarchivierung

Ob wissenschaftliche Arbeiten oder Messwerte: Forschungsdaten sind ein wertvoller Rohstoff. Sofern es sich z.B. in den Sozialwissenschaften um personenbezogene Daten handelt, unterliegen sie den gesetzlichen Datenschutzbestimmungen. Forschungsdaten erfordern darüber hinaus aufmerksame Maßnahmen für die Datensicherheit und langfristige Archivierung: Denn empirische Daten ebenso wie Messwerte entstehen unter großem Zeit- und Kostenaufwand. Sie sind einmalig und wären bei Verlust nur mit größtem Aufwand – und nicht in identischer Form – wiederholbar.

Im Bereich Forschung und Lehre gilt eine spezifische Compliance, die Universitäten, Einrichtungen und Forschungsförderer wie die Deutsche Forschungsgemeinschaft (DFG) immer stärker betonen. Dies geschieht auch vor dem Hintergrund des steigenden Datenwachstums und der zunehmenden Analysemöglichkeiten. Die Anforderungen an eine nachhaltige Datensicherung und zuverlässige Datenarchivierung steigen. Ein durchdachtes und belastbares Konzept für das Forschungsdatenmanagement gilt als selbstverständlicher Bestandteil eines Projektentwurfs.

Welche Rolle spielt dabei die langfristige Archivierung der Daten? Welche Bedeutung haben spezifische Compliance-Anforderungen? Und vor allen Dingen: Wie lässt sich zuverlässiges Datenmanagement in Forschung und Lehre bewerkstelligen, und wie können auch große Mengen an Forschungsdaten langfristig sicher archiviert werden?

Compliance und Langzeitarchivierung

Unter Compliance versteht man die Einhaltung von Regeln und Vorschriften, bezogen auf Gesetze, aber beispielsweise auch auf branchen- und unternehmensspezifische Vorgaben. Für Wissenschaftlerinnen und Wissenschaftler bedeutet das: Bindung an gesetzliche Vorschriften wie Datenschutz und Urheberrecht. In Bezug auf empirische Forschungen können ethische Erwägungen eine Rolle spielen. Forscher sind ebenso gebunden an die Regeln guter wissenschaftlicher Praxis. Neben vielen weiteren Aspekten umfassen diese auch die sorgfältige Archivierung und Zugänglichmachung von Forschungsdaten. Auf diese Weise sollen ihre Nachnutzbarkeit und Weiterverwertung gewährleistet werden.

So sehen die DFG-Leitlinien zum Umgang mit Forschungsdaten vor, dass schon der Entwurf eines Forschungsprojekts Überlegungen zur Datensicherung und -archivierung enthalte. Es solle sichergestellt sein, dass die im Rahmen eines Projekts entstehenden Forschungsdaten auch anderen Forschern für die Nachnutzung zur Verfügung stünden. Ziel ist eine langfristige Sicherung der Daten, die bis zu 10 Jahren archiviert werden sollten.

Die sichere und umsichtige Langzeitarchivierung der Daten ist also ein wichtiger Aspekt des Forschungsdatenmanagements. Mit einer durchdachten Archivierungsstrategie bleiben die wertvollen Daten lange Zeit verfügbar und nutzbar.

Um bei der Projektplanung auch die benötigten Ressourcen für Speicherhardware und Speichersoftware berücksichtigen zu können, sind Überlegungen bzgl. der anfallenden Datenmengen und Datentypen grundlegend. Von großer Bedeutung ist auch die Frage, inwiefern bei bestimmten Daten spezifische Betroffenenrechte greifen. Kurz gesagt: Nur wer weiß, was gespeichert werden muss, kann eine Archivierungsstrategie planen, die die Daten speichert, sie zuverlässig schützt und langfristig verfügbar hält. Nur so kann ermittelt werden, welche Speicherhardware und Speichersoftware benötigt werden.

Zuverlässige und leistungsstarke Speichersoftware für Compliance in der Forschung

Eine geeignete Storage Software muss die anfallenden Forschungsdaten schnell und verlässlich auf die ausgewählten Speichersysteme speichern. Sie muss ebenso den schnellen und reibungslosen Zugriff auf archivierte Daten garantieren – und das auch noch Jahre nach der Speicherung. Damit die Auswahl der Hardware mit Fokus auf die Eignung und unter Kostenaspekten erfolgen kann, muss die Software hersteller- und technologieunabhängig eine große Bandbreite an Storage Hardware unterstützen.

PoINT Storage Manager und PoINT Archival Gateway sind zwei Lösungen aus dem Storage Software Bereich, die den Anforderungen der Langzeitarchivierung von Forschungsdaten gerecht werden. Sie bewältigen riesige Datenmengen und können dabei helfen, die spezifischen Compliance-Vorgaben zu erfüllen. Je nach Datentyp, Datenmenge und Archivierungsanforderungen empfiehlt sich der Einsatz von PoINT Storage Manager oder PoINT Archival Gateway.

Der PoINT Storage Manager verschiebt Daten entsprechend ihres Alters und festgelegter Regeln jeweils auf die geeignete Speicherebene und das geeignete Speichermedium innerhalb der Speicherarchitektur. Ein solches „Information Lifecycle Management“ berücksichtigt den Lebenszyklus der Dateien und kommt damit dem Prinzip des Datenlebenszyklus wissenschaftlicher Daten entgegen. Es unterstützt nicht nur die effiziente Nutzung der Storage Infrastruktur, sondern bewerkstelligt gleichzeitig die sichere Archivierung der wichtigen Daten.

Das Produkt PoINT Archival Gateway bietet einen performanten und skalierbaren Objektspeicher mit S3-Schnittstelle. So ermöglicht es die Speicherung von Datenmengen im Petabyte-Bereich und mit hohen Transferraten auf Tape und optischen Speichermedien. Die Software unterstützt ihre Anwender bei der sicheren und regelkonformen, langfristigen Archivierung wertvoller Forschungsdaten.

Beide Lösungen stellen außerdem Möglichkeiten bereit, um schnell und reibungslos auf die archivierten Daten zuzugreifen. So können Anwender auch Jahre nach Erstellung der Daten diese unkompliziert aufrufen. Damit sind die Voraussetzungen für ihre Nachnutzung geschaffen.

Langzeitarchiv und Nachnutzbarkeit

Um die langen Aufbewahrungsfristen und die Vorgaben der Nachnutzbarkeit zu erfüllen, müssen Ausfallszenarien und Datenmigrationen mit bedacht und eingeplant werden. Die Daten sollten nicht nur an einem Speicherort aufbewahrt werden, außerdem müssen Speichermedien in der Regel nach fünf bis sieben Jahren ausgetauscht werden. Das heißt zum einen, dass auch eine umsichtige Backup-Strategie mit geplant werden muss. Zum anderen sollten die Daten in standardisierten Dateiformaten gespeichert werden, die nicht an eine bestimmte Speicherhardware oder Speichersoftware gebunden sind.

Die Software von PoINT unterstützt Wissenschaftlerinnen und Wissenschaftler bei der zuverlässigen und Compliance-konformen Langzeitarchivierung ihrer Forschungsdaten. Sie arbeitet unabhängig von Hardware-Herstellern und nutzt standardisierte Formate. Auf diese Weise sind Migrationen reibungslos durchführbar und die Daten über die geforderten Zeiträume nicht nur gesichert, sondern auch für die Nachnutzung verfügbar.