Langzeitarchivierung (LZA)

Die große Herausforderung für die Langzeitarchivierung besteht darin, Daten, Metadaten und Dokumente so zu erhalten, dass sowohl die Lesbarkeit der Dateien als auch die Interpretierbarkeit ihrer Inhalte garantiert werden können. Die Langzeitarchivierung ist dabei einem fortwährenden technischen Wandel unterworfen. Die in den anderen Abschnitten dieser Standards und Workflows dargestellten Arbeitsschritte tragen dazu bei, dem Wandel mit standardisierten, plattformunabhängigen und in der Praxis bewährten Werkzeugen zu begegnen. GESIS stellt sich seit 1960 dieser Herausforderung.

GESIS hat die Zielsetzungen für die Langzeitarchivierung in einer Preservation Policy (344 kB)niedergelegt.
Konkrete Maßnahmen sind im Preservation Plan (300 kB) beschrieben.

Open Archival Information System (OAIS)

Im Open Archival Information System (OAIS, ISO-Standard 14721) sind drei Pakete an Daten und Dokumenten vorgesehen.
GESIS folgt dieser Logik.

  1. Datengeber*innen stellen für die Langzeitarchivierung und Publikation ihrer Daten ein Informationspaket
    aus mehreren Objekten zusammen, das sog. Submission Information Package (SIP). Das SIP umfasst besonders die Erhebungs- oder Erfassungsinstrumente sowie eine methodische Beschreibung der Datenerhebung.

    Das SIP dient GESIS zur Verwendung bei der Erstellung oder Aktualisierung eines oder mehrerer sog.
    Archival Information Packages (AIPs) sowie der zugehörigen beschreibenden Informationen. Das AIP wird zusammen mit den Datengeber*innen erstellt.
     
  2. Voraussetzung für die Erstellung eines AIP ist eine Dateneingangsprüfung. Das AIP besteht dann im Wesentlichen aus drei Teilen:
    • Die Daten und Informationen, die gesichert werden sollen.
    • Informationen, die für eine Interpretation erforderlich sind:
      • Informationen zur Herkunft (Provenienz),
      • Referenzen wie einen Digital Objekt Identifer (DOI),
      • Informationen zum Schutz gegen unerlaubte Änderungen
        (z. B. Checksummen),
      • Informationen zum Kontext, sowie
      • Zugriffsrechtsinformationen.
    • Bei GESIS aufbereitete Versionen der Daten und Dokumenten sowie entsprechende
      Programme zur Datendefinition.
      Dies sind z. B. (kommentierte) Syntaxdateien für SPSS oder Do-Files für Stata.
      Diese stellen den Bezug zwischen Original- und Archivversionen her.
       
  3. Aus dem AIP wird ein sog. Dissemination Information Package (DIP) erstellt. Dieses wird Nutzer*innen über verschiedene Services von GESIS zur Verfügung gestellt.

Archivsystem

Alle gelieferten Daten werden nach festgelegten Regeln im Archivsystem abgelegt. Die Datenarchivierung erfolgt entlang des Lebenszyklus von Forschungsdaten.

Das Archivsystem unterliegt strikten Zugriffsrechten. Nur autorisierte Mitarbeiter dürfen langfristsicherungsfähige Objekte in das digitale Archiv überführen bzw. aus dem Archiv entfernen.

Das Archivsystem hat eine dateibasierte Verzeichnisstruktur. Die Dateien werden nach bestimmten Regeln in definierte Verzeichnisse abgelegt und nach einem einheitlichen Schema benannt. Die Originale, d.h. die vom Datengeber gelieferten Dateien werden in der ursprünglichen Form mit den ursprünglichen Dateinamen abgelegt und erhalten. Durch dieses Vorgehen werden die technischen und logischen Beziehungen der Objekte zueinander ausgedrückt.

Neben den beschriebenen organisatorischen und technischen Maßnahmen, setzt GESIS eine moderne und leistungsfähige IT-Infrastruktur zur Sicherstellung des physischen Erhalts ein. Diese ermöglicht u. a. im Katastrophenfall eine schnelle Wiederherstellung. Zur IT-Infrastruktur gehören die physische Sicherung der Daten (‚Bitstream Preservation‘) durch regelmäßige Backups, die Sicherung der Daten auf verschiedenartigen Speichermedien, eine redundante Speicherung an unterschiedlichen Standorten sowie die Medienmigration.

Vertrauenswürdiges Archiv – Zertifizierung

Ein digitales Langzeitarchiv ist vertrauenswürdig, wenn es gemäß seinen Zielen und seiner Aufgaben den Erhalt von Daten über einen langfristigen Zeitraum sicherstellen kann und seine Nutzer, Produzenten, Betreiber, Partner ihm dieses zutrauen.

Der Nachweis der Vertrauenswürdigkeit digitaler Archive erfolgt in der Regel über Zertifizierungs- und Self-Audit-Verfahren.

Das GESIS Datenarchiv hat nach einer Selbstevaluierung das CoreTrustSeal (ehemals Data Seal of Approval, DSA) erhalten und wurde somit als vertrauenswürdiges Archiv zertifiziert.