Konzept

Das HDC – Ein stabiles Haus für geisteswissenschaftliche Forschungsdaten

hdc-haus
Zentrale Aufgabe des zukünftigen Datenzentrums wird es sein, die Forschungsdaten verschiedener geisteswissenschaftlicher Disziplinen langfristig zu sichern und, im Rahmen der rechtlichen Bedingungen, für die Nachnutzung bereitzustellen. Darüber hinaus werden Werkzeuge, Schnittstellen zur Einbindung von Virtuellen Forschungsumgebungen sowie Beratungs- und Schulungsangebote zum Forschungsdatenmanagement angeboten.

Eine von nestor durchgeführte Bestandsaufnahme zur Langzeitarchivierung von Forschungsdaten [Link] hat gezeigt, dass diesbezüglich die Entwicklung von digitaler Infrastruktur in den Geisteswissenschaften noch nicht so weit vorangeschritten ist wie etwa in der Astrophysik oder in den Geowissenschaften, die bereits über ein weltweites Netz etablierter, miteinander kooperierender Datenzentren verfügen. Das Verbundprojekt Humanities Data Centre (HDC) ist eine Designstudie für ein Forschungsdatenzentrum, das im späteren Betrieb die für geisteswissenschaftliche Forschungsdaten notwendigen Aufgaben übernehmen wird.

Für den nachhaltigen Betrieb eines solchen Datenzentrums ist neben der eng an den Anforderungen der Zielgruppe orientierten Definition des Angebotes und dessen technischer Umsetzung vor allem ein solider organisatorischer Rahmen unerlässlich. Dazu gehören u.a. ein tragfähiges Geschäftsmodell, die Klärung rechtlicher Fragen sowie die intensive Kooperation und Vernetzung mit ähnlichen Initiativen und der enge Austausch mit Vertreterinnen und Vertretern der geisteswissenschaftlichen Einzeldisziplinen.

Langzeitarchivierung und organisatorischer Rahmen

Grundlage für das Konzept des HDC ist die in der Abbildung in Form eines Hauses visualisierte Struktur von aufeinander aufbauenden Service-Levels, die Art und Umfang der jeweils zu erbringenden Dienstleistung definieren. Das Fundament bildet die Bitstream Preservation, auf der als weitere Stockwerke die technische Nachnutzbarkeit und schließlich die intellektuelle Nachnutzbarkeit aufbauen. Das Haus ist unvollständig und instabil ohne ein schützendes Dach. Im Fall des HDC ist dies der stabile organisatorische Rahmen, ohne den es auf Dauer nicht bestehen kann.

Bitstream Preservation

Die Basis für die langfristige Erhaltung digitaler Objekte bildet die Bitstream Preservation. Sie stellt sicher, dass der Bitstream – die Folge der Bits, der Einsen und Nullen, aus denen die digitalen Objekte (also die Forschungsdaten) bestehen – unverändert erhalten bleibt. Die Bits sind auf physischen Medien gespeichert. Ohne den Erhalt der Speichermedien und des darauf gespeicherten Bitstreams, geht das digitale Objekt verloren.

Technische Nachnutzbarkeit

Die Bitstream Preservation ist unabdingbar, aber noch nicht hinreichend. Das Objekt muss auch mit aktueller Technik so wiedergegeben werden können, dass seine wesentlichen Inhalte und signifikanten Eigenschaften noch vorhanden sind. Dies wird als technische Nachnutzbarkeit bezeichnet. Die technische Nachnutzbarkeit gewährleistet den Zugang zu den Forschungsdaten, auch wenn die ursprünglich genutzte technische Umgebung (Hardware, Programme, Formate etc.) veraltet ist. Hierfür ist ein kontinuierliches technisches Qualitätsmanagement erforderlich, das auch die technischen Anforderungen und Arbeitsumgebungen der Wissenschaftlerinnen und Wissenschaftler berücksichtigen muss. Bereits hier ist also eine enge Kooperation mit den einzelnen geisteswissenschaftlichen Fachdisziplinen notwendig.

Intellektuelle Nachnutzbarkeit

Doch selbst die technische Nachnutzbarkeit reicht in vielen Fällen noch nicht aus, um den eigentlichen oder umfassenden wissenschaftlichen Gehalt der Daten zu erschließen, d.h. die intellektuelle Nachnutzbarkeit der Daten zu ermöglichen. Dafür sind begleitende Kontextinformationen unerlässlich, die es ermöglichen, die Genese und Auswertung der Forschungsdaten methodisch nachzuvollziehen. Dies erfordert zum einen die vollständige und klar strukturierte Dokumentation der Kontextinformationen, zum anderen die Verknüpfung der digitalen Objekte mit standardisierten, möglichst vollständigen Metadaten. In beiden Fällen müssen die Informationen regelmäßig aktualisiert werden. Auch für die hiermit verbundenen Aufgaben ist die enge Zusammenarbeit mit den Fachwissenschaften unabdingbar, die idealerweise schon in der Planungsphase eines Forschungsvorhabens beginnen sollte.

Insbesondere die beiden letztgenannten Service-Level eines geisteswissenschaftlichen Forschungsdatenzentrums übersteigen rein technische Aufgabenstellungen bei Weitem. Sie setzen eine breite Kenntnis der Forschungsinhalte und -methoden in den Geisteswissenschaften voraus. Im Vergleich zu anderen Disziplinen stellt das Volumen der Forschungsdaten in den Geisteswissenschaften ein vergleichsweise geringes Problem dar. Die spezifischen Herausforderungen ergeben sich hier aus der technischen und inhaltlichen Heterogenität der Daten. Diese zeigt sich auch in sehr individuellen Daten- und Metadatenmodellen und erschwert insbesondere die langfristige technische und inhaltliche Nachnutzung.

Stabiler organisatorischer Rahmen

Es geht jedoch nicht nur um die langfristige Sicherung und Bereitstellung der Forschungsdaten im Humanities Data Centre – auch der Bestand des Datenzentrums selbst muss über die Projektlaufzeit hinaus auf lange Sicht gesichert werden. Hierfür bedarf es eines stabilen institutionellen Rahmens, der die organisatorischen Abläufe und Verantwortlichkeiten definiert und die finanzielle Nachhaltigkeit sowie rechtliche Sicherheit gewährleistet. Von herausragender Bedeutung ist in diesem Zusammenhang zudem die Kommunikation und Kooperation mit den Wissenschaftlerinnen und Wissenschaftlern, die es dem HDC ermöglicht, das Dienstleistungsangebot an ihren Anforderungen auszurichten sowie sie mit Beratungs- und Schulungsangeboten zu unterstützen und sich so als vertrauenswürdiger Partner der Geisteswissenschaften zu etablieren.