Update: 16.09.2015, HDC-Workshop im Rahmen der Konferenz “Forschungsdaten in den Geisteswissenschaften” (FORGE 2015), Universität Hamburg

Humanities Data Centre: Langzeitverfügbarkeit geisteswissenschaftlicher Forschungsdaten als organisatorische Herausforderung beim Aufbau und Betrieb eines Forschungsdatenzentrums

Themen (und Zielsetzung) des Workshops
Das Projekt Humanities Data Centre (HDC) erarbeitet in der vom Land Niedersachsen geförderten Designphase (2014-2016) die konzeptionellen Grundlagen für den Aufbau und den Betrieb eines Forschungsdatenzentrums für die Geisteswissenschaften. Auf die Designphase, in der erste technische Umsetzungen in Form von Prototypen realisiert werden, folgen eine Aufbau- und eine initiale Betriebsphase.

Geisteswissenschaftliche Forschungsdaten sollen über die üblichen Lebenszyklen von Projekten, Datenformaten und Software hinaus nutzbar sowie über die Anwesenheit der ursprünglichen Datenersteller hinaus interpretierbar und nachnutzbar sein. Dieser Bedarf stellt sich sowohl aus der Sicht von Forschenden aus Gründen der Guten Wissenschaftlichen Praxis, der Nachnutzbarkeit von Forschungsdaten und als Teil des wissenschaftlichen Diskurses, als auch aus der Perspektive von Forschungsförderern mit Blick auf die Effizienz und Nachhaltigkeit von Projektfinanzierungen.

Bestimmte Charakteristika (geisteswissenschaftlicher) Forschungsdaten stehen einer Standardisierung, wie sie bspw. bei Publikationen gut möglich ist, entgegen:

  • Forschungsdaten bestehen immer häufiger aus verbundenen Objektsammlungen. Zunehmend gewinnen Datenbanken oder Applikationen (bspw. digitale Editionen, Visualisierungen) in deren Design bereits wissenschaftliche Erkenntnis steckt, an Bedeutung.
  • Forschungsdaten sind nicht generisch, sondern zum wesentlichen Teil disziplinspezifisch. Oftmals ist nur ein administrativer Kern (an Metadaten) einfach standardisierbar.
  • Viele Dienste zur Archivierung und Bereitstellung von Forschungsdaten skalieren nicht. Anders als bei stark standardisierten Daten ist die Archivierung und Nachnutzung von heterogenen Forschungsdaten stark abhängig vom Einzelfall.

Die genannten Eigenschaften verlangen tendenziell nach fallspezifischen Lösungen. Im Gegensatz dazu haben Infrastrukturbetreiber (Rechenzentren, Bibliotheken) ein großes Interesse an der Standardisierbarkeit und ergo Skalierbarkeit von Services, damit sie ein finanzierbares Angebot realisieren können. So ist der Aufbau eines Forschungsdatenzentrums, das beständig lernt und seine Angebote (auch unter Berücksichtigung von Einzelfällen) erweitert, aus Sicht der Infrastruktureinrichtungen zwar technisch und organisatorisch denkbar, finanziell aber kaum realistisch. Dieser Widerspruch zwischen der Notwendigkeit der kontinuierlichen Weiterentwicklung lokaler Angebote und gleichzeitig (fehlender) Skalierbarkeit der Angebote ist eine der großen Herausforderungen beim Aufbau eines Forschungsdatenzentrums.

In der Zusammenschau und ungeachtet aller informationswissenschaftlichen und technologischen Herausforderungen stellt sich die langfristige Nachhaltigkeit und Nachnutzbarkeit von Forschungsdaten somit vor allem auch als eine organisatorische Herausforderung dar.

Eine wichtige Voraussetzung für die langfristige Sicherung und Bereitstellung der Forschungsdaten ist zunächst die Sicherstellung der organisatorischen und finanziellen Nachhaltigkeit des Datenzentrums selbst, wofür ein tragfähiges Betriebs- und Geschäftsmodell (inkl. Kostenmodell) nötig ist. Auch rechtliche Fragen spielen in diesem Zusammenhang eine Rolle – ebenso wie in Bezug auf die Langzeitarchivierung und Bereitstellung der Daten, bei denen vor allem urheber- und datenschutzrechtliche Aspekte zu beachten sind. Nicht zuletzt ist für den Erfolg und langfristigen Bestand eines geisteswissenschaftlichen Datenzentrums eine gelungene Kooperation mit den Fachwissenschaften sowie mit Initiativen ähnlicher oder gleicher Zielrichtung entscheidend.

Der Workshop wird eine Reihe von Fragestellungen zum Thema der organisatorischen Umsetzung eines geisteswissenschaftlichen Forschungsdatenzentrums behandeln. Ein wesentlicher Bestandteil wird dabei neben der Vorstellung von Überlegungen und Projektergebnissen zu den einzelnen Themen die Diskussion mit den Teilnehmerinnen und Teilnehmern und die gemeinsame Erarbeitung von Ergebnissen sein.

Interessentenkreis
Der Workshop richtet sich an Forschende der Digital Humanities sowie aus den Bereichen Informationswissenschaften und Forschungsdateninfrastruktur und Institutionen, die Forschungsdaten und -werkzeugen ein “stabiles, nachhaltiges und sicheres Zuhause” geben wollen.

Vorläufiges Programm (Stand 11.08.2015)

Forschungsdaten in den Geisteswissenschaften – HDC-Workshop
8:45 – 9:00 Registrierung mit Kaffee
9:00 – 9:30 Einführung in Thema und Ablauf
Grußworte: Dr. Jan Brase (SUB), Dr. Ulrich Schwardmann (GWDG)
Einführungsvortrag: Dr. Felix F. Schäfer (IANUS)
9:30 – 10:45 4 Breakout-Sessions mit einleitenden Impulsvorträgen (siehe unten)

  1. Mehr als wegspeichern – Das (Nach-)leben digitaler Forschungsdaten, Moderation: Dr. Ulrike Wuttke, Dr. Frank Fischer (DARIAH-DE)
  2. Von individuellen Anwendungsfällen zu normierten Aufbewahrungsstrategien, Moderation: Stefan Buddenbohm, Fabian Cremer (Max-Weber-Stiftung)
  3. Nachhaltige Organisations- und Kostenmodelle für geisteswissenschaftliche Forschungsdatenzentren, Moderation: Claudia Engelhardt, Jonathan Blumtritt (DCH)
  4. Nachhaltige Infrastruktur als technologische Herausforderung,  Moderation:  Dr. Sven Bingert, Tim Hasler, Tibor Kálman (DARIAH-EU)
10:45 – 11:15 Pause mit Kaffee
11:15 – 12:15 Ergebnisdiskussion im Plenum, Moderation: Dr. Jan Brase (SUB), Dr. Ulrich Schwardmann (GWDG), Dr. Felix F. Schäfer (IANUS)
12:15 – 12:30 Zusammenfassung und Ausblick:
Dr. Jan Brase (SUB), Dr. Ulrich Schwardmann (GWDG)

Kurzbeschreibung der Breakout-Sessions

Session 1) Mehr als wegspeichern – Das (Nach-)leben digitaler Forschungsdaten
In dieser Session wollen wir gemeinsam darüber diskutieren, aus welchen Gründen und zu welchem Zweck geisteswissenschaftliche Forschungsdaten langfristig erhalten werden sollen. Welche Implikationen haben die Bedürfnisse der verschiedenen Interessengruppen für die Langzeitarchivierung bzw. die mit diesen Aufgaben betrauten Institutionen, wie z.B. disziplinäre Forschungsdatenzentren? Die Interessen und Bedingungen reichen von der Erhaltung der Forschungsdaten zu Dokumentationszwecken in einer geschlossenen Archivlösung, über die Publikation als Forschungsergebnis bis hin zur Nachnutzung im Rahmen neuer Forschungsfragen. Ausgehend von verschiedenen Nachnutzungsszenarien wollen wir unter anderen der Frage nachgehen, welche sozialen, technischen oder rechtlichen Barrieren der nachhaltigen Archivierung, vor allem aber der produktiven Nachnutzung im Wege stehen, und wo Möglichkeiten bestehen, Anreize für Data Sharing und bessere Bedingungen für die Nachnutzung zu schaffen.

Session 2) Von individuellen Anwendungsfällen zu normierten Aufbewahrungsstrategien
Während wir es bei klassischen geisteswissenschaftlichen Publikationen häufig mit Text in Form von Buch- oder Zeitschriftenbeiträgen zu tun haben, gestaltet sich das Feld bei Forschungsdaten wesentlich vielfältiger. Was aus wissenschaftlicher Sicht ein Zeichen für eine gewünschte Vielfalt ist, wirft aus Sicht der Archivierung und Nachnutzung von Forschungsdaten erhebliche Herausforderungen auf. In der Session wollen wir der Frage nachgehen, wie die unterschiedlichen Anwendungsfälle (oder Forschungsdatentypen) sinnvoll strukturiert werden können und welche Aufbewahrungsstrategien in Betracht kommen.

Session 3) Nachhaltige Organisations- und Kostenmodelle für geisteswissenschaftliche Forschungsdatenzentren
Im Mittelpunkt dieser Session stehen Szenarien der nachhaltigen Finanzierung und Organisation von Forschungsdatenzentren. Wir gehen von dem Standpunkt aus, dass die Kuratierung und Langzeitarchivierung von Forschungsdaten in den Geisteswissenschaften mit ihren komplexen Datenstrukturen nur schwer standardisierbar sind und einen hohen Beratungs- und Betreuungsaufwand erfordern. Diese Ausgangslage bedingt ausdifferenzierte Leistungsportfolios. Gegenstand der Session wird es sein zu fragen, welche Kostenmodelle diesen Leistungen gegenübergestellt werden können, welche Möglichkeiten zur Finanzierung zur Verfügung stehen und welche organisatorischen Aspekte dabei eine Rolle spielen können. Darüber hinaus soll diskutiert werden, mit welchen Folgekosten bzw. Verlusten zu rechnen ist, wenn Kuratierungs- und Erhaltungsmaßnahmen unterbleiben.

Session 4) Nachhaltige Infrastruktur als technologische Herausforderung
Für die Nachhaltigkeit eines Forschungsdatenzentrums müssen nicht nur organisatorische Fragen geklärt werden, sondern auch die Infrastruktur selbst stellt eine technologische Herausforderung dar. Dabei gilt es zuerst zu definieren, was unter Nachhaltigkeit zu verstehen ist. Über eine sichere Speicherung hinaus bedeutet dies, dass die Daten dauerhaft über alle technischen Entwicklungen hinweg lesbar – also intellektuell nachnutzbar – bleiben. Diese Anforderungen sind für einfache Datentypen und Anwendungsfälle noch übersichtlich, bedürfen aber für komplexe Datenstrukturen und für verschiedene Nachnutzungsszenarien einer technisch ausgereiften Infrastruktur. Dies wird am Beispiel der granularen Referenzierung von digitalen Objekten, einer Anforderung aus der Wissenschaft, deutlich. In unserer Session werden wir unsere Ideen und Konzepte für eine nachhaltige Infrastruktur anhand eines Forschungsdatentyps aus Sicht der Wissenschaftlerinnen und Wissenschaftler und der Infrastrukturanbieter diskutieren.

Art der geplanten Vorträge
Der Workshop soll einerseits aus Impulsvorträgen und andererseits der gemeinsamen Erarbeitung von Ergebnissen bestehen. Die Impulse müssen nicht ausschließlich HDC-spezifisch sein. Die Inhalte sollen generell auf die Bedingungen geisteswissenschaftlicher Forschungsdaten abzielen, dabei aber offen für andere Initiativen oder geisteswissenschaftliche Forschungsdatenzentren sein. Die Ergebnisse sollen gesammelt werden und können ggf. in einem geeigneten Kreis geteilt oder zur Verfügung gestellt werden.

Link zur Veranstaltungswebseite und Anmeldung: FORGE2015

Weitere Informationen zum Workshopprogramm werden sukzessive an dieser Stelle bekanntgegeben.

Namen und Kontaktdaten der Organisatoren

Für das Humanities Data Centre:

  • Dr. Sven Bingert, Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (sven.bingert@gwdg.de)