Forschungsdaten

Die Geisteswissenschaften umfassen eine ganze Reihe von Einzeldisziplinen, in denen eine Vielzahl unterschiedlicher Forschungsmethoden verwendet wird. Entsprechend sind auch die Forschungsdaten, die genutzt und produziert werden, heterogen und von unterschiedlicher Komplexität. Die Spanne reicht von relativ „einfachen“ Textdokumenten in verschieden Formaten über Audio- und Videodateien, in diversen Statistikformaten vorliegenden Umfragedaten bis hin zu Datenbanken und Simulationsdaten, um nur einige zu nennen.

Durch die zunehmende Anwendung digitaler Methoden wird der Anteil der eher komplexen Forschungsdaten tendenziell zunehmen. So entstehen vermehrt hybride (d.h. sowohl analog als auch digital vorliegende) Brief- und Handschrifteneditionen, die es erlauben, komplexe, handschriftliche Aufzeichnungen vollständig durchsuchbar zu machen und in ihrer ganzen Vielschichtigkeit darzustellen. Dadurch wird etwa die Abbildung der Textgenese möglich. Auch können Daten aggregiert und über Linked Open Data mit anderen Datenquellen (z.B. Normdaten) in Zusammenhang gebracht werden, um komplexe Beziehungsnetzwerke zu rekonstruieren. In der Linguistik werden zum Beispiel mit Hilfe von Algorithmen riesige elektronische Textkorpora untersucht, um bisher unbeachtete Zusammenhänge aufzudecken oder neue Thesen zu generieren – aber auch, um alte Forschungsfragen unter einem neuen Blickwinkel zu betrachten.

Einige konkrete Beispiele aus den am HDC beteiligten Institutionen illustrieren einen Ausschnitt aus der Bandbreite der in den Geisteswissenschaften verwendeten Methoden und Daten: