zum Hauptinhalt
Vermessen. Fächer wie Medizin, Soziologie oder Physik hängen von guten Daten ab. Doch junge Wissenschaftler sehen in der Erhebung ein sprödes Handwerk, das wenig Reputation bringt. Und oft haben nur wenige Zugriff auf aufwendig erhobenes Material.
© Volkmar Schulz / Keystone Presse

Wissenschaftliche Daten: Empfindliche Lücken

Hochwertige Daten zu sammeln ist teuer und schwierig. Doch sie werden dringend gebraucht. Eine systematische Sicherung gibt es aber nicht, die Daten geraten in Vergessenheit.

Die „Allianz der deutschen Wissenschaftsorganisationen“ hat jüngst „Grundsätze zum Umgang mit Forschungsdaten“ beschlossen. Unter dieser etwas spröden Überschrift verbirgt sich die Tatsache, dass der Aufwand für das Gewinnen von Daten als Grundlage wissenschaftlicher Erkenntnis – beispielsweise in der Soziologie, Medizin, Fernerkundung oder Hochenergiephysik – allein in Deutschland in der Größenordnung von mehreren Milliarden Euro pro Jahr liegt.

Aber, so stellt die Allianz fest, „es ist unbestreitbar, dass viele dieser Daten nach einer relativ kurzen Phase der Auswertung durch Einzelne oder kleine Gruppen dem Vergessen oder gar dem Verfall ausgesetzt sind. Hier sehen alle Wissenschaftseinrichtungen einen dringenden Handlungsbedarf hinsichtlich der systematischen Sicherung, Archivierung und Bereitstellung dieser Daten für die Nachnutzung durch Dritte.“ Diese Situation zu verbessern ist aber nicht rein technisch zu lösen, sondern die Anreize und „Belohnungsmechanismen“ innerhalb des Wissenschaftssystems müssen zugunsten der Datenproduktion, Archivierung und Nutzung verbessert werden. Dies ist eine ausgesprochen schwierige Aufgabe.

Ohne Datenerhebung und Statistik ist insbesondere angewandte Forschung nicht möglich, aber das „Handwerk“ des Datenerhebens und das Handwerk der Datenaufbereitung haben es im akademischen Betrieb schwer, der spitzfindige Analysemethoden und natürlich sensationelle Entdeckungen mehr schätzt als die mühselige Erhebung und Aufbereitung von Daten. Ausnahmen, wie etwa die gigantische Datenproduktion der Experimentalphysik, bestätigen die Regel.

Die als nachrangig angesehene Produktion und Weitergabe von Daten wird oft speziellen Institutionen wie statistischen Ämtern und „Ressortforschungseinrichtungen“, wie etwa dem Deutschen Wetterdienst oder der Bundesanstalt für Materialforschung und -prüfung (BAM), dem Robert-Koch-Institut (RKI) und dem Deutschen Zentrum für Altersfragen (DZA), alle in Berlin ansässig, überlassen. Auf der anderen Seite spielt zum Beispiel das Bundesarchiv bei der Archivierung von Forschungsdaten gar keine Rolle und die großen Forschungsbibliotheken, etwa die Technische Informationsbibliothek (TIB) in Hannover oder die Deutsche Zentralbibliothek für Wirtschaftswissenschaften (ZBW) in Hamburg und Kiel, haben erst begonnen, sich mit dem Archivieren und Zurverfügungstellen von Forschungsdaten zu beschäftigen. Notwendig ist aber mehr Wettbewerb um die besten Ideen aus der Forschung heraus. Dafür haben die Empfehlungen der Allianz nun gute Grundlagen gelegt.

Wenn Forschungsdaten, wie zum Beispiel Daten über das Klima in Vergangenheit und Gegenwart, über die historische Sozialstruktur oder über Entwicklungsverläufe von Babys bis zu Menschen in der letzten Phase ihres Lebens aus der Mitte der Forschung heraus produziert und archiviert werden sollen, dann muss es entsprechende Anreize für Wissenschaftler/innen geben. Von zentraler forschungsstrategischer Bedeutung ist daher die Anerkennung der Datenproduktion, der Archivierung und des Zugangs (data sharing) als eigenständige Leistungen innerhalb des Wissenschaftssystems. In ihren Grundsätzen würdigt die Allianz „qualitätsgesicherte Forschungsdaten“ nun als „einen Grundpfeiler wissenschaftlicher Erkenntnis“. Wer Forschungsdaten zur weiteren Nutzung bereitstelle, helfe der Wissenschaft als ganzer: „Die Allianz ermutigt zur Anerkennung und Förderung dieses zusätzlichen zeitlichen und finanziellen Aufwands.“

Es ist wirklich hervorragend, dass die „Allianz“ nun ihre Anstrengungen bei der Entwicklung des Forschungsdaten-Managements, von Standards bei Dokumentation und Zugriff verstärkt, sowie eine zielgerichtete Lehre und Weiterqualifikation fordert. Aber nicht nur die Anreize für Archivierung und Zur-Verfügung-Stellung müssen verbessert werden, sondern auch das „Sammeln“ und die Produktion von Daten müssen innerhalb des akademischen Elfenbeinturms besser belohnt werden. Nur dann sind Langfristvorhaben im internationalen Kontext machbar. Und es gibt in der Tat empfindliche Lücken.

So beklagte der renommierte Anthropologe und Ökonom Joe Henrich kürzlich in einem vielbeachteten Aufsatz in „Behavioral and Brain Science“, dass viele psychologische und verhaltensökonomische Studien nur mit Studenten in amerikanischen Eliteuniversitäten durchgeführt werden, da dies einfach organisierbar ist. Von den „sonderbarsten Menschen in der Welt“ („the weirdest people in the world“) wird dann auf das Verhalten von Menschen in ganz unterschiedlichen Kulturen geschlossen. Was wahrscheinlich vielfach zu – gegebenenfalls gefährlichen – Fehlschlüssen führt; wie jetzt auch in den Top-Fachzeitschriften „Nature“ und „Science“ diskutiert wird.

Will man das Verhalten aller Menschen wirklich verstehen, muss man jahrzehntelang laufende Längsschnittstudien in unterschiedlichen Ländern durchführen. Das zu organisieren ist sehr schwierig und vor allem auch sehr teuer, deswegen gibt es solche Studien bislang nicht. Allerdings ermutigende Ansätze mit dem an der Cornell University ansässigen „Cross National Equivalent File“ und vor allem einer inzwischen weltweiten Längsschnittstudie zu Alterungsprozessen (SHARE), die an der Universität Mannheim koordiniert wird. Beides sind sozialwissenschaftliche Studien, von denen andere Disziplinen wahrscheinlich lernen können. Denn das Archivieren von und der freie Zugang zu Forschungsdaten haben in den Sozialwissenschaften Tradition. Und auch die amtliche Statistik hat in jüngster Zeit in etlichen Ländern, so auch in Deutschland, mit „Forschungsdatenzentren“ vorbildliche Strukturen aufgebaut.

Es ist ausgesprochen sinnvoll, dass die Allianz deutlich macht, dass es beim Zugang zu Forschungsdaten keine Einheitslösung geben kann, sondern fachspezifische Besonderheiten zu berücksichtigen sind. Etwa im Bereich der Naturwissenschaften gibt es keinen personenbezogenen Datenschutz – in den Sozial- und Wirtschaftswissenschaften ist der Datenschutz aber ebenso wichtig wie etwa in der Medizin und den Verhaltenswissenschaften. Auch beim effektiven Datenschutz haben die Sozialwissenschaften zusammen mit der amtlichen Statistik beachtenswerte Verfahren entwickelt.

Zentral ist aber: Erstklassige Daten-Produktion sowie nutzungsfreundliche Archivierung und Data Sharing müssen akademisch voll anerkannt und mit Reputation honoriert werden. Neuere Entwicklungen, wie beispielsweise die eindeutige Identifikationsnummer zum Zitieren von Forschungsdaten und den dahinterstehenden Wissenschaftler/innen und Statistiker/innen können dazu beitragen, dass insbesondere junge Wissenschaftlerinnen mit Datenproduktion und -weitergabe Reputation erwerben und somit auch bereit sind, neue Ideen zu entwickeln und im Wettbewerb um knappe finanzielle Mittel durchzusetzen. Auch den Mitarbeiterinnen in statistischen Ämtern sollte für gute Arbeit persönliche Reputation erwachsen.

Die Allianz betont zu Recht, dass die „Conditio sine qua non für den Erfolg die enge Kooperation zwischen Fachwissenschaftlern und Informationsdienstleistern ist“. Dabei wachsen auch Fachbibliotheken ganz neue Aufgaben zu. Während das Beschaffen von Büchern und Zeitschriftenaufsätzen mehr und mehr mithilfe elektronischer Kopien direkt von Wissenschaftlern selbst erledigt wird, können Bibliotheken beim nutzerfreundlichen Dokumentieren und Auffinden von Forschungsdaten ganz außerordentlich helfen. Zudem sind Bibliotheken weltweit vernetzt.

Um das ebenso neue wie unübersichtliche Feld der „Forschungsdaten“ auszumessen und neu zu ordnen, wurde von der von Bund und Ländern getragenen Gemeinsamen Wissenschaftskonferenz die „Kommission Zukunft der Informations-Infrastruktur“ (KII) eingesetzt. Sie soll im Frühjahr nächsten Jahres Ergebnisse vorlegen. Eine ebenso wichtige wie spannende Diskussion wird dann folgen. Diese wird weitgehend nur in den entsprechenden Fachöffentlichkeiten geführt werden. Wichtig ist diese Diskussion für die Allgemeinheit trotzdem: denn ohne moderne Informationsinfrastruktur kann es keine moderne Forschung geben.

Der Autor, Professor für Empirische Wirtschaftsforschung und Wirtschaftspolitik an der TU Berlin, leitet die Längsschnittstudie SOEP am DIW Berlin und ist Vorsitzender des Rats für Sozial- und Wirtschaftsdaten

Zur Startseite