Gesellschaft Deutscher Chemiker

Artikel

Wo befinden wir uns in der digitalen Transformation wirklich?

Nachrichten aus der Chemie, April 2024, S. 15-17, DOI, PDF. Login für Volltextzugriff.

Von Wiley-VCH zur Verfügung gestellt

Damit der Übergang ins Zeitalter der digitalen Chemie gelingt, ist ein kultureller Wandel in der Community notwendig. Forschungsdaten entstehen zum Beispiel bei der Synthese von Substanzen, der Aufnahme von Spektren oder beim Anwenden quantenchemischer Methoden und müssen dokumentiert, archiviert und zur Nachnutzung verfügbar gemacht werden – doch wie behandeln Chemiker:innen ihre Forschungsdaten tatsächlich?

Die Nationale Forschungsdateninfrastruktur (NFDI) ist eine Initiative der deutschen Bundesregierung und der Länder. Ihr Ziel ist es, ein interdisziplinäres Netzwerk zu schaffen, das Forschungsdaten gemäß den Fair-Prinzipien (Findable, Accessible, Interoperable, Reusable)1) behandelt. Das Chemie-Konsortium NFDI4Chem2) strebt danach, den gesamten Workflow in der chemischen Forschung nahtlos zu digitalisieren und damit die analogen Lücken im digitalen Datenlebenszyklus zu schließen. Dazu stellt das Konsortium der Chemie-Community verschiedene Services, Ressourcen und Weiterbildungsmöglichkeiten zur Verfügung,3) um sie im aktuellen kulturellen Wandel zu unterstützen.

Zur digitalen Transformation zählt beispielsweise die Bereitstellung von open-source Electronic Lab Notebooks (ELNs). Diese sorgen für die unkomplizierte Veröffentlichung von Daten in Repositorien. Außerdem gehört dazu die Entwicklung von Standards und Tools wie auch ein enger Austausch mit der Community. Die Berücksichtigung der Community ist essenziell, um die Entwicklung der Infrastruktur entlang der Bedürfnisse der Nutzenden voranzutreiben.

Befragung der Community

NFDI4Chem führt regelmäßig Umfragen durch, die eben diese Bedürfnisse der Nutzenden ermitteln sowie den aktuellen Stand zum Umgang mit Forschungsdaten in der Community abfragen. Nach der Umfrage aus dem Jahr 20194–6) hat das Konsortium von Januar bis April 2023 erneut die Mitglieder der Community befragt. Dabei haben insgesamt 813 Wissenschaftler:innen teilgenommen, von denen 680 in den letzten drei Jahren überwiegend in Deutschland in der Forschung tätig waren. Die teilnehmenden Gruppen verteilen sich auf alle Karrierestufen: hauptsächlich Doktoranden (33 %), Mitglieder des akademischen Mittelbaus (Gruppenleiter, Senior Researcher, Postdocs; 24 %), Professor:innen (22 %), Studierende (9 %) und industriell Forschende (5 %). Vertreten waren überwiegend die klassischen Fachrichtungen der Chemie, angeführt von der organischen (33 %), anorganischen (27 %) und physikalischen Chemie (19 %). Weitere Subdisziplinen mit bedeutenden Anteilen sind die Materialwissenschaften (14 %), analytische (12 %), Bio- (10 %) und theoretische Chemie (8 %).

Um zu verstehen, wie die Forschenden aktuell mit ihren erfassten Daten umgehen, wurde zunächst gefragt, welche Arten von Daten gesammelt werden. Dabei zeigen sich im Vergleich zur Umfrage von 2019 keine großen Abweichungen. Vorne liegen: spektroskopische Daten (75 %), experimentelle Synthesedaten (65 %), kristallographische Daten (38 %), Daten aus Simulationen oder quantenmechanischen Berechnungen (30 %) und mikroskopische Daten (29 %). 55 % der Teilnehmenden gaben an, dass sie von Anfang an digitale Daten generieren, während 45 % die Daten zunächst in einem nicht elektronischen Format sammeln und später digitalisieren (konform zu 2019: 58 % zu 42 %).

Dabei werden erstaunlicherweise neben zu erwartenden Angaben, wie Synthesedetails und Beobachtungen, NMR-Spektren immer noch als Beispiel für nicht elektronische Formate und deren spätere Digitalisierung genannt. Während der Datenverarbeitung beschreiben über die Hälfte der Teilnehmenden (56 %; 2019: 42 %) die gesammelten Daten mit Metadaten, wobei 44 % diese manuell hinzufügen, 11 % mit Software-Tools arbeiten und 46 % eine Kombination aus beidem nutzen. Bei der Verwendung von Metadaten sind 45 % der Nutzenden der Meinung, dass ihre hinzugefügten Metadaten Mitgliedern ihrer Arbeitsgruppe helfen, die Daten zu verstehen. 32 % denken, dass die Metadaten sowohl den Wissenschaftler:innen ihrer Arbeitsgruppe als auch denen außerhalb ihrer Arbeitsgruppe helfen, während 10 % angeben, dass die Daten nur in Verbindung mit einer entsprechenden Publikation verständlich sind. Die verbleibenden 12 % dieser Gruppe äußern, dass andere ihre Daten ohne weitere Erklärung nicht verstehen können.

Elektronische Laborjournale werden häufiger

Chemiker:innen verabschieden sich zunehmend vom analogen Laborbuch und steigen auf elektronische Laborjournale (ELN) um. Aktuell verwenden 30 % der Teilnehmenden ein ELN im Vergleich zu 19 % im Jahr 2019. Dabei werden über 20 unterschiedliche Typen von ELNs von den Teilnehmenden genannt, wobei 10 % der ELN-Nutzergruppe Word und Excel ebenfalls als ELN betrachten. Das ELN Chemotion nutzen 26 %, eLabFTW 20 % und Sciformation/open enventory 9 % der Befragten. 88 % der ELN-Nutzenden verwenden ihr ELN außerdem, um ihre Daten innerhalb ihrer Arbeitsgruppe zu teilen und gemeinsam zu nutzen. Auf alle Umfrageteilnehmende bezogen nutzen 22 % ein ELN zum Datenteilen (2019: 15 %), während auch andere Instrumente und Tools dafür zum Einsatz kommen (Abbildung oben). Bereits 19 % (2019: 12 %) der Teilnehmenden greifen auf Datenrepositorien zurück, um ihre Daten außerhalb ihrer Arbeitsgruppe zu verbreiten. Der Anteil derer, die ihre Daten in der Supporting Information oder als Datenpublikation ihrer Textpublikation beifügen, ist leicht auf 45 % gestiegen (2019: 39 %). Bemerkenswert ist, dass 12 % (2019: 10 %) angeben, dass sie ihre Daten außerhalb ihrer Gruppe gar nicht teilen.

https://media.graphassets.com/vth3jNRt28ChUUCQtAwD
So teilen Chemiker:innen ihre Daten.

Langzeitarchivierung

Neben der Datenteilung beschäftigen sich die Wissenschaftler:innen auch mit der Langzeitarchivierung ihrer Daten (Abbildung rechts, A), wobei 49 % der Teilnehmenden alle produzierten Daten archivieren (2019: 61 %). Im Vergleich zu 2019 zeigt sich hier deutlich, dass die Teilnehmenden im Jahr 2023 differenzierter bei der Datenspeicherung vorgehen. Es wird verstärkt eine Kombination aus Rohdaten, verarbeiteten Daten und analysierten Daten gespeichert (Zuwachs von 18 auf 26 %).

https://media.graphassets.com/SdNCnMYWS76aTu90JGFB
Fragen an die Teilnehmenden: A) Welche Version Ihrer Daten archivieren Sie? B) Haben Sie Ihre Daten publiziert? C) Haben Sie Daten anderer Wissenschaftler:innen nachgenutzt?

Außerdem geben 13 % an, dass sie Daten nicht reproduzierbarer oder nicht analysierbarer Experimente/Messungen vorsichtig löschen. Dabei werden beispielsweise die Messdaten gelöscht, der Eintrag im ELN bleibt aber bestehen und wird mit einem entsprechenden Hinweis versehen.

Zur Langzeitarchivierung verwenden 40 % (2019: 54 %) der Teilnehmenden lokale Arbeitsbereiche wie PCs für die Datenspeicherung, 64 % (2019: 75 %) die Server der Arbeitsgruppe oder des Instituts, 39 % (2019: 34 %) Universitätsserver-Infrastrukturen und 20 % (2019: 18 %) ein Cloud-System. Während die Nutzung externer Festplatten (38 %; 2019: 42 %) und USB-Sticks oder DVDs/CDs (17 %; 2019: 22 %) nur leicht abgenommen hat, setzten bereits 20 % der Teilnehmenden auf ein Datenrepositorium zur Langzeitarchivierung (2019: 13 %). 77 % der Teilnehmenden geben dabei an, dass sie die DFG-Regularien7) zur Datenspeicherung für mindestens 10 Jahre umsetzen. Insgesamt folgen 62 % der Teilnehmenden definierten Regeln zum Umgang mit ihren Forschungsdaten in ihrer Arbeitsgruppe und ihrem Institut (2019: 54 %) – 20 % sind sich keiner Regeln bewusst, und 18 % haben keine Regeln.

Daten wiederverwenden

Daten wiederzuverwenden spielt unter Wissenschaftler:innen eine immer größere Rolle. Dazu ist zunächst die Veröffentlichung der Daten erforderlich (Abbildung oben, B), die mit 22 % als Teil einer Textveröffentlichung in einem Datenrepositorium im Vergleich zu 2019 (16 %) zugenommen hat. Dass 36 % bisher noch keine Daten veröffentlicht haben, hängt auch mit der hohen Zahl junger Doktorand:innen als Teilnehmende dieser Studie zusammen. 18 % der Teilnehmenden geben an (Abbildung oben, C), dass sie bereits Daten aus einem Datenrepositorium wiederverwendet haben (2019: 15 %).

Beachtenswert ist außerdem, dass 73 % der Teilnehmenden die Frage, ob sie von Online-Datenbanken oder -Datenrepositorien wissen, nicht beantwortet haben. Von denen, die geantwortet haben, antworteten nur 24 % mit Ja. Immerhin 29 % der Umfrageteilnehmenden kennen Dienste, die sie bei der Handhabung von Daten unterstützen. Dabei werden NFDI4Chem, die American Chemical Society, Universitätsbibliotheken und IT-Zentren als Beispiele genannt. Insgesamt kennen 50 % der Teilnehmenden NFDI4Chem, während aktuell nur 20 % derer, die die Frage beantwortet haben (30 %), die bereitgestellten Dienste nutzen. Der am häufigsten genannte Dienst ist das Chemotion ELN.

Weitere Unterstützung nötig

Als zentrale Aussage kommt zu Tage, dass 86 % der Teilnehmenden denken, dass zukünftige Studierende und Arbeitsgruppen ihres Instituts davon profitieren würden, wenn der Umgang mit Forschungsdaten und das Forschungsdatenmanagement Teil des offiziellen Lehrplans wären. Somit ergibt sich aus der Community ein klarer Bedarf an weiterer Unterstützung und Information und damit auch der eindeutige Auftrag für NFDI4Chem, weiterhin Dienste sowie Lehr- und Weiterbildungsmöglichkeiten zum Umgang mit Daten für aktuelle und zukünftige Forschende bereitzustellen.

Die Autor:innen

Diesen Beitrag haben Jochen Ortmeyer, Daniela Hausen und Sonja Herres-Pawlis verfasst (alle RWTH Aachen). Ortmeyer (Postdoc im Institut für bioanorganische Chemie) ist bei NFDI4Chem seit Ende 2020 als Projektmanager für die Task Area Community Involvement & Training tätig. Hausen (Universitätsbibliothek) arbeitet seit 2016 im FDM-Team der RWTH als Data-Steward-Koordinatorin, betreut das Fachreferat Chemie und ist seit 2020 als RDM-Trainerin in NFDI4Chem tätig. Herres-Pawlis ist Co-Sprecherin von NFDI4Chem und der NFDI-Sektion EduTrain. Sie leitet den Lehrstuhl für bioanorganische Chemie und bearbeitet seit 2009 chemische Workflows und Forschungsdaten.

  • 1 M. D. Wilkinson, M. Dumontier, I. J. Aalbersberg et al., Sci. Data 2016, 3, 160018, doi: 10.1038/sdata.2016.18
  • 2 J. Ortmeyer, F. Schön, S. Herres-Pawlis et al., Bausteine Forschungsdatenmanagement 2021, 2, 34–45, doi: 10.17192/bfdm.2021.2.8340
  • 3 J. Ortmeyer, J. D. Jolliffe, Nachr. Chem. 2022, 70(10), 16–17, doi: 10.1002/nadc.20224131398
  • 4 O. Koepler, J. Liermann, F. Schön et al., Nachr. Chem. 2020, 68(12), 20–23, doi: 10.1002/nadc.20204095910
  • 5 S. Herres-Pawlis, J. Liermann, O. Koepler, Z. Anorg. Allg. Chem. 2020, 646, 1748–1757, doi: 10.1002/zaac.202000339
  • 6 S. Herres-Pawlis, O. Koepler, J. Liermann, Dataset: First NFDI4Chem User Survey 2020, doi: 10.25835/0077933
  • 7 DFG, Leitlinien zur Sicherung guter wissenschaftlicher Praxis. Kodex, 2022, Version v2, doi: 10.5281/zenodo.6472827

Bildung + Gesellschaft

Überprüfung Ihres Anmeldestatus ...

Wenn Sie ein registrierter Benutzer sind, zeigen wir in Kürze den vollständigen Artikel.