Gesellschaft Deutscher Chemiker

Meinungsbeitrag

Den Datenschatz endlich heben

Nachrichten aus der Chemie, Oktober 2021, Seite 3, DOI, PDF. Login für Volltextzugriff.

Von Wiley-VCH zur Verfügung gestellt

Ein (gar nicht so) fiktives Szenario: Sie promovieren gerade und haben Ihrem Doktorvater Ihr aktuelles Problem geschildert. Die Antwort: „Das hat XY vor 15 Jahren gemacht, schauen Sie mal in der Dissertation!” Wenn Sie Glück haben, finden Sie das Opus und darin nach längerem Stöbern die gesuchte Information. Vielleicht haben Sie aber auch Pech und die Dissertation ist beim letzten Laborumzug verloren gegangen? Oder Ihr Vorgänger fand die Information nicht wichtig genug, um sie in die Dissertation zu schreiben?

Oder: Sie synthetisieren eine knifflige Vorstufe für einen Naturstoff, und das NMR-Spektrum sieht rätselhaft aus. Zu Ihrem Glück finden Sie eine ähnliche Verbindung in der Literatur – doch die Autoren des Artikels waren keine Freunde ausschweifender NMR-Diskussionen und haben der Supporting Information ein grobkörniges Bild des 1H-Spektrums spendiert …

Diese Szenarien sind Alltag in der Chemie. Während Computer und Spektrometer heute um ein Vielfaches leistungsfähiger sind als noch vor wenigen Jahrzehnten, wird ein Großteil der Forschungsdaten wie zu Liebigs Zeiten im Laborbuch aus Papier erfasst. Dort, wo Daten heute selbstverständlich digital entstehen, sind sie durch proprietäre Datenformate, fehlende Metadaten oder schlicht Papierausdrucke oft nicht vernünftig zugänglich, nachnutzbar oder gar maschinenlesbar.

Im Jahr 2016 wurden vier Prinzipien für Forschungsdaten formuliert, die Fair Guiding Principles: Forschungsdaten sollen findable, accessible, interoperable und reusable sein. Dafür sollten sie in offenen, digitalen Formaten vorliegen. Genauso wichtig sind Metadaten, also die Daten beschreibenden Daten. Gut strukturierte und reichhaltige Metadaten sind der Schlüssel zu allen vier Aspekten der Fair-Prinzipien.

In Deutschland bauen Bund und Länder eine Nationale Forschungsdateninfrastruktur (NFDI) auf, und im Fachkonsortium NFDI4Chem wollen wir die chemische Community dabei unterstützen, die Fair-Prinzipien umzusetzen – im Laboralltag, aber auch mit der langfristigen Datenorganisation im Blick.

Auch die GDCh hat die Bedeutung eines guten Datenmanagements erkannt. In den neuen Empfehlungen für den Bachelorstudiengang Chemie wird dem Umstand Rechnung getragen, dass Daten ein wichtiger Rohstoff der Zukunft sind.

Der Aufwand, alle Forschungsdaten zu digitalisieren und mit Metadaten zu versehen, ist groß. Und Daten erst nachträglich zu digitalisieren, ist kaum zu leisten. Deswegen ist das Ziel, alle Forschungsdaten von Anfang an digital zu erheben und möglichst automatisch mit Metadaten zu versehen. Elektronische Laborjournale (ELN) helfen hierbei: Die Forschenden können ihre Daten im ELN auswerten und erhalten die Peaklisten direkt für die Publikation. So lässt sich etwa auch eine geschlossene Arbeitskreis-Datenbank aufbauen. Final sollen die Daten und ihre Metadaten dann in chemischen Repositorien abgelegt werden – es gibt sie schon, aber sie werden nur wenig verwendet, mit Ausnahme des Cambridge Crystallographic Data Centre. Die zeitliche Investition, die jeder Forschende leistet, zahlt sich mittel- und langfristig aus.

Sie ahnen (oder befürchten vielleicht), welcher Kulturwandel damit in der Chemie verbunden ist. Diesen können wir nur gemeinsam bewältigen: Nutzerfreundliche digitale Werkzeuge werden dazu gerade nach den Bedürfnissen der Chemie entwickelt. Wir als NFDI4Chem-Konsortium freuen uns schon jetzt, mit Ihnen zu diskutieren und auf diese Ziele hinzuarbeiten – lassen Sie uns die chemischen Datenschätze aus ihrem verborgenen Dasein heben.

Prof. Dr. Sonja Herres-Pawlis und Dr. Johannes C. Liermann organisieren die Task Area 5 (Communication and Training) des Fachkonsortiums NFDI4Chem

https://media.graphcms.com/E9tJOudHQAn2MFhKLkNK
https://media.graphcms.com/biicMOw8QsQ2HUVZ2Uot

Leitartikel

Überprüfung Ihres Anmeldestatus ...

Wenn Sie ein registrierter Benutzer sind, zeigen wir in Kürze den vollständigen Artikel.