Maschinelles Lernen eignet sich, um Photochemie und somit elektronisch angeregte Zustände zu beschreiben; klassische Molekulardynamiktechniken erlauben, bestimmte Aspekte der nuklearen Quanteneffekte in Probleme der physikalischen Chemie einz...
Trendbericht Theoretische Chemie 2022
Maschinelles Lernen für elektronisch angeregte Zustände
Von Wiley-VCH zur Verfügung gestellt
Maschinelles Lernen eignet sich, um Photochemie und somit elektronisch angeregte Zustände zu beschreiben; klassische Molekulardynamiktechniken erlauben, bestimmte Aspekte der nuklearen Quanteneffekte in Probleme der physikalischen Chemie einzubeziehen, und was Finite-Feld-Methoden mit alten Sternen zu tun haben.
Maschinelles Lernen für elektronisch angeregte Zustände
Maschinelles Lernen (ML) revolutioniert viele Bereiche unseres Lebens. Auch in der theoretischen Chemie brachte es schon Fortschritte, beispielsweise bei der Entwicklung neuer Medikamente1) oder Photokatalysatoren.2)
Die Frage „Welcher Trend … ist aufgekommen, den Sie so nicht erwartet haben?“ oder „In welchem Gebiet erwarten Sie … die größten Entwicklungen?“ beantworteten Autor:innen vergangener Trendberichte oft mit ML oder künstlicher Intelligenz.
Auch in der Simulation von Photochemie wird ML immer wichtiger, da sich aufwendige quantenchemische Berechnungen durch schnellere ML-Vorhersagen ersetzen lassen.
Um Photochemie und somit elektronisch angeregte Zustände zu beschreiben, gibt es viele Ansatzpunkte für ML (Abbildung 1).3) So lassen sich damit Wellenfunktionen beschreiben, aus denen sich alle anderen Eigenschaften mit einem nachfolgenden Rechenschritt bestimmen lassen. Alternativ lassen sich beispielsweise ML-Kraftfelder generieren, wobei die Wellenfunktionsinformationen vernachlässigt werden können, um höhere Rechengeschwindigkeiten zu erzielen. Diese ML-Kraftfelder eignen sich, um in Dynamikrechnungen zeitabhängige Eigenschaften zu beschreiben.
Noch schnellere Vorhersagen sind möglich, wenn man direkt Observablen berechnet, beispielsweise Spektren. Dabei ist dann weder die Information der Wellenfunktion noch diejenige aus den Zeitschritten einer Dynamikrechnung verfügbar. Für all diese Anwendungsbereiche lässt sich ML zusätzlich zur Datenanalyse heranziehen. Auch beim Erzeugen der zugrundeliegenden Daten mit quantenchemischen Rechnungen hilft ML, optimale Ansätze zu finden.
Photodynamiksimulationen auf der Nanosekunden-Zeitskala
Besonders nützlich sind ML-Methoden, wenn sich viele aufeinanderfolgende quantenchemische Rechnungen durch die schnelleren ML-Rechnungen ersetzen lassen. Dies ist bei Dynamikrechnungen der Fall, bei denen die potenzielle Energie und die Kräfte auf die Atomkerne an vielen verschiedenen Molekülgeometrien benötigt werden. Diese Aussage gilt sowohl, wenn nur der elektronische Grundzustand betrachtet wird, als auch wenn elektronisch angeregte Zustände in der Dynamik wichtig sind. Im zweiten Fall werden mehrere Potenzialhyperflächen, die zugehörigen Kräfte und weitere Eigenschaften benötigt. Zu diesen gehören beispielsweise nicht-adiabatische Kopplungen (verantwortlich für den Prozess der internen Konversion), Spin-Bahn-Kopplungen (verantwortlich für Interkombination) oder Übergangsdipolmomente. Sie gestalten die Molekulardynamikrechnungen in angeregten Zuständen deutlich komplexer als im Grundzustand.
Die Vorgehensweise, um ML für Dynamikrechnungen zu verwenden und längere Zeitskalen zu ermöglichen, ist dann wie folgt (Abbildung 2):3–5) Zuerst werden Trainingsdaten mit Quantenchemie (QC) erzeugt. Hier ist Expertenwissen nötig, um einen geeigneten Ansatz zu wählen: etwa MRCI, multi reference configuration interaction, oder TDDFT, time-dependent density functional theory, und weitere.6) Mit den QC-Daten werden ML-Modelle trainiert. Das heißt, diese Modelle lernen, wie potenzielle Energien und andere Eigenschaften von der Molekülgeometrie abhängen. Hierbei sind neuronale Netze und Kernel-basierte Methoden am weitesten verbreitet.3) Die so erhaltenen ML-Potenziale und -Kopplungen gehen dann in Dynamikansätze ein, beispielsweise Wellenpaketmethoden7) oder Surface-Hopping-Methoden.8) Auch Pfadintegralmethoden,9) wie sie M. Rossi für den elektronischen Grundzustand im Trendbericht zur Quantennatur der Kerne beschreibt [diese Nachrichten, ab S. 58], eignen sich für die Dynamik angeregter Zustände.10)
Die Zeitschritte in diesen Dynamikrechnungen liegen in der Größenordnung von 1 fs (10–15 s). Mit QC-basierter Dynamik lassen sich so Zeitskalen in der Größenordnung von Pikosekunden simulieren, während ML-basierte Dynamik die Simulation von Prozessen im Nanosekundenbereich abdeckt.11) Es ist also eine Beschleunigung um einen Faktor von zirka 1000 möglich.12) Durch Methoden zum Sampling seltener Ereignisse lassen sich solche Zeitskalen übrigens nochmals erweitern.13)
Entdeckung neuer Photoreaktionsmechanismen
Die Möglichkeiten, die sich durch ML eröffnen, gehen über die pure Beschleunigung von Dynamikrechnungen hinaus. So lassen sich unter bestimmten Umständen molekulare Systeme simulieren, die mit konventionellen QC-Methoden außer Reichweite sind.
Ein Beispiel ist die essenzielle Aminosäure Tyrosin.14) Für diese sind die meisten QC-Methoden nur in bestimmten Bereichen der Potenzialflächen geeignet, während sie in anderen Bereichen falsche Ergebnisse liefern. Diese Bereiche können bei unterschiedlichen QC-Ansätzen komplementär sein. Nun lassen sich Trainingsdaten durch die verschiedenen QC-Methoden selektiv aus den Bereichen der Potenzialflächen generieren, in denen die jeweiligen QC-Methoden zuverlässige Ergebnisse liefern.
ML-Modelle, die solche Trainingsdaten verwenden, können das Gesamtsystem an allen relevanten Molekülstrukturen sinnvoll beschreiben. So lassen sich bisher unzugängliche Systeme simulieren und neue Reaktionsmechanismen entdecken. Bei Tyrosin wurde auf diese Weise das Phänomen des „Roaming“ in den Simulationen beobachtet. Dabei löst sich ein Atom aus einem Molekülverband, wandert um das Molekül herum und lagert sich an einer anderen Stelle wieder an – ähnlich einer Fliege, die um ein Pferd herumschwirrt (Abbildung 3). Dieser neuartige Reaktionsmechanismus wurde erstmals im Jahr 2004 für Formaldehyd vorhergesagt und auch experimentell gemessen.15) ML-Simulationen zeigten erstmals, dass Roaming auch in Biomolekülen auftritt.
Darüber hinaus hilft ML auch bei der Datenanalyse, beispielsweise bei der Frage, welche Fragmente bei einer Dissoziationsreaktion von Tyrosin im Anschluss an den Roamingprozess entstehen oder welche Ladung das beim Roaming umherwandernde H-Atom hat.14)
Fazit
ML kann viele Simulationen, speziell in der Photochemie, beschleunigen. Richtig angewendet ermöglicht es darüber hinaus tiefere Einblicke in physikalische Prozesse, etwa indem es Analyseverfahren vereinfacht.
Trotz dieser Fortschritte ist ML nicht als Allheilmittel für die vielfältigen Probleme in der Chemie zu verstehen. Andere Methoden und Ansätze werden auch weiterhin gefragt sein. Sie können jedoch durch ML unterstützt und verbessert werden. So wird ML immer mehr zum festen Bestandteil der Werkzeuge insbesondere in der theoretischen Chemie und auch darüber hinaus.
Drei Fragen an den Autor: Philipp Marquetand
Welche Methode hat sich in den letzten zwölf Monaten aus Ihrer Sicht am meisten weiterentwickelt?
Maschinelles Lernen (ML) hat an Fahrt aufgenommen – beispielsweise für ML-Potenziale, ML-Retrosynthese oder ML-Materialdesign.
Was sind derzeit Ihre Hauptforschungsprojekte?
Neben ML-Potenzialen für elektronisch angeregte Zustände und Photodynamiksimulationen: ML-Ansätze für Wellenfunktionen in Quanten-Monte-Carlo-Methoden, Sampling seltener Ereignisse in angeregten Zuständen und wie Moleküle mit starken Laserfeldern wechselwirken.
In welchem Gebiet erwarten Sie in den nächsten zwölf Monaten die größten Entwicklungen und warum?
Beim ML, da dort die Möglichkeiten noch nicht voll ausgeschöpft sind und der Strom an Forscher:innen, die neu in dieses Gebiet einsteigen und ML für ihre Forschung nutzen, noch lange nicht abreißen wird.
Philipp Marquetand, Jahrgang 1978, arbeitet am Institut für Theoretische Chemie, Fakultät für Chemie, Universität Wien. Zudem beteiligt er sich an der Vienna Research Platform on Accelerating Photoreaction Discovery, Universität Wien, und dem Research Network Data Science @UniVienna. Seine Forschungsgebiete sind maschinelles Lernen für theoretische Chemie, Ab-initio-Molekulardynamik und Simulation von Licht-Materie-Wechselwirkungen.
- 1 X. Yang, Y. Wang, R. Byrne, G. Schneider, S. Yang, Chem. Rev. 2019, 119, 10520
- 2 H. Mai, T. C. Le, D. Chen, D. A. Winkler, R. A. Caruso, Chem. Rev. 2022, doi: 10.1021/acs.chemrev.2c00061
- 3 J. Westermayr, P. Marquetand, Chem. Rev. 2021, 121, 9873
- 4 P. O. Dral, M. Barbatti, Nat. Rev. Chem. 2021, 5, 388
- 5 J. Li, S. A. Lopez, Acc. Chem. Res. 2022, 55, 1972
- 6 L. González, R. Lindh, Quantum Chemistry and Dynamics of Excited States, Wiley-VCH 2020
- 7 Y. Guan, C. Xie, D. R. Yarkony, H. Guo, Phys. Chem. Chem. Phys. 2021, 23, 24962
- 8 J. Westermayr, P. Marquetand, Mach. Learn. Sci. Technol. 2020, 1, 043001
- 9 V. . Kapil, M. Rossi, O. Marsalek et al., Comput. Phys. Commun. 2019, 236, 214
- 10 N. Ananth, Annu. Rev. Phys. Chem. 2022, 73, 299
- 11 J. Westermayr, M. Gastegger, M.F. S. J. Menger et al., Chem. Sci. 2019, 10, 8100
- 12 J. Westermayr, M. Gastegger, P. Marquetand, J. Phys. Chem. Lett. 2020, 11, 3828
- 13 M. M. Reiner, B. Bachmair, M. X. Tiefenbacher et al., ArXiv:2208.00686, 2022
- 14 J. Westermayr, M. Gastegger, D. Vörös et al., Nat. Chem. 2022, 14, 914
- 15 D. Townsend, S. A. Lahankar, S. K. Lee et al., Science 2004, 306, 1158
Überprüfung Ihres Anmeldestatus ...
Wenn Sie ein registrierter Benutzer sind, zeigen wir in Kürze den vollständigen Artikel.