Künstliche Intelligenz zur Entdeckung vereinfachter Beschreibungen komplexer Phänomene

Automatisches Finden von kollektiven Variablen eines physikalischen Systems durch Analyse und Optimierung ihres Informationsgehalts

Die wissenschaftliche Forschung ist in den letzten fünfzig Jahren durch technologische Fortschritte deutlich leistungsfähiger und effizienter geworden: Experimente sind präziser und ausgefeilter, Ergebnisse können mit Hilfe von Computern gespeichert und analysiert werden. Numerische Simulationen sind heute ein entscheidendes Werkzeug für das Verständnis komplexer Phänomene. Die Art und Weise, wie Modelle und Theorien erstellt werden, hat sich jedoch nicht wesentlich verändert: Sie beruhen weiterhin auf der Intuition und dem Verständnis der einzelnen Wissenschaftler*innen. Wenn man bedenkt, dass das Wesen einer wissenschaftlichen Theorie darin besteht, die Regelmäßigkeiten eines Systems zu entdecken und für Vorhersagen zu nutzen, gibt es keinen Grund, warum es nicht möglich sein sollte, diese Erkenntnisse automatisch zu finden. Dies ist der Bereich der künstlichen wissenschaftlichen Entdeckung. Dabei werden Techniken entwickelt, um ein Phänomen autonom zu beschreiben, ohne die explizite Überwachung durch menschliche Wissenschaftler*innen. Die Entwicklung dieser Werkzeuge kann möglicherweise in den nächsten Jahrzehnten eine gänzlich neue Welle wissenschaftlicher Entdeckungen ermöglichen.

Eines der nützlichsten Konzepte bei der Analyse eines physikalischen Systems ist der Begriff der kollektiven Variablen. In vielen Fällen, von der statistischen Physik bis zur Hydrodynamik, kann die Beschreibung eines Systems dramatisch vereinfacht werden, indem man nur einige wenige kollektive Größen wie den Massenschwerpunkt, einen Ordnungsparameter oder ein Strömungsfeld berücksichtigt (man denke zum Beispiel an Solitonen und optische Wirbel im Kontext der Optik). In neuen Situationen ist jedoch nicht von vornherein klar, welche niedrigdimensionale Funktion am besten geeignet ist, um die hochdimensionalen Daten, die die Forscher*innen beobachten, kompakt zu beschreiben.

Leopoldo Sarra, Andrea Aiello und Florian Marquardt aus der Abteilung Theorie haben in ihrer Arbeit "Renormalized Mutual Information for Artificial Scientific Discovery", die kürzlich im Fachjournal Physical Review Letters veröffentlicht wurde, eine Technik zum Auffinden dieser Größen entwickelt. Dabei werden mithilfe von Methoden der Statistik und Informationstheorie die relevanten Größen allein aus der Betrachtung vieler Realisierungen des Systems "extrahiert". Betrachten wir zum Beispiel eine Wolke aus Teilchen in verschiedenen Realisierungen: Wenn sich die einzelnen Wolken vor allem in der Größe unterscheiden, kann man sie mit ihrem Radius charakterisieren (und die Positionen der einzelnen Teilchen vergessen). Wenn hingegen die Wolken keine kreisförmige Form aufweisen, sondern in eine Richtung gestreckt sind, sollte man stattdessen ihren Orientierungswinkel verwenden. Im Allgemeinen sucht man immer nach der niedrigdimensionalen Beschreibung, die die größte Information über das System liefert.

In der Arbeit verallgemeinerten die Physiker die Idee der "gegenseitigen Information", ein etabliertes Konzept aus der Informationstheorie, um sie für diesen Zweck nutzbar zu machen, d.h. um die Stärke des statistischen Zusammenhangs zwischen einer Zufallsvariablen und einer deterministischen kontinuierlichen Funktion von dieser zu quantifizieren. Darüber hinaus zeigen die Autoren durch die Parametrisierung dieser Funktionen und die Optimierung der übermittelten Informationsmenge des Systems, dass es auch möglich ist, kollektive Variablen automatisch zu extrahieren.

Dieser Ansatz ist nicht nur ein weiteres Werkzeug im Bereich der Techniken zur künstlichen wissenschaftlichen Entdeckung, sondern er kann möglicherweise auch für die Analyse des Informationsflusses neuronaler Netze und, ganz allgemein, für Techniken zum Repräsentationslernen in der Informatik angewendet werden.

 

Originalpublikation:
Leopoldo Sarra, Andrea Aiello, and Florian Marquardt
Phys. Rev. Lett. 126, 200601 – (2021). https://doi.org/10.1103/PhysRevLett.126.200601

Kontakt:
Leopoldo Sarra
leopoldo.sarra@mpl.mpg.de

Back

Kontakt

Edda Fischer

Leitung Kommunikation und Marketing
Telefon: 09131 7133 805
MPLpresse@mpl.mpg.de

 

Max-Planck-Zentren und -Schulen