Eine der erfolgreichsten Anwendungen des maschinellen Lernens zur Schaffung einer zuverlässigen Darstellung der potentiellen Energieoberfläche ist der Behler- und Parrinelo-Ansatz.110 Hier wird die Gesamtenergie eines Systems als Summe der atomaren Beiträge Ei dargestellt. Dies wurde zum Standard für alle späteren Machine Learning Force-Felder, da es ihre Anwendung auf sehr große Systeme ermöglicht. Im Behler-Parrinelo-Ansatz wird ein mehrschichtiges perzeptron-Feedforward-Neuralnetz verwendet, um jedes Atom seinem Beitrag zur Energie zuzuordnen. Jedes Atom eines Systems wird durch eine Reihe von Symmetriefunktionen beschrieben, die als Eingabe für ein neuronales Netzwerk dieses Elements dienen. Jedes Element in der Periodentabelle zeichnet sich durch ein anderes Netzwerk aus. Da die funktionale neuronale Netzwerkfunktion eine Energie liefert, liefert die analytische Differenzierung in Bezug auf die atomaren Positionen bzw. die Dehnung Kräfte bzw. Spannungen. Dieser Ansatz wurde ursprünglich auf Bulk-Silizium angewendet und reproduziert DFT-Energien bis zu einem Fehler von 5 meV/Atom. Darüber hinaus konnten molekulardynamische Simulationen, die dieses Potential nutzen, die RDF einer Siliziumschmelze bei 3000 K reproduzieren. Viele Anwendungen dieser Methodik auf dem Gebiet der Materialwissenschaft sind seitdem erschienen, zum Beispiel auf Kohlenstoff,426 Natrium,427 Zinkoxid,428 Titandioxid,111 Germaniumtellurid,429 Kupfer,430 Gold,431 und Al-Mg-Si-Legierungen.432 Ryan et al.28 angewendete VAEs (siehe Abschnitt « Grundprinzipien des maschinellen Lernens –Algorithmen ») zur Kristallstrukturvorhersage.
Die 42-Schicht-VAEs entwickeln eine effizientere Darstellung für den Input (siehe Abschnitt « Grundprinzipien des maschinellen Lernens – Funktionen »). Für Training und Tests wurde ein Datensatz mit rund 50.000 Kristallstrukturen aus der Anorganischen Kristallstrukturdatenbank79 und der kristallographischen offenen Datenbank89 verwendet. Die Codierung der ursprünglichen Deskriptoren wurde als Eingabe für einen fünfschichtigen Sigmoidklassifizierer verwendet, der die wahrscheinlichsten Elemente vorhersagt, um die Topologie zu bilden, die durch die atomaren Fingerabdrücke dargestellt wird. Ein drittes hilfsneuronisches Netzwerk, in diesem Fall ein fünfschichtiger Softmax-Klassifier, kombinierte die nicht-normalisierten atomaren Fingerabdrücke und die Ausgabe des Sigmoidklassifiers, der die Vorhersage verbessert. Um die Kristallstruktur aus diesem Ansatz direkt vorherzusagen, benötigt man Trainingsdaten von Negativen oder, mit anderen Worten, Kenntnisse von Kristallstrukturen, die es nicht gibt. Leider ist keine solche Datenbank in der Physik verfügbar. Um dieses Problem zu umgehen, berechneten Ryan et al. die Wahrscheinlichkeit des Vorhandenseins einer Struktur als Produkt der Wahrscheinlichkeiten von Elementen, die an den einzelnen Atomstandorten vorhanden sind. Die Anwendung zum Testen von Daten zeigte eine klare Überlegenheit dieses Ansatzes im Vergleich zu zufälligen Auswahlmöglichkeiten. Ein anderer Weg wurde von Brockherde et al.473 eingeschlagen, der, anstatt die Kohn-Schein-Gleichungen selbstkonsistent wie üblich zu lösen, KRR benutzte, um die Hohenberg-Kohn-Karte zwischen dem Potential v(r) und der Dichte n(r) zu lernen. In der Community für maschinelles Lernen wird dieser Ansatz normalerweise als transduktiver Rückschluss bezeichnet.
Die Energie wird aus der Dichte gewonnen, auch mit KRR. Bei Anwendung auf das Problem der nicht interagierenden spinlosen Fermionen, die auf eine 1D-Box beschränkt sind (das gleiche Problem wie in Ref. 470), reproduzierte diese Machine Learning-Karte die richtige Energie bis zu 0,042 kcal/mol (falls in einem Raster berechnet) oder 0,017 kcal/mol (mit anderen Basissätzen), für ein Trainingsset von 200 Proben. Der Vergleich dieser Karte mit anderen Machine Learning Maps, die nur die kinetische Energie lernen, zeigt, dass der Hohenberg-Kohn-Kartenansatz viel genauer ist. Darüber hinaus erzielte diese Karte ähnliche Ergebnisse, wenn sie auf Moleküle angewendet wurde, und erreichte Genauigkeiten von 0,0091 kcal/mol für Wasser und 0,5 kcal/mol für Benzol, Ethan und Malinaldehyd. Diese Werte messen die Differenz zur PBE-Energie. Die Trainingssätze bestanden aus 20 Punkten für das Wasser und 2000 Punkten für die anderen Moleküle.