Algorithmus zieht aus Forschungsliteratur neues Wissen

Labor einer Forschungsstelle für Komplexchemie. — **Labor**
[Foto: Wittig; Hans-Günter Quaschinsky, Quelle: Bundesarchiv/ Wikimedia Commons, Lizenz: CC BY-SA 3.0 de]

Robert Züblin – 03.07.2019, 23:59 Uhr

Forschern war es mit Hilfe eines Algorithmus möglich, aus veröffentlichten wissenschaftlichen Texten neues Wissen zu schaffen.

Vorhersage von künftigen Entdeckungen

Die Wissenschaftler, von denen die meisten am Lawrence Berkeley National Laboratory (Berkeley Lab) arbeiten, haben einen Algorithmus namens Word2vec mit 3,3 Millionen Abstracts (Zusammenfassungen) von Texten aus dem Bereich der Materialwissenschaft gefüttert. Die Texte stammen aus mehr als 1000 Zeitschriften und wurden zwischen den Jahren 1922 und 2018 veröffentlicht.

Durch die Analyse, wie Wörter miteinander in Beziehung stehen, sei der Algorithmus in der Lage gewesen, thermoelektrische Materialien für funktionelle Anwendungen vorzuschlagen, die erst Jahre später entdeckt worden seien, wie es auf der Website des Berkeley Lab heißt.

„Dies deutet darauf hin, dass latentes Wissen über zukünftige Entdeckungen weitgehend in frühere Publikationen eingebettet ist“, schreiben die Wissenschaftler in der Fachzeitschrift „Nature„.

»Algorithmus lernt Periodensystem selbst

Das Nützliche an dem Algorithmus sei, dass er sehr große Textmengen bewältige. In jedem Forschungsbereich gebe es Forschungsliteratur aus 100 Jahren, wird einer der Mitautoren des „Nature“-Artikels, Vahe Tshitoyan, auf der Website des Berkeley Lab zitiert. „Ein Forscher kann nur auf einen Bruchteil davon zugreifen“, sagt Tshitoyan.

Anubhav Jain, ein anderer an dem Projekt beteiligter Wissenschaftler, berichtet auf der Seite des Berkeley Lab, dass der Algorithmus das Periodensystem und die Kristallstruktur von Metallen erlernt habe, ohne ihm vorher etwas über die Materialwissenschaft gesagt zu haben.

Algorithmus