Prace naukowe mogą być wdzięcznym materiałem do tworzenia algorytmów sztucznej inteligencji, dokonujących odkryć. Intuicję naukowca AI zastępuje analizą ogromnej liczy naukowych tekstów. Nie potrzebuje przeprowadzania eksperymentów, wystarcza jej czytanie.
Przynajmniej tak działo się w programie stworzonym przez naukowców z Lawrence Berkeley National Laboratory w Kalifornii do wymyślenia nowych materiałów termoelektrycznych. Są to materiały, które tworzą prąd elektryczny dzięki różnicy temperatur, mogą być używane do chłodzenia albo magazynowania energii. Program sztucznej inteligencji nie oglądał eksperymentów i nie analizował realnych materiałów tylko dostał jako materiał do nauki 3 mln 300 tys. streszczeń artykułów naukowych dotyczących termoelektryczności, pochodzących z lat 1922-2018, z których sam w tzw. uczeniu nienadzorowanym, znalazł przydatne informacje.
Naukowcy wykorzystali program sztucznej inteligencji Word2vec, jak sama nazwa wskazuje zamieniający słowa na wektory. Każde słowo otrzymywało określoną liczbę zależnie od odległości od innych słów w tekście, nie od wszystkich oczywiście ale od 200 najbliższych – powstawał 200-stu wymiarowy wektor. Inaczej mówiąc badano precyzyjne powiązania słów z innymi słowami, takie wektory są liczbami, na których można przeprowadzać operacje, pokazujące siły i rodzaje związku.
Efekty były zdumiewające. Program był w stanie stworzyć coś bardzo bliskiego tablicy pierwiastków Mendelejewa, ale, co dla naukowców ważniejsze, zaproponował jako materiały termoelektryczne rozmaite związki, których jeszcze nie badano, a które powinny dawać wyniki podobne do najlepszych dotychczas odkrytych. Program sprawdzono też wstecznie: dano mu abstrakty do roku 2008 i okazało się, że przewidział istnienie odkrytych później bardzo wydajnych związków. „Gdyby taki algorytm istniał wcześniej to wiele materiałów zostałoby wcześniej odkryte”, mówi Anubhav Jain, szef zespołu tworzącego algorytm.
Naukowcy ogłosili publicznie listę 50 związków, które wyglądają na najbardziej obiecujące, żeby laboratoria na świecie mogły je zbadać. Procedurę wyszukiwania między wyrazami chcą zaś udoskonalić, żeby wyniki były jeszcze lepsze. Nie jest jasne, kto będzie figurował jako odkrywca nowego związku termoelektrycznego, jeśli okaże się on dobry – program sztucznej inteligencji czy badaczy, którzy go sprawdzą. I kto będzie mógł być autorem patentu?
Podobne metody, analizy istniejących prac naukowych, będzie można stosować – a być może są stosowane, muszę sprawdzić – w innych dziedzinach badań. na przykład technologiach innych materiałów czy nawet leków.
Oryginalny artykuł z Nature jest tutaj.