Вештачка интелигенција тренирана на стари научни статии дојде до откритија кои луѓето ги промашиле

Врз основа на јазикот на милиони постари научни текстови, алгоритам за машинско учење успеа да направи сосема нови научни откритија.

Во студија објавена во списанието Nature од 3 јули, истражувачи од Националната лабораторија Лоренс Беркли користеле алгоритам наречен Word2Vec, чија задача била да обработува постари научни текстови и да бара врски кои луѓето ги пропуштиле. Откако ја завршил работата, алгоритамот исфрлил предвидување за квалитетни термоелектрични материјали, кои претвораат топлина во енергија и можат да бидат применливи и за греење, и за ладење. Но со оглед на тоа што тој бил хранет со податоци од статии објавени пред 2009, излегува дека предвидувањето го направил четири години пред тие материјали навистина да станат достапни, во 2012.

Алгоритамот притоа не ја знаел дефиницијата на „термоелектрично“. Не добил никаква обука за наука за материјали. Користејќи само вербални асоцијации, тој можел да одреди кои кандидати би биле соодветни како идни термоелектрични материјали, при што некои од нив би биле и подобри од оние кои ги користиме денес.

Предноста на вештачката интелигенција пред обичниот човечки читател е што не само што ги минува поединечните текстови, туку воспоставува и врски помеѓу различните дисциплини, помеѓу наоди од една област со некои во друга. За да го обучат спомнатиот алгоритам истражувачите зеле предвид 3.3 милиони апстракти поврзани со науката за материјали, односно речник од околу 500.000 зборови.

Само врз основа на нив, тој  можел да разбере концепти како периодичен систем и хемиска структура на молекули. Групирал зборови кои често се наоѓале едни до други, на тој начин создавајќи вектори на поврзани термини кои помагаат во дефинирање концепти. Во некои случаи, зборовите биле поврзани со термоелектричните концепти, но никогаш не биле третирани така во апстрактите кои биле земени предвид. Овој јаз во знаењето е тешко забележлив за човечко око, но лесно воочлив за алгоритамско.

Секако, алгоритамот не мора да се однесува само на наука за материјали. Бидејќи не се тренира на специфичен сет на научни податоци, тој може лесно да се применува и во други дисциплини. Работи без надзор и си гради свои врски, па оттаму може да се користи и за медицински истражувања или за откривање нови лекови. Информациите се таму некаде - само не сме ги направиле соодветните врски, затоа што никој не може да ги прочита сите статии на овој свет, дури ни во најтесна област.