Туринговиот тест е дело на Алан Туринг, и според него ВИ треба да се смета за вистински интелигентна ако луѓе не можат да погодат дали зборуваат со човек или со машина.
Според авторот на истражувањето успехот на Чатгпт „многу повеќе зборува за Туринговиот тест отколку за интелигенцијата кај модерната ВИ.“
Во спроведувањето на тестот, истражувачите побарале од 500 учесници да зборуваат со четворица различни агенти: три ВИ и еден човек. ВИ биле Чатгпт 4, Чатгпт 3,5 и ЕЛИЗА програмата за чатување од 1960-те.
Откако разговарале со некој од агентите, на учесниците им била дадена 5-минута пауза пред да одговорат дали зборувале со компјутер или со човек, зошто мислат така и колку се сигурни во својот одговор.
ЕЛИЗА успеала да ги излаже соговорниците од 22% од случаите, Чатгпт 3.5 во 50%, а 4-ката во 54%. Ако бројките на 4-ката ви изгледаат ниски, треба да имате предвид дека човекот само во 67% од случаите минал како човек.
Учесниците објасниле дека нивните одговори и идентификување многу повеќе зависеле од стилот, ликот и тонот на одговорите, отколку од интелигенција.
„Исто така една од најуспешните стратегии за идентификување на роботи е да ги прашаш за нивните човечки искуства, што успеало во 75% од времето.
Ова покажува дека Туринговиот тест не докажува дека системот е интелигентен, туку ја мери неговата способност да ископира или излаже човек.
Во најдобар случај, истражувачите порачуваат дека ова сепак дава поддршка на тврдењето дека Чатгпт е интелигентен,“ пишува Дејли меил.