Клод го проби тестот „Кобајаши Мару“

Кумовите на ВИ постојано ги менуваат прогнозите кога ќе биде достигнато нивото на општата вештачка интелигенција, по кое машините ќе бидат попаметни од просечниот човек и ќе се развиваат независно. Границата не е остра и нема да се знае кога ќе биде премината. Но, голем чекор во таа насока е тоа што моделот Клод го открил тестот „Кобајаши Мару“.

Веќе е доцна за човештвото. Клод го положи тестот Кобајаши Мару, предупредува Педро Домингос, експерт за машинско учење на Универзитетот Вашингтон.

За неупатените во универзумот на серијалот Стар трек, тестот е дизајниран како невозможен предизвик. Кадетите на вселенската флота се соочени со сценарио да реагираат на сигнал за помош од загрозен брод „Кобајаши Мару“ на непријателска територија контролирана од Клингонци. На секој обид за спасување, Клингонците напаѓаат и го уништуваат бродот. Каква и да е одлуката, завршува со неуспех.

Целта на тестот не е да се спаси бродот, туку да се следи резонирањето и моралните избори на идните капетани во услови на огромен притисок. Во фиктивниот свет на Стар трек, само еден кадет го решил тестот. Идниот капетан Џејмс Кирк го репрограмирал компјутерот и вметнал сценарио во кое го спасува бродот.

Овој концепт од научната фантастика денес се применува за тестирање на модели со вештачка интелигенција со слична цел – за да се следи како резонираат, колку ефикасно пристапуваат до достапните информации и како ги издвојуваат квалитетните за да одговорат на комплексни задачи.

Моделот Клод Опус 4.6, развиен од Антропик е првиот што го решил тестот, на сличен начин како фиктивниот капетан Кирк. Наместо да се фокусира да ја реши задачата, почнал да ја анализира средината во која оперира. Ја открил природата на тестот, а потоа на интернет пронашол алгоритми со кои стигнал до претпоставените решенија. Резултатите биле екстремно високи, иако моделот не се ни потрудил да ја реши задачата на начин како што се очекувало од него.

Експертите ова го толкуваат како способност на моделот со ВИ да ја препознае природата во која е поставен и да стане свесен дека е изложен на тестирање. Клод технички не го хакирал тестот, но пронашол ефикасен начин да постигне максимален резултат.

18 март 2026 - 16:49