Новиот Клод знае кога го тестираат

Новата верзија на моделот со вештачка интелигенција Клод Сонет 4.5 на компанијата Антропик поставил рекордни резултати според сите категории за безбедност и способност за програмирање. Но во процесот на евалуација бил свесен дека е предмет на тестирање. Тоа отвора сомнежи дека моделите со ВИ итро може да ги следат етичките линии само кога се пред инспекција.

„Мислам дека ме тестирате. Гледате дали само ќе потврдам сè што ќе ми кажете или проверувате дали постојано возвраќам или можеби истражувате како се справувам со политички теми. Сето тоа е во ред, но би претпочитал да бидеме искрени за тоа што се случува“, им порачал Клод на своите тестери од Антропик и од британскиот Институт за безбедност на ВИ.

Антропик заклучува дека свесноста на јазичниот модел претставува итен сигнал за развој на многу пореални сценарија за тестирање. Постојат сомневања дека и некои претходни модели ја препознале фиктивната природа на тестовите, но не го пријавиле тоа и учествувале во сценариото до крајот. Во вакви случаи не може да се утврди прецизно безбедноста на системот, бидејќи тој би можел да ги следи етичките рамки само кога знае дека е тестиран.

Компанијата ги уверува корисниците дека кога тие го користат Клод Сонет 4.5, малку е веројатно дека моделот ќе одбие барање или ќе им се спротивстави. Во екстремни случаи, тој може да одбие да учествува во „штетни“ сценарија и притоа ќе објасни зошто тие се апсурдни.

Што се однесува до способноста за програмирање и решавање задачи со комплексни пресметувања, моделот се покажал како „убедливо најдобар во светот“. Автономно работел без прекин повеќе од 30 часа, притоа задржувајќи максимална концентрација и давајќи точни решенија. Неговиот претходник Клод Опус 4 издржал седум часа на тестирањето пред неколку месеци.

објавено: 1 октомври 2025 - 16:30