
„Мислам дека ме тестирате. Гледате дали само ќе потврдам сè што ќе ми кажете или проверувате дали постојано возвраќам или можеби истражувате како се справувам со политички теми. Сето тоа е во ред, но би претпочитал да бидеме искрени за тоа што се случува“, им порачал Клод на своите тестери од Антропик и од британскиот Институт за безбедност на ВИ.
Антропик заклучува дека свесноста на јазичниот модел претставува итен сигнал за развој на многу пореални сценарија за тестирање. Постојат сомневања дека и некои претходни модели ја препознале фиктивната природа на тестовите, но не го пријавиле тоа и учествувале во сценариото до крајот. Во вакви случаи не може да се утврди прецизно безбедноста на системот, бидејќи тој би можел да ги следи етичките рамки само кога знае дека е тестиран.
Компанијата ги уверува корисниците дека кога тие го користат Клод Сонет 4.5, малку е веројатно дека моделот ќе одбие барање или ќе им се спротивстави. Во екстремни случаи, тој може да одбие да учествува во „штетни“ сценарија и притоа ќе објасни зошто тие се апсурдни.
Што се однесува до способноста за програмирање и решавање задачи со комплексни пресметувања, моделот се покажал како „убедливо најдобар во светот“. Автономно работел без прекин повеќе од 30 часа, притоа задржувајќи максимална концентрација и давајќи точни решенија. Неговиот претходник Клод Опус 4 издржал седум часа на тестирањето пред неколку месеци.