Тајно ја описменувале ВИ со милиони украдени книги

Судски документи од тужби за нарушување авторски права откриваат како информатичките гиганти од Силициумската долина ги граделе јазичните модели со вештачка интелигенција. За да не ги повредат авторските права, тајно ги купувале сите книги што можеле, ги скенирале и потоа ги фрлале, за да ги обучат машините да се изразуваат со стил. 

Стартапот за вештачка интелигенција Антропик при крајот на 2024 година тајно го почнал проектот „Панама“. Во рок од околу една година компанијата потрошила десетици милиони долари за да купи милиони книги, кои биле растурени на страници и скенирани, за да се полнат со содржина моделите со ВИ.

Проектот Панама е наш обид деструктивно да ги скенираме сите книги во светот. Не сакаме да се знае дека работиме на ова пишува во интерен документ претставен во судска постапка. 

Антропик, чија вредност денес е проценета на 183 милијарди долари, во август платила отштета од 1,5 милијарди долари за да затвори бран тужби за прекршување авторски права, поднесени од од автори, уметници, фотографи и новински куќи. Окружниот судија што го водел процесот минатата недела дозволил да бидат откриени повеќето документи од тужбите. Конечниот број на скенирани книги и нивната цена се зацрнети, но во еден документ пишува дека Антропик бара да ангажира „искусен соработник заради скенирање на меѓу 500.000 и 2 милиони книги во период од шест месеци“.

Слични документи обелоденети од други судски процеси укажуваат дека Антропик, Мета, Гугл и Опен АИ воделе тајна трка за да комплетираат „собрани дела на човештвото“. Книгите биле главната цел. Мета во 2024 година го опишала пристапот до дигитална ризница книги како „суштински“ за да биде конкурентна во бизнисот на ВИ.

Обуката со книги може да ги научи моделите со ВИ како да се изразуваат квалитетно, наместо да го имитираат комуницирањето по интернет „со низок квалитет“, напишал еден од основачите на Антропик во јануари 2023 година.

Ретко кој во Силициумската долина побарал директна дозвола од авторите и издавачите за да ги користи нивните дела. Вработени во Мета во неколку интерни пораки изразиле загриженост дека преземањето милиони книги без дозвола би го прекршило законот за авторски права. Документ од Антропик сведочи дека коосновачот Бен Ман во јуни 2021 година за 11 дена лично симнал збирка на фикција и документаристика од сомнителната онлајн библиотека LibGen. 

Новите откритија укажуваат дека компаниите за ВИ им должат на авторите многу повеќе отколку што досега им платиле. Потребно е итно да се ресетира индустријата и креативците треба да бидат фер платени за виталните придонеси што ги даваат, изјави Ед Њутн-Рекс, музички композитор кој сега води организација за заштита на авторски права.

Повеќето од судските процеси сè уште се во тек. Во две рани пресуди, судиите пресудија во полза на ИТ компаниите. Во јуни, окружен судија пресуди дека Антропик има право да користи книги за обука на модели со ВИ, бидејќи тие го обработуваат материјалот „како наставници што учат деца да пишуваат добро“. Набрзо потоа друг окружен судија во случај против Мета пресуди дека авторите не успеале да докажат дека моделите со ВИ можат да ја нарушат продажбата на нивните книги.

Но, Антропик ќе го изгубел процесот што во август го затвори со вонсудска спогодба за отштета од 1,5 милијарда долари. Авторите во групната тужба ќе добијат по околу 3.000 долари за секое дело.

28 јануари 2026 - 13:00