Тину-нину, тину-нину

Гугл транслејт и апокалиптичните верски пророштва

Додека не беа обелоденети, некои комбинации на зборови на Гугл транслејт во „преводи“ даваа резултати кои делуваат ко извадени од некоја света книга. Што е работата со алгоритмиве?

„Апокалипсата ќе се случи во три минути до полноќ. Во светот ќе се појават ликови и драматични настани, што ќе покаже дека се приближува крајот на светот и враќањето на Исус“.

Ова е пораката која до скоро се појавуваше по куцањето деветнаесет пати на dog во Гугл транслејт и негов превод од маорски на англиски. И ова е само еден од бизарните преводи кои почнаа да се обелоденуваат на тн. „Транслејт гејт“ на Редит. Сето тоа започнало кога некој постирал сведоштво за чудни преводи кои се добиени од сомалијски на англиски со алатката на Гугл. Но откако корисници на социјалните мрежи почнале да експериментираат со вметнување апсурдни комбинации зборови во преведувачот од разни јазици, за да ги преведат на англиски, се појавиле уште поморничави резултати.

Иако Гугл тврди дека никогаш не користи приватни преписки како материјал за преведувачките алгоритми, теоријата е дека ваквите необични преводи доаѓаат токму од содржини на приватни мејлови, муабети на чет и сајтови - всушност од секаков текст кој е на интернет, без оглед дали е јавен или приватен. Додуша има и поинакви теории - дека морничавите преводи се резултат на духови, или на „интелектуални демони“.

Откако сајтот Мадерборд се обратил до Гугл за објаснување на ваквиот феномен, сите пријавени преводи одеднаш магично исчезнале од Гугл транслејт. Според истиот има неколку објаснувања за нив. Можно е нив да ги вметнуваат незадоволни вработени во Гугл, или такви со необичен смисол за хумор. Можеби тоа е пак резултат на опцијата „сугерирај и уреди“ на самиот Гугл транслејт, кој овозможува предлози за подобри преводи на одреден текст. Но Александар Раш, професор на Харвард кој ги проучува процесирањето на прирдните јазици и компјутерскиот превод, вели дека воспоставените системи за заштита на квалитетот веројатно би ги фатиле ваквите манипулации. Поверојатно е дека е до промената во начинот на кој функционира Гугл транслејт направена пред некоја година, кога тој почнал да користи техника позната како „превод со помош на невронска машина“.

При ваквиот тип на превод, системот се обучува со помош на голем број текстови на еден јазик и кореспондирачки преводи на друг, за да создаде модел за прелевање помеѓу двата. Но кога во него ќе ставите нешто апсурдно, системот може да „исхалуцинира“ бизарни резултати. Голем број од нив ќе личат на човечки јазик, но нема да бидат воопшто поврзани со првичниот текст.

Исто така е важен податокот дека најчудните резултати се од јазици кои имаат помал обем на преведен текст отколку на пример англискиот или кинескиот (на пример сомалиски, хавајски, маорски). Можно е Гугл да користи религиски текстови, како на пример Светото писмо, кое е преведено на голем број јазици, како основа на тренирање на моделот за овие јазици. Оттаму и верската содржина на необичните резултати. И точно е - неколку бизарни преводи од сомалиски личат на одредени делови од Библијата (Ихсод 27:18, на пример).

И ќе мислевме дека сето ова можеби е зафрканција, да не се обидовме сами. Рендом осум пати „леле“ од српски на македонски, го дава следниов резултат. Па сега вие декодирајте кој е тој кој ќе биде (леле) оставен сам, и што тоа значи...