Пред месец дена објавивме Press Release за анализата која ја направивме на Панама документите користејќи ја нашата технологија, каде што најдовме интересни податоци. На пример, со нашата технологија можевме да најдеме дека спортисти (повеќе од 20%), а не политичари се најголемата група која има Оф-шор фирми во Панама. Потоа следат уметници, а трети се политичари. Помеѓу спортистите, фудбалерите се тие што се најмногу инволвирани во бизнисот на избегнување даноци. Потоа следат кошаркари (околу 10%), хокеј играчи и одбојкари на трето место (5%).
Драган Милчевски
Во април оваа година, повеќе од стотици весници, телевизии и онлајн медиуми објавија нови податоци за избегнување и затајување данок. Податоците беа базирани на “Панама Пејпрс”, колекција која содржи 11.5 милиони документи компресирани во 2.6 терабајти. Документите беа обелоденети во Зидојчецајтунг во 2015, каде интернационална група на новинари ги прегледуваше и евалуираше речиси една година. Сега, истражувачи од Ambiverse, старт-апод Макс-Планк Институтот по Информатика во Саарбрикен Германија, ги анализираа податоците со интелегентен софтер, и тоа за неколку саати, добивајќи нови резултати. Софтверот има за цел да им помонгне на компаниите во автоматско аланизирање на големи количини на текстуални податоци.
Додека меѓународната група на новинари ги анализираше Панама документите во длабочина, фокусирајќи се на луѓе како Наваз Шариф, премиер на Пакистан, или Петро Порошенко, претседател на Украина, младите претприемачи се решија да го искористат нивниот софтвер за еден поширок пристап. На пример, тие открија дека спортистите, а не политичарите, се најголема група на лица вклучени во целата афера. Според нив, спортистите сочинуваат повеќе од 20% од сите личности идентификувани од страна на софтверот, следени од уметниците, а дури на трето место доаѓаат политичарите.
Способноста на софтверот автоматски да ги категоризира лицата, придонесе кон поинаков увид во аферата. Ambiverse оваа анализа ја има направено уште во јуни 2016 и резултатите ги има објавено овде и овде. Помеѓу спортистите, фудбалерите се тие кои што се најмногу инволвирани во стратегиите за избегнување и затајување на данок (околу 20%). На второ место се тенисерите и кошаркарите (околу 10%); хокеарите и одбојкарите се на трето место (околу 5%). Интересен податок во врска со политичарите: политичката иделологија не влијаела врз нивната одлука да отворат офшор семтки. Конзервативните и социјалистичките политичари се подеднакво застапени во Панама документите.
“Жално е што ние можевме да работиме само на податоците објавени и веќе подготвени од страна на Меѓународниот конзорциум на истражувачки новинари. Нашиот систем не само што е способен да се справи со базични-податоци (raw data), туку во тој случај би добил и подобри резултати”, објаснува Јоханес Хофарт, чиј докторат на Саарланд Универзитетот е основа на оваа технологија. Тој пред една година, заедно со уште четворица други истражувачи од Макс-Планк Институтот по Информатика, ја основаат компанијата Ambiverse, за да ја понудат истата технологијата на пазарот.
Еден од основачите на фирмата е и Драган Милчевски, Македонец, кој факултет завршил на Природно Математичкиот факултет во Скопје, за потоа да го продолжи школувањето токму на Саарланд Универзитетот. Тој таму пред две години ги заврши постдипломските студии на насоката компјутерски науки.
Како што сервисите за вести мора да имаат армија на аналитичари кои ги анализираат и евалуираат јавно достапните текстови, бизнисите можат да го сторат истото со нивните документи, и тоа за неколку минути со технологијата од Ambiverse.
Софтерот е толку моќен, бидејќи, меѓу другото, не пребарува само по клучни зборови. Наместо тоа, на пример, пребарувањето за “Ангела Меркел” наоѓа текстови во кои канцеларката е спомната како “Енџи” или како “шеф на ЦДУ”. Во исто време, софтверот не ги зема во обзир документите кои се однесуваат на добро познатиот фудбалски тренер од германија со исто презиме, Макс Меркел. Така, бизнисите може да најдат луѓе, локации, и продукти во големи количества на текст, дури и кога пребарувањето е отежнато од двосмисленоста на термините или кратенките.
Пребарувањето по категории дури овозможува да се пребарува за “финансиски компании” или “фудбалери” без да мора тие да се специфицираат подетално. Покрај тоа, софтверот може да се користи не само за текстови на германски и англиски, но, исто така и за текстови на шпански и кинески (Според Драган, македонски би можел релативно лесно да се додаде во оваа група). Ова е овозможено од страна на така наречената “база на знаење” (knowledge base), развиена на Макс-Планк Институтот по Информатика, чија што содржина е развиена делумно со помош на онлајн енциклопедијата Википедија. Пред неколку месеци, основачите на Ambivese победија на транс-регионалниот натпревар за бизнис планови, “1,2,3, GO”.
Извор: http://www.mmci.uni-saarland.de/en/news/article/?article_id=302
Линк до фирмата: https://www.ambiverse.com/