На следнава слика од сајтот на Државна Изборна Комисија е дадено резиме на излезноста на изборите за Градоначалник низ целата Република
http://i46.tinypic.com/255ufzn.png
Како што може да се види, вкупно гласале 1.152.979 гласачи, а бројот на неважечки гласачки ливчиња е 39.767. Тоа одговара на просечна застапеност од 3.449% на неважечки ливчиња.
Од друга страна, на нареднава слика е дадено резиме на излезноста за Општина Центар:
http://i49.tinypic.com/2ij6yqf.png
Овде застапеноста на неважечки ливчиња изнесува 4.883%. Ова е поголема застапеност од просекот на Републиката. Тоа ме наведе да се запрашам дали ваквото отстапување е статистички значајно или може да се објасни како статистичка флуктуација во примерокот.
Ако претпоставиме дека распределбата на неважечки ливчиња во Општина Центар е биномна со просечна застапеност p = 0.003449 и вкупен број примероци N = 26.745, тогаш математичкото очекување <n> = N*p = 922,4, а стандардната девијација е σ = √(N*p*(1 – p)) = 29,843. Понатаму, за волку голема популација, биномната распределба може да се апроксимира со нормална распределба (http://en.wikipedia.org/wiki/Binomial_distribution#Normal_approximation), и она што е од интерес е т.н. "z-score" кој се пресметува како (кликни на линкот за да ја видиш формулата):
http://latex.codecogs.com/gif.latex?z%20%3D%20%5Cfrac%7Bn%20-%20%5Clang…
Вметнувајќи ги горните вредности (со n = 1.306 неважечки ливчиња во Општина Центар), добиваме z-score z = (1.306 – 922,4)/29,843 = 12,85!
Тоа значи дека отстапувањето на застапеноста на невежечки ливчиња во Општина Центар е скоро 13 стандардни девијации поголема отколку просекот на Републиката! Сè што е над 3 стандардни девијации се смета за статистички значајно! За споредба, критериумот за откритието на Хигсовиот Бозон беше отстапување од позадинскиот сигнал од 5 стандардни девијации за да се смета како откритие! Ова што го пресметавме претставува драстично поголемо отстапување и во никој случај не може да се препише на статистички флуктуации во примерокот.
Останува прашањето која е причината за вака големиот број неважечки ливчиња.
Се надевам дека ќе го објавиш писмово,
Загрижен и математички писмен граѓанин
-----------------------------------------------------
Пред да ни се претвори сајтов во ексел, само една уредничка напомена: првото писмо го објавивме без на памет да ни дојде да се задлабочуваме во формулите и цифрите. Ние сме од оние кои секогаш се ежеле од статистика, и како факултетески предмет и како адамов лист за разни срамотилаци. Но, темата ни изгледаше битна па го објавивме интегрално. Со истиот не-научен пристап го објавуваме и следното, малку кавгаџиско писмо (иако не очекувавме дека и за ова ќе се полемизира, мислевме егзактно све тоа). Еве го и него на промаја на јавноста. Плус, ги отвораме и коментарите па ако има и трети бројки - таму.
-----------------------------------------------------
Здраво Трендо,
Ќе ги замолам твоите МАТЕМАТИЧКИ ПИСМЕНИ ЧИТАТЕЛИ да ми пресметаат "z-score" за следниве резултати од минативе локални избори:
Избори за градоначалник на Општина БУТЕЛ
http://217.16.84.17/Results.aspx?RaceID=1&UnitID=11&IsPS=0&Turnout=0&La…
Процент на неважечки гласачки ливчиња 5,08 %
Избори за градоначалник на Општина РЕСЕН
http://217.16.84.17/Results.aspx?RaceID=1&UnitID=64&IsPS=0&Turnout=0&La…
Процент на неважечки гласачки ливчиња 2,61 %
Избори за градоначалник на Општина КИЧЕВО
http://217.16.84.17/Results.aspx?RaceID=1&UnitID=39&IsPS=0&Turnout=0&La…
Процент на неважечки гласачки ливчиња 1,37 %
Уште една задача. Во Боговиње излезност 46,88%, во Демир Хисар излезност 82,85%, а на ниво на држава 66,98%. Дали ова може да се објасни како статистичка флуктуација во примерокот? И колкав е тука "z-score"?
Ако човеков беше писмен, ќе знаеше дека избори не се случаен процес. Ако беа ќе и дадевме на Маријана да ни ги извлече градоначалниците и советниците во среда после лотото и немаше да се мачиме да гласаме.