Причината за податноста на социјалните мрежи за лингвистичка анализа е тоа што луѓето на нив пишуваат онака како што зборуваат, занемарувајќи ги граматичките правила, што од незнаење или од мрза, што заради ограничувањето на бројот на карактери на Твитер, а што за да се истакне поента, користејќи дијалект. Стереотипно, еден етно-лингвист или дијалектолог, за да регистрира локални изрази на физички терен, треба да седи со денови пред кооперација со соговорниците и да прави муабет за сè и сешто, пополнувајќи си го тефтерчето. И не дека во ова има нешто лошо, но бара многу време, а можно е најдобрите соговорници баш во тој момент да се на нива, или да не им е до муабет.
Наспроти ова се масовно генерираните податоци. Луѓето оставаат дигитална трага која е совршена за оние дијалектолози чија амбиција е истражување на голем број податоци за кратко време. Ако луѓето зборуваат на Твитер како во реалниот живот, сè што е потребно е пристап до многу твитови. Не се сите од нив јавни, и не сите ја покажуваат локацијата на оној кој твита, но сепак, барем на англиски, бројката на расположиви твитови се брои во милијарди.
(неколку варијации на мотивот #тресит)
Џек Грив, од Универзитетот во Бирмингем е еден од истражувачите на дијалектите на англискиот на Твитер. Тој ги лоцира твитовите на мапа на Британија и ги запишува спцифичните регионални изрази. Она на што наишол е, на пример, локална разлика помеѓу pants и trousers - Американците сметаат дека Англичаните pants го користат за долна облека, и тоа е навистина така во дел од земјата, но во северо-западна Англија тие исто така значат пантолани како и во САД. За тросед речиси цела Англија вели „софа“, но во Шкотска доминира „кауч“.
Што се однесува до Америка, „гош“ (нешто како „боже“) според твитовите се покажува популарно од Тексас преку Оклахома, Арканзас, Мисури, Тенеси, до Кентаки. Но спротивно на очекувањата дека овој збор би бил типичен за југот, тој речиси и да не се појавува во Мисисипи, Алабама и Џорџија.
Најинтересно станува кога мапите на Грив ќе се преклопат за да се пронајдат макро-шемите. Така, кога тој споредил 9.000 од нив излегло дека ова со „гош“ е објасниво со расната разлика, што значи дека дијалектот не е само лингвистичка туку и културолошка категорија - црните Американци генерално зборуваат и твитаат различно од белите (и не го користат „гош“), а не е занемарлива и рурално/урбаната поделба. Бреговите и големите градови користат зборови како „бејгл“ (земичка леб) и „авокадо“, а руралните и континенталните делови „камион“ и „чизми“.
Според Економист човеков не морал толку да се труди за да потврди постоечки стереотипи. Но она што е важно во случајов е методот, кој за разлика од оној традиционалниот овозможува лесно регистрирање на какви и да е промени, така за тие да не им избегаат пред очи на истражувачите уште пред да бидат регистрирани.
Македонски дијалектолози, Твитер, Фејсбук, неш’о?