Хапакс легоменон или „ќе го кажам ова само еднаш“

Термин од лингвистиката кој се однесува на збор или израз кој се појавува само еднаш во одреден контекст, „хапакс легоменон“ е интересен затоа што има обратна логика од вообичаената кога е во прашање проучување на зачестеноста. Во случајов „само еднаш“ го вклучува алармот за интересност.

Изразот „хапакс легоменон“, збор или израз кој се појавува само еднаш во одреден корпус, доаѓа од старогрчкиот - хапакс, што значи еднаш и легомемон, пасивна форма од „кажува“. Се мисли на нешто што е само еднаш кажано односно спомнато во дело или група дела на одреден автор, во археолошки наоди (на пример остатоците од записи на древните Маи), во верски списи како Светото писмо или Куранот, па дури и во цели книжевни корпуси на одреден јазик од конкретен период. 

Зошто единечната или ретката појава на одреден збор е важна? Ова се користи за докажување на авторство на текстови кога постои сомневање околу истото - постојаното појавување на хапакс легомена во едни, а нивно тотално отсуство во други, може да биде индикатор за тоа дека вторите не се од истиот автор. 

Втората причина е што ваквите зборови, токму поради својата реткост, често излегувале од употреба или биле маргинализирани. Притоа може да се работи за архаизми чие присуство останало за последен пат регистрирано во некое дело (и потоа се загубиле) или пак термини кои биле измислени од авторите. Еден од поинтересните е „хонорификабилитудинитатибус“, латински за „способност за постигнување почесни дела“, кој го изговара ликот Костард во првата сцена на „Со сила убавина не бидува“ на Шекспир, чии дела покажуваат голем обем на вакви, единечни зборови. 

Третиот аспект е што вметнувањето на ваков збор во цел корпус може да има симболичко значење - наместо најмала всушност да има најголема вредност која читателот треба да ја открие, но само ако е навистина внимателен и го забележи „црниот лебед“ помеѓу белите страници. За детектирање на хапакс легомена помагаат и соодветни софтвери за обработка на текст. Сепак, повообичаена постапка при компјутерска обработка на големи корпуси е ваквите зборови просто да се игнорираат, а предност да им се даде на статистички порелевантните, со што се губат скапоцени информации. 

Вакви примери има и кај Дикенс, како „сасигасити“, со веројатно значење на храброст) или „индекси“ во „Дракула“ на Брам Стокер, кој е искористен како придавка со нејасно значење: „Ако тој беше обичен лудак ќе ризикував да му верувам; но тој изгледа толку замешан со грофот на индексен [веројатно затскриен] начин што се плашам да му помогнам“.  

Со оваа тема е поврзан тн. „Гуглвак“ (Googlewhack), натпревар во Гугл пребарување кое враќа само еден резултат. Но вообичаено победите се краткотрајни, бидејќи откако еднаш резултатот ќе биде објавен на интернет веќе постојат два резултата за него (поради што учесниците често нудат слики а не го пишуваат самиот збор онлајн.)

15 мај 2023 - 09:20