Нова книга под наслов „Омилениот збор на Набоков е светло-лила: што ни откриваат бројките за класиците, бестселерите и нашето сопствено пишување“ на Бен Блат, се занимава со статистичка анализа на книжевни дела, метод кој кај самите книжевници (и кај љубителите на читањето) знае да предизвика во најмала рака блага недоверба или целосно отфрлање, затоа што е премногу технички пристап кон суптилна работа како што е пишувањето книги. Па сепак, од ова искрснуваат некои шеми и закономерности, кои не мора ништо посебно да значат во однос на доживувањето на одреден автор или книга, но се интересни како поглед зад завесата (или зад листот).
Статистиката открива, на пример, дека најкратки први реченици користат Тони Морисон, Маргарет Атвуд и Марк Твен, а најдолги Салман Ружди. Дека алгоритам може да идентификува одреден автор врз основа на неговиот или нејзиниот прозен стил. Дека писателките пишуваат различно од писателите. Сето ова не ни кажува многу за уметноста на пишувањето, но ни кажува многу за него како за вештина и занает.
Се разбира, секоја ваква статистичка операција подразбира дека оној кој ја прави тргнува од некои претпоставки пред да почне да внесува бројки во машината. Секое поглавје на Блат почнува со образложување на неговата методологија, формулите кои ги користел или неговата дефиниција на „значајни книги“, „долги реченици“ или „омилен збор“. За последнава категорија, на пример, тој воведува четири правила: за одреден збор да може да биде прогласен за омилен на некој автор тој мора да се појавува барем во половина од неговите книги, мора да се користи со стапка од барем еднаш на 100,000 зборови, не сме да е премногу опскурен, односно помалку употребуван од еднаш на милион во корпусот на пишуваниот англиски јазик, и да не е лична именка.
Еве, во таа смисла, кои се омилените зборови на некои од анализираните автори:
Џејн Остин: civility, fancying, imprudence (пристојност, допаѓање, непромисленост)
Ден Браун: grail, masonic, pyramid (грал, масонски, пирамида)
Труман Капоте: clutter, zoo, geranium (неред, зоолошка, гераниум)
Агата Кристи: inquest, alibi, frightful (истрага, алиби, страшен)
Јан Флеминг: lavatory, trouser, spangled (тоалет, пантолани, „направен“ - од дрога или алкохол)
Ернест Хемингвеј: concierge, astern, cognac (консиерж, бродска крма, коњак)
Владимир Набоков: Mauve, banal, pun (светло-лила, банално, игра со зборови)
Дури и само три збора извадени од контекст се доволни за да ни асоцираат на темите и стилот на одреден автор. А во случајот со Набоков приказната е уште поинтересна - тој бил способен за синестезија (повеќе во „Како е да гледаш идеи како форми?“), состојба која предизвикувала тој да поврзува различни бои со звукот и формата на буквите и зборовите. Mauve му била очигледно омилена, и како боја и како збор, бидејќи ја користел 44 пати повеќе отколку што тој збор се појавува во целиот корпус на пишуван англиски.
Повеќе за другите статистички податоци во книгата тука. Најинтересното: авторите кои користат најмал број клишеа се сите авторКИ. Прва е Џејн Остин, со само 1/3 од стапката со која со дрн дрн во своите книги се извлекува, на пример, Џејмс Патерсон.