В субботу, когда я прочитал про Гугл.Тушку, полез смотреть на Google.Labs, что ещё у них есть интересного. И не пожалел, хотя и не выспался.
Одна из главных вещей, подвесивших меня на много часов, это Books Ngram Viewer. Гениальная штука, позволяющая смотреть частоту упоминания того или иного слова — но не в интернетах, как это делает Яндекс.Wordstat или Яндекс.Пульс, а по книгам. Период исследования — с 1800 по 2008 год, что само по себе уже вдохновляет. Добавим возможность искать отдельно по русскоязычной литературе, британской, американской, немецкой и станет понятно, что это суперский инструмент для исследований. Историкам он поможет проверять гипотезы, неисторичным людям вроде меня — просто доставит удовольствие.
К недостаткам в настоящее время можно отнести
Однако авторы сделали исходные данные доступными для скачивания и самостоятельной обработки. Так что если кому-то горит, он может исправить вышеперечисленные недостатки самостоятельно.
Разумеется, п1 не столь серьёзен и может быть легко компенсирован заданием сразу нескольких вариантов слова, чтобы убедиться, что между ними есть корреляция:
Делюсь кое-чем интересненьким, из того, что нашёл.
1. Динамика внимания к Ленину и Сталину:
Обратите внимание на спад количества упоминаний Сталина, начавшийся в 51-52 годах. Напоминаю, что Сталин умер в 1953 году. То есть спад начался до его смерти. Также посмотрите на пик упоминаний Ленина в 1941 году, одновременно со сталинским провалом. Я не знаю причин, но выглядит очень любопытно.
2. «Холодное лето 1953-го». «Воровство» и «убийство» в период с 1940 по 1960 годы.
В 1953 году нет пика ни по «воровству», ни по «убийству». Что вполне может объясняться цензурными причинами. Зато пик «воровства» есть в 1947 году (почему?) и «убийства» в 1954 году.
3. «Молиться, поститься!» — «религия» и «голод»
Что косвенно подтверждает это исследование.
4. «Несправедливость»
Просто для калибровки системы. Пики в 1905 и 1920 году вполне понятны. Небольшой пик в 1928 и горка, в 1953 любопытны. Ну и рост «несправедливости» в 1990-х тоже вполне объясним. Кстати, обратите внимание, что рост продолжается и сейчас.
5. «Let kill 'em in WC»©.
И мы знаем, кому слово «сортир» обязано такой популярностью в последние годы. Ну, хоть так в историю вошёл. Или влип. Кстати, посмотрите и «мочить в сортире» — там график совсем очевидный.
6. «Шизофрения» у нас и за рубежом.
Это Россия/СССР:
Это Британия:
США:
А это Германия:
Шизофрения имхо любопытна тем, что упоминание о ней обычно (насколько я знаю) не цензурируется. В то же время, чем гаже обстановка в стране, тем больше шизофреников (психиатры, поправьте, если я здесь ошибся). Поэтому графики в принципе показывают реальный уровень напряженности и фрустрированности в обществе. Разумеется с поправкой на научные публикации и политзаказы. Например, при Брежневе в СССР была популярна «карательная психиатрия», когда диссидентов упекали в дурку. В том числе и с диагнозом «шизофрения». Возможно этим объясняется пик в 70-х. А может быть, причина — разочарование в «оттепели».
В России любопытен пик в середине 30-х. Возможно он связан со всем нам известными событиями. А в Германии больше SCH стало как раз к 1945 году. Вероятно народ начал приходить в себя после угара нацизма и как-то болезненно осознал, что скоро им хана. США в 65-73 году вели войну во Вьетнаме, оттуда возвращались Рембо, а встречали их пацифисты. Посмотрите на пик в эти годы.
7. «Боишься ли ты конца, Света? Конец, Света, близок!»
Да, 17 год не для всех был счастливым. И с 70-х ощущение неминуемого трындеца стабильно нарастало. Но почему такой пик в конце 40-х?
Любопытно, что в англоязычной литературе ожидания конца света («end of the world») неизменно снижаются. UPD. «Doomsday» выравнивает график.
Как пример, США:
Более-менее равномерные ожидания конца света только в англоязычной художественной литературе (English Fiction corpus).
8. Нефть, газ, уголь. Oil, gas, coal.
Относительная роль угля стабильно снижается в СССР с 60-х. И кризисы уголь не подбрасывают.
А вот в Буржуинии этот спад начался раньше. США:
9. Млеко, яйки, брот!
Ну и напоследок, загадка почище улыбки Моны Лизы. Откуда такое паранойяльное внимание к яйцам в середине 1930-х? UPD. Виноват Фаберже.
Также любопытно посмотреть следующие слова:
Для более детального исследования можно как скачать исходные данные, так и посмотреть литературу за выбранный период прямо онлайн, по ссылкам под графиком.
Хорошего вам развлечения!
Процитировать пост: | ![]() | ![]() | ![]() | ![]() |