• Авторизация


Google изучил эволюцию языка за двести лет 13-01-2011 16:29 к комментариям - к полной версии - понравилось!

Это цитата сообщения pmos_nmos Оригинальное сообщение

 Ученые приспособили поисковый сервис Google для проведения масштабных лингвистических исследований. С его помощью специалисты, используя 5 миллионов отсканированных книг, смогли проследить эволюцию языка в последние 200 лет. Статья специалистов опубликована в журнале Science, а коротко о работе пишет New Scientist ( Google's 'fossil record' digitises 5 million books ).

До сих пор у лингвистов не было инструмента, при помощи которого можно было бы проанализировать значительное количество текстов. Авторы нового исследования работали с книгами, которые были переведены в цифровой формат к настоящему моменту - всего их насчитывается около 15 миллионов. Ученые выбрали из них треть текстов (5,2 миллиона книг, написанных на английском, французском, испанском, немецком, китайском и русском языках) и составили базу всех использованных в них слов - их получилось около 500 миллиардов. Базу слов Ngrams можно найти здесь - поиск по словам осуществляется на базе алгоритмов Google.

Проанализировав полученные данные, авторы смогли сделать большое количество разнообразных выводов. В частности, они установили, что за последние сто лет число часто используемых слов возросло вдвое - если в 1900 году использовалось около 544 тысяч слов, то в 2000 году это число возросло до одного миллиона, причем 52 процента новых слов стало активно употребляться после 1950-х годов. 

Вот, например, изменение частоты употребления слова "амбиции" с 1920 по 2000 годы:

[644x236]

 

Слово "подонок":

  [644x243]



Слово "любовь":

[644x236]



 Cлово "честь":

[644x236]



Cлово "добро":


[644x236]

Кроме того, специалисты изучили, как сказывалась на использовании тех или иных слов цензура. Ученые установили, что после 1989 года словосочетание "площадь Тяньаньмень" практически перестало встречаться в литературе, изданной в Китае. То же самое произошло с именем Лев Троцкий в СССР в 1940-е годы и с именами голливудских актеров, уличенных в связях с Советским Союзом в США.

Авторы и их коллеги полагают, что новый инструмент позволит ученым исследовать слова и лингвистические тенденции, используя те же подходы и методы, что и специалисты по естественным наукам.

 Базу слов можно найти здесь - введите любое интересующее вас слово, получите график. Кстати, частота всем известных и весьма популярных в нынешнем русском языке ругательств резко возросла в последние годы - в чем вы сможете убедиться лично, введя их в поиск, в то время, как слово "ничтожество" постепенно уходит из языка:

[644x243]

pmos_nmos 

Спасибо lj_davidaidelman

вверх^ к полной версии понравилось! в evernote
Комментарии (11):
Энабель 13-01-2011-16:32 удалить
что совсем не радует...
goldmetel 13-01-2011-16:33 удалить
Ответ на комментарий Энабель # Когда не можешь ничего изменить, надо все принимать как есть.
Энабель 13-01-2011-16:47 удалить
Ответ на комментарий goldmetel # даже ругательства?
goldmetel 13-01-2011-16:49 удалить
Ответ на комментарий Энабель # Маринка...
Для меня что-ли написал? Не переношу мат и мысленно никогда не произносила. Знаешь как я говорю, если что-то вдруг выведет меня из себя? "Персика, марья, пунпули, пунаюри, поркана" Всё это говорится быстро, без остановок. А переводится с финского "персик, ягода, вата,морковь, свекла". Сказала и легко стало.
Энабель 13-01-2011-16:57 удалить
Ответ на комментарий goldmetel #
goldmetel 13-01-2011-16:57 удалить
Ответ на комментарий Лариса_Дунаева # Лариса, мне легче становится, когда по-другому говорю. Но это не для твоих ушей )))
Ответ на комментарий goldmetel # Главное, не при мне.
Miss_Liliya 15-01-2011-04:05 удалить
Показательные графики. Амбиции и подонки -вверх,любовь и честь-вниз. О времена,о нравы!
goldmetel 15-01-2011-04:08 удалить
Ответ на комментарий Miss_Liliya # Лили, так было, так есть, так будет всегда. Просто математика и графические интерфейсы мониторов сегодня позволяют это увидеть наглядно.
Miss_Liliya 15-01-2011-04:18 удалить
Ответ на комментарий goldmetel # Так и я примерно о том же. Последние слова сказаны даже не в прошлом веке.Но жизнь продолжается.


Комментарии (11): вверх^

Вы сейчас не можете прокомментировать это сообщение.

Дневник Google изучил эволюцию языка за двести лет | goldmetel - Дневник goldmetel | Лента друзей goldmetel / Полная версия Добавить в друзья Страницы: раньше»