Это цитата сообщения
Джек_Северянин Оригинальное сообщение
[420x280]
Рукопись, недавно идентифицированная как относящаяся к началу XV века и сочинённая на неизвестном языке с помощью неведомого алфавита, долгое время рассматривалась множеством исследователей в качестве шутки, созданной для введения в заблуждение покупателей редких и ценных книг, ибо за набором незначащих символов скрывалась лишь пустота, нуль. Похоже, это мнение отжило своё.
После того как муж автора «Овода» в 1912 году случайно нашёл рукопись с непонятными символами, прошли десятилетия, но попытки её дешифровки не дали никаких результатов. В связи с этим многие учёные предполагали, что никакого смысла в тексте нет, что это классическая абракадабра. Более того, несколько лет назад одно исследование постулировало, что европейские криптографические техники XVI века теоретически позволяли создать такой текст из набора бессмысленных символов. Тогда многие посчитали, что проблема снята, ибо именно тем столетием и датировался манускрипт.
Однако радиоуглеродный анализ 2011 года поубавил ясности, ибо оказалось, что пергамент создан в начале XV века, между 1404 и 1438 гг., что на сто лет раньше появления таких методик. Наконец, приписывание текста Джону Ди или его подручным, долгое время бывшее весьма популярным, тоже не оправдало себя. И уж тем более провалилась попытка рассмотрения его как аналога аналитического языка Джона Уилкинса.
[показать]
Вы когда-нибудь видели такое растение? Вот и учёные затрудняются его идентифицировать. Изображения ниже интерпретируются то как Млечный Путь (правда, в XV веке не было телескопов, без которых спиральную галактику не увидеть), то как рисунок бассейна. Без расшифровки вопрос не прояснить... (Здесь и ниже текст изображения неизвестного автора, Marcelo Montemurro et al.)
Чтобы разобраться со всем этим, Марсело Монтемурро (Marcelo Montemurro) из Манчестерского университета (Великобритания) использовал для анализа 240-страничного текста (судя по нумерации, исходно 272-страничного) энтропию распределения «слов» (групп знаков, похожих на слова).
Энтропия распределения слов в тексте понималась как равномерность их использования, которую сравнили с равномерностью их распределения в искусственно перемешанном массиве того же текста. Разница между этими двумя энтропиями (естественной и нормализованной) с учётом частоты употребления каждого слова позволяет отследить важность слова для того или иного письменного источника.
Например, в 2009 году, когда этот подход в модельных целях был применён на дарвиновском «Происхождении видов», самыми неравномерными по распределению словами высокой встречаемости были «виды», «разнообразие», «гибриды», «формы» и «роды», а в «Моби Дике» максимальная энтропия была у слова «кит». Как вы догадываетесь, это наиболее нагруженные в смысловом отношении слова названных произведений. Напротив, союзы «и», «а» и сходные с ними лексемы были равномерно «размазаны» по тексту.
Что это дало в случае сверхстранной рукописи в более чем 170 тыс. знаков? Оказалось, что наиболее нагруженные смыслом слова образовывают кластеры. В фармацевтической (предположительно) секции манускрипта доминировал один набор этих значащих слов, а в, возможно, астрологический — другой, и так далее. Именно такая структура свойственна настоящим книгам на известных языках, и подделать её в начале XV века можно было примерно с той же эффективностью, как фотографии лунной поверхности, ибо техника анализа по энтропии появилась лишь через несколько столетий.
Кроме того, книга представляет собой не разрозненный сборник, а единый текст, так как кластеры, где встречаются связанные слова, в отдельных главах довольно велики, в то время как в «понадёрганных» трудах вроде сборников цитат (или диссертациях плагиаторов) так просто не бывает. Более того, длина таких кластеров в человеческих языках, на которые переведено то же «Происхождение видов», колеблется в районе 500–700 слов. Для сравнения: код на Фортране имел кластеры в 300 слов, а ДНК-код дрожжей — всего в десять генов.
«Мы хотели понять, совместима ли определяемая нашим анализом структура с реальным языком, — поясняет г-н Монтемурро. — Если бы итог был как у ДНК-кода дрожжей, это определённо заставило бы сомневаться в природе «рукописи Войнича». Но, учитывая полученные результаты, невозможно отрицать — это язык».
Тут, конечно, нельзя не заметить, что оппоненты уверены, что это ещё не доказательство. К примеру, аргументируют они, получить такой же итог можно, взяв набор корней, приставок и суффиксов, записанных другим алфавитом, и пропустив их через решётку Кардано. Само собой, доказать или опровергнуть что-то тут очень сложно, особенно учитывая непонятность алфавита и то, что решётку Кардано изобрели примерно на два века
Читать далее...