Не позволяйте вчерашнему дню влиять на себя сегодня

Сможет ли Искусственный Интеллект расшифровать «Манускрипт Войнича»?


Одна из страниц Манускрипта
Манускрипт Войнича (далее: МВ или, как принято сокращать в западной литературе, VMS) это рукописная книга неизвестного автора, выполненная пером на пергаменте предположительно в первой половине 1400-х годов. В ней порядка двух сотен страниц: изначально было больше, но за века хождения по рукам часть потерялась, а другие меняли порядок. Владельцами за это время были более дюжины человек, часто исторических персоналий, однако современным названием она обязана Вильфреду Войничу, польскому революционеру и антиквару, который извлёк её из пыльных архивов церкви в 1912 году. Этот момент можно считать началом периода систематизированных и, главное, массовых попыток прочтения.

Приблизительный смысл книги ясен уже из беглого её просмотра. Вот, вы и сами можете полистать отсканированные с высоким разрешением страницы на сайте библиотеки Университета Йеля, в которой она сейчас хранится. Там множество иллюстраций, сопровождаемых большими объёмами текста. И даже не будучи историком, можно понять, что МВ посвящён медицине, вероятно, с уклоном в обычный для Средних веков оккультизм. Загвоздка, благодаря которой Манускрипт Войнича прославился, заключается в том, что изображает он неизвестные науке виды жизни и написан на неизвестном языке.

Откройте Манускрипт, увеличьте, всмотритесь. Латынь в ту пору была универсальным языком науки, но вы увидите не латынь. Убористо, аккуратно, бегло, строку за строкой, страницу за страницей покрывают полтораста тысяч «букв», сгруппированных в три с лишним десятка тысяч «слов». Кавычки не случайны: мы называем слова словами, а буквы буквами по привычке, но на самом деле это лишь предположение, ибо истинный смысл того и другого по сей день не ясен.


То же под увеличением
На расшифровку МВ потрачены сотни, если не тысячи человеко-лет, без преувеличения! Как правило, если за него кто-то брался, то отдавал ему годы, порой — десятилетия. Но результаты этого труда позволяют утверждать наверняка лишь, что текст действительно осмыслен: количество «букв» ограничено (29, если с символами форматирования) и употребляются они примерно так, как буквы в алфавитах известных нам языков, то есть не случайным образом.

Но и всё. Никаких устойчивых параллелей ни с одним из живых или мёртвых языков провести не удалось. Ничего не дал и штурм Манускрипта высокотехнологичными инструментами XXI века. Да, скрупулёзно изучен даже химический состав чернил, но всё чего удалось добиться на этом направлении — уточнить датировку, да сделать видимыми некоторые поистёршиеся записи.

Недостатка в теориях, конечно, нет. Только за последнее столетие, а до того особенно активно в XVII веке, их выдвинуто множество. Располагая этот материал в порядке возрастания «сумасшедшести», получим впечатляющий спектр. На одном его краю окажутся версии мистификации. Мол, на самом деле Манускрипт — лишь тарабарщина, очень похожая на осмысленную речь. Кто-то из великих умов прошлого, а может и сам Войнич, мог подшутить таким образом над коллегами или потомками. Либо был одержим глоссолалией: маниакальным «талантом» выдавать бессмыслицу. Эти теории так или иначе опровергаются: статистическим анализом (тарабарщина не имела бы структуры), датировкой по химическому составу и пр.

С другой стороны — версия внеземного происхождения. Мол, Манускрипт — подарок иной цивилизации, написанный на недоступном нашему пониманию языке и изображающий не людей, а гуманоидов, чужую флору, фауну, чужое небо. Этому, увы, противопоставить нечего, разве что качество материала, из которого выполнен «носитель информации». Едва ли представители высокоразвитой цивилизации, прибывшие из глубин космоса, оставили бы память о себе на кусках телячьей кожи посредственной выделки, процарапанной гусиным пером.


Обнажённое женское тело встречается в Манускрипте чаще всего.
Но не выдаём ли мы желаемое за действительное?
Люди ли это вообще?
А между ними — огромное множество уже более вменяемых теорий, рассматривающих Манускрипт как зашифрованный документ. Собственно разногласие между их авторами только одно: был ли смысл скрыт умышленно (шифр!) или же использована некая система сокращений, которую мы (например, утратив важные исторические детали) теперь не понимаем и принимаем за шифр. В любом случае, если следовать этим теориям, текст может быть расшифрован.

Увы, вариант с простейшими шифрами приходится отмести. Это точно не побуквенная замена (частотный анализ букв в МВ — помните «Золотого жука» Эдгара По? — хоть и подтверждает схожесть с латынью и английским, но разгадки не даёт; в Манускрипте есть нюансы, нехарактерные для европейских языков — например, некоторые буквы встречаются только в начале слов, но не в середине), это не результат сложения оригинального текста с каким-либо внешним документом, например, Библией (в таком случае анализ почерка выявил бы паузы при письме, но автор МВ писал гладко, без задержек, словно на родном языке), это не стеганография (одно время была популярной версия, что истинный текст написан миниатюрным шрифтом и спрятан в декорациях).

Никуда не привели и более сложные теории. Точнее сказать, множество авторов в своё время заявляли об успешной дешифровке, но при ближайшем рассмотрении всякий раз оказывалось, что они выдавали желаемое за действительное: разглядеть смысл в «расшифрованном» ими тексте удаётся лишь с очень большой натяжкой. И прозвучавшее заявление тележурналиста Николаса Гиббса из того же разряда. Опубликованная им «научная работа» и не работа вовсе, а развлекательная статья, в которой он высказывает (даже не оригинальную) догадку, что текст Манускрипта — набор восходящих к латыни сокращений. Ничего удивительного, что «прочитать» таким образом ему удалось буквально несколько строк, что, очевидно, не более чем случайное совпадение.


Алфавит Манускрипта.
Ну а что же компьютеры? Естественно, для взлома Манускрипта Войнича применялись и они, причём чуть ли не с начала компьютерной эры. Здесь мы многим обязаны Вольфу/Вильяму Фридману — легендарному американскому криптографу российского происхождения. Это он, кстати, придумал слово «криптоанализ», возглавлял отдел криптографии АНБ в самом начале существования этой организации, а шифрами увлёкся, прочитав подростком уже упомянутого «Золотого жука». Манускрипт был для него своего рода хобби, которому он отдавал свободное время всю свою сознательную жизнь, и даже организовал из военных криптографов две добровольческих группы, бившихся над решением вместе с ним (сразу после Второй мировой и в 60-х годах).

Но в отличие от предшественников, корпевших над кальками с карандашом, Фридман заложил фундамент машинной обработки. Он стал первым, кто перевёл МВ в машинно-читаемую форму — начав в 40-х ещё с перфокарт (IBM, увы, не сохранившихся, а может быть хранящихся в архиве АНБ), а после (в 60-х) применив компьютеры RCA. Для этого пришлось изобрести новую кодировку и попутно решить ещё несколько задач (например, разрывы между «словами» не везде чёткие). И сегодня ещё в текстовых файлах, содержащих текст Манускрипта, есть частичка его труда.


Так преобразуют Манускрипт в удобную для обработки на компьютере форму: оригинал, промежуточный текстовый формат, чистый текст без метаданных.
Увы, Фридман, бившийся над разгадкой до последних лет, в конце концов расписался в бессилии. Но не продвинулись дальше и его последователи, имевшие доступ к куда более быстрым вычислительным машинам (вот, просто для примера, одна из работ, чтобы оценить количество математики). Так что чисто механическая вычислительная мощь, увы, не помогла. 

И здесь самое время остановиться и оценить ситуацию заново.

Дело в том, что за последние пару лет в воображаемом интеллектуальном противостоянии человека и машины произошло кое-что принципиально важное. Нет, искусственный интеллект в полном смысле этого слова так до сих пор и не создан. Однако удалось построить компьютерные системы, решающие полезные для человека задачи недоступным пониманию человека способом.

Ярчайший пример этого — прошлогодняя победа компьютера в го: играть машину учил человек, но вот выигрывать она училась сама — и даже создатели называют это «интуицией», будучи не в силах объяснить, что же происходит в «электронном мозгу», каким образом он решает неразрешаемое! Ведь го невозможно «решить» простым перебором вариантов, почему победа в ней компьютера и стала сенсацией. Рискну предположить, что следующей большой победой ЭВМ будет Манускрипт Войнича.


Пример партии го — анимация первых 60-ти ходов
Его так же невозможно «решить» перебором. Нужно некое гениальное прозрение, та самая «интуиция» в извлечении смысла из потока цифр, которую машина продемонстрировала при игре в го. После победы в го, в играх машинам делать больше нечего — разве что сражаться против самих себя на биржевых площадках. Скучно! Пришла пора взяться за Манускрипт Войнича, как крупнейший интеллектуальный артефакт, всё ещё ожидающий разгадки.



           По теме: