Не позволяйте вчерашнему дню влиять на себя сегодня

Новый алгоритм искусственного интеллекта взламывает нерасшифрованные языки

Сценарий Ронгоронго — нерасшифрованный язык

Сценарий Ронгоронго — нерасшифрованный язык


Ученые создали новый алгоритм для поиска сходств в древних языках, и он призван распутать тайну всех нерасшифрованных языков.

Согласно новому отчету MIT, «на большинстве когда-либо существовавших языков больше не говорят». Изучение утерянных и «нерасшифрованных языков» становится исключительно сложной задачей, поскольку существует очень мало древних записей, которые могли бы помочь обычным инструментам и алгоритмам машинного перевода, таким как Google Translate. Поскольку достаточно не изучены грамматика, словарный запас и синтаксис древних языков, многие тексты остаются нерасшифрованными. Без них весь объем знаний о людях, которые нв них говорили, недоступен.

📚 Отслеживание эволюции нерасшифрованных языков

Команда исследователей из Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (CSAIL) недавно создала новую компьютерную систему, которая способна «автоматически расшифровывать утраченные языки», не требуя глубоких знаний об их отношении к другим языкам, включая паузы, пунктуацию и т. д. и перегиб. Кроме того, эта новая система была протестирована на ее способность автоматически определять любые отношения между языковыми группами, и в ходе этих тестов было установлено, что иберийский язык Испании не имеет отношения к баскскому.

Одна из пяти мемориальных досок Монумента лос Фуэрос (Пасео де Сарасате, Памплона)

Одна из пяти мемориальных досок Монумента лос Фуэрос (Пасео де Сарасате, Памплона). Этот текст был написан в 1905 году на баскском языке в виде адаптации северо-восточной иберийской письменности.


В этом новом проекте, который частично финансировался в рамках деятельности по перспективным исследовательским проектам в области разведки ( IARPA ), профессор Массачусетского технологического института Регина Барзилай объясняет в новой статье , что система «опирается на несколько принципов, основанных на знаниях исторической лингвистики», поскольку языки развиваются предсказуемо . пути. Доктор Барзилай объясняет, что в языках редко добавляются или опускаются целые звуки и что могут происходить определенные замены звуков, например, слова со звуком «р» в родительском языке могут превратиться в звук «б» в языках-потомках, но потому, что из-за значительного пробела в произношении менее вероятно, что «p» превратится в «k».

☘️ Перевод звуков в огромной тишине киберпространства

Собрав все известные лингвистические шаблоны, команда ученых разработала новый «алгоритм дешифрования» , который предназначен для обработки и интерпретации того, что исследователи описывают как «огромное пространство возможных преобразований и нехватку направляющего сигнала на входе». » Новый алгоритм самообучается, внедряя звуки языка «в многомерное пространство, где различия в произношении отражаются на расстоянии между соответствующими векторами».

Это означает, что новая система или алгоритм позволяет исследователям изолировать языковые модели, выражающие изменения, и использует их для формирования новых вычислительных ограничений и ограничений, а как только они сегментируются на слова в утраченном языке, сходство со связанными языками может стать возможным. быть нанесено на карту. По сути, он выявляет сходства в звуках и предлагает возможные связи.

Линейное письмо А

Если не считать некоторых знаков чисел, линейное письмо А
до сих пор остается нерасшифрованным языком


☘️ Программирование фонетического зеркала вампира

Плавая в концептуальном киберпространстве, новый алгоритм действует как «вампирское фонетическое зеркало» (мои слова), поскольку он отражает любые звуковые структуры, которые он считает похожими на другие, но при этом не предлагает отражения от несвязанных или несвязанных звуков /звуки, (отсюда и вампир)/. Система также может определить близость между любыми двумя заданными языками и точно определить «языковые семьи». Вот почему команда применила новый тест (алгоритм) к иберийскому и баскскому языкам, «а также к менее вероятным кандидатам из романских, германских, тюркских и уральских семей».

Хотя баскский и латынь оказались ближе к иберийскому, чем другие языки, они по-прежнему слишком различались, чтобы их можно было считать «родственными», и группа ученых в настоящее время расходится во мнениях относительно фактического родственного языка, при этом некоторые ученые утверждают, что иберийский язык не является родственным. Согласно новой статье, они относятся «к любому известному языку».

Эволюция языков (Алекс Гендлер)



Исследователи Массачусетского технологического института надеются, что их соединение древних текстов с родственными словами на известных языках (процесс, известный как «дешифровка на основе родственных слов») является лишь первым шагом в создании сверхпродвинутой системы, которая в конечном итоге сможет идентифицировать семантическое значение. слов, даже если неизвестно, как именно первоначально были произнесены эти древние слова.



(Copyrighted © Перевод с англ. Louiza Smith)



Источник:

By Ashley Cowie,
«New AI Algorithm is Cracking Undeciphered Languages»