Страницы

Откуда в мозге помехи и как это мешает разработчикам искусственного интеллекта

Если бы клетки головного мозга общались друг с другом при помощи голоса, в наших головах стоял бы непрерывный гвалт. Нейроны не только постоянно обмениваются сигналами, реагируя на внешние импульсы, но и производят фоновый «шум», дергая друг друга по делу и без. Как ни странно, именно это, похоже, дает человеческому интеллекту преимущество перед искусственным. Опираясь на исследования ученых из Франкфуртского университета, Флоридского университета нейронауки имени Макса Планка и Миннесотского университета, главный редактор журнала Nautilus Майкл Сигал объясняет, как нестабильность живых нейронных сетей связана с мышлением и воображением. (перевод с некоторыми сокращениями).
Одну из главных проблем современного искусственного интеллекта можно проиллюстрировать на примере желтого школьного автобуса. Если он изображен со стороны лобового стекла, обученная нейронная сеть безошибочно его распознает. Если он лежит на боку поперек дороги, алгоритм с большой уверенностью предположит, что перед ним снегоочиститель. А при взгляде снизу и под углом нейросеть и вовсе решит, что это мусоровоз.

Все дело в контексте. Когда очередное изображение сильно отличается от ранее загруженных картинок, механизм распознавания запинается, даже если разница сводится к тому, что искомый объект повернут или частично перекрыт другим. Современные модели ИИ все еще не дотягивают до человеческого мозга и поэтому хуже ориентируются в непривычных ситуациях.

Шумный мозг

Компьютеры — цифровые устройства, они работают с бинарными элементами, которые могут находиться во включенном или выключенном состоянии. Исходящий сигнал нейрона тоже похож на двоичный код — нейрон в каждый момент времени либо активен, либо нет, — но «на вход» нейрон работает как аналоговое устройство: данные недискретны, и на их характеристики влияет множество факторов.

Кроме этого, построенные человеком вычислительные системы строго детерминированы: отдавая одну и ту же команду несколько раз, вы всегда получите одинаковый результат. В человеческом мозге все устроено иначе — реакция на один и тот же стимул всегда будет разной.

Возможно, все дело в ненадежной нейротрансмиссии, то есть сбоях движения сигнала в синапсах. Во время активности нейрона сигнал движется по аксону, но вероятность того, что он достигнет следующего нейрона, составляет лишь 50%. Из-за этого в системе возникают помехи.

Другой фактор — постоянная активность в самых разных отделах мозга. Например, зрительная кора активируется визуальными образами, но одновременно получает сигналы из других источников, поскольку в мозге много перекрестных соединений. Это позволяет нам ориентироваться в контексте и формировать горизонт ожиданий: так, услышав лай собаки, мы спешим настороженно обернуться, чтобы найти ее глазами.

Даже в отсутствие визуальных стимулов зрительная кора демонстрирует такую же активность, как и при их наличии, являя что-то вроде визуального воображения. Вы что-то видите, одновременно думаете о том, что видели вчера, — возможно, это тоже способствует тому, что реакция на одни и те же стимулы раз от раза меняется.

Наконец, эксперименты и модели показали, что в мозге может возникать активность, затрагивающая области, расположенные далеко друг от друга. Это обычное дело для зрелой коры, в которой связи дальнего радиуса действия сформированы анатомически. Однако даже в раннем возрасте, когда физических связей между разными областями мозга еще нет, корреляция между их активностью уже наблюдается.


Откуда шум?

Любопытно, что паттерны спонтанной активности нейронов складываются на ранних стадиях развития мозга, еще до того, как сформировано сенсорное восприятие. Например, спонтанная активность в зрительной коре наблюдается еще до того, как ребенок впервые откроет глаза. Уже после этого воображение связывается с реальными зрительными образами.

Спонтанная активность присуща нам с раннего возраста, но ее природа пока неизвестна. Возможно, она предопределена генетически, но с большой вероятностью связана с процессом самоорганизации (как самоорганизующаяся система может формировать сложные паттерны, описывается в теории динамических систем). Можно предположить, что весь наш ум определен генами, но это невозможно:
информации в ДНК слишком мало, чтобы определить все многочисленные синаптические связи в мозге. Генетически можно закодировать лишь несколько простых алгоритмов для ранних стадий развития мозга, которые дадут импульс созданию и развитию определенной структуры.
Отправной точкой для такого процесса могут стать всего несколько основных правил — например, как нейроны формируют цепи и как активность цепи, в свою очередь, изменяет соединения в цикле обратной связи.

Зачем все так сложно

Теория аттракторных нейросетей гласит, что вся их активность сводится к конечному множеству состояний. При определенном наборе входящих сигналов сеть приходит в одно из возможных состояний; при других, но схожих, — к такому же состоянию. Это делает ее устойчивой к небольшим колебаниям сигналов и помехам. Обсуждение теории идет уже не первый год, но пока не удалось получить адекватных экспериментальных доказательств того, что мозг работает именно так. Нам бы не помешала возможность регистрировать состояние достаточно большого числа клеток мозга в достаточно стабильных условиях — а еще инструменты, которые позволили бы активировать их напрямую.

Возможно, в непредсказуемости мозга есть свой смысл.
Смотря на один и тот же предмет, мы всегда воспринимаем его немного по-разному, и именно эта изменчивость реакции на одинаковый стимул помогает обнаружить новые грани знакомых вещей.
Любое визуальное изображение состоит из тысяч деталей. Выделяя главное, мы отсеиваем ненужное. Это похоже на эволюцию, когда в результате хаотичных мутаций выживают наиболее приспособленные особи. По аналогии можно предположить, что мозг добавляет «шум», чтобы пересмотреть множество возможных изображений и найти самое подходящее для данного контекста.

Можно ли разгадать алгоритм спонтанной активности? Вероятно. Один из вариантов — изучение близнецов. Другой — наблюдение за ранними стадиями проявления спонтанной активности.


Воспроизвести помехи

Глубокие нейронные сети — наиболее успешный вид ИИ — созданы по образу и подобию человеческого мозга: у них есть нейроны, своеобразная иерархия и гибкость связей. Но о том, могут ли такие сети воспроизводить процессы, происходящие в процессе обработки сигналов мозгом, ведутся споры.

Одна из особенностей работы глубоких нейронных сетей, за которую их часто критикуют, — прямая восходящая связь: сигнал передается от входа к выходу через последовательность промежуточных уровней без какого-либо «петляния». Рекуррентные связи (например, между нейронами одного уровня) либо отсутствуют, либо смоделированы довольно грубо; как правило, нет нисходящих связей, которые бы передавали сигнал от выхода ко входу. Такие связи затрудняют обучение нейросети — но в коре головного мозга их полно! Сеть, построенная только на прямой связи, — это очень грубое упрощение, сильно отличающееся от тесно взаимосвязанных отделов мозга.
Как правило, нейронная активность в человеческом мозге — это непрерывные перекрестные «разговоры» между разными областями мозга, где сенсорный стимул играет лишь модулирующую роль.
Глубокие нейронные сети работают совсем иначе: они активизируются только при наличии исходных данных. К чему это приводит? Например, к неспособности ИИ уловить контекст: глубокая сеть обучается на определенном наборе данных и не справляется, когда появляется принципиально новая информация.

В то время как, согласно одной из теорий, спонтанная активность в мозге как раз и кодирует контекст. Возможно, эта активность являет собой нейронную основу обработки визуальных образов, в ходе которой мы устанавливаем взаимосвязь между различными объектами (и их частями) в пространстве. Это предположение слегка притянуто за уши, потому что функционал этой спонтанной активности пока до конца не понятен, но уже ясно, что она может играть важную роль в интерпретации событий.

Нам остается черпать вдохновение из наблюдений за мозгом. Например, упоминавшаяся выше ненадежность синаптических связей уже сейчас эмулируется в машинном обучении для избежания «переподгонки» (ситуации, когда построенная нейросетью модель хорошо объясняет примеры из обучающей выборки, но не работает на примерах, не участвовавших в обучении.).


T&P