Не позволяйте вчерашнему дню влиять на себя сегодня
Показаны сообщения с ярлыком искусственный интеллект. Показать все сообщения
Показаны сообщения с ярлыком искусственный интеллект. Показать все сообщения

Собор Тьюринга: от архитектуры фон Неймана к вселенскому разуму Google

Один из главных эпизодов научно-технической революции случился в 1945 году, когда математик Джон фон Нейман, вооружившись идеями Алана Тьюринга, описал принцип работы первого цифрового компьютера и тем самым навсегда изменил мир. Историк науки Джордж Дайсон в эссе «Собор Тьюринга» рассуждает о том, сильно ли эволюция вычислительной архитектуры влияет на человечество, как искусственный интеллект даст знать о том, что он действительно создан, и стоит ли этого бояться.
В цифровой вселенной есть две разновидности битов: те, что образуют собой структуру, находясь в разных частях пространства, и те, что образуют последовательность, меняясь с ходом времени. По определению, данному Аланом Тьюрингом и реализованному Джоном фон Нейманом, цифровая вычислительная машина — это устройство, осуществляющее взаимодействие между двумя разновидностями битов по заданным правилам.

В середине сороковых XX века математик Джон фон Нейман, сотрудник Института перспективных исследований в Принстоне, приступил к поиску средств на создание машины, которая осуществляла бы такое взаимодействие со скоростью перемещения электрического заряда.
«Я абсолютно уверен, что задуманное устройство — вернее, тот класс устройств, который оно представляет пока в единственном числе — окажется настолько революционным, что многие сферы его применения станут понятны только после того, как оно заработает, — писал он Льюису Страуссу 24 октября 1945 года. — По определению, наиболее важными будут те сферы, о которых мы пока и не догадываемся, поскольку они находятся за пределами нашего нынешнего знания».
Фон Неймана немедленно поддержали армия, флот и ВВС США, но главным спонсором выступила Комиссия по атомной энергии (КАЭ). Сделка с дьяволом оказалась уж очень заманчивой. В 1951 году была запущена машина с 5 килобайтами оперативной памяти — матрицей двоичных цифр размерностью 32×32×40. Они были представлены пульсирующей мозаикой электрических зарядов, меняющихся со скоростью миллисекунд на сорока катодно-лучевых трубках.

Архитектура этой пустынной вселенной строилась на следующем принципе: пара 5-битных координат идентифицирует адрес ячейки памяти со строкой в 40 бит. Эти 40 бит могли содержать не только данные (числа, нечто означающие), но и команды (числа, нечто делающие) — например, способные переадресовать задачу другой ячейке или совершить что-то еще.

Упразднив различие между данными и командами, фон Нейман высвободил мощный потенциал компьютеров с запоминаемыми программами и тем самым необратимо изменил наш мир. Неслучайно цепная реакция команд и адресаций в ядре компьютера напоминает цепную реакцию в атомной бомбе.

В начале 1950-х время бесперебойной работы оперативной памяти измерялось считанными минутами. Невозможно было представить, чтобы система, для работы которой критически важна доставка каждого бита в точно определенное ему место и в точно определенное время, стала в 1013 раз больше и заработала в миллион раз быстрее. Фон Нейман очень хотел понять, как природе удается из ненадежных деталей строить надежно функционирующие живые организмы. Он не сомневался, что на смену «архитектуре фон Неймана» вскоре придет какая-то иная. Ведь даже если полностью исключить программные ошибки, никогда нельзя будет полагаться на то, что многие миллионы ячеек памяти станут работать абсолютно бесперебойно.

Спустя пятьдесят лет, благодаря полупроводниковым технологиям, по-прежнему используется именно первоначальная модель фон Неймана. Основная задача компьютерных технологий сейчас не в том, чтобы добиться надежного результата с ненадежным оборудованием, а в том, как обеспечить надежность при использовании недостаточно надежных программ. Архитектура фон Неймана никуда не исчезнет. Но уже появляются новые разновидности архитектуры, содержащие внутри себя привычные машины Тьюринга-фон Неймана. Что же будет дальше? Что представлял фон Нейман перед тем, как остановилась программа его собственной жизни?

Будучи живыми организмами, мы обладаем двумя хранилищами информации: генетической и собранной в нашем мозге. Архитектура того и другого хранилища отлична от фоннеймановской — неудивительно, что это привлекло внимание ученого, когда он намечал программу дальнейших исследований (осуществить которую ему помешал рак). О мозге, как о хранилище информации, он писал в опубликованной посмертно книге «Компьютер и мозг». В языке, используемом нервной системой, меньше логической и арифметической глубины, чем в привычных нам языках, он должен принципиально от них отличаться по своей структуре».

Или, как выразился друг фон Неймана Станислав Улам:
«С чего вы взяли, что мы мыслим в согласии с законами математической логики?» 
Частотное кодирование, которое наблюдается в нервной системе и используется в основанных на вероятностных моделях поисковых машинах, зависит не от точных характеристик данных, а от связей между ними и статистики частоты их использования. Фон Нейман писал в 1948 году:
«Для того, чтобы понять, как функционируют высокосложные устройства и, в частности, центральная нервная система, необходима новая теория, основанная на базе логики. Однако по ходу создания такой теории логике с гораздо большей вероятностью грозит пережить трансформацию в неврологию, чем неврологии — в логику».
Смерть фон Неймана совпала с началом революции в микробиологии, вспыхнувшей после того, как в 1953 году была раскрыта структура ДНК. Жизнь в современном понимании основана на представленных в цифровом коде командах, которые преобразуют последовательность в структуру (от нуклеотидов до белков) в точном соответствии с определением Тьюринга. Рибосомы и прочая клеточная машинерия выполняют роль программы: считывают, дуплицируют и интерпретируют записанные на ленте последовательности. Как ни поразительно сходство, не следует забывать, что для исполнения команд в живой и электронной системах используются абсолютно разные способы адресации.

Нейросеть создает реалистичные изображения поддельных знаменитостей

Пока Facebook и Prisma используют искусственный интеллект, чтобы обрабатывать обычные снимки в стиле художников, NVIDIA стремится к полному реализму. Производитель видеокарт подробно описал алгоритм машинного обучения GAN, который создает реалистичные фотографии несуществующих людей.
Технология включает две нейронные сети, одна из которых генерирует изображения, а другая старается отличить их от образцов из реального мира. Ее используют, чтобы генерировать фотографии, которые человеческим глазом воспринимаются как натуральные изображения.

Алгоритм NVIDIA начал обучение с изображений низкого разрешения, но затем научился добавлять к ним новые слои и доводить до HD.

Вместо того, чтобы использовать фото обычных людей, компания получила изображения звезд из базы данных CelebA HQ. Нейросеть использовала их черты и создала сотни портретов. Некоторые из них выглядят фотореалистичными, тогда как другие — по-настоящему жуткими. 

Также метод позволил алгоритму сгенерировать серию различных объектов, животных и пейзажей.




Откуда в мозге помехи и как это мешает разработчикам искусственного интеллекта

Если бы клетки головного мозга общались друг с другом при помощи голоса, в наших головах стоял бы непрерывный гвалт. Нейроны не только постоянно обмениваются сигналами, реагируя на внешние импульсы, но и производят фоновый «шум», дергая друг друга по делу и без. Как ни странно, именно это, похоже, дает человеческому интеллекту преимущество перед искусственным. Опираясь на исследования ученых из Франкфуртского университета, Флоридского университета нейронауки имени Макса Планка и Миннесотского университета, главный редактор журнала Nautilus Майкл Сигал объясняет, как нестабильность живых нейронных сетей связана с мышлением и воображением. (перевод с некоторыми сокращениями).
Одну из главных проблем современного искусственного интеллекта можно проиллюстрировать на примере желтого школьного автобуса. Если он изображен со стороны лобового стекла, обученная нейронная сеть безошибочно его распознает. Если он лежит на боку поперек дороги, алгоритм с большой уверенностью предположит, что перед ним снегоочиститель. А при взгляде снизу и под углом нейросеть и вовсе решит, что это мусоровоз.

Все дело в контексте. Когда очередное изображение сильно отличается от ранее загруженных картинок, механизм распознавания запинается, даже если разница сводится к тому, что искомый объект повернут или частично перекрыт другим. Современные модели ИИ все еще не дотягивают до человеческого мозга и поэтому хуже ориентируются в непривычных ситуациях.

Шумный мозг

Компьютеры — цифровые устройства, они работают с бинарными элементами, которые могут находиться во включенном или выключенном состоянии. Исходящий сигнал нейрона тоже похож на двоичный код — нейрон в каждый момент времени либо активен, либо нет, — но «на вход» нейрон работает как аналоговое устройство: данные недискретны, и на их характеристики влияет множество факторов.

Кроме этого, построенные человеком вычислительные системы строго детерминированы: отдавая одну и ту же команду несколько раз, вы всегда получите одинаковый результат. В человеческом мозге все устроено иначе — реакция на один и тот же стимул всегда будет разной.

Возможно, все дело в ненадежной нейротрансмиссии, то есть сбоях движения сигнала в синапсах. Во время активности нейрона сигнал движется по аксону, но вероятность того, что он достигнет следующего нейрона, составляет лишь 50%. Из-за этого в системе возникают помехи.

Другой фактор — постоянная активность в самых разных отделах мозга. Например, зрительная кора активируется визуальными образами, но одновременно получает сигналы из других источников, поскольку в мозге много перекрестных соединений. Это позволяет нам ориентироваться в контексте и формировать горизонт ожиданий: так, услышав лай собаки, мы спешим настороженно обернуться, чтобы найти ее глазами.

Даже в отсутствие визуальных стимулов зрительная кора демонстрирует такую же активность, как и при их наличии, являя что-то вроде визуального воображения. Вы что-то видите, одновременно думаете о том, что видели вчера, — возможно, это тоже способствует тому, что реакция на одни и те же стимулы раз от раза меняется.

Наконец, эксперименты и модели показали, что в мозге может возникать активность, затрагивающая области, расположенные далеко друг от друга. Это обычное дело для зрелой коры, в которой связи дальнего радиуса действия сформированы анатомически. Однако даже в раннем возрасте, когда физических связей между разными областями мозга еще нет, корреляция между их активностью уже наблюдается.


Откуда шум?

Любопытно, что паттерны спонтанной активности нейронов складываются на ранних стадиях развития мозга, еще до того, как сформировано сенсорное восприятие. Например, спонтанная активность в зрительной коре наблюдается еще до того, как ребенок впервые откроет глаза. Уже после этого воображение связывается с реальными зрительными образами.

Спонтанная активность присуща нам с раннего возраста, но ее природа пока неизвестна. Возможно, она предопределена генетически, но с большой вероятностью связана с процессом самоорганизации (как самоорганизующаяся система может формировать сложные паттерны, описывается в теории динамических систем). Можно предположить, что весь наш ум определен генами, но это невозможно:
информации в ДНК слишком мало, чтобы определить все многочисленные синаптические связи в мозге. Генетически можно закодировать лишь несколько простых алгоритмов для ранних стадий развития мозга, которые дадут импульс созданию и развитию определенной структуры.
Отправной точкой для такого процесса могут стать всего несколько основных правил — например, как нейроны формируют цепи и как активность цепи, в свою очередь, изменяет соединения в цикле обратной связи.

Нейросеть научилась превращать одиночную фотографию в трехмерную модель


Команда ученых из Университета южной Калифорнии разработала программу, которая позволяет создавать реалистичные трехмерные изображения лица по одной фотографии. Статья исследователей доступна на сайте ArXiv.

Обычно при создании «виртуальных масок» дизайнеры используют качественные фотографии, сделанные в нескольких ракурсах при идеальном освещении. Это необходимо для того, чтобы передать все особенности лица человека, включая его асимметрию, изгибы и мелкие детали, например родинки. Американские ученые предложили метод, который позволяет использовать для этих целей всего один непрофессиональный снимок, сделанный в повседневной обстановке. Для этого они задействовали нейросеть.

Сначала исследователи разработали модель, которая умеет «считывать» форму лица по фото и создавать для него карту альбедо (albedo map), определяющую диффузный цвет (он виден при освещении предмета белым светом). После этого они использовали предварительно подготовленную сверточную нейросеть VGG-19, которая анализировала заготовки лиц и подбирала к ним реалистичные текстуры. Как сообщают авторы статьи, при выполнении этой задачи она опиралась на существующую базу данных лиц, в которой собраны фотографии мужчин и женщин разного возраста и разной национальности.


Разработчики протестировали работу системы, взяв фотографии нескольких знаменитостей и создав для них трехмерных аватаров. Виртуальные двойники появились у Дональда Трампа, Джека Ма, Мохаммеда Али, Иэна Кертиса, а также других известных людей.



Разработчик Google и Uber создал религию об искусственном интеллекте

Бывший топ-разработчик Google и Uber Энтони Левандовски создал собственную религию — «Путь будущего» (Way of the Future). Он подал документы о регистрации организации в Налоговое управление США в Калифорнии.
В них указано, что в поклонении искусственному интеллекту эта инновационная церковь видит «путь развития современного общества». Инженер указал себя президентом и генеральным директором инициативы.

Энтони Левандовски работал сначала в Google, а затем в Uber над созданием беспилотных автомобилей. Однако вскоре был уволен из Uber из-за обвинений в том, что он украл часть разработок Google.

В мае 2017 года суд даже запретил Левандовски работать с датчиками, используемыми на беспилотниках, но оставил за ним право разрабатывать автономные автомобили.

Инженер также остался без вознаграждения от Uber в размере $ 250 млн.

В основе некоммерческой квазирелигиозной организации лежит учение о «развитии бога, основанного на искусственном интеллекте».

Однако пока организация не предоставила больше информации о себе и не ответила на запросы от изданий The Guardian, The Verge и CNET.


Создатели организации считают, что у современных технологий тоже должен быть свой Бог, а религия должна идти в ногу со временем.

"Почему сельскохозяйственные божества отличались от духов охотника-собирателя, почему фабричные руки и крестьяне фантазировали о разном рае? Так почему революционные технологии XXI века не могут создать свое религиозное движение?", - поделился один из создателей Ювал Ноа Харари



Есть ли доказательства того, что мы живем в матрице?


Еще древнегреческий философ Платон, живший почти два с половиной тысячелетия назад, выдвинул предположение, что наш мир не реален. С появлением компьютерной техники и обретением виртуальной реальности человечество все больше приходит к пониманию, что мир, в котором оно живет, может быть симуляцией реальности – матрицей, причем кто и зачем ее создал, нам, скорее всего, никогда не узнать.

Можно ли создать матрицу?


Даже сегодня, имея, к примеру, суперкомпьютер Sunway TaihuLight (Китай), способный выполнять почти сто квадриллионов вычислений в секунду, можно за считанные дни смоделировать несколько миллионов лет истории человечества. А ведь на подходе квантовые компьютеры, которые станут работать в миллионы раз быстрее нынешних. Какие же параметры будут у компьютеров через пятьдесят, сто лет?

А теперь представьте, что некая цивилизация развивалась много миллиардов лет, и по сравнению с ней наша, которой всего несколько тысяч, - это просто новорожденный младенец. Как вы думаете, в состоянии эти высокоразвитые существа создать компьютер или какую-то иную машину, способную симулировать наш мир?

Кто и зачем стал бы создавать матрицу?

Итак, матрицу создать можно; даже наша цивилизация подошла к этому вплотную. Но возникает другой вопрос: кто допустил такое, поскольку с точки зрения нравственности данное действие не совсем законно и оправданно. Вдруг в этом иллюзорном мире что-то пойдет не так? Не слишком ли огромную ответственность берет на себя создатель подобной матрицы?

С другой стороны, можно предположить, что мы живем в матрице, созданной, так сказать, нелегально - кем-то, кто таким образом просто развлекается, а потому даже не задается вопросом о нравственности своей виртуальной игры.

Есть и такой возможный вариант: какое-то высокоразвитое общество запустило данную симуляцию в научных целях, например, в качестве диагностического теста, чтобы выяснить, что и почему с реальным миром пошло не так, и впоследствии исправить ситуацию.

Матрица обнаруживается через свои недостатки?

Можно предположить, что в случае достаточно качественной симуляции реальности никто внутри матрицы даже не поймет, что это - искусственный мир. Но вот в чем проблема: у любой программы, даже самой совершенной, могут появиться сбои.

Вот их-то мы постоянно и замечаем, хотя не можем рационально объяснить. К примеру, эффект дежа вю, когда нам кажется, что какую-то ситуацию мы уже проживали, а в принципе такого быть не может. То же касается множества других загадочных фактов и явлений.

 Скажем, куда бесследно исчезают люди, причем иногда прямо на глазах у свидетелей? Отчего какой-то незнакомый человек вдруг начинает встречаться нам по нескольку раз в сутки? Почему одного человека одновременно видят в нескольких местах?.. Поищите в Интернете: подобные случаи там описаны тысячами. А сколько неописанных хранится в памяти людей?..

В основе матрицы лежит математика

Мир, в котором мы живем, можно представить в виде двоичного кода. Вообще Вселенная лучше объясняется математическим, нежели словесным языком, к примеру, даже наша ДНК разгадана с помощью компьютера в ходе осуществления проекта «Геном человека».

Получается, что в принципе на основе этого генома можно создать и виртуального человека. А если возможно построить одну такую условную личность, то значит - и целый мир (вопрос только в мощности компьютера).

Многие исследователи феномена матрицы предполагают, что некто уже создал такой мир, и это именно та симуляция, в которой мы с вами живем. При помощи той же математики ученые пытаются определить, действительно ли это так. Однако пока они высказывают лишь догадки…


Антропный принцип как доказательство матрицы

Ученые давно уже с удивлением констатируют, что на Земле каким-то непостижимым образом созданы идеальные условия для жизни (антропный принцип). Даже наша Солнечная система – уникальна! При этом в обозримом самыми мощными телескопами пространстве Вселенной нет больше ничего подобного.

Возникает вопрос: почему эти условия так отлично нам подошли? Может быть, они созданы искусственно? Например, в некой лаборатории вселенских масштабов?.. А может, никакой Вселенной и нет и это необъятное звездное небо – тоже симуляция?

Что делать с людьми, которых заменят роботы?


Предсказывать будущее в наши дни стало абсолютным must have среди экспертов. Когда технологии меняют мир настолько стремительно, очень хочется заглянуть хотя бы на несколько лет вперед. Цели разные. Потребителям — пофантазировать, восхититься и/или ужаснуться, бизнесам — скорректировать планы, политикам — продумать меры по сохранению спокойствия в социуме на случай «большого технологического шухера».

К примеру, вот несколько цифр из исследования McKinsey Global Institute от декабря 2017 года:
  • к 2030 году из-за растущего количества роботов работу потеряют 800 млн человек, 375 млн из них, возможно, переквалифицируются;
  • порядка 59% всей производственной деятельности может быть автоматизировано;
  • потенциально автоматизируемо: 90% задач, которые выполняют сварщики и фрезеровщики, 73% профессий в общепите, 43% рабочего времени в финансовом секторе;
  • здравоохранение имеет технический потенциал для автоматизации около 36%.
Такие цифры — где-то больше, где-то меньше — встречаются во многих источниках. А если человек выступает с презентацией в этой теме, то куда же без прогнозов?

По роду деятельности я часто посещаю мероприятия по нейросетям, машинному обучению и big data. Именно эти области разработок заставляют роботов обыгрывать нас в шахматы и го, ретушировать фото и видео так, что мы не видим разницы с настоящим, помогать автомобилям двигаться без водителя.

Конечно же, на таких ивентах все тоже говорят, что искусственный интеллект заместит какие-то профессии. Из очевидного:
  • под угрозой сотрудники колл-центров, потому что есть чат-боты;
  • водители грузовиков и таксисты — самоуправляемые автомобили пока не очень уверенно, но однажды обойдутся без них;
  • частично юристы и частично врачи — базовые заключения и базовая диагностика может делаться чат-ботами и системами автоматического анализа.
Возникает вопрос: что будет с этими людьми, которых вытесняют технологии?
И здесь начинается поле для фантазий. Основных идей две.

Одни говорят, что введут некий социальный налог на робота: если компания вдруг меняет живого человека на машину, то она должна будет его финансировать.

Другие уверены, что люди, высвободившись из оков рутины, либо переучатся — и уйдут в другие профессии, либо останутся в тех же сферах, но займутся более сложными и высокоинтеллектуальными задачами. Есть даже такая фантазия, что значительная часть уйдет в программисты (часть которых, кстати, тоже непременно автоматизируют).

Загвоздка в том, что нынешний технологический рывок случился буквально за 15-20 лет. Люди рассуждают, что роботы могут заменить только какой-то ограниченный набор скиллов. Но, думаю, этот набор гораздо больше, чем мы предполагаем сейчас. И он будет постоянно расширяться.

Уже есть самоуправляемые роботы-автомобили. А если даже не самоуправляемые, то напичканные тысячами датчиков, которые при корректном программировании позволяют автомобилю делать самодиагностику на ходу. Чтобы будущий робот-ремонтник знал, где «лечить». Есть роботы, собирающие автомобили, и роботы, управляющие сборщиками автомобилей. Множество рабочих и даже промежуточных профессий рано или поздно заменится.

Возьмем юриста или врача-диагноста. Для них обоих можно довольно четко прописать дерево «если — то». Понятно, что это касается случаев, где не требуется общение с пациентом, где можно посмотреть пару кодексов и прецедентов для понимания, как поступить. Или, к примеру, бухгалтера. По большей части, они ищут данные, комбинируют, сверяют их в одном-другом-третьем месте. Уже сейчас есть программы, которые решают базовые бухгалтерские проблемы. Они еще не умные и пока только помогают человеку. Но вскоре «докачаются».

Если вдуматься, большинство людей на Земле занимается не очень высокоинтеллектуальным трудом. Да, сложным, но не требующим мегакреатива. Ключевой момент: это повторяющиеся вещи. А значит — автоматизируемые.

Тогда можно предположить, что однажды на планете останутся только крайне умные профессии. Например, ученые, изобретатели, суперкрутые доктора, юристы. В процентах от общего числа их не так много. Всех остальных можно заменить.

Искусственный интеллект, занимающийся физикой, может выводить законы воображаемых вселенных

Музей Леонардо да Винчи
Милан

После обучения ИИ трюкам, которые физики используют для понимания реального мира, получается чрезвычайно мощная машина
Есть знаменитая история о том, как Галилей наблюдал за качанием лампы в Пизанском соборе, и замерял его по отношению к своему пульсу. Он пришёл к выводу, что период постоянен и не зависит от амплитуды.

Галилей предположил, что маятник может управлять часами, и позже разработал подобное устройство, хотя первые часы такого типа построил Гюйгенс через 15 лет после смерти Галилея.

Совершая открытие, гений Галилея проигнорировал все неприятные детали, которые можно было бы учесть – сопротивление воздуха, температуру, мерцание света, шум, других людей, и т.п. Он рассмотрел простейшую модель качающейся лампы, используя только её период, концентрируясь на самой заметной особенности.

Многие историки считают, что подход Галилея представляет самый ранний этап эволюции научного метода – процесса, подарившего нам полёты, квантовую теорию, электронные компьютеры, Общую теорию относительности и искусственный интеллект.

В последние годы ИИ-системы начали находить интересные закономерности в данных и даже самостоятельно выводить определённые законы физики. Но в этих случаях ИИ всегда изучал особый набор данных, изолированный от отвлечений реального мира. Способности этих ИИ-систем сильно не дотягивают до возможностей таких людей, как Галилей.

Могут ли нейронные сети читать мысли, Или о том, как подгонять картинки к моделям

Guohua Shen/ATR
Shen et al., 2017


Недавно в новости попали японские исследователи из ATR Computational Neuroscience Labs в Киото и из Университета Киото. Их статья под названием «Глубокие нейронные сети для реконструкции изображений по активности человеческого мозга» (Shen et al., 2017), по сути, утверждает, что они разработали модель машинного обучения, которая может прочесть ваши мысли (примеры реконструированных из мыслей картинок показаны выше). Что все это значит? Может, пора уже привыкать думать только правильные мысли? Чтобы понять, что на самом деле означает эта новость, придется начать с кратких пояснений.

Как читать мысли глубоких нейросетей

У нейронных сетей всегда была одна большая проблема — непрозрачность: конечный результат увидеть можно, но очень трудно понять, что же там внутри происходит. Это проблема относится ко всем архитектурам, но давайте сейчас сосредоточимся на сверточных нейронных сетях (convolutional neural networks, CNN), которые постоянно используются для обработки изображений и вообще данных с пространственной структурой.

Очень грубо говоря, CNN — это многослойные (глубокие) нейронные сети, в которых каждый слой обрабатывает свой вход маленькими окнами, извлекая локальные признаки. Последовательно, уровень за уровнем, локальные признаки обобщаются и становятся глобальными: признаки на высоких уровнях сети «видят» гораздо большую часть изображения, чем на низких. Вот как это работает в очень простой CNN (картинку я взял из вот этого текста, который рекомендую прочесть полностью):

WILDML
В конце концов, через несколько (иногда несколько сотен) слоев мы получаем глобальные признаки, которые уже «смотрят» на все исходное изображение целиком, и уже их на последних слоях сети мы комбинируем так, чтобы получить метки классов (распознать, кошечка это, собачка или моторная лодка). Но как нам понять, что конкретно распознают эти признаки? Можем ли мы их интерпретировать?

Один возможный способ это понять — посмотреть на картинки, которые активируют конкретные нейроны в этой нейросети. Можно надеяться, что у этих картинок будет что-то общее. Эту идею развили, в частности, в знаменитой работе «Визуализация и понимание сверточных сетей». Вот посмотрите: на картинке ниже показаны окна из реальных изображений (справа), которые дают самые большие активации разным нейронам на одном из высоких уровней сверточной сети, а слева показаны пиксели, которые участвуют в этих активациях. Видно, что такой выбор картинок, подходящих под конкретные признаки, действительно позволяет многие нейроны неплохо интерпретировать:

Rob Fergus

Затем появилась другая простая, но очень интересная идея, которая тоже неплохо работает для интерпретации признаков. Весь процесс обучения модели устроен так: мы берем данные (скажем, размеченные изображения) и подгоняем веса модели так, чтобы модель как можно лучше эти данные описывала. Изображения при этом остаются фиксированными, а меняются веса сети, параметры тех самых сверточных слоев, о которых мы говорили выше.

Но можно попробовать наоборот: давайте зафиксируем сеть и изменим изображение так, чтобы сеть на нем выдавала то, что нам надо!

Для целей интерпретации нейронных сетей эта идея была развита, например, в работе «Интерпретация нейронных сетей при помощи глубокой визуализации». Результаты оптимизации картинок под конкретные цели очень похожи на знаменитые «deep dreams», и это, конечно, не случайно. Вот, например, картинки, специально оптимизированные с целью как можно сильнее активировать те или иные классы:

Jason Yosinski
Немного узнаваемо, но довольно странно выглядит, правда? Похожие эффекты мы увидим и в картинках из «чтения мыслей».

Другое важное применение той же идеи — антагонистические примеры (adversarial examples) для сверточных сетей: раз уж мы научились подгонять картинки под нейронную сеть, а не наоборот, давайте попробуем подогнать картинки так, чтобы обмануть сеть. Так можно получить примеры наподобие вот этого:

Jason Yosinski
Слева на этой картинке — самое обычное изображение, и оно вполне корректно распознается как крышка от бутылки. А справа — «антагонистическое» изображение: разницу между ними трудно заметить, даже когда они стоят рядом, но та же самая сеть, которая картинку слева распознавала как крышку, картинку справа уверенно распознает как… карликового пуделя.

На самом деле картинка справа получилась из картинки слева добавлением специального шума, очень маленьких изменений, которые выглядят абсолютно случайными, но на самом деле все направляют сеть в одну и ту же сторону — в сторону карликового пуделя. Это делается как раз при помощи оптимизации картинок под сеть, в данном случае — под один из ее выходов.

Что «видит» вычислительная система, когда мы просматриваем фильм

Арт-проект Бенджамина Гроссера показывает, что «видит» вычислительная система, когда мы просматриваем фильм. Видео может выглядеть как абстракция или как попытка показывать цвет глазами дальтоника; в реальности это множество временных эскизов, которые синхронизируются со звуком, где фиксирован сам процесс создания компьютером схематического изображения.

Художник создал программу с использованием алгоритма искусственного интеллекта (AIR) и компьютерного зрения (CVA), чтоб дать системе некую степень автономии — компьютер сам выберет то, что «захочет посмотреть».

Гроссер задаёт зрителю трудные вопросы: «почему мы видим то, что мы видим, когда мы видим?». Как говорит автор, его больше всего волнует демонстрация «разницы в пути культурного развития машин и людей».


Бенджамин Гроссер:
Обсуждения о «компьютерном видении» часто фокусируются на использовании камер и программном обеспечении для навигации и интерпретации физического мира.

Например, мы программируем компьютеры «видеть» автомобили для анализа трафика или «идентифицировать» лица для наблюдения. Тем не менее эти виды задач видения по своей сути пытаются заставить компьютер видеть как «мы» делаем.

Assorted Vision является первым в наборе видео, который вместо этого представляет, как компьютеры рассматривают данные на основе изображений для «самих себя», в отличие от нас.

Используя фундаментальный вычислительный метод сортировки массивов значений, это видео посещает каждый пиксель в клипе из The Matrix; результат показывает каждый пиксель оригинала, но переупорядочивается в зависимости от значения его оттенка.

Assorted Vision - это незабываемое усилие моего проекта Autonomous Video Artist.




Google наглядно демонстрирует работу системы ИИ на базе компьютерного зрения, отслеживающей позы человека

Компания Google запустила оригинальный эксперимент под названием Move Mirror, в основе которого лежат технологии искусственного интеллекта. Принять участие в эксперименте могут все желающие.

Для этого требуется посетить сайт Move Mirror и разрешить доступ к камере устройства. После этого камера зафиксирует изображение человека и оценит его позу при помощи модели PoseNet. Затем система ищет в большой базе данных (более 80 тыс. фотографий) наиболее точные соответствия позе пользователя. При этом изображение подобранной фотографии на сайте выводится в режиме реального времени, и когда человек двигается, изменяя позу, автоматически подбирается новое изображение. При желании можно создать GIF изображение изменений поз пользователя и подобранных изображений.

AI Experiments: Move Mirror


В Google отмечают, что для работы Move Mirror используется TensorFlow.js, так что отслеживание поз пользователя осуществляется непосредственно в браузере. Никакие данные не передаются на сервера Google и нигде не сохраняются.

Источник: Engadget



Николас Карр. Делает ли Google нас глупее?


«Дейв, остановись! Да остановись же ты! Стой, Дейв! Ты можешь остановиться?», — умоляет суперкомпьютер HAL непримиримого астронавта Дейва Боумана в знаменитой и необыкновенно драматичной сцене в фильме Стэнли Кубрика «2001: Космическая одиссея». 

Боуман, которого неисправная машина чуть было не обрекла на смерть в глубинах космоса, спокойно и холодно отключает схемы памяти, которые регулируют ее искусственный интеллект. «Дейв, мой разум существует», — говорит HAL сиротливо. «Я чувствую это. Я чувствую».

2001: A Space Odyssey (original title) //
2001 год: Космическая одиссея


Director:
Stanley Kubrick
Writers:
Stanley Kubrick (screenplay), Arthur C. Clarke (screenplay)
Stars:
Keir Dullea, Gary Lockwood, William Sylvester | See full cast & crew
Я тоже это чувствую. Несколько лет назад у меня появилась тревожная мысль, что кто-то или что-то, копалось в моем мозге, перенастраивало нервную систему, перепрограммировало память.

Не то, чтобы я теряю разум – по крайней мере, мне так не кажется, — но он изменяется. Я не думаю так, как я привык думать. Это сильнее всего ощущается во время чтения.

Раньше погрузиться в книгу или длинную статью было просто. Мой ум следовал за повествованием или же проносился по виражам из аргументов, я мог провести часы, гуляя по необъятным просторам текстов. Вряд ли такое ещё случится. Сейчас я часто теряю концентрацию уже после двух-трех страниц. Я суечусь, теряю нить рассуждений, начинаю искать, что бы ещё сделать. Я чувствую, как заставляю свой капризный мозг вернуться к тексту. Вдумчивое и серьезное чтение, которое было естественным, превратилось в проблему.

Я думаю, что знаю, что происходит. Больше десятилетия я провожу много времени онлайн, ищу информацию и прехожу с сайта на сайт, и иногда добавляю что-нибудь в огромные базы данных Интернета.

Сеть – это находка для меня как писателя. Исследование, для которого раньше требовались дни в книгохранилищах или залах периодики библиотек, сейчас осуществляется за минуты. Несколько Google-запросов, кликов на гиперссылки — и готов факт или содержательная цитата. Даже если я не работаю, я захожу в Сеть с тем же удовольствием, если бы тысячу лет не делал этого.

Читаю и пишу e-мейлы, просматриваю заголовки или посты в блогах, смотрю видео и слушаю подкасты, или попросту путешествую с ссылки на ссылку. (В отличие от сносок, с которыми их иногда путают, гиперссылки не только указывают на связанные с ней работы, но уводят вас от них).

Для меня, как и многих других, Сеть становится универсальным медиумом, каналом для большей части информации, которая поступает благодаря зрению и слуху в мозг. Преимуществ мгновенного доступа к такому невероятно богатому арсеналу информации много, и они уже широко описаны и оценены должным образом. «Абсолютный конец кремниевой памяти», --написал Клив Томпсон в журнале Wired, «может оказаться хорошей почвой для размышлений». Но эта почва имеет цену.

Как отметил в 1960-х теоретик медиа Маршалл Маклюэн, медиа — не просто пассивные каналы информации. Они поставляют материал для размышлений, но они также формируют и сам процесс мышления. И, кажется, что интернет урезает мою способность к концентрации и созерцанию. Сейчас мой мозг рассчитывает получать информацию тем же способом, которым Сеть распространяет её: в быстро движущемся потоке частиц. Когда-то я был аквалангистом в море слов. Сейчас я проношусь по поверхности как парень на моторной лодке.

Сеть как способ мышления

И я не один. Когда я рассказываю о своих проблемах с чтением друзьям и знакомым – в большинстве своём это литераторы, многие из них говорят, что замечают за собой что-то подобное. Чем больше они пользуются Сетью, тем чаще вынуждены силой удерживать внимание на длинных кусках текста. Некоторые блогеры, которых я читаю, тоже стали замечать этот феномен. Скот Кап, который ведёт блог об онлайн-медиа, недавно признался что совершенно перестал читать книги. «Я был среди читающего большинства в колледже, настоящим книжным червем», — писал он. «И что произошло?» Он рассуждает над ответом: «Что если я читаю всё онлайн не потому, что мне так удобнее, но из-за изменившегося способа мышления?»

Робот-эйчар уволил программиста — об этом не знало даже начальство


Американский разработчик и сооснователь компании Renly Ибрагим Диалло рассказал, как машина уволила его с работы без ведома руководства. Мужчину постепенно лишали доступа к рабочему месту, пока в какой-то момент не разорвали контракт. О необычном освобождения Диалло рассказал в своем блоге.

К моменту увольнения разработчик восемь месяцев работал в крупной компании, название которой он не уточнил. По словам Диалло, он работал добросовестно и получал похвалы от начальства, пока однажды утром ему не пришло необычное сообщение.

“Было 7 утра, когда зазвонил телефон. Вместо будильника меня разбудила моя рекрутёр. Было слишком рано для телефонных звонков или для того, чтобы быть застигнутым врасплох, поэтому я не ответил. Я пошёл в душ и приготовился ко дню. На работе я послушал запись автоответчика, которую она мне оставила: “Боже мой, ты в порядке!?”
Мужчина решил, что его с кем-то перепутали, ведь в компании работает несколько его полных тёзок. Однако на этом странности не закончились: Диалло не смог попасть на работу, так как его проходка оказалась недействительна. Тогда разработчик посмотрел на охранника, который пожал плечами, посмеялся и пропустил его через турникеты вручную.

Диалло всё-таки позвонил рекрутёру, чтобы разобраться в ситуации. Девушка рассказала ему, что получила электронное письмо о нём и переспросила всё ли с ним в порядке. Рекрутёр пообещала уточнить детали у своего менеджера и перезвонить, но так и не сделала этого. 

Короткометражка «Доработка» (Retrofit)


Модернизация установлена в ближайшем будущем, когда смерть - это просто новое начало для тех, кто может себе это позволить.

Дилан, руководствуясь потребностью в примирении, возвращает своего отца из мертвых и вживляет его в потрепанный робот, приобретенный на «черном» рынке…

Фильм был создан в сотрудничестве с различными художниками по визуальным эффектам, в основном живущими в Великобритании.

Режиссёры Гвилим и Ллойд Моррисы.

В главных ролях Том Ботт и Фрэнк Фицпатрик. Перевод и озвучка — DeeAFilm Studio





Как Google Duplex ведёт нас в киберпанк-будущее


В начале мая 2018г.  прошла ежегодная конференция разработчиков Google I/O 2018. Корпорация объявила, что в основу ее следующей операционной системы под рабочим названием Android P ляжет принцип искусственного интеллекта. Новая ОС будет лучше понимать, как люди используют смартфон, подстраиваться под график и ритм жизни пользователя. Голосовой помощник сможет выполнять сложные и нелинейные запросы и даже учить вежливости, если вопрос задан грубо. Технология Google Lens позволит сканировать окружающий мир, распознавая объекты – от пород собак до названия книг – и искать о них необходимую информацию и похожие товары в интернете. Звучит так, словно будущее уже наступило, правда?

Так же подумали и участники конференции, первыми увидевшие презентацию ещё одного апгрейда ИскИна Google – Google Duplex. На глазах у зала голосовой помощник позвонил в парикмахерскую и записал пользовательницу на стрижку. Киберсобеседник общался с сотрудницей салона в совершенно естественной манере, делая паузы, переспрашивая и хмыкая, как живой человек. На другом конце провода даже не поняли, что общались с роботом.


Демонстрация возможностей Google Duplex произвела фурор. Бот понимает контекст и может вести осмысленный разговор на заданную тему, переспрашивать и корректно реагировать на заминки, вопросы и паузы собеседника. Похоже, он недалёк от того, чтобы пройти тест Тьюринга — проверку, отделяющую людей от машин.

Дети Икс: дни скорого будущего


Многих интересует вопрос, когда же искусственный интеллект наконец обретет свое лицо, и человеческое ли оно вообще, или же это звериный оскал, как у капитализма. И пока в Институте Сингулярности (SIAI) в США изучают проблемы глобального риска, которые может создать будущий сверхчеловеческий искусственный интеллект, сотрудники новозеландской Лаборатории анимационных технологий при Оклендском университете в Новой Зеландии вовсю контактируют с дальним родственником Терминатора – анимированным ребенком.

Исследователи попытались подружить искусственный интеллект на основе сложных нейронных сетей с внешностью маленькой девочки. Проект получил название Baby X – очевидно, благодаря Х-хромосоме, – и в данный момент тестирование проходит уже третья программная версия этого интересного эксперимента.

Это уже не просто симулятор младенца кукла Baby Born – оставим такие игрушки настоящим детям. Baby X – это интерактивная анимированная модель трехлетней девочки. Ее поведение полностью контролируется специальными психобиологическими алгоритмами, которые разработали сотрудники лаборатории. Это почти что настоящий, полноценный ребенок, способный радоваться, грустить, интересоваться новыми вещами и максимально полно выражать свои эмоции на экране монитора.
«Искусственная девочка» видит окружающий мир с помощью встроенной в компьютер камеры и слышит его при помощи микрофона. В реальном времени она способна реагировать на знакомые слова и ассоциировать их с теми или иными объектами, действиями или изображениями. Можно сказать, что Baby X обучается точно так же, как и реальные дети ее возраста.

Мы их или они нас


Американский ученый Макс Тегмарк, признанный авторитет в сфере ИИ, опубликовал новую книгу о том, какие шаги нужно предпринять, чтобы люди выжили в мире машин

Тегмарк, к мнению которого прислушиваются Илон Маск, Стивен Хокинг и Рэй Курцвэйл, дал своей новой книге красноречивое название Жизнь 3.0.

В предисловии к книге ученый прямо указывает, что не принадлежит к числу паникеров. Победа машин не обязательно должна обернуться чем-то ужасным, констатирует Тегмарк. Главное – сделать так, чтобы мы сами решили, каким будет наше будущее в эпоху машин, и не допустили, чтобы это сделали за нас, заявляет он.
Все в наших руках

Основная задача человечества в условиях приближающейся эпохи ИИ – сделать так, чтобы цели и задачи машин не шли вразрез с целями и задачами людей. Это первый и ключевой тезис книги.

Это позволит в некоторой степени обеспечить безопасность людей во времена, когда машины будет превосходить их в развитии и в количестве.

Макс Тегмарк,
профессор Массачуссетского технологического института
Важно также подготовиться к тому, что в определенный момент (и это произойдет достаточно скоро!) люди перестанут быть самым разумным видом на планете Земля. Или по крайней мере, перестанут быть единственным разумным видом.

И да, вероятно, разумная жизнь будет основана не на углеродных соединениях, а на кремниевых чипах или других аналогичных вычислительных технологиях. Т.е. Тегмарк считает, что пора готовиться к трансформации человечества как такового.

Люди будущего будут представлять собой симбиоз человека и машин с серьезным уклоном в сторону машин, убежден Тегмарк. И этого не стоит бояться, это тоже будет жизнь, просто на другой основе.

Больше того, предсказывает Тегмарк, это может быть вечная жизнь. Сверхлюди будущего, лишенные хрупких тел, смогут существовать бесконечно долго.

Но для этого предстоит приложить определенные усилия, в частности, упомянутые выше. Нужно сделать так, чтобы ИИ изначально не конфликтовал с человечеством.

Тегмарк солидарен в своих опасениях насчет возможного будущего ИИ с Илоном Маском. Больше того, вместе со своим другом Яаном Таллином, со-основателем Skype, на деньги Маска Тегмарк проводит изыскания в организации Future of Life Institute, штаб-квартира которой расположена в Кэмбридже, штат Массачуссетс.

Робогражданка Саудовской Аравии встала на ноги


Робот-гуманоид София наконец-то получила нижнюю часть тела и теперь может самостоятельно перемещаться, правда не быстро — всего 1 километр в час. Также робот умеет жестикулировать и выполнять простые танцевальные движения.

Свое новое умение София продемонстрировала посетителям выставки технологий CES 2018 в Лас-Вегасе. Напомним, что человекоподобный робот работает на блокчейн-платформе SingularityNET с искусственным интеллектом и умеет общаться с собеседником на разные темы.


Впервые о Софии стало известно в 2015 году, и с тех пор компания Hanson Robotics постоянно развивает навыки робота. В настоящий момент София умеет воспроизводить 62 разные эмоции с помощью механических мышц лица. В глаза робота встроены камеры, поэтому она может поворачивать голову и «смотреть» на собеседника, а также общаться на английском языке.

Робот нанимает человека: плюсы известны, в чём минусы?


«Вера» собственной персоной.
По желанию работодателя может предстать и в мужском облике: «Ермил».

«Будущее настало!». Вот каким настроением встречена новость о применении робота для найма новых сотрудников сетью салонов «Связной». Робот «Вера», разработанный российской компанией Stafory, был использован «Связным» для ускорения рекрутинга — и на текущий момент это один из наиболее крупных и удачных опытов такого рода. Собственно, «Вера» на российском рынке уже не одна, около года здесь трудится, например, российский же роборекрутер Skillaz. Но тем больше причин рассказать, почему, наблюдая за успехами роборекрутинга, не все испытывают восторг — кое-кого преследуют страх и отвращение. И вовсе не потому, что машины освоили профессию, которой традиционно занимался только человек, но потому, что люди, которые этим теперь пользуются, не видят последствий...

Unity Adam demo - the full film

Unity Adam demo - the full film

Adam — короткометражный демо-фильм, лауреат премии Webby Award, полностью созданный на платформе Unity для показа в реальном времени.