Как мы видим? Нейробиология зрительного восприятия - Ричард Маслэнд
Шрифт:
Интервал:
Закладка:
Сегодня почти каждое новое изобретение лишь поначалу принимается с торжествующим криком, а потом он переходит в вопль страха.
До сих пор я не высказывался однозначно, но теперь скажу прямо: как и большинство ученых, я считаю, что мозг – это компьютер. Поначалу такого рода сопоставления оставались всего лишь красивой метафорой. В 1980-х компьютеры были настолько несовершенны, что едва могли разобраться с вашей чековой книжкой. Но в последующие годы их вычислительная мощность удваивалась каждые 18 месяцев, как это предсказывал закон Мура, и сегодня от скорости и производительности компьютеров захватывает дух. Также в соответствии с законом Мура хорошие быстрые компьютеры стали относительно дешевы. Конечно, мы, ученые, не можем позволить себе такие же супермашины, которыми пользуются Агентство национальной безопасности (АНБ), Google или ЦРУ. Но нам вполне по карману приобрести достаточно мощный компьютер, способный сравниться если не с мозгом, то хотя бы с маленьким кусочком мозга. Это дало возможность начать создавать модели, которые имитируют мозг или по крайней мере некоторые его функции, и через это лучше понять работу настоящего живого мозга.
Это замечательный прогресс, в котором кроется своя ирония. На заре эпохи компьютерных технологий разработчики создавали зачатки искусственного интеллекта, черпая вдохновение в живом мозге. Но постепенно компьютеры развивались, а люди учились все лучше их обучать, так что в итоге машины в решении некоторых задач превзошли мозг. В результате сегодня не только создатели искусственного интеллекта учатся у живого мозга, но и нейробиологи узнают о мозге много нового благодаря компьютерам и ИИ. Это замечательная улица с двусторонним движением – объединение сил в попытке понять феномен восприятия, и в конце книги мы рассмотрим несколько областей, в которых живой мозг продолжает вдохновлять разработчиков компьютерных систем. Одним из таких направлений, следующим важным этапом в развитии ИИ, является машинное обучение без учителя. Но сначала я расскажу вам о том, что уже умеют делать современные умные компьютеры и что мы можем узнать о нашем собственном мозге благодаря им.
* * *
Лет 20 назад я столкнулся на коктейльной вечеринке с инженером из аэрокосмической компании, которая специализировалась на машинном распознавании образов и, в частности, разрабатывала системы наведения для «умных» бомб. На мой вопрос, используют ли они в своих разработках принципы нейронных сетей, он с ноткой раздражения ответил: «Послушайте, моя задача – создать систему, которая умеет обнаруживать танки среди деревьев. За это мне и платят. Зачем мне вся эта нейронная чушь с ее нечеткой логикой и прочими непонятными вещами? Мне нужно точно знать, как работает моя система, и точка».
Пережитки такого образа мышления сохраняются по сей день. Да, разработчики нейронных сетей не всегда могут сказать, как именно работает их детище, но, несмотря на это, нейронные сети все шире используются для выполнения различных задач, таких как управление автомобилем и т. п. Желание инженеров с их предельно рациональным мышлением детально знать каждый шаг вполне понятно, и в будущем «умные» компьютеры, возможно, помогут им в этом. В конце концов, компьютер всего лишь машина, которая состоит из обычных атомов, и теоретически всегда можно узнать, в каком состоянии находится каждый ее компонент. Поэтому я уверен, что когда-нибудь инженеры в этом разберутся. А тем временем искусственный интеллект будет продолжать совершенствоваться – даже если мы не всегда будем знать, как именно он это делает.
КОМПЬЮТЕРЫ, КОТОРЫЕ СПОСОБНЫ УЧИТЬСЯ
Итак, способность распознавать лица развивается у обезьян благодаря опыту: чтобы в мозге обезьяны появились нейроны, избирательно реагирующие на лица, и участки распознавания лиц, она должна видеть лица. Но как это происходит? Как регулярное восприятие лиц превращается в физическую цепь нейронных связей, идущую из сетчатки в латеральное коленчатое тело, затем в первичную зрительную кору V1 и далее в височную долю, где расположены участки распознавания лиц? На данный момент у нас есть лишь проблески понимания и обрывочные факты с единственной надежной биологической основой – механизмом долговременной потенциации, обеспечивающим усиление синаптических связей по мере практики. Однако мы можем зайти с другой стороны: существует модель, которую мы хорошо понимаем, потому что сами же ее и создали, – и эта модель называется компьютерным зрением.
Дедушкой современных видящих компьютеров (которые вполне можно приравнять к мыслящим компьютерам) был уже упомянутый выше перцептрон. Поскольку перцептрон воплощает в себе базовый принцип машинного обучения, давайте поговорим о нем подробнее.
Первый перцептрон, созданный в конце 1950-х гг., имел простое устройство: он включал набор перцептивных элементов (сенсоров), каждый из которых мог воспринимать один простой параметр, и центр принятия решений, который механистически суммировал входные сигналы и выдавал общий выход. В его основе лежала ранняя версия системы распознавания образов со звучным названием «пандемониум», которая была предложена изобретателем Оливером Селфриджем. Перцептивные элементы в этой системе соответственно назывались «демоны». Каждый демон отвечал за восприятие конкретного признака и мог передавать информацию тремя способами: молчать, шептать «Я вижу немного этого признака» или кричать «Я его вижу!» (одно из значений слова «пандемониум» – адский шум и гам; именно это происходило, когда все демоны принимались одновременно выкрикивать свои сообщения).
Перцептрон способен учиться и становиться «умнее». Предположим, вы хотите научить его распознавать дома. Вы показываете ему изображение дома, в ответ на что все перцептивные демоны сообщают центру решений свои фрагменты информации. Затем вы, выступая в роли учителя, сообщаете центру решений: «Это дом» – на основе чего тот оценивает ввод каждого демона, определяя его ценность для вывода системы в целом (ценность выражается в виде весового коэффициента). Например, демон, отвечающий за обнаружение прямых линий, дал ценный ввод (потому что дома содержат много прямых линий); следовательно, в будущем его голосу будет придаваться чуть больше веса. Хотя сам по себе этот демон не может идентифицировать дом, распознаваемый им признак – прямые линии – имеет непосредственное отношение к изображению дома. И наоборот, демоны, воспринимающие не связанные с домами признаки, дали малоценный ввод, поэтому в будущем их сообщениям будет придаваться меньший вес.
На рисунке ниже показана базовая структура перцептрона. На языке машинного обучения перцептрон называется алгоритмом контролируемого обучения бинарных классификаторов.
Это означает, что перцептрон может принимать решения «да – нет» или в контексте распознавания лиц «Это Бет» или «Это не Бет». Хотя это звучит примитивно, параллельная работа множества таких перцептронов – основа распознавания объектов.