Homo Roboticus? Люди и машины в поисках взаимопонимания - Джон Маркофф
Шрифт:
Интервал:
Закладка:
Озарение пришло к Амнону Шашуа, когда он, студент последнего курса по информатике в Иерусалиме, сидел в библиотеке. Из статьи Шимона Ульмана, который был первым аспирантом у пионера в области исследования зрения Давида Марра, он неожиданно для себя узнал, что сетчатка глаза человека во многих отношениях является компьютером. Ульман был компьютерщиком и специализировался на изучении зрения и людей, и машин. Мысль о том, что внутри глаза происходит обработка данных, захватила Шашуа, и он решил пойти по стопам Ульмана.
Шашуа приехал в Массачусетский технологический институт в 1996 г. для изучения проблемы искусственного интеллекта, когда отрасль восстанавливалась после очередного спада. Компании пытались создавать коммерческие экспертные системы на основе правил и логического подхода, предложенного пионерами искусственного интеллекта вроде Эда Фейгенбаума и Джона Маккарти. На заре развития искусственного интеллекта казалось, что встроить предметные экспертные знания в программную оболочку довольно просто, однако программы были ненадежными и не имели успеха на рынке, что привело к краху целого ряда амбициозных стартапов. Теперь же мир искусственного интеллекта возрождался. Прогресс, который первые три десятилетия был сравнительно медленным, наконец стал очевидным в 1990-х гг., когда статистические методы сделали проблему систематизации и принятия решений разрешимой. Эксперименты в области искусственного интеллекта пока что не приносили грандиозных результатов, поскольку компьютерам той эпохи не хватало мощности для обработки необходимых данных, но новые идеи уже витали в воздухе.
В аспирантуре Шашуа сосредоточился на перспективном подходе к визуальному распознаванию объектов путем получения множества изображений и определения геометрии. Идея была заимствована из сферы компьютерной графики, где ее предложил Мартин Ньюэлл в период учебы в магистратуре в Университете Юты. В 1970-е гг. в стенах этого университета родилось немало подходов к созданию компьютерной графики. На эту идею Ньюэлла натолкнул обычный чайник Melitta. Однажды, когда он за чаем обсуждал проблемы моделирования объектов с женой, она предложила ему смоделировать этот чайник, который впоследствии стал иконой исследований в области компьютерной графики.
В Массачусетском технологическом институте Шашуа учился у специалистов в области компьютерного зрения Томми Поджио и Эрика Гримсона. Поджио был ученым, работавшим на стыке вычислительной техники и нейробиологии. Гримсон, специалист по вычислительной технике, позже стал ректором Массачусетского технологического института. В то время казалось, что от определения формы объектов до их распознавания один шаг, однако разработка программ распознавания оказалась сложнейшей задачей. Даже сегодня заветная цель – «понимание сцен» (например, не только идентификация фигуры как женщины, но и определение того, что она делает) – недостижима, и существенный прогресс заметен лишь в некоторых узких областях. Так, многие автомобили могут сейчас распознавать пешеходов и велосипедистов и сбрасывать скорость до столкновения.
Шашуа стал одним из мастеров по освоению таких областей. В академическом мире, где специалисты в области мозга вели бесконечный спор со специалистами по теории вычислительных машин, он примкнул к группе, позиция которой выражалась словами «хотя самолеты не машут крыльями, это не означает, что они не могут летать». После аспирантуры Шашуа вернулся в Израиль и основал успешную компанию Cognitens, использующую моделирование зрения для создания невероятно точных трехмерных моделей деталей промышленного назначения. Эти образы с допусками не больше толщины волоса позволяли производителям из разных отраслей, от автомобильной до аэрокосмической, создавать цифровые модели существующих деталей для проверки их годности и качества поверхности. На компанию быстро нашелся покупатель.
В поисках нового применения сил Шашуа узнал от бывшего клиента об автопроизводителе, которому нужна технология стереозрения для компьютерной системы управления. Там знали о работе Шашуа в области геометрии множественных проекций и поинтересовались, не может ли он предложить что-либо в области стереозрения. Шашуа ответил: «Вопрос, конечно, интересный, но вам не нужна стереосистема, можно обойтись и одной камерой». Он пояснил, что, если нужно, люди способны определять расстояние с помощью одного глаза.
Предприимчивый Шашуа убедил General Motors вложить $200 000 в разработку демонстрационного программного обеспечения, а потом предложил своему другу, бизнесмену Зиву Авираму, создать новую компанию. «Это шанс, – сказал он. – Поле для игры здесь огромно, все представляют его совершенно неправильно, а у нас уже есть готовый платить заказчик». Они назвали новую компанию Mobileye. Шашуа написал демонстрационную программу для настольного компьютера и вскоре показал систему машинного зрения с одной камерой, которая в то время казалась автомобилестроителям научной фантастикой.
Через полгода после начала проекта Шашуа узнал от крупного поставщика автокомпонентов, что General Motors собирается объявить конкурс на разработку способа предупреждения водителей о выходе автомобиля из своего ряда. До этого Mobileye концентрировалась на далеких от практической реализации проблемах, таких как обнаружение автомобилей и пешеходов, которые считались в отрасли неразрешимыми. Но поставщик автокомпонентов посоветовал Шашуа: «Вы должны показать что-нибудь прямо сейчас. Важно зацепить автопроизводителей чем-то реальным, а потом можно работать дальше».
Эта идея показалась Шашуа разумной, и он подключил на пару месяцев одного из своих студентов в Еврейском университете к этому проекту. Демонстрационная программа удержания полосы движения получилась довольно приличной, но Шашуа понимал, что она вряд ли превзойдет программы конкурентов, начавших заниматься разработкой раньше, и что у молодой компании практически нет шансов на победу.
А потом его осенило. Он добавил в программу функцию обнаружения автомобилей, а в GM сказал, что эта возможность – техническая накладка, на которую не нужно обращать внимания. «В следующей версии мы ее уберем, поэтому просто не обращайте внимания», – сказал он. Этого было достаточно. В GM пришли в восторг от возможности повысить безопасность за счет обнаружения других автомобилей за небольшие деньги. Автогигант немедленно отменил конкурс и начал финансировать разработки компании-новичка. Обнаружение транспортных средств должно было привести к появлению нового поколения систем безопасности, которые не заменяют водителей, а расширяют их возможности с помощью невидимого датчика и компьютерной сети безопасности. Такие средства, как сигнализатор выхода за пределы полосы движения, адаптивный круиз-контроль, сигнализатор возможности столкновения и система экстренного торможения, быстро становятся стандартом безопасности автомобилей.
Mobileye превратилась в одного из крупнейших международных поставщиков систем видения на основе искусственного интеллекта для автомобильной промышленности, но у Шашуа были более масштабные идеи. После создания Cognitens и Mobileye он в 2001 г. работал научным сотрудником с ученой степенью в Стэнфорде и занимал один офис с Себастьяном Труном. Оба они в конечном итоге стали пионерами в создании беспилотных автомобилей. Шашуа использовал те же технологии, что и Трун, но с более прагматичным, менее «оторванным от земли» подходом. Большое влияние на него оказал Поджио, проповедовавший биологический подход к зрению, который был альтернативой использованию «грубой силы» – все более мощных компьютеров.