Homo Roboticus? Люди и машины в поисках взаимопонимания - Джон Маркофф
Шрифт:
Интервал:
Закладка:
Чейер был одним из немногих исследователей Кремниевой долины, рано понявших, что интернет станет звеном, объединяющим всю коммерцию. Чейер пришел к одному из конкурентов, VerticalNet, создал там исследовательскую лабораторию и вскоре был назначен вице-президентом по разработке. Как и Грубера, его захватил водоворот доткомов. В какой-то момент рыночная стоимость VerticalNet взлетела до $12 млрд при доходах немного больше $112 млн. Конечно, это не могло продолжаться долго. Он проработал в компании четыре года, а затем вернулся в SRI.
DARPA обратилось к Чейеру с предложением возглавить амбициозный проект национального масштаба по созданию CALO, находившийся под крылом Тони Тетера. DARPA рассчитывало, что он привлечет исследователей искусственного интеллекта со всей страны. Обычно DARPA финансировало сразу несколько исследовательских лабораторий и не интегрировало результаты. Однако на этот раз предполагалось, что разработку CALO будет координировать SRI. Все должны были отчитываться перед командой SRI и работать над одной интегрированной системой. Чейер помог написать первоначальное предложение DARPA и стал архитектором проекта, когда SRI получил заказ. CALO твердо основывался на традиционном символьном подходе первого поколения искусственного интеллекта – планирование, рассуждение и онтологии, – но было и новое направление, которое обозначалась как «обучение в естественной среде».
CALO был похож на небольшой Манхэттенский проект. На пике в нем участвовало более 400 человек, а его результатом стало более 600 исследовательских работ. DARPA потратило на него почти четверть миллиарда долларов, что делает его одним из самых дорогих проектов в области искусственного интеллекта в истории. Участники проекта CALO пытались создать программного помощника с адаптируемостью, как у человека, способного учиться у человека, с которым он работает, и соответственно менять свое поведение.
Когда CALO прошел ежегодные тесты, DARPA было в восторге. Тетер наградил проект за отличные успехи, а часть технологий перешла в проекты ВМС. Но Адам Чейер, как архитектор проекта, испытал сильнейшее разочарование. Джон Маккарти как-то сказал, что для создания «интеллектуальной машины» нужны «1,8 Эйнштейна и десятая часть ресурсов Манхэттенского проекта». Если исходить из оценки Маккарти и учесть, что Манхэттенский проект стоил бы больше $25 млрд в текущих долларах, то на CALO ушло меньше того, что требовалось для создания интеллектуальной машины.
Для Чейера, однако, основным препятствием в проектировании CALO был не дефицит финансирования, а DARPA, пытавшееся мелочно контролировать процесс. Часто ему не удавалось действовать по своему плану, руководство неоднократно отклоняло его идеи. Ему было трудно направлять огромное количество команд, каждая из которых имела собственные приоритеты и получила лишь небольшую часть финансирования от проекта CALO. Призывы Чейера работать совместно над общим проектом, интегрировавшим множество идей в новую «когнитивную» архитектуру, в основном не находили отклика. Его вежливо выслушивали, поскольку хотели получить следующий транш, и создавали программы, но всех в первую очередь интересовали собственные проекты. Большая и бюрократическая программа не могла родить нечто, способное оказать прямое воздействие на реальный мир.
Чтобы справиться с разочарованием, он наметил ряд параллельных проектов для продолжения работы в 2007 г. Они варьировали от попыток коммерциализировать технологию CALO до создания с несколькими друзьями социальной сети для активистов под названием change.org. Этот год стал удивительно плодотворным для Чейера. С аспирантом Дидье Гуццони он использовал технологии CALO для создания новой системы разработки программного обеспечения, в конечном итоге ставшей основой для Siri. Он также собрал небольшую группу разработчиков, начавшую выпускать на рынок различные компоненты Siri: календари для смартфонов, средства онлайнового чтения новостей и т. д. Он также принял участие в создании компании машинного обучения Genetic Finance, построившей кластер более чем из миллиона компьютеров для решения задач в сфере финансов, например прогнозирования состояния фондового рынка.
Попутно Чейер обратился к руководству SRI с просьбой профинансировать исследовательские работы. Он сказал: «Я хочу начать небольшой параллельный проект и создать собственного помощника CALO, но так, как я вижу это». Ему хотелось получить цельную интегрированную систему, а не лоскутное одеяло, сделанное десятками различных организаций. SRI согласился, проект назвали Active Ontologies. Чейер занимался им параллельно основной работе.
Проект получил ускорение, когда группа ведущих технических специалистов SRI собралась на однодневном выездном семинаре в Хаф-Мун-Бэй, прибрежном городке неподалеку от лаборатории в Менло-Парке. Глава SRI Курт Карлсон все настойчивее требовал превращения результатов исследований в источник прибыли, и CALO был очевидным кандидатом. Семинар имел большое значение для поиска ответов на основополагающие вопросы о целях программного обеспечения: какими должны быть «ощущения» от персонального помощника? Следует ли использовать аватар? Аватары всегда были спорным аспектом при разработке виртуальных помощников. Видео о Knowledge Navigator компании Apple показывало строгого молодого человека с галстуком-бабочкой, чуть смахивавшего на Стива Джобса. Однако у проекта CALO не было аватара. Разработчики по-разному отвечали на вопрос, должна ли система быть виртуальным собеседником, своего рода персональным компаньоном, которым исследователи занимались не одно десятилетие, предлагая пользователям «поговорить» с помощью клавиатуры с программами вроде Eliza. В конце концов компромисс нашли. Было решено, что вряд ли кто-то станет сидеть и болтать с виртуальным роботом весь день и нужно создавать систему для людей, которым требуется помощь в управлении повседневными делами.
Группа придумала понятие «наггетсы для удовольствия». Поскольку она пыталась создать подобную человеку личность, возникла идея вставить в программу вызывающие расположение людей фразы. Например, если пользователь спрашивает систему о прогнозе погоды на день, то она не просто отвечает, что может быть дождь, а добавляет: «Не забудьте зонтик!» Разработчики хотели дать пользователю то, что он хочет, и сделать целью проекта помощь людям в управлении повседневными делами и при этом (чуть-чуть) удивить их. Включение этих фраз добавляло взаимодействию ощущение человечности, хотя системы еще не обладали функциями синтеза и распознавания речи.
Встреча 2007 г. послужила стартовой площадкой. Совет SRI по коммерциализации одобрил в августе решение команды найти внешнее финансирование. Название Siri стало работать на самых разных уровнях. Помимо того, что оно означало «секрет» на суахили, Чейер когда-то работал над проектом Iris, т. е. Siri наоборот. И конечно, всем понравилось, что это название было похоже на SRI.
В 1987 г. руководитель Apple Джон Скалли выступил с программной речью на национальной конференции по информационным технологиям в образовании Educom. Он показал рекламный ролик, сделанный небольшой командой Apple для демонстрации идеи Knowledge Navigator. Идея, конечно, привлекла внимание публики, но в тот момент она показалось очень далеким будущим. Система Knowledge Navigator была прорывом, указывавшим путь к компьютерному миру после настольных компьютеров середины 1980-х гг. Knowledge Navigator в конечном итоге породила в Кремниевой долине поток высокотехнологичных «заявлений о видении», в том числе одно от Microsoft, сделанное Биллом Гейтсом в 1991 г. и названное «Информация на кончиках пальцев» (Information at Your Fingertips). Но Knowledge Navigator первой дала убедительное представление о будущем после настольных компьютеров. В центре видео находился разговор между рассеянным преподавателем и веселым экранным аватаром с галстуком-бабочкой, действовавшим как советчик преподавателя в его исследованиях и повседневных делах. Это был набросок будущего, где для взаимодействия с компьютером не требовались клавиатура и мышь. Knowledge Navigator предполагала естественный разговор с интеллектуальной машиной, которая и распознавала, и синтезировала речь.