Миры, которые я вижу. Любопытство, исследования и открытия на заре ИИ - Fei-Fei Li
Шрифт:
Интервал:
Закладка:
С годами это вошло в привычку и у меня.
Еще одна Tesla. Менее чем через год после выпуска Model S в середине 2012 года автомобиль стал модным трендом Пало-Альто, и я видел повсюду. Наверное, еще один технарь. Возможно, из венчурного капитала. Следующий автомобиль, мимо которого я проходил, был не таким модным, но все же о чем-то говорил. Это был какой-то хэтчбек, выкрашенный в бежевый цвет, но выцветший от многолетней стоянки на улице. Похоже на то, на чем ездил бы один из моих студентов.
Я был приглашен на ужин в недавно открывшийся ресторан горячих горшков и воспользовался Google Maps, чтобы найти его, включая несколько фотографий витрины из Street View, чтобы убедиться, что я узнаю ее из машины. По дороге мой обычно неспешный интерес к визуальным мелочам - привычка, которая никогда не отключается, но чаще всего отступает, превращаясь в некий белый шум, - проявлялся активнее, чем обычно. Если половина меня ориентировалась на то, как добраться до ужина, то другая половина была одержима тем, что я видел по дороге.
При всем том, что автомобили могут рассказать о людях, от отдельных личностей до сообществ, существуют ограничения по масштабу, в котором их можно оценить. Именно такую информацию исторически пытались собрать с помощью опросов, но платить профессионалам за создание карт автомобильной собственности в масштабах города дорого и долго, и их невозможно практически использовать за пределами регионов скромных размеров. Но что, если эти ограничения можно преодолеть? Что, если бы подобный анализ можно было проводить в любом масштабе? И что, если бы это были не только автомобили, но и все остальное? Что угодно? Какие новые открытия - общественные, культурные, даже политические - можно было бы сделать, просто внимательнее присмотревшись к миру, который окружает нас каждый день? Это был вопрос, на который, казалось, невозможно ответить без совершенно новой формы восприятия. И тут меня осенило: Google Street View. Модели автомобилей. Тонкая классификация. Что, если мы уже создаем это?
Как и любой доминирующий организм, потомство AlexNet - новые поколения нейронных сетей, совершающие впечатляющие скачки год за годом, - монополизировали свою среду, оказавшись настолько эффективными, элегантными и далеко идущими в применении, что практически все другие методы практически в одночасье отошли на второй план. Любимцы академического сообщества, которые приводили исследователей в восторг всего год или два назад, - алгоритмы вроде машин опорных векторов и байесовских сетей - исчезли из докладов на конференциях, опубликованных статей и даже из разговоров в лаборатории. Все, о чем хотелось поговорить, - это последние разработки в области нейронных сетей.
Мы знали это, потому что многие из этих новых моделей были представлены на конкурсе ImageNet Challenge. Прошло чуть больше пяти лет с момента дебюта набора данных на CVPR в 2009 году, и конкурс превратился в основополагающее событие в области компьютерного зрения, обеспечивая общий ориентир для прогресса, на который мы всегда надеялись. Хотя наша лаборатория придерживалась политики не представлять собственные модели во избежание явного конфликта интересов, простое наблюдение за конкурсом стало регулярным событием, сравнимым с Рождеством. Каждый год приносил новые достижения, неуклонно сокращая разрыв между машинами и человекоподобной производительностью. Коэффициенты ошибок становились все ниже и ниже, все ближе к нашим собственным, человеческим. А потом, возможно, еще ниже.
И все же, даже когда технология приблизилась к "человеческим характеристикам", сама идея казалась надуманной, если не миражом. Наши возможности, конечно, гораздо богаче, чем может отразить любая метрика. Но наши недостатки могут быть столь же поучительны, как и достоинства. Например, люди могут лучше компьютеров объяснить, почему они считают, что птица на соседней ветке - это прибрежная голубая сойка, опираясь на всевозможные общие знания, визуальные подсказки и интуицию. Даже опытные орнитологи редко могут определить более пары сотен видов, что оставляет подавляющую часть птичьей вселенной недоступной для одного наблюдателя.
Пока ИИ пытался преодолеть последние несколько процентных пунктов, отделявших его от человеческого уровня в общей классификации объектов, он, казалось, был дразняще близок к тому, чтобы превзойти нас в других измерениях, причем довольно значительно. Мы просто не можем держать в голове столько знаний, сколько может компьютер.
Именно тогда точки начали соединяться по-новому. Благодаря Street View у нас теперь были снимки высокого разрешения почти всех районов страны. Несмотря на то, что основной целью этого приложения была помощь в навигации, я был потрясен тем, насколько детально оно передавало информацию о нашем мире. Деревья, уличные фонари, почтовые ящики и, конечно, автомобили, на которых мы ездим... Street View давал возможность заглянуть в те скрытые измерения информации, которые лежат вокруг нас. Когда я вспомнил о работе нашей лаборатории по точному определению моделей автомобилей, возможность, которую предоставил Street View, показалась мне еще одним всплеском серендипити.
Все чаще и чаще возникал вопрос: а стоит ли вообще говорить о "зрении"? Что бы ни представляла собой эта новая способность - некое сочетание остроты зрения с энциклопедической глубиной знаний по всем мыслимым темам, - я начинал верить, что это нечто большее, чем машинный эквивалент человеческих глаз. Это было нечто совершенно новое: более глубокая, более тонко отполированная линза, способная раскрыть наш мир с такой стороны, о которой мы даже не подозревали.
Рассматривая наше растущее хранилище моделей автомобилей, кропотливо собранных из источников, разбросанных по всему интернету, я представлял, как трудно будет объяснить своему подростку, какое отношение все это имеет к науке. Детали работы, конечно, были несущественны; это было лишь последнее свидетельство главных ценностей лаборатории: глубокого уважения к сложности мира и жажды его изучения, чего бы это ни стоило. Мы чувствовали себя как любители искусства во время экскурсии по музею: каждый новый экспонат заставлял нас задуматься и в то же время вызывал благоговейный трепет перед безграничными деталями, окружавшими нас.
Мы не тратили время на беспокойство о том, окупится ли все это, как мы надеялись. Сам факт