Миры, которые я вижу. Любопытство, исследования и открытия на заре ИИ - Fei-Fei Li
Шрифт:
Интервал:
Закладка:
Тем временем нам предстояло преодолеть обычную батарею препятствий. Масштаб, конечно, был неизбежным вызовом. Но на этот раз мы были готовы. После ImageNet мы привыкли к головной боли, которую влечет за собой компиляция такого объема данных. Мы изучили такие сайты, как Craigslist, Cars.com, Edmunds и другие онлайн-площадки, чтобы получить обучающий набор изображений, охватывающий практически все уникальные разновидности автомобилей на дорогах в 2014 году - все 2 657 из них - и направили его в самые большие и точные классификаторы, которые когда-либо создавали. Мы также задействовали поток изображений Google Street View, заполнив наши серверы фотографиями проспектов, бульваров, углов, перекрестков и тупиков, пересекающих всю страну. В нашей лаборатории собирался еще один микрокосм мира, и уже скоро мы сможем заглянуть в него напрямую, открыв все секреты, которые он хранит.
Однако эти секреты не раскрылись бы без борьбы. Поскольку мы намеревались использовать автомобили в качестве косвенного инструмента для изучения более широких социально-экономических вопросов - соотнесения их с такими аспектами личности их владельцев, как доход, образование и род занятий, - нам пришлось столкнуться с тем, что резкие различия в денежной стоимости часто приводят лишь к незначительным различиям во внешнем облике. Поэтому, хотя мы без труда отличали седан Cadillac от пикапа Toyota, ранние эксперименты показали, что "наивно" обученный классификатор может с легкостью принять Cadillac за, скажем, Honda Accord, особенно если автомобили окрашены в похожие цвета - именно такой ошибки мы стремились избежать. Еще сложнее было отличить Cadillac ATS от CTS, не говоря уже о бесчисленных вариациях внутри каждого модельного ряда. Особенно сложной нам показалась концепция уровней отделки, поскольку пакеты опций на общую сумму в тысячи долларов, а иногда и больше, зачастую влекли за собой лишь незначительные изменения в стиле кузова и шильдике автомобиля.
"Прежде чем мы прервемся, у меня есть идея, которой я хочу поделиться".
Наше еженедельное совещание по проекту Street View подходило к концу, когда заговорил аспирант по имени Тимнит Гебру. Мы собрались в моем кабинете - маленьком, узком прямоугольнике на третьем этаже здания Gates Computer Science Building - помещении, соответствующем академическому стереотипу: тесная каморка, усугубленная грудами книг, бумаг и безделушек, которые сыплются с полок и ползут к центру комнаты. Уютно устроившись на ярко-красном диване в обрамлении беспорядка со всех сторон, наша команда студентов, состоящая теперь из трех человек.
"Итак, идея состоит в том, чтобы применить наши классификаторы изображений ко всем этим снимкам Street View, отследить все модели автомобилей, которые мы можем, и посмотреть, какие закономерности они выявляют, верно? Я тут покопался, и мне кажется, мы нашли идеальный способ сделать это".
Тимнит была самой младшей из троицы студентов, работавших над проектом, но она была целеустремленной до такой степени, что это придавало ей грозное присутствие. Несмотря на невысокий рост, как и у меня, ее уверенность в себе и ораторские способности позволяли ей без труда командовать в комнате. А поскольку Цзя защищал кандидатскую диссертацию, а Джон жонглировал множеством других проектов, Тимнит без колебаний взяла инициативу в свои руки.
Впервые мы встретились примерно за год до этого, когда она посетила один из моих продвинутых семинаров. Она была аспиранткой третьего года обучения по специальности "электротехника" и практически не занималась вопросами ИИ. Но она сразу же произвела на меня впечатление - не только потому, что была единственной чернокожей женщиной, получающей степень доктора технических наук, но и потому, что ее готовность задавать вопросы демонстрировала жажду учиться, которую преподаватели сразу же замечают. Когда она предложила присоединиться к лаборатории, я без колебаний согласилась, отказавшись даже от таких элементарных формальностей, как рекомендательные письма.
Я услышал в ее голосе убежденность, когда она продолжила. "Это Бюро переписи населения США. Каждый год они проводят общенациональный опрос под названием ACS - American Community Survey - и отслеживают массу социологической информации о регионах по всей стране".
"И вы предлагаете включить это в наш анализ?"
"Возможности просто безграничны. Перепись населения - это абсолютный кладезь данных, организованных по районам, округам, штатам и даже избирательным участкам. Но на ее сбор уходит так много времени и сил. Представляете, как соотнести все это с объектами, которые находят наши классификаторы?"
Она более чем убедительно доказала свою правоту, но больше всего меня поразила ее готовность. Такие моменты, когда студент представляет нечто творческое, новое и совершенно неожиданное, причем самостоятельно, - одни из самых приятных для преподавателя. И ее интуиция оказалась верной. Изучая данные переписи населения, которые она помогла нам получить, мы удивлялись не только их масштабам и разнообразию, но и идеям, которые они исследовали. У нас под рукой был общенациональный снимок политики, образования, доходов и даже преступности, готовый быть соотнесенным с принципиально новым сигналом о мире - компьютерным видением. Это были данные такого рода, с которыми наша лаборатория никогда раньше не сталкивалась, и они придавали работе ту серьезность, которой никто не ожидал. Это было нечто большее, чем просто проект по сбору данных.
На кухне царил беспорядок, но это был мой любимый вид беспорядка. Сильвио с ловкостью ремесленника в своей мастерской сновал туда-сюда между разбросанными кастрюлями и сковородками, поминутно пользуясь посудой, которая лежала рядом с ними, и время от времени хватая горстями ингредиенты из радуги пакетов, коробок и банок, выстроившихся на прилавках.
"Что все это значит?" спросил я.
"Наверное, у меня было настроение приготовить сегодня на ужин что-то особенное. Это polpo alla luciana. Осьминог. Еще у меня есть паста из цукини, перец на гриле, буррата и руккола, все в таком духе".
"Вау, я не могу дождаться! Давай, эм, закроем дверь".
Он знал, к чему я клоню. Жизнь в семье, состоящей из трех поколений и двух культур, быстро научила Сильвио искусству сосуществования с моей матерью, которая доводила чистоту на кухне почти до патологической крайности, следуя принципу "убирай, пока готовишь" настолько рабски, что точнее было бы сказать, что она готовит, пока убирает. Как бы ей