Создатели искусственного гения. О бунтарях, которые наделили интеллектом Google, Facebook и весь мир - Кейд Метц
Шрифт:
Интервал:
Закладка:
Глава 15
Предвзятость. «Google Photos, вы там охренели? Моя подруга не горилла»
Одним воскресным днем в июне 2015 года Джеки Алсине сидел у себя в комнате, которую он делил со своим младшим братом, прокручивая длинный поток твитов, посвященных вручению премий от телеканала Black Entertainment Television. В их квартире в бруклинском микрорайоне Краун-Хайтс кабельного телевидения не было, и поэтому саму церемонию награждения он смотреть не мог, но, по крайней мере, мог читать текущие комментарии в Twitter на своем ноутбуке. В это время подруга прислала ему интернет-ссылку на несколько фотоснимков, которые она разместила в новой версии сервиса Google Photos. Сам Алсине, двадцатидвухлетний инженер-программист, уже пользовался этим сервисом в прошлом, но новую версию, вышедшую только несколькими днями ранее, еще не испытывал. Новая система Google Photos способна анализировать ваши снимки и автоматически сортировать их в виртуальные папки на основе того, что было изображено на каждом из них. Одна и та же фотография может попасть сразу в несколько папок, «собаки», «день рождения» и «отдых на пляже». Потом вам легко находить интересующие вас фотографии по тегам. Если вы наберете «надгробие», Google автоматически найдет все фотографии с надгробием. Когда Алсине прошел по ссылке и открыл сервис, он не мог не заметить, что его собственные фотографии уже были реорганизованы – и одна из папок называлась «гориллы». Ему показалось это странным, поэтому он открыл папку и обнаружил там более восьмидесяти фотографий своей подруги, которые он сделал почти год назад во время концерта в близлежащем Проспект-парке. Его подруга была афроамериканкой, и система Google назвала ее «гориллой».
Он мог бы закрыть на это глаза, если бы Google по ошибке пометила таким тегом только одну фотографию. Но речь шла о восьмидесяти фотографиях. Он сделал скриншот и разместил его в социальной сети Twitter, которую он называл «самым большим в мире клубом», местом, куда любой мог зайти и обратить внимание окружающих на какие-то вопросы. «Google Photos, вы там охренели?476 – написал он. – Моя подруга не горилла». С ним очень быстро связался сотрудник Google и попросил предоставить им доступ к его аккаунту, чтобы компания могла разобраться в случившемся. В течение следующих нескольких дней Google рассыпалась в извинениях через СМИ, обещая принять незамедлительные меры и гарантируя, что это никогда не повторится. В итоге они полностью удалили тег «горилла» из лексикона сервиса, и в таком положении ситуация была заморожена на несколько лет. Даже пять лет спустя сервис Google Photos все еще блокировала возможность поиска фотографий по слову «горилла».
Проблема заключалась в том, что специалисты Google обучили нейронную сеть распознавать горилл, показывая ей тысячи фотографий с гориллами и не думая о возможных побочных эффектах. Нейронные сети способны осваивать масштабные задачи, которые инженеры никогда не смогли бы запрограммировать своими силами, но при обучении этих систем бремя выбора правильных исходных данных ложится на инженеров. Более того, когда обучение закончено, даже если эти инженеры были при выборе данных предельно осторожны и внимательны, они не могут знать всего, чему научилась машина – просто в силу масштабности этого обучения, связанного с гигантским количеством входных данных и вычислений. Джеки Алсине сам работает инженером-программистом и проблему понимает. Он сравнивает это с приготовлением лазаньи. «Если ингредиенты никудышные, хорошую лазанью не сделаешь», – говорит он. – То же самое и с ИИ. Нужно быть очень внимательным в том, какие данные ты в него вводишь, потому что потом дать задний ход очень трудно».
* * *
На групповой фотографии членов команды Google Brain477, сделанной сразу после публикации «Статьи о кошках» летом 2012 года, когда Джефф Хинтон официально числился в лаборатории стажером (шестидесятичетырехлетним), они с Джеффом Дином держат гигантское цифровое изображение кошки, а вокруг них толпится примерно дюжина других исследователей. В их числе был и Мэтт Зилер, молодой человек в черной рубашке-поло с короткими рукавами и выцветших синих джинсах, широко улыбающийся, с лохматой шевелюрой и многодневной щетиной на подбородке. Зейлер был аспирантом в лаборатории глубокого обучения в Нью-Йоркском университете и тем же летом проходил стажировку в Google Brain. Год спустя он выиграл конкурс ImageNet, пойдя по стопам Хинтона, Крижевского и Суцкевера. В этом самом горячем цехе технологической индустрии многие чествовали его как рок-звезду. Алан Юстас предложил ему работу в Google и большие деньги, но Зилер отверг это предложение, чтобы открыть свою собственную компанию.
Компания получила название Clarifai. Она разместилась в Нью-Йорке, в небольшом офисе на Третьей улице, недалеко от лаборатории глубокого обучения Нью-Йоркского университета, и занималась созданием технологии, способной автоматически распознавать объекты на цифровых фотографиях – например, просматривать снимки обуви, платьев и сумочек на сайте интернет-магазина в поисках нужного товара или идентифицировать лица в потоковой видеозаписи, передаваемой с камер наблюдения. Идея состояла в том, чтобы скопировать системы распознавания изображений, на создание которых Google и Microsoft потратили годы труда в своих лабораториях искусственного интеллекта, а затем продавать их другим компаниям и государственным учреждениям, включая полицию.
В один из дней 2017 года, спустя четыре года после основания компании, Дебора Раджи сидела за своим столом в офисе Clarifai в нижнем Манхэттене. Флуоресцентные лампы ярко освещали ее, ее стол, холодильник с пивом в углу и всех остальных сотрудников, которые – молодые, двадцати с чем-то лет, – сидели в наушниках, не отрывая глаз от огромных компьютерных мониторов. Раджи тоже смотрела в экран, заполненный лицами – фотографиями, которые компания использовала для обучения своей системы распознавания лиц. Прокручивая эти лица, страница за страницей, она не могла не заметить проблему. Раджи была чернокожей двадцатиоднолетней жительницей Оттавы. На большинстве фотографий – более 80 процентов – были изображены белые лица. А еще не могло не броситься в глаза то, что на более 70 процентов из них были мужчины. Когда система пройдет обучение на этих исходных данных, она наверняка сможет хорошо распознавать белых мужчин, думалось Раджи, но в распознавании небелых, а также, вероятно, женщин, систему ждет жестокое фиаско.
И это была отнюдь не единичная проблема. Мэтт Зилер и возглавляемая им компания Clarifai также создавали так называемую «систему модерирования контента», инструмент, который позволял автоматически идентифицировать и удалять порнографию из моря изображений, размещаемых людьми в социальных сетях. Компания обучала эту систему, используя два набора данных: тысячи «непристойных» фотографий, взятых с порносайтов, и