Миры, которые я вижу. Любопытство, исследования и открытия на заре ИИ - Fei-Fei Li
Шрифт:
Интервал:
Закладка:
Это была способность, которую я особенно остро осознавала. Каждый вечер, как только я возвращалась домой с работы и закрывала за собой дверь, я делала что-то совершенно определенное, обычно еще до того, как ставила сумку. Это был не совсем ритуал, поскольку в нем отсутствовала продуманная структура ритуала, но каждый день он разворачивался одинаково и в одно и то же время. Это был момент, хорошо знакомый всем, кто ухаживает за больным членом семьи: я находила маму, где бы она ни находилась в доме - на кухне, в гостиной или, может быть, на заднем дворе, - и одним взглядом понимала, стоит ли мне беспокоиться о ней или нет; был ли у нее один из лучших дней, и я могла выдохнуть, или же это было... что-то другое.
Это было все, что требовалось. Самое важное решение, которое я мог принять, было выполнено с помощью всплеска когнитивной магии, настолько быстрой и автоматической, что она была практически непрозрачной даже для человека, работающего в моей сфере. Мама чистит картошку у раковины. Папа в фартуке наливает оливковое масло в вок на плите и, похоже, готовится бросить туда нарезанную кубиками курицу. Оба выглядят довольными. Ни один из них пока не взглянул на меня. Никакого смущения или беспокойства. Слава Богу. Я могу выдохнуть. Сегодняшняя ночь будет хорошей. Пока, по крайней мере.
Но так было не всегда. Мама лежит на диване. Она не совсем сидит или лежит, и выглядит неловко. Ее голова лежит на руках, брови сведены в кучку. Рядом с ней свернулась калачиком кошка, но мамина свободная рука лежит на ее спине. Она не гладит ее.
Плохо. Пора провести домашний тест на кровяное давление, проверить температуру и пульс, а затем, возможно, позвонить врачу.
Эта способность отличается удивительной скоростью и силой. Я редко вспоминал, как перечислял отдельные предметы, окружавшие меня: мебель в комнате, мать и отца, одежду, которую они носили, кухонную утварь, нераспечатанный пакет или конверт, эспрессо-машину Сильвио, семейного кота и так далее. Несмотря на всю работу, которую мы проводили, обучая машины классифицировать объекты, эта задача, казалось, включала в себя не только остроту зрения. В такие моменты происходило нечто гораздо более глубокое: я не просто видел свою мать, а понимал ее состояние: оценивал ее позу, оценивал ее отношение, делал выводы о жизни и смерти из чего-то столь неосязаемого, как морщины на ее бровях или угол наклона ее тела, когда она прислонялась к стойке.
Это способность, которая мгновенно ставит в тупик даже наши самые передовые алгоритмы. Вот мы празднуем дробное сокращение числа ошибок при классификации - настолько ничтожное достижение в восприятии, насколько это вообще можно себе представить, в то время как наш собственный мозг наполняет каждый момент таким беглым осознанием нашего мира, что его живость стала для нас практически невидимой. Еще в 1970-х годах исследователь и математик Анатоль Холт подвел итог этой близорукости, сказав, что ИИ - это технология, которая может сделать идеальный шахматный ход, в то время как комната горит. Как актуален этот диагноз и сейчас. Современный ИИ ведет себя как своего рода савант в игре, справляясь с отдельными задачами, которые поддаются узким метрикам вроде "коэффициента ошибок", и не замечая горящих углей, которые падают на доску.
При всей нашей ограниченности человеческое восприятие является противоположностью этому. Мы видим мир целостно, не просто определяя, но и понимая его содержание - их взаимосвязи, их значения, их прошлое и будущее. Суть в следующем. Мы не просто свидетели, а рассказчики. Мне показалось, что алгоритмам пора научиться делать то же самое.
"Вот, прочтите это". Я бросил распечатку своей статьи в Journal of Vision на стол Андрея Карпати, аспиранта второго года обучения и особенно многообещающего новичка в лаборатории. Высокий, стройный и вечно быстро говорящий, Андрей родился в Словакии и вырос в Канаде. Он с энтузиазмом решал сложные проблемы и обладал техническим талантом, чтобы воплощать свои идеи в жизнь. Как и многие студенты в моей лаборатории, он обладал упорством и настойчивостью инженера, ему было так же удобно разбирать транзисторный радиоприемник, как и покрывать доску уравнениями. Если Эйнштейн, Бор и Уилер были космическими мечтателями, то студенты вроде Андрея были другими, вырезанными из той же ткани, что и Эдисон или братья Райт. Это различие было практически незаметно для внешнего мира, но настолько актуально в нашей лаборатории, что, казалось, оно окрашивало каждый разговор. Это были противоположные, но дополняющие друг друга стили, каждый из которых был призван бросать вызов, увлекать и слегка раздражать другого. Но когда дело доходило до попытки сделать что-то новое - особенно что-то сложное, как это часто случалось в нашей лаборатории, - их сочетание оказывалось мощным.
"Что это?" - спросил он, взяв в руки книгу и просматривая аннотацию.
"Наш следующий вызов".
Встречи с Андреем стали постоянным пунктом в моем календаре. Даже по высоким стандартам, установленным в нашей лаборатории, идея алгоритма, который мог бы описать всю сцену, а не просто обозначить какой-либо объект на ее переднем плане, казалась будущим нашей работы - возможно, даже всей области. Но моя страсть сделала меня особенно суровым критиком.
"Хорошо, Андрей, это выглядит превосходно".
"Но...?" - сказал он с нерешительной усмешкой. Он знал, что будет дальше.
Дисплей на его рабочей станции выглядел именно так, как мы и хотели: на вход подавалась фотография, а на выходе получалось предложение с ее описанием.
"Но" - его работа была умной, чрезвычайно умной, в некоторых отношениях; тем не менее я знал, что нам предстоит более долгий путь. Это был лишь проблеск решения, но не полная картина - "мы просто еще не пришли".
Он опустился на свое место.
Проблема была тонкой, но она демонстрировала явление, которое я остро осознал за годы работы профессором. Как это часто бывает со студентами, Андрей был настолько сосредоточен на том, работает ли его модель, что вопрос о том, как она работает, отошел на второй план. Признаться, она действительно работала, по крайней мере, на первый взгляд. Но наши регулярные встречи позволили мне подробно изучить ход его мыслей, и хотя его подход был грамотным и хорошо обоснованным, в итоге модель оказалась чем-то вроде системы подбора надписей.
Проще говоря, слишком много описания, выводимого на экран, в той