Всё об искусственном интеллекте за 60 минут - Питер Дж. Бентли
Шрифт:
Интервал:
Закладка:
Эти нейроны объединены в сети, причем некоторые нейроны на входе получают данные, например изображение с камеры. Они могут быть подключены к рядам «скрытых слоев», которые в конечном итоге сообщаются с меньшим количеством выходных нейронов, обеспечивающих суммарный результат – классификацию входных данных или управляющий сигнал для робота.
Нейронные сети учатся, изменяя приоритетность связей между нейронами, делая некоторые из них более важными, а другие менее – в зависимости от различных входных условий. После оптимизации веса соединений (значение, которое указывает на важность каждого звена) и предпочтения (еще один способ изменения эффекта функции активации) таким образом, чтобы нейрон выводил правильный ответ при получении обучающих данных, в результате получается обученная нейронная сеть, которая ведет себя корректно и для новых входных данных, с которыми она раннее не сталкивалась.
Такие сети называются сетями с прямой связью, поскольку каждый слой нейронов подключается к следующему уровню, а не к предыдущему. Распространенным методом обучения таких нейронных сетей является метод обратного распространения, при котором компьютер запускает выходные нейроны и работает в обратном направлении через слои нейронов, обновляя веса и предпочтения, чтобы минимизировать ошибки на выходе.
Одной из самых больших проблем в обучении нейронной сети является предоставление ей правильных данных. В ранних работах предпринимались попытки тщательного извлечения значимых элементов: границы, геометрические фигуры, расстояния извлекались из изображения другими алгоритмами, а затем эти элементы передавались в нейронную сеть. Нейронные сети, предназначенные для обработки визуальной информации, обычно тренируют, применяя контролируемое обучение: если мы хотим получить простой классификатор, который выводит 1, когда на изображении есть кошка, и 0, когда – собака, мы предоставляем сотни или тысячи примеров изображений этих животных и настраиваем сеть (например, используя метод обратного распространения), пока та не начнет правильно выводить 1, когда «видит» кошку, и 0 – когда собаку. Важно использовать контролируемое обучение для такого рода сетей, поскольку мы хотим быть уверенны, что они распознают именно то, что нам нужно. Однако эти концепции по-настоящему начали развиваться, только когда были созданы нейронные сети, по структуре напоминающие связанные нейроны в зрительной коре живых существ.
Оказывается, в организме глаза довольно продуманно соединены с мозгом. Вместо того чтобы одна фоторецепторная клетка (палочка или колбочка) в сетчатке присоединялась к одному нейрону, к нему присоединяются целые области клеток. Соседние нейроны связываются с соседними перекрывающимися областями сетчатки. Затем эти нейроны направляют свои отростки в новый слой, где каждый нейрон в свою очередь соединяется с группой соседних нейронов в предыдущем слое. Те направляют свои отростки дальше, в еще один новый слой нейронов, и так далее. Это совсем другой способ подключения по сравнению с полностью связанными уровнями традиционной сети прямой связи. Когда искусственные нейронные сети были подключены таким образом и объединены с большим количеством слоев нейронов и входных данных, внезапно их возможности изменились.
Такие сети известны как сверточные нейронные сети – это одна из технологий глубокого обучения, обычно применяемая для компьютерного зрения (обучение является «глубоким», поскольку в нем много слоев нейронов). Размер подобных сетей делает обучение очень медленным и требующим большое количество входных данных. Но в последние годы обе эти проблемы удалось решить. Эпоха больших данных упростила тренировку сетей: теперь можно найти миллионы необходимых изображений практически любого вида, будь то автомобильные номера, буквы алфавита или лица людей. И, возможно, это удивительно, но проблему скорости решила индустрия компьютерных игр, создав потрясающе быстрые компьютерные процессоры для прорисовки графики. Их, как обнаружили исследователи нейронных сетей, можно использовать для выполнения всех вычислений, связанных с нейронным обучением. К 2012 году компьютеры превзошли человеческое зрение: они смогли распознавать объекты на изображениях со сверхчеловеческой точностью. Сверточные нейронные сети теперь настолько умны, что нам больше не нужно сначала вычислять объекты на изображениях. Нейронные сети все делают сами.
Мозг точно не работает, когда кто-то программирует его по правилам.
На сегодняшний день достижения в области компьютерного зрения очевидны для всех. Нас окружают удивительные продукты и сервисы, полагающиеся на эти методы ИИ, начиная с распознавания лиц в телефонах и заканчивая тем, с какой скоростью большинство книг и письменных записей оцифровывается, обнаружением объектов автономными транспортными средствами, распознаванием различных форм опухолей с помощью медицинских сканеров. Наши фабрики все больше полагаются на эти передовые системы для осуществления контроля качества и выявления ошибок в производстве, а заводы по переработке мусора используют компьютерное зрение, чтобы роботы могли сортировать мусор по соответствующим категориям. Появляются также впечатляющие результаты, связанные с классификацией сигналов мозга в рамках электроэнцефалографии, что позволит людям контролировать роботизированную руку силой мысли. Это технология, с помощью которой можно выйти на принципиально новый уровень в протезировании конечностей. Подобные методы нейронных сетей также трансформировали обработку других типов сенсорных данных, таких как распознавание речи (см. главу 7). Разработка контролируемых алгоритмов обучения движется с огромной скоростью, появляются новые виды нейросетей, например капсульные. Они привносят в сверточные нейронные сети иерархическую структуру, вдохновленную биологическими примерами, делая их еще более мощными.
Современные достижения в области компьютерного зрения создают огромные новые возможности для анализа изображений, что экспоненциально влияет на все отрасли бизнеса: от автомобильной промышленности до рекламы и дополненной реальности.
Контролируемое обучение (с использованием сверточных нейронных сетей и множества других методов), без сомнения, совершило революцию в ИИ и робототехнике. И это действительно захватывающе, однако в то же время тревожно, поскольку в подобных технологиях отражаются и наши предрассудки. Несмотря на то что у нас имеется огромное количество данных, из-за различных предубеждений современного общества ИИ обучаются преимущественно на изображениях светлокожих мужчин. И в результате с помощью ИИ далеко не всегда удается распознать лица темнокожих женщин, к примеру. В недавних тестах системы ИИ от ведущих компаний, IBM, Microsoft и Amazon, неправильно идентифицировали лица Опры Уинфри, Мишель Обамы и Серены Уильямс, не испытав при этом никаких затруднений с лицами белых мужчин.