Всё об искусственном интеллекте за 60 минут - Питер Дж. Бентли
Шрифт:
Интервал:
Закладка:
Разговор с ИИ (или чат-ботом, как их еще называют), таким как этот, дарит удивительный опыт. На сегодняшний день можно достаточно правдоподобно переписываться в чате и даже получать удовольствие от такого общения. Чат-бот, разговор с которым описан выше, получил множество наград за свою способность участвовать в последовательной беседе с людьми. Возможно, этих наград оказалось больше, чем у других ИИ, поскольку общение так важно для нас. Однако вскоре мы поймем, что чат-боты имеют свои ограничения. Приведенный выше разговор иллюстрирует типичную проблему: часто ИИ не может поддерживать дискуссию, состоящую из нескольких предложений. Он теряет нить и рассматривает каждое предложение независимо. Он также не способен связать свои ответы с реальностью – хотя может следовать языковым правилам, статистическим корреляциям или даже искать факты, касающиеся ответов на каждое новое предложение. Идея Джона Серла о китайской комнате (см. главу 2) все еще остается в силе. Компьютеры при общении имитируют разговоры. Они манипулируют символами, не понимая их значения. Другими словами, нечто может выглядеть как утка, звучать как утка, но при этом не быть уткой[13]. А являться всего лишь умелой подделкой.
Философы глубоко погружены в эти проблемы, но бизнес-сообщество – нет. Для его представителей важнее результат, нежели то, как он генерируется. Например, в реальных приложениях чат-бот, который автоматизирует онлайн-обслуживание клиентов и отвечает на их вопросы, используя базу данных о продуктах, – ценный инструмент для бизнеса, который освобождает людей для более сложных запросов. Чат-боты уже здесь, и их популярность растет по мере улучшения их возможностей.
Ноам Хомски – американский лингвист, философ и один из основателей когнитивной науки (научных исследований разума и его возможностей). Он многое сделал для понимания процесса обработки естественного языка – этим занимается символический ИИ внутри некоторых чат-ботов, он выясняет, что делать с написанными словами. Одна из самых известных идей Хомски – теория универсальной грамматики, которую он создал после изучения развития речи у детей. Он полагал, что дети не получают достаточно информации, чтобы научиться говорить так свободно, как они это делают, – он назвал это бедностью стимула. Хомски утверждал, что ответственной за развитие у детей необходимых речевых навыков является некоторая врожденная способность к общению, запрограммированная в мозге. Она может рассматриваться как набор языковых правил – универсальная грамматика.
Держите нос диктора прямо, официант или дружелюбное молоко будут отменять приказ моим брюкам. Одно предложение, обычные слова, но никогда прежде они не ставились в таком порядке… Понимаете?
Хомски развил эту идею в теорию трансформационно-генеративной грамматики, предполагающей использование формальных грамматик для описания правил, встроенных в разные языки, что позволяет их сравнивать. Эта идея доминировала в лингвистике в течение 20 лет, с 1950-х до 1970-х годов, – как раз то время, когда исследователи ИИ начали пытаться заставлять компьютеры обрабатывать слова.
Ранние чат-боты широко использовали теории Хомски, поскольку те позволили разработать четкие и точные правила языка. Нет ничего, что компьютеру нравилось бы больше, чем набор правил, которым нужно следовать. Их объединили с другими технологиями, например экспертными системами, и в результате ИИ научились принимать текстовый ввод, следовать правилам грамматики для извлечения ключевых слов, связывать их и использовать сохраненные знания, а также, вновь следуя правилам грамматики, генерировать в ответ правильно согласованные предложения. Многие чат-боты были созданы (и создаются до сих пор) таким образом, но их легко обмануть. Один из самых простых способов это сделать – говорить в чате случайные слова. Даже если вы сначала предупредите бота о том, что собираетесь сделать, его ответы все равно окажутся бессмысленными.
ИЕРАРХИЯ ХОМСКИ
Хомски показал, что его формальные грамматики могут быть расположены иерархически, от общих к частным. Все формальные грамматики относятся к типу 0, их еще называют неограниченными. Только некоторые из них и принадлежат одновременно и к типу 1, и являются контекстно зависимыми. Они разработаны, чтобы уловить идею, что слово может употребляться в определенном месте в зависимости от контекста. Лишь часть грамматик типа 1 относится также к типу 2. Они не зависят от контекста (это контекстно свободные грамматики), и именно эта концепция лежит в основе большинства языков программирования: в выражениях не может быть никакой двусмысленности. И наконец, некоторые грамматики типа 2 принадлежат также к типу 3 – типу регулярных грамматик, включающему обычные языки, которые настолько просты и ограниченны, что конечный автомат может их понять.
– Привет, умный бот.
– Я не умный бот.
– Кто ты?
– Лиз! Я только что тебе сказал!
– Я скажу тебе сейчас несколько случайных слов.
– Я не знаю, смешной ли я.
– Гарри, дерево, под, морковь.
– Нет.
– Запах, если, лягушка, королева.
– Нет. Я из Техаса. Вы янки?
Хотя грамматики Хомски давали замечательные результаты, было ясно, что нужно нечто большее. Ответ пришел из области больших данных. По мере того как знания, деловая активность и социальное взаимодействие переходят в интернет, объем разговорных данных растет в геометрической прогрессии. Первое использование этих данных заключалось в автоматическом создании языковых правил с применением метода ИИ под названием «деревья решений».
Деревья решений похожи на поведенческие деревья, используемые для управления роботами. Это, как правило, ряд закрытых вопросов, помогающих делать прогноз или классифицировать входные данные по различным группам. Алгоритмы, которые генерируют деревья решений (такие как ID3, C4.5 и C5.0), задействуют обучающие данные и пытаются извлечь как можно больше информации из каждого решения. Поэтому, если у вас есть утверждения «жарко, прогноз солнечный», «жарко, прогноз дождливый» и «тепло, прогноз облачный», вы получите больше информации, если разделите функции «прогноз» и «температура». Другими словами, дерево решений должно сначала спросить о прогнозе и лишь затем о температуре.
В последние годы этот метод приобрел большую популярность благодаря созданию «случайных лесов» – комбинаций деревьев решений, используемых вместе, каждое из которых обучается на меньшем подмножестве данных, чтобы предотвратить переобучение (когда модель, изученная ИИ, становится слишком избирательной к данным обучения и не может обобщать новые данные).