Когнитивная психология - Роберт Солсо
Шрифт:
Интервал:
Закладка:
Этот спор далек от завершения, и некоторые, видимо, находят определенную ценность в его философской глубине. Для меня этот спор уж точно не разрешен (на самом деле он, вероятно, неразрешим ! ). Кроме того, оба лагеря ужесточили свои позиции и выдвигают скорее аргументы веры, чем разума. Для такой книги, как эта, его важность двояка. Во-первых, он заставляет читателя глубоко задуматься о том «человеческом», что заключено в человеческом познании. Во-вторых, в связи с этим спором встает вопрос, до какого предела ИИ может имитировать человеческий интеллект. Страсти, разгоревшиеся вокруг «теста Тюринга» и «китайской комнаты» с обеих сторон, отражают сильную заинтересованность современных философов и специалистов по ИИ проблемой электронного джина, выпущенного из бутылки.
В следующем разделе мы рассмотрим некоторые конкретные возможности компьютеров. Развитие этих функций в целом соответствует последовательности обработки информации от восприятия до распознавания паттернов и познания «высшего порядка».
Восприятие человека инициируется внешними сигналами, состоящими из света, звука, молекулярных соединений и давления. Эти сигналы обнаруживаются органами чувств и преобразуются (конвертируются в нервную энергию) в сообщения, понимаемые мозгом. Количество информации, доступной органам чувств, огромно; одна только зрительная система может передавать в мозг 4,3 х 106 бит информации в секунду. Фейгенбаум (Feigenbaum, 1967) предполагает, что некоторые периферийные устройства, иногда называемые периферической системой памяти, действуют подобно сенсорному буферу, предохраняющему мозг от переполнения потоком втекающей в него информации.
Как построить машину, способную подражать этому перцептивному механизму? Логично было бы разработать механизм, способный чувствовать. Эта попытка осуществляется в работе по созданию компьютерных распознающих систем[107].
Один из способов научить компьютеры распознавать геометрические формы путем анализа логических признаков — руководствоваться правилом, согласно которому сложные геометрические формы состоят из простых. В этой программе использован ряд небольших «матриц», систематически сопоставляемых с каждым объектом в поисках соответствия. Пример «матрицы» и идентифицируемого геометрического объекта приведен на рис. 16.1.
Рис. 16.1. Обнаружение левого края посредством шестиэлементной матрицы. Знаки «+» и «-» указывают на элементы, реагирующие на условия «присутствует» и «отсутствует» соответственно
Матрица состоит из сенсоров двух типов — позитивного и негативного; «присутствует», «отсутствует» — это единственный сигнал, подаваемый такой ячейкой, или подразделением матрицы. Изображенная матрица содержит только шесть ячеек — три «минуса» и три «плюса», и, судя по расположению этих компонентов (все «отрицательные» элементы расположены слева), вполне подходит для идентификации левого края объекта. Помещение матрицы ее средней линией над левым краем куба привело бы к полному соответствию. На углу соответствие было бы плохим, а на нижнем крае, где плюс и минус отменяют друг друга, соответствия не будет. Хотя эта эвристика в наибольшей степени ориентирована на возможности машин, она не расходится с результатами изучения восприятия у человека и животных. Ранее в этой книге (см. главу 4) мы упоминали, что психофизиологам удалось найти детекторы линий в клетках коры головного мозга кошек, и, хотя эти данные еще не полностью подтверждены, похоже, что у человека также имеются детекторы края.
Трудность использования вышеприведенной системы состоит в том, что для распознавания даже простых паттернов требуется большое количество матриц (например, детектор левой кромки, детектор правой кромки). Также проблематична «добротность» стимула; большинство геометрических форм (особенно в реальном мире) могут иметь резкие или расплывчатые, яркие или тусклые края. Распознавание паттернов путем распознавания линий можно сильно упростить, если идентифицируемую форму сначала преобразовать в образ, состоящий только из линий, и затем использовать матрицы для определения ориентации этих линий.
Системы распознавания паттернов обычно имеют дело со зрительным материалом. Как правило, воспринимающие устройства у таких систем имеют растр, или матрицу из фотоэлементов, реагирующих на свет. Обычно эти фотоэлементы находятся в двух состояниях: «включено» и «выключено» (для «белого» и «черного»). Рассмотрим элементарную задачу идентификации цифры. На рис. 16.2 показано, как цифры можно преобразовать в двоичный код: 0, или «выключено», — для «черного», и 1, или «включено», — для «белого»
Рис. 16.2. Двоичное представление (колонка в центре) букв (колонка слева). Нули показывают «выключено», или «черный», единицы — «включено», или «белый». В правой колонке показано, как выглядели бы цифры при считывании их сканером
Компьютер считывает каждую цифру (то есть фотоэлементы — один для каждого квадрата сетки, накладываемой на число, «ощущают» световые зоны, т. е. те, которые не заняты числом) исходя из того, насколько данный цифровой код совпадает с матрицей, хранящейся в памяти компьютера. Этот принцип работает очень хорошо, если все буквы одной формы, одинаково расположены и не размыты, такие устройства широко применяются в американской промышленности и государственной почтовой службе. Но когда дело доходит до чтения рукописных писем, присланных для тети Иолы, у оптических сканирующих устройств начинаются разные трудности. Однако в наше время быстро разрабатываются системы для «чтения» даже рукописных текстов.
Идентификация букв и слов средствами ИИ — это не только практическая задача, она также имеет значение для тех ученых, кто интересуются процессом анализа информации человеком. Многое из того, что нам уже известно об идентификации человеком букв и слов, обсуждалось в главе 12. Эти знания помогают разрабатывать компьютерные программы, имитирующие данный процесс. Подробный отчет по этой теме, послуживший руководством для последующих исследований, представили Селфридж и Найссер (Selfridge & Neisser, 1963). Выше описанная общая процедура «восприятия буквы» потребовала бы компьютерной памяти огромного объема (для хранения матрицы каждого нового варианта каждой буквы) или оказалась бы неспособной обнаруживать многие встречающиеся в действительности формы букв.