Сигнал и Шум. Почему одни прогнозы сбываются, а другие - нет - Нейт Сильвер
Шрифт:
Интервал:
Закладка:
И компьютеры, и люди должны разбить шахматную партию на три промежуточные цели: допустим, захват пешки оппонента или шах королю. В середине игры, когда фигуры начинают прямое противостояние и угрожают друг другу, возникает огромное количество подобных стратегических целей. Достижение их требует разработки определенной тактики, и правильное прогнозирование может оказать самое сильное влияние на оставшуюся часть игры. Цели первых шагов сравнительно абстрактны. Компьютерам приходится сражаться с абстрактными и открытыми проблемами, а люди формулируют эвристические правила, такие как «контроль центра доски» и «сохранение нужной организации пешек», и формулируют неограниченное количество творческих способов по их исполнению.
Более того, поскольку первые ходы более привычны для игроков, чем позиции, с которыми они могут столкнуться позже, люди могут полагаться на многолетний опыт, позволяющий выбрать лучшие ходы. Хотя теоретически белые могут выбрать для начала игры 20 ходов, более чем 98 % серьезных шахматных партий начинаются с одного из четырех лучших{625}.
Проблема людей в том, что компьютерные программы могут систематизировать это знание путем изучения статистики. Шахматные базы данных содержат результаты сотен тысяч партий, и с помощью этих данных вполне можно сделать целый ряд глубоких выводов и прогнозов. Программисты IBM изучали, насколько часто разыгрывалась каждая последовательность первых ходов и насколько сильными были игроки, их разыгрывавшие. Они считали, насколько часто каждая серия шагов приводит к победам, поражениям и ничьим для сторон{626}. Эвристика компьютера, необходимая для анализа этой статистики, позволяла, в принципе, достаточно эффективно противостоять человеческой интуиции и опыту, а то и переигрывать их. «Каспаров играет не против компьютера, а против духов гроссмейстеров прошлого», – говорилось на сайте IBM при описании баз данных Deep Blue{627}.
Таким образом, цель Каспарова в первой из шести игр матча против Deep Blue в 1997 г. состояла в том, чтобы извлечь программу из «страны баз данных» и заставить ее работать в условиях нулевой видимости». Он начал партию с довольно распространенного первого хода, переместив коня на клетку доски, известную игрокам под названием f3. Deep Blue ответил продвижением вперед слона, поставившего коня Каспарова под угрозу, – вне всякого сомнения, потому что его базы данных показали, что этот ход исторически снижал возможность выигрыша белых с 56 до 51 %[116].
Однако эти базы данных строились вокруг предположения о том, что Каспаров должен был ответить на это тем же, что делают почти все другие игроки в такой ситуации{628}, то есть отодвинуть коня назад. Вместо этого он проигнорировал угрозу, посчитал, что Deep Blue блефует{629}, и предпочел двинуть вперед одну из своих пешек, чтобы позволить своему слону контролировать центр доски.
Ход Каспарова, хотя и осмысленный со стратегической точки зрения, позволил добиться и еще одной цели. Он сделал всего три хода, а Deep Blue – всего два, однако позиция, к которой они пришли (рис. 9.2), ранее возникала в профессиональных соревнованиях всего один раз{630} из сотен тысяч игр, имеющихся в базе данных Deep Blue.
Рис. 9.2. Расположение фигур после третьего хода Каспарова в первой партии
Даже когда разыгрываются популярные шахматные ходы, количество возможных ответвлений на дереве настолько велико, что базы данных становятся бесполезными примерно после 10–15 ходов. В любой достаточно длинной шахматной партии со временем вполне может возникнуть ситуации, с которой никогда не сталкивался никто из шахматистов в истории человечества. Однако Каспаров смог «отключить» базу данных после всего лишь трех ходов. Как мы постоянно видим в этой книге, исключительно статистические подходы к прогнозированию оказываются в лучшем случае неэффективными при отсутствии достаточной выборки данных для работы. Deep Blue пришлось «думать» за себя.
Середина шахматной партии (обычно называемая миттельшпиль) потенциально позволяет использовать сильные стороны компьютера. Когда у фигур есть возможность сдвинуться в центр доски, то в среднем существует около 40 возможных ходов вместо 20{631}. Это может показаться не особенно большой разницей, однако из-за того, что древо возможностей разрастается в геометрической прогрессии, количество возможных вариантов ходов быстро увеличивается. Предположим, например, что вы хотите рассчитать всего три следующих хода (точнее, по три хода ваших и вашего противника, то есть всего шесть ходов). В начале партии значение этой функции рассчитывается примерно как 20 в шестой степени – то есть существует 64 млн позиций, и это уже гигантское число. Однако в середине игры вам уже нужно рассчитать 40 в 50‑й степени комбинаций, или 4,1 млрд возможностей. Deep Blue мог бы рассчитать все эти положения всего за 20 секунд. А Каспарову для этого потребовалось бы буквально 43 года, даже без перерывов на еду, сон или туалет.
Великие игроки типа Каспарова не обманывают себя и не верят в то, что им под силу рассчитать все эти варианты. Именно это и отличает лучших игроков от любителей. В своем знаменитом исследовании шахматистов голландский психолог Адриаан де Гроот обнаружил, что любители при столкновении с шахматной проблемой часто начинают напряженно искать идеальный ход и в итоге не могут сделать ни одного{632}.