Сигнал и Шум. Почему одни прогнозы сбываются, а другие - нет - Нейт Сильвер
Шрифт:
Интервал:
Закладка:
Поначалу программа должна была оценивать результативность питчеров, а не подающих. Предсказать этот параметр невероятно сложно, поэтому после пары лет экспериментов с системой под названием WFG Baseball Prospectus оставил попытки и начал публиковать пустые поля для своих прогнозов по этой группе игроков. Я почуял возможность и показал PECOTA Хакебею. К моему удивлению, система понравилась и ему, и сотрудникам Baseball Prospectus; они предложили мне выкупить PECOTA в обмен на долю в Baseball Prospectus и при условии, что я создам аналогичную систему для бьющих (хитеров){211}. Я это сделал, и зимой 2003 г. в Baseball Prospectus был опубликован первый ряд прогнозов PECOTA.
По окончании сезона 2003 г. мы обнаружили, что PECOTA сработала немного лучше, чем другие коммерческие системы прогнозирования{212}. Фактически ежегодно с 2003 по 2008 г. наша система была не хуже конкурентов. Это демонстрировалось по итогам тестов – как наших, так и сторонних{213}. При этом нам удавалось показывать более четкие результаты, чем те, что использовались букмекерами в Вегасе{214}. Несколько успешных прогнозов помогли существенно укрепить репутацию системы. Например, в 2007 г. PECOTA предсказала, что Chicago White Sox – всего за два года до выигрыша титула в чемпионате – обеспечит себе по итогам сезона лишь 72 победы. Этот прогноз чикагских СМИ и руководство White Sox пытались опротестовать{215}. Однако он оказался правдивым – сезон для White Sox завершился именно так: 72 победы против 90 поражений.
Но уже к 2009 г. другие системы начали догонять, а то и опережать прогнозы PECOTA. Подобно тому как я заимствовал некоторые элементы системы у Джеймса и Хакебея, другие исследователи заимствовали ряд инноваций у PECOTA и добавляли к ним какие-то свои идеи. Некоторые из этих систем оказались очень хорошими. Если вы попытаетесь проранжировать лучшие прогнозы года по тому, насколько хорошо они предсказывали результаты игроков основной лиги, то разница между результатами лучших систем не будет превышать долей процента{216}.
Меня давно интересовала и еще одна цель, с которой можно использовать PECOTA, – прогнозирование результатов игроков низшей лиги, таких как Педройя. Это значительно сложнее. А поскольку в то время очень мало систем разрабатывалось с подобной целью, единственным реальным конкурентом были скауты.
В 2006 г. я впервые опубликовал список 100 лучших потенциальных игроков, по версии PECOTA, а также сравнил его со списком, созданным на основе работы скаутов и опубликованным в это же время в Baseball America. Игроки в списке PECOTA были проранжированы по величине возможного вклада в результат в течение следующих шести сезонов после вхождения в состав команд высшей лиги{217}.
Сезон 2011 г. стал шестым годом после публикации прогнозов, поэтому я мог провести корректное сравнение прогнозов и реальности. Хотя игроки в этом списке были сравнительно молодыми, данные давали довольно четкое представление о том, удалось ли им стать звездами, либо же они просидели основную часть сезонов на скамейке запасных или вообще покинули мир большого спорта.
По данным моего списка, Педройя оказался на четвертом месте в списке потенциальных звезд. Это был не единственный успешный прогноз PECOTA. Система дала высокую оценку Иену Кинслеру, который вообще отсутствовал в списке Baseball America; в реальности он вошел в состав двух команд «Всех звезд» и стал одним из ведущих нападавших команды Texas Rangers. PECOTA высоко оценила и Мэтта Кемпа, суперзвезду команды Dodgers, который в 2011 г. получил редкую награду – бейсбольную Тройную корону[49] (оценка, данная ему Baseball America, была значительно ниже моей).
Но доводилось ли вам слышать о Жоэле Гузмане? Дональде Мерфи? Йосемиро Пети? Возможно, нет, если только вы не подлинный фанатик бейсбола. PECOTA же посчитала этих игроков достаточно перспективными.
Свои упущения были и у Baseball America – скауты проявляли чрезмерный оптимизм в отношении Брэндона Вуда, Ластингса Милледжа и Марка Роджерса. Однако были и успешные прогнозы. Так, Baseball America отметила питчера Red Sox Йона Лестера, шорт-стопа[50] Rockies Троя Туловицки и аутфилдера[51] Baltimore Orioles Ника Маркакиса, все они имели довольно скромные статистические результаты в низшей лиге и вообще не были включены в список PECOTA.
Для статистического сравнения систем имеется достаточно большой объем данных. В частности, мы можем посмотреть на количество побед игроков в составе команд в каждом списке – например, на показательWARP[52]{218}. Этот показатель призван оценить, какой вклад вносит игрок любыми действиями: хитингом, питчингом и ловлей.