Математика с дурацкими рисунками. Идеи, которые формируют нашу реальность - Бен Орлин
Шрифт:
Интервал:
Закладка:
В то же время оценки по трансфигурации лежат на почти идеальной прямой: каждый дополнительный час подготовки приносит дополнительные 0,35 балла, за исключением одного выдающегося ребенка, который снижает корреляцию от идеальной единицы до 0,816.
Экзамен по заклинаниям соответствует еще более четкой схеме: чем больше вы готовитесь, тем лучше ваша оценка, но в какой-то момент тенденция меняется. Если вы будете заниматься дольше десяти часов, с каждым часом ваша оценка будет ухудшаться (возможно, из-за сонливости). Как бы то ни было, корреляция может выявить только линейную зависимость, поэтому она не замечает эту параболу и коэффициент корреляции равен 0,816.
Наконец, перед экзаменом по защите от темных искусств все ученики занимались по 8 часов, но получили разные оценки. Зная продолжительность подготовки, вы не можете предсказать оценку. Есть одно исключение: трудоголик-одиночка потратил 19 часов на подготовку и получил высший балл. Одна-единственная точка повышает коэффициент корреляции от 0 до… 0,816.
Оценки по каждому экзамену следуют своей логике, подчиняются уникальной схеме. Но коэффициент корреляции упускает это из виду.
Опять-таки такова природа статистики. Как я люблю говорить:
Статистика — ненадежный свидетель.
Она не лжет, но никогда не говорит всю правду.
Цитируйте меня на здоровье. Или, следуя традиции, придумайте афоризм о статистике самостоятельно и припишите его мне.
Взлет и падение бейсбольной статистики
С момента своего возникновения бейсбол был игрой чисел. На данный момент в «Википедии» перечислены 122 разновидности бейсбольной статистики, от DICE до FIP и VORP, и я подозреваю, что это лишь верхушка айсберга. Более того: подберите наугад три буквы — готов поклясться, что кто-нибудь где-нибудь уже скрупулезно ведет статистику под таким кодовым названием.
Эта глава посвящена одной статистической модели — от скромного начала до постепенного упадка. Речь идет о рейтинге «БА» (англ. BA): бостонский акцент. Простите, блатной алкоголь. Ну ладно, хорошо: batting average (процент реализации выходов на биту).
Когда-то этот рейтинг царил безраздельно. В наши дни специалисты по статистике придерживаются мнения, что это китч и пережиток простодушных дней. Настало время пустить его в расход? Или дышащий на ладан ветеран с ноющими суставами еще даст прикурить?
В 1856 году англичанин по имени Генри Чедвик, крикетный репортер The New York Times, случайно впервые в жизни попал на матч по бейсболу[148]. Он был заворожен. «В бейсболе все сверкает!» — воскликнул он, как мог воскликнуть только фанат крикета. Он, словно ленивец, пораженный молниеносностью и блеском черепахи, посвятил свою жизнь этому американскому виду досуга. Он заседал в нормативных комитетах, написал первую книгу об этом виде спорта и был редактором первого бейсбольного ежегодника. Однако титул «отец бейсбола» Чедвик снискал за нечто более фундаментальное — статистику.
Чедвик изобрел таблицу очков для отслеживания ключевых событий игры. Просматривая колонки цифр — очки, хиты, ауты и так далее, можно было практически воочию наблюдать за тем, как проходила игра. Таблицы очков составляли не для долгосрочных прогнозов или подсчетов статистической значимости. Однако они рассказывали историю на языке цифр: в них отражались позор и слава, герои и злодеи. В таблицах кратко описывались погодные условия и подчеркивались ключевые моменты игры, чтобы помочь фанатам оказаться в гуще событий (задолго до радио, экшен-камер или mlb.com). Это был SportsCenter 1870-х годов.
Идея Чедвика с рейтингом BA перекочевала из крикета, где, впрочем, есть только две базы, а очки вы набираете каждый раз, когда перемещаетесь от одной базы к другой. Игроки в крикет продолжают отбивать, пока соперник не сделает им аут, и хороший игрок вполне может заработать для своей команды десятки очков. (Рекорд всех времен и народов — 400 очков[149].) Таким образом, этот процент в крикете высчитывается из очков, набранных на один аут, сделанный соперником. Великий игрок может набрать 50 %, даже 60 %.
В бейсболе подобная формула не работает. Здесь один-единственный хит может завершить ваш выход на биту. Как любой хороший математик, Чедвик начал играть с правилами, перепробовал несколько формул и пришел к той, которая используется сейчас.
Итак, процент реализации выходов на биту состоит из одного незамысловатого математического действия: количество хитов делится на общее количество выходов на биту. Чедвик сказал, что это «единственный подлинный критерий в оценке навыка игры на бите»[150].