Сигнал и Шум. Почему одни прогнозы сбываются, а другие - нет - Нейт Сильвер
Шрифт:
Интервал:
Закладка:
Это качество предсказаний порой может представлять проблему и с точки зрения правильности предсказаний, касающихся гриппа, поскольку их цель, хотя бы отчасти, состоит в повышении общей осведомленности о болезни и, таким образом, изменения поведения в обществе. Самым эффективным прогнозом в отношении гриппа может считаться тот, которому не удается сбыться, поскольку он мотивирует людей на более здоровый выбор.
Финский ученый Ханна Кокко предпочитает использовать статистическую или прогнозную модель рисования карт{514}. Модель должна содержать достаточно деталей, чтобы быть полезной и честно отображать фундаментальную картину: наверняка вы не захотите упустить из внимания крупные города, рельефные реки, высокие горные массивы и главные дороги.
Однако чрезмерное количество деталей иногда может запутать путешественника, а порой и сбить его с пути. Как было отмечено в главе 5, эти проблемы носят не только эстетический характер.
Без необходимости усложненные модели способны оставить в системе больше шумов, чем сигналов, и в результате плохо воспроизводят лежащую в основе структуру, тем самым ухудшая качество прогнозов.
Но какой объем деталей считать недостаточным или, напротив, чрезмерным? Чтобы изучить картографию и научиться сочетать элементы искусства и науки, присущие ей, может уйти целая жизнь. Возможно, говорить о выстраивании модели как о форме искусства – это уже чересчур, но что-то правильное в идее есть.
Однако в идеале на вопросы, подобные тому, что задала Кокко, можно дать эмпирический ответ. Работает ли модель? Если нет, то, возможно, нам стоит изучить ее с другой степенью детализации. В эпидемиологии традиционные модели, используемые докторами, довольно просты – и не работают так, как хотелось бы.
Самое базовое математическое описание инфекционного заболевания называется SIR-моделью (рис. 7.4). В этой модели, сформулированной в 1927 г.{515}, принято следующее допущение: существуют три «состояния», в одном из которых любой человек может находиться в каждый момент времени. S (susceptible) означает восприимчивые к болезни, I (infectiousill) – заразившиеся, a R (recovery) – выздоровевшие после болезни. В рамках этой модели переход от одного состояния к другому происходит всегда в одном направлении – от S к I и затем к R. Вакцинация выступает своего рода «короткой дорожкой»[96], позволяющей человеку перейти от S к R без перенесения заболевания. Математика этой модели сравнительно проста и сводится к ряду дифференциальных уравнений, которые можно решить на ноутбуке за несколько секунд.
Рис. 7.4. Схематическое изображение SIR-модели
Проблема состоит в том, что для нормальной работы модели требуется сделать множество предположений, и некоторые из них на практике выглядят не вполне реалистично. В частности, в модели заложено предположение, что все участники той или иной популяции ведут себя одинаковым образом: то есть они в равной степени подвержены болезням, имеют одинаковый доступ к вакцинации и пересекаются друг с другом случайным образом. Нет никаких различий с точки зрения расы, пола, возраста, религии или сексуальной ориентации, и все ведут себя более-менее одинаково.
Парадокс ВИЧ в Сан-Франциско
Увидеть недостатки этих допущений проще всего при изучении болезней, передающихся половым путем. В конце 1990‑х и начале 2000‑х гг. был заметен сильный рост незащищенного секса в гомосексуальном сообществе Сан-Франциско{516}, опустошенном пандемией ВИЧ/СПИД двумя десятилетиями ранее. Некоторые исследователи видели причину этого в увеличении темпов потребления наркотиков, особенно кристального метамфетамина, который наиболее часто вызывает более рискованное сексуальное поведение. Другие обращали внимание на повышение эффективности антиретровирусной терапии – коктейлей из различных лекарственных средств, способных продлить жизнь ВИЧ-инфицированных пациентов на многие годы или десятилетия. В результате геи перестали воспринимать диагноз ВИЧ как смертельный приговор. Другие теории концентрировались на поколенческих закономерностях – молодое поколение геев начало воспринимать Сан-Франциско 1980‑х гг. с его эпидемией СПИДа как древнюю историю{517}.
Единственное заключение, с которым соглашались эксперты, состояло в том, что при увеличении случаев незащищенного секса должно было увеличиться и количество случаев заражения ВИЧ{518}. Однако этого не случилось, хотя наблюдался рост других заболеваний, передающихся половым путем. В частности, наблюдался всплеск (с девяти случаев в 1998 г. до 502 в 2004 г.{519}) количества вновь поставленных диагнозов «сифилис» среди мужчин, занимавшихся сексом с другими мужчинами (MSM){520}, притом что в 90‑е гг. эти болезни почти исчезли в Сан-Франциско. Выросло и количество заболеваний гонореей. Однако, как ни парадоксально, количество новых случаев ВИЧ не увеличилось. В 2004 г., когда заболеваемость сифилисом достигла самого высокого уровня за многие годы наблюдений, количество диагнозов ВИЧ упало до минимального значения с начала эпидемии СПИДа (рис. 7.5). С точки зрения исследователей, это казалось очень странным: сифилис и ВИЧ в обычных условиях обладают достаточно высокой статистической корреляцией. Кроме этого, между ними имеется причинно-следственная связь, поскольку наличие одной болезни может сделать вас более уязвимым к приобретению второй{521}.