Как лгать при помощи статистики - Дарелл Хафф
Шрифт:
Интервал:
Закладка:
Далеко не всегда сообщают, сколько случаев было взято для изучения. Отсутствия такой цифры достаточно, чтобы бросить тень подозрения на все сообщение в целом, особенно если оно исходит от заинтересованного источника. Точно так же не следует принимать слишком серьезно информацию о корреляции между двумя величинами, если не указана степень достоверности этого показателя (вероятная ошибка, стандартная ошибка).
Будьте начеку, если вам называют среднее без уточнения его вида, во всех случаях, когда можно заподозрить, что среднее арифметическое и медиана существенно различаются.
Множество цифр утрачивают всякий смысл из-за неправомерных сравнений. Так, статья в журнале Look, касаясь темы синдрома Дауна, сообщает, что «как показало одно исследование, в 2800 случаях более половины матерей были 35 лет или старше». Чтобы данная информация имела для вас хоть какой-то смысл, вы должны иметь общее представление, в каком возрастном диапазоне женщины в массе своей рожают детей. А такими знаниями мало кто из нас владеет.
Ниже приводится выдержка из рубрики «Нам сообщают из Лондона» в журнале New Yorker от 31 января 1953 г.
Министерство здравоохранения недавно обнародовало данные, что за неделю, когда держался густой туман, уровень смертности в Лондоне подскочил на 28 %. Эти сведения глубоко потрясли общественность, привыкшую считать последствия неприветливого британского климата скорее досаждающими, нежели губительными… Небывалая смертельная опасность…
Но насколько смертоносной на самом деле была эта неделя? Считать ли исключительным случаем, что уровень смертности настолько превысил обычный показатель? Такого рода вещам вообще свойственно варьироваться. А как насчет последующих недель? Упал ли уровень смертности ниже среднего уровня, указывая, что если туман и убивал, то по большей части людей нездоровых, которых болезни в любом случае вскоре свели бы в могилу? Сама приведенная цифра выглядит весьма внушительно, но отсутствие других цифр, которые позволили бы оценить ее значение, сводит почти на нет весь смысл сообщения.
Бывает и так, что в источнике приводятся проценты, а стоящие за ними исходные цифры отсутствуют, и это тоже способно ввести в заблуждение. Давным-давно, когда Университет Джонса Хопкинса только начал принимать девушек, некто, не испытывавший особых восторгов по поводу совместного обучения, обнародовал данные, ставшие для многих потрясением: оказывается, 33 1/3 % студенток университета повыходили замуж за преподавателей! Однако исходные цифры позволяли точнее оценить картину «бедствия». На тот момент в списке учащихся числились три девушки-студентки, и одна из них действительно вышла замуж за преподавателя.
Пару лет назад Торговая палата Бостона взялась составить свой список «Самых успешных американок года». Про шестнадцать из них, также вошедших в справочник «Кто есть кто», сообщалось, что в общей сложности на них приходится «60 ученых степеней и 18 детей». Эти сведения выглядят вроде бы достаточно информативно, чтобы вы могли составить себе представление о самых успешных американках, но лишь до тех пор, пока не становится известно, что в составе этой группы женщин числятся декан Вирджиния Гилдерслив[29]и миссис Лилиан Гилбрет[30]. На этих двух дам приходится добрая треть упомянутых шестидесяти ученых степеней. А миссис Гилбрет, как известно, воспитала две трети от общего числа упомянутых детей.
Некая корпорация с полным на то основанием объявила, что держатели ее акций – 3003 человека и что в среднем у каждого акционера во владении находится по 660 акций. И это было правдой. Как был правдой и тот факт, что три четверти общего количества акций, которых насчитывалось два миллиона, принадлежали трем лицам, а оставшуюся четверть делили между собой остальные 3000 акционеров.
Если вам подсовывают индекс, вы вправе спросить, какие сведения относительно этого индекса вам недодали. Это может быть основа расчетов индекса, основа, выбранная так, чтобы представить реальную картину в превратном виде. Одна общенациональная организация рабочих как-то раз продемонстрировала, что после Депрессии индексы прибылей и производства росли опережающими темпами по сравнению с индексом заработной платы. Эта иллюстрация, предназначенная служить аргументом в пользу повышения заработной платы рабочим, утратила всю свою убедительность, когда нашелся некто, кто раскопал недостающие данные. Тогда стало ясно, что прибыли были почти «обречены» на более быстрый рост в процентах, чем заработная плата, по той тривиальной причине, что исходно находились на более низкой отметке, что и обусловило меньшую основу для расчета процентного роста.
В некоторых случаях не называют фактор, который и спровоцировал перемены. Подобное замалчивание позволяет создать впечатление, что перемены обусловил другой фактор, более желательный для целей тех, кто эти данные обнародует. В каком-то году были опубликованы цифры, призванные продемонстрировать, что дела у данного бизнеса идут в гору: особо подчеркивалось, что в апреле объем розничных продаж превысил прошлогодний. Что «позабыли» упомянуть авторы сообщения, так это что в прошлом году Пасха приходилась на март, а в рассматриваемом году была в апреле.
Сообщение о том, что за последнюю четверть века наблюдается резкий рост смертности от раковых заболеваний, создаст у вас ложное впечатление о положении дел, только если вам неизвестно, что это следствие целого ряда факторов. В тех случаях, когда сегодня констатируют смерть от рака, раньше применили бы формулу «смерть от неизвестных причин»; аутопсию в наши времена делают чаще, чем раньше, что позволяет более точно поставить диагноз; учет, регистрация и обобщение медицинских статданных на сегодняшний день осуществляются более полно; и наконец, сегодня люди чаще доживают до возраста, в котором шансы заболеть раком увеличиваются. И если вы изучаете абсолютные показатели смертности, а не просто уровень смертности, не пренебрегайте тем фактом, что в наши дни численность населения больше, чем в прежние времена.