Статистика и котики - Владимир Савельев
Шрифт:
Интервал:
Закладка:
Однако важным отличием является то, что мы проводим все измерения на одних и тех же котиках. Иными словами, каждый котик измеряется по несколько раз и, соответственно, вносит свой вклад в общую дисперсию. Таким образом, наша дисперсия делится уже на три части: межгрупповую, внутригрупповую и межиндивидуальную.
Критерий Фишера сравнивает между собой только первые два вклада. Соответственно, чем он больше, тем больше причин отклонить нулевую гипотезу. И опять же — если вы отклонили ее, то попарное сравнение нужно будет проводить с помощью специальных post hoc критериев.
У дисперсионного анализа с повторными измерениями есть свой непараметрический брат-близнец — критерий Фридмана, который применяется, если есть выбросы и/или распределение отличается от нормального.
Идея его достаточно проста. Возьмем одного из котиков, у которого взяли три пробы анализов. Каждой из этих проб мы присваиваем ранг, где один — это самый плохой анализ, а три — самый хороший. То же самое мы делаем и с остальными котиками, получая в итоге вот такую таблицу.
Очевидно, что если первая проба у всех котиков самая плохая, а последняя — самая хорошая, то по итогу суммы рангов будут сильно различаться и нулевая гипотеза будет опровергнута. Обратная ситуация — когда суммы рангов во всех пробах одинаковы. Это будет означать, что лечение никак не повлияло на котиков.
Сам же критерий Фридмана, собственно, и позволяет оценить, насколько различаются эти суммы рангов.
НЕМАЛОВАЖНО ЗНАТЬ!
Сложные эксперименты
Некоторое время назад мы рассмотрели, как правильно обрабатывать простые эксперименты с двумя группами и двумя замерами (до и после воздействия). Однако если групп и замеров больше, то наша задача существенно усложняется.
К примеру, мы разделили наших котиков на три группы: первой мы даем лекарство (экспериментальная), второй не даем лекарство (контрольная), а третьей даем пустышку, но говорим им, что дали лекарство (плацебо-группа). При этом каждая группа замеряется три раза: в начале, середине и конце лечения.
Для обработки такого исследования нам необходим двухфакторный дисперсионный анализ с повторными измерениями. Подобно обычному двухфакторному ДА такой анализ легче всего интерпретируется с помощью графиков.
В частности из этого графика мы можем увидеть, что котики, принимавшие лекарство, выздоровели, плацебо-котикам стало чуть лучше, а контрольные котики так и продолжают болеть. Правда, возможно, на наши результаты могли повлиять небольшие различия между котиками в начале эксперимента.
К слову, все попарные различия между группами в разные моменты также необходимо проверять с помощью post hoc критериев. В частности — с помощью поправки Бонферрони.
Безусловно, мы все хотим, чтобы наши котики были счастливы, и поэтому стараемся их постоянно радовать. Однако разных котиков радуют разные вещи: один любит вкусно поесть, другой — поиграть, а третий — поточить когти о любимый хозяйский диван.
Безусловно, существуют и некоторые универсальные вещи, которые радуют большинство котиков, что сильно упрощает нам жизнь. И в этой главе мы рассмотрим один из методов, который позволяет их выявить, — корреляционный анализ.
Предположим, мы решили проверить, связаны ли между собой котиковое счастье и размер ежедневных котиковых порций. Если обильная еда делает котиков счастливыми, то эта взаимосвязь будет отражаться вот таким графиком.
Это так называемая линейная положительная связь. Противоположная (хотя и маловероятная) ситуация — котики являются приверженцами оздоровительных голоданий, и чем больше порции им предлагают, тем более несчастными они становятся.
Такая связь называется линейной отрицательной. Наконец, может получиться так, что котикам вообще не важно, насколько большие у них порции, главное, чтоб еда была вкусной. В этом случае мы наблюдаем отсутствие связи (или нулевую связь), которая отображается вот таким вот графиком.
Однако в реальной жизни мы очень редко можем наблюдать подобные случаи: как правило, у нас возникает что-нибудь такое.
И поэтому мы нуждаемся в некоторой мере, которая позволила бы нам, во-первых, оценить, насколько сильно связаны между собой счастье и количество доступной еды, а во-вторых, является ли эта связь положительной или отрицательной.
Для вычисления такой меры воспользуемся хитрым способом. Для начала представим, что у нас наблюдается линейная положительная связь. Теперь посчитаем средние арифметические по размеру порций и уровню счастья, а затем возьмем эти показатели в качестве нулевых точек отсчета для нашего графика. После этого мы можем увидеть, что часть котиков более счастлива и получает больше еды, чем в среднем, а остальные — менее счастливы и получают меньше еды, чем средний котик.