ANOVA с повторными измерениями: для замеров во времени
Когда у одних людей есть 3+ замера (до, в середине, после), берут дисперсионный анализ с повторными измерениями. Условие сферичности, аналог Фридмана, примеры и FAQ.
Вы измерили один и тот же показатель у одних и тех же людей не два, а три и более раз — например, перед программой, в середине и в конце. Хочется доказать, что динамика реальна, а не случайна. И тут возникает соблазн сравнить замеры попарно несколькими критериями — но это путь к ошибке.
Правильный инструмент для такой задачи — дисперсионный анализ с повторными измерениями (его ещё называют repeated-measures ANOVA, или RM-ANOVA). Разберём, когда он нужен, что такое загадочная «сферичность» и чем его заменить, если данные не дотягивают до нормального распределения.
В двух словах
- Дисперсионный анализ с повторными измерениями проверяет, значимо ли меняется показатель при 3+ замерах у одних и тех же людей. Это «брат» обычного дисперсионного анализа, только для связанных замеров, а не для разных групп.
- Если данные числовые и распределены нормально — берут именно его. Если это баллы анкет или распределение ненормальное — непараметрический аналог, критерий Фридмана.
Главное правило: 3 и более замера у тех же людей → один общий тест, а не куча отдельных сравнений «до vs после», «до vs середина» и так далее.
Когда нужен дисперсионный анализ с повторными измерениями
Метод подходит, когда одновременно выполнены условия:
- Связанные замеры — это одни и те же люди, измеренные несколько раз. Каждый человек проходит через все точки.
- Три и более замера (k ≥ 3): до / в середине / после; или четыре контрольные точки сезона и т. п.
- Данные — количественные измерения (секунды, метры, миллиграммы, баллы шкалы как числа).
- Распределение показателя в каждой точке близко к нормальному (проверяют критерием Шапиро-Уилка; p > 0,05 — нормальное).
Пример. У 18 пловцов замерили время на 50 м трижды: в начале, в середине и в конце сборов. Время — числовое измерение, разброс нормальный → дисперсионный анализ с повторными измерениями.
Если замеров ровно два (только до и после), отдельный метод не нужен — берут парный критерий Стьюдента. RM-ANOVA — именно для трёх и более точек.
Чем он отличается от обычного ANOVA
Оба метода называются «дисперсионный анализ», но работают с разными данными — и это главная путаница.
- Обычный (однофакторный) ANOVA сравнивает разные группы людей: три потока, три методики, три класса. Люди в группах не пересекаются.
- ANOVA с повторными измерениями сравнивает один и тот же набор людей в нескольких точках. Это не разные группы, а один состав, прошедший все замеры.
Почему нельзя просто прогнать обычный ANOVA по трём замерам? Потому что он считает их независимыми. А ваши замеры связаны: тот, кто медленно плыл в начале, скорее всего и в середине не в лидерах. RM-ANOVA это учитывает: он «вычитает» индивидуальные различия между людьми и за счёт этого видит динамику чётче.
Связанность данных — не помеха, а помощник. Убирая постоянную «фору» каждого участника (кто-то в принципе быстрее, кто-то медленнее), метод убирает лишний шум и легче замечает реальный сдвиг во времени. Поэтому при одних и тех же данных он чувствительнее, чем сравнение разных групп.
Почему нельзя сравнивать «несколькими Стьюдентами»
Самая частая ошибка с тремя замерами — сравнить все пары парным критерием Стьюдента: «до vs середина», «середина vs после», «до vs после». Так делать нельзя без поправки.
Каждое сравнение допускает 5% риска «увидеть» различие там, где его нет (это ошибка первого рода, подробно — в статье «Ошибки первого и второго рода»). Когда сравнений несколько, эти проценты складываются: для трёх пар суммарный риск ложного вывода уже около 14%, а не 5%.
Правильный порядок такой:
- Сначала один общий тест (RM-ANOVA) на все замеры сразу.
- Если он значим (p < 0,05) — тогда делают попарные сравнения с поправкой (например, поправкой Бонферрони: делят порог 0,05 на число пар).
- Если общий тест незначим — попарные сравнения не нужны, динамики нет.
«Три замера — три Стьюдента без поправки» — грубая методическая ошибка, которую сразу замечают на защите. Сначала общий дисперсионный анализ, и только при значимом результате — попарные сравнения с поправкой. Как её сделать, разобрано в статье «Множественные сравнения и поправка Бонферрони».
Условие сферичности простыми словами
У RM-ANOVA есть особое требование — сферичность (в отчётах SPSS его проверяет «тест Мокли», англ. Mauchly). Звучит пугающе, но идея простая.
Между замерами есть разности: «середина минус начало», «конец минус середина», «конец минус начало». Сферичность означает, что эти разности колеблются примерно одинаково — ни одна пара замеров не «прыгает» заметно сильнее других.
Пример. Представьте, что от начала к середине у всех результат меняется плавно и кучно, а вот к концу у кого-то рывок, у кого-то спад — разброс этой разности резко больше. Тогда сферичность нарушена: пары замеров ведут себя по-разному.
Зачем это нужно знать? Если сферичность нарушена, обычный расчёт завышает значимость — можно получить «ложное» p < 0,05. К счастью, лечится это легко.
Если тест Мокли показал нарушение сферичности (p < 0,05 у самого теста), не паникуйте и не меняйте метод. Просто возьмите p-значение со встроенной поправкой Гринхауса-Гейссера (Greenhouse-Geisser) — её выдаёт тот же SPSS строкой ниже. Это стандартное решение, которое спокойно принимают на защите.
Непараметрический аналог — критерий Фридмана
Дисперсионный анализ — параметрический метод: ему нужны числовые данные и близкое к нормальному распределение. Если этого нет, его не применяют.
В двух типичных ситуациях берут непараметрический аналог — критерий Фридмана:
- данные — баллы анкеты, оценки, ранги (порядковая шкала), а не «настоящие» измерения;
- распределение далеко от нормального (сильные выбросы, перекос), даже если данные числовые.
Фридман решает ту же задачу — сравнивает 3+ связанных замера, — но работает не со средними, а с рангами внутри каждого человека, поэтому к форме распределения нечувствителен. Как он устроен и считается вручную — в руководстве по критерию Фридмана. Что вообще значит «параметрический / непараметрический» — в статье «Параметрические и непараметрические критерии».
Развилка простая. Числа + нормальное распределение → дисперсионный анализ с повторными измерениями. Баллы или ненормальное распределение → критерий Фридмана. Оба отвечают на один вопрос — «есть ли динамика по замерам?», — просто один считает по средним, другой по рангам.
Когда брать дисперсионный анализ, а когда Фридмана
Чтобы не запутаться, держите перед глазами короткую развилку — она же на схеме ниже.
Берите дисперсионный анализ с повторными измерениями, если:
- замеров три и больше у одних и тех же людей;
- данные — числовые измерения (время, рост, объём, концентрация);
- распределение в каждой точке нормальное (Шапиро-Уилк: p > 0,05).
Берите критерий Фридмана, если:
- замеров тоже три и больше у тех же людей, но
- данные — баллы, оценки, ранги, либо
- распределение ненормальное (выбросы, перекос, очень малая выборка).
Как читать результат и пример с числами
После расчёта метод выдаёт несколько чисел. Главные — статистика F (с двумя числами степеней свободы) и p-значение (как его понимать — в статье «Что такое p-value»).
Пример. У 18 пловцов сравнили время на 50 м в трёх точках сборов. Получили F = 12,4; p = 0,001. Поскольку p < 0,05, динамика по замерам значима. Затем попарные сравнения с поправкой Бонферрони показали, где именно произошёл сдвиг.
Результат удобно свести в таблицу. На таблицу в тексте ссылаются прямо: «динамика представлена в таблице 1».
Таблица 1 — Динамика времени на 50 м по трём замерам сборов (n = 18)
| Замер | M (с) | Стандартное отклонение | F | p |
|---|---|---|---|---|
| Начало | 31,8 | 1,4 | 12,4 | 0,001 |
| Середина | 30,9 | 1,3 | — | — |
| Конец | 30,1 | 1,2 | — | — |
После таблицы — короткий вывод словами: «Среднее время улучшается от 31,8 с в начале до 30,1 с в конце; различия между замерами статистически значимы (F = 12,4; p = 0,001)».
Пример. А вот обратная ситуация: у 15 студентов трижды за семестр замерили объём кратковременной памяти (числовой тест), распределение нормальное. Получили F = 1,2; p = 0,31. Здесь p > 0,05 — значимой динамики нет, и попарные сравнения уже не нужны.
Что писать в дипломе
Для дисперсионного анализа с повторными измерениями в тексте обязательно указывают: сам метод, статистику F, степени свободы, число испытуемых n и p-значение, а для наглядности — средние по каждому замеру.
Готовые формулировки:
- «Применён дисперсионный анализ с повторными измерениями для трёх замеров показателя у одних и тех же испытуемых (n = 18)».
- «Выявлены статистически значимые различия между замерами (F = 12,4; p < 0,05): среднее улучшилось с 31,8 до 30,1 с».
- «Попарное сравнение с поправкой Бонферрони показало значимый сдвиг между первым и третьим замером (p < 0,05)».
- «Статистически значимых различий между замерами не выявлено (F = 1,2; p = 0,31)».
Если данные были балльными и вы взяли Фридмана, формулировка та же по смыслу, но со статистикой χ² и медианами по замерам вместо средних. Как описывать результаты в целом — в статье «Эффективность тренировки статистикой».
Частые ошибки
- Прогонять обычный ANOVA по трём замерам одних людей. Он считает замеры независимыми и теряет точность — нужен именно вариант с повторными измерениями (или Фридман).
- Сравнивать замеры несколькими Стьюдентами без поправки. Накапливается ошибка первого рода — сначала общий тест.
- Игнорировать сферичность. При её нарушении берут p с поправкой Гринхауса-Гейссера, иначе значимость завышена.
- Применять метод к баллам анкет или ненормальным данным. Тогда корректнее критерий Фридмана.
- Делать попарные сравнения, когда общий тест незначим. Если динамики нет, искать её между парами незачем.
Частые вопросы
Чем дисперсионный анализ с повторными измерениями отличается от обычного?
Обычный сравнивает разные группы людей, а вариант с повторными измерениями — одних и тех же людей в нескольких точках во времени. За счёт связанности данных он точнее замечает динамику.
Что такое сферичность простыми словами?
Это требование, чтобы разности между парами замеров колебались примерно одинаково. Если у какой-то пары разброс резко больше, сферичность нарушена — тогда берут p с поправкой Гринхауса-Гейссера.
Что делать, если данные ненормальные или это баллы анкеты?
Перейти на непараметрический аналог — критерий Фридмана. Он сравнивает те же 3+ связанных замера, но по рангам, и нормальность ему не нужна.
У меня только два замера — это тоже сюда?
Нет. Для двух замеров у одних людей берут парный критерий Стьюдента (или Вилкоксона для баллов). Дисперсионный анализ с повторными измерениями нужен от трёх точек.
Метод показал значимость — как понять, между какими замерами разница?
Общий тест говорит только «динамика где-то есть». Чтобы найти, где именно, делают попарные сравнения с поправкой на множественность (например, Бонферрони).
А если у меня разные группы, а не повторные замеры?
Тогда это не повторные измерения. Для 3+ независимых групп берут обычный дисперсионный анализ, а для баллов и ненормальных данных — критерий Краскела-Уоллиса.
Короткий алгоритм
- Убедитесь, что замеры связанные (одни люди) и их три и больше.
- Проверьте данные: числовые и нормальные (Шапиро-Уилк) → дисперсионный анализ с повторными измерениями; баллы или ненормальные → Фридман.
- Запустите один общий тест на все замеры сразу.
- При нарушении сферичности возьмите p с поправкой Гринхауса-Гейссера.
- Если результат значим (p < 0,05) — сделайте попарные сравнения с поправкой и опишите средние (для Фридмана — медианы) по замерам.
Что ещё почитать
- Калькулятор критерия Фридмана — посчитать непараметрический аналог онлайн.
- Дисперсионный анализ (ANOVA): полное руководство — базовый метод для независимых групп.
- Руководство по критерию Фридмана — механика рангового аналога с примером.
- Множественные сравнения и поправка Бонферрони — как корректно сравнивать пары замеров.
- Как проверить нормальность распределения — ключевое условие для параметрического варианта.
Не уверены, какой метод подойдёт вашим данным — загляните в базу методов или закажите консультацию: эксперт подберёт критерий и посчитает всё за вас.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию