Как сравнить спортсменов разной квалификации
Три и больше групп — новички, разрядники, КМС — сравниваем критерием Краскела-Уоллиса и попарно с поправкой. Разбор на функциональной пробе, с примерами и FAQ.
Вы разделили спортсменов на группы по уровню подготовки — новички, разрядники, кандидаты в мастера — и хотите показать, что какой-то показатель (например, восстановление пульса или результат функциональной пробы) с ростом квалификации меняется.
Здесь нельзя просто «погонять» Стьюдента между каждой парой групп. Для трёх и более групп есть свой инструмент. Разберём, какой именно и как описать результат в дипломе.
В двух словах
- Если групп три и больше и они независимы (разные люди, никто не попал сразу в две группы) — берите критерий Краскела-Уоллиса. Это «Манна-Уитни для нескольких групп».
- Он отвечает на один вопрос: «Хоть где-то между группами есть различие?» Да или нет — но не говорит, какие именно группы отличаются.
- Чтобы узнать, между какими группами разница, после него делают попарные сравнения (Манна-Уитни) с поправкой на множественность.
То есть это всегда два шага: сначала общий критерий, потом — уточняющие попарные сравнения.
Почему нельзя просто сравнивать пары Стьюдентом
Самая частая идея у студента: «У меня три группы — сравню новичков с разрядниками, разрядников с КМС, новичков с КМС, и всё». Это ошибка, и вот почему.
Каждое сравнение пары — это розыгрыш «повезёт / не повезёт» с риском ошибиться. Если порог значимости 0,05, то у одного сравнения шанс ложной находки — 5%. Но сравнений у вас не одно, а несколько, и риски складываются.
Пример. При трёх группах получается 3 пары, при четырёх — уже 6 пар. Чем больше сравнений, тем выше шанс, что хотя бы одно «выстрелит» случайно. На 6 сравнениях вероятность поймать ложное различие — около 26%, а не 5%.
Поэтому сначала проверяют одним общим критерием: есть ли различия в принципе. И только если он сказал «да», переходят к парам — уже с поправкой, которая компенсирует накопленный риск.
Гонять парный или независимый критерий Стьюдента по всем парам групп «насквозь» без общего теста и без поправки — грубая методическая ошибка. Рецензент это видит сразу.
Почему Краскел-Уоллис, а не дисперсионный анализ
У задачи «сравнить 3+ групп» есть два инструмента-родственника.
- Дисперсионный анализ (ANOVA) — параметрический. Сравнивает средние и требует, чтобы данные были числовыми и распределены примерно нормально в каждой группе.
- Критерий Краскела-Уоллиса — непараметрический. Сравнивает группы по рангам (по «местам в общем рейтинге»), нормальность ему не нужна.
Для спортивных и психологических дипломов Краскел-Уоллис обычно безопаснее: выборки часто небольшие, данные перекошены, а часть показателей вообще измеряется в баллах. О том, чем параметрические методы отличаются от непараметрических, есть отдельная статья — «Параметрические и непараметрические критерии».
Не уверены, нормальны ли данные в группах? Проверьте критерием Шапиро-Уилка (p > 0,05 — распределение близко к нормальному). Сомневаетесь — берите Краскела-Уоллиса: на нормальных данных он тоже корректен, просто чуть менее «чувствителен».
Что значит «по рангам»
Слово «ранги» пугает, хотя идея простая. Представьте, что вы выписали все результаты всех спортсменов в один общий список и расставили их по росту: 1-е место — самый маленький результат, последнее — самый большой. Номер в этом списке и есть ранг.
Дальше критерий смотрит: у какой группы ранги в среднем выше, у какой ниже. Если квалификация на показатель не влияет, ранги перемешаются равномерно и средние «места» у групп окажутся похожими. Если влияет — одна группа сядет в начало списка, другая в конец.
Пример. По пробе восстановления пульса у КМС значения лучше (восстановление быстрее), поэтому их результаты занимают «хорошие» места в общем рейтинге, а у новичков — «слабые». Средний ранг у КМС выходит заметно ниже (или выше — смотря как считаем показатель), и Краскел-Уоллис это улавливает.
Шаг 1. Общий критерий
Вы загружаете данные по всем группам сразу и получаете H-статистику и p-значение (что это такое — в статье «Что такое p-значение»).
Читается результат так:
- p < 0,05 — между группами есть значимые различия (хотя бы где-то). Идём на шаг 2.
- p > 0,05 — значимых различий нет. Останавливаемся: попарные сравнения делать уже незачем.
H — это сама величина критерия (по смыслу — «насколько сильно разъехались ранги между группами»). В дипломе её приводят вместе с числом степеней свободы df и p-значением. Здесь df = число групп минус один: для трёх групп df = 2.
Шаг 2. Попарные сравнения с поправкой
Если общий тест дал p < 0,05, вы знаете, что различие где-то есть, но пока не знаете, между кем. Теперь сравниваете группы по парам критерием Манна-Уитни: новички и разрядники, разрядники и КМС, новички и КМС.
Чтобы суммарный риск ложной находки не раздулся, к результатам применяют поправку. Самая простая — поправка Бонферрони: порог значимости делят на число сравнений.
Пример. Сравнений три → новый порог 0,05 / 3 ≈ 0,017. Значит, пара считается различающейся, только если у неё p < 0,017, а не привычные 0,05. Подробно про этот приём — в статье «Множественные сравнения и поправка Бонферрони».
Так вы получаете честную картину: возможно, новички значимо отличаются от КМС, но соседние группы (новички и разрядники) — нет.
Что писать в дипломе
Сначала — итог общего критерия, потом расшифровка по парам и таблица.
Готовые формулировки:
- «Сравнение трёх групп по уровню квалификации выявило статистически значимые различия восстановления ЧСС (H = 11,4; df = 2; p = 0,003)».
- «При попарном сравнении с поправкой Бонферрони значимые различия обнаружены между новичками и КМС (p < 0,017); группы новичков и разрядников значимо не различались».
- Если общий тест незначим: «Статистически значимых различий между группами разной квалификации не выявлено (H = 2,1; df = 2; p = 0,35)».
Для каждой группы рядом приводят медиану и квартили (это устойчивые «середина» и «разброс» для непараметрики — см. «Медиана и квартили»), а не среднее со стандартным отклонением.
На таблицу в тексте ссылаются прямо: «Описательные статистики и результат критерия представлены в таблице 1». Подпись таблицы ставят сверху.
Таблица 1 — Время восстановления ЧСС (с) у спортсменов разной квалификации (критерий Краскела-Уоллиса)
| Группа | n | Me | Q1–Q3 | H (df = 2) | p |
|---|---|---|---|---|---|
| Новички | 14 | 96 | 88–104 | 11,4 | 0,003 |
| Разрядники | 15 | 82 | 75–90 | ||
| КМС | 12 | 71 | 66–78 |
После таблицы — короткий вывод словами: «С ростом квалификации время восстановления ЧСС закономерно снижается; различия между группами статистически значимы (H = 11,4; p < 0,05)».
Для наглядности показатель по группам удобно изобразить столбиками.
В выводе всегда указывайте сам критерий, его статистику (H), число степеней свободы (df) и p-значение, а для пар — какие именно группы различаются. Фраза «с ростом разряда показатель улучшается» без этих цифр не считается доказанной.
Частые ошибки
- Сравнивать все пары Стьюдентом без общего теста. Сначала Краскел-Уоллис, и только при p < 0,05 — пары.
- Делать попарные сравнения без поправки. Тогда суммарный риск ложного результата завышен; нужна поправка (Бонферрони и т. п.).
- Лезть в пары, когда общий тест незначим. Если H-критерий дал p > 0,05, попарные сравнения уже не делают.
- Писать средние и стандартные отклонения. Для рангового критерия группы описывают медианой и квартилями.
- Применять Краскела-Уоллиса к связанным замерам. Если это один и тот же спортсмен в трёх состояниях (например, в начале, середине и конце сезона) — нужен критерий Фридмана, а не Краскел-Уоллис.
Частые вопросы
Сколько нужно групп, чтобы брать Краскела-Уоллиса?
От трёх и больше. Если групп ровно две, общий критерий не нужен — сразу берите Манна-Уитни. Об этом подробно — в статье «Манна-Уитни или Краскел-Уоллис».
А если групп всего две, но я хочу «как у всех»?
Для двух групп Краскел-Уоллис даёт тот же ответ, что Манна-Уитни, так что смысла в нём нет — берите Манна-Уитни и не усложняйте.
Можно ли вместо Краскела-Уоллиса использовать ANOVA?
Можно, если данные числовые и в каждой группе распределены примерно нормально (проверка Шапиро-Уилка). Тогда сравнивают средние. Какой из двух выбрать при разном числе групп — в статье «U, H или ANOVA: сколько групп» и в руководстве по ANOVA.
Группы у меня разного размера — это проблема?
Нет. Краскел-Уоллис спокойно работает с группами разной численности (14, 15 и 12 человек — нормально). Главное, чтобы в каждой было хотя бы примерно по 5 наблюдений и больше.
Что делать, если у меня функциональная проба (Штанге, Генчи, проба Руфье)?
Это типичный случай для Краскела-Уоллиса: показатель числовой, выборки небольшие. Логика та же — общий тест, затем пары. Как вообще оформлять такие данные, разобрано в статье «Обработка функциональных проб в дипломе».
Короткий алгоритм
- Сколько групп? Две → Манна-Уитни. Три и больше → дальше.
- Группы независимы (разные люди)? Если это один человек в нескольких состояниях → Фридман.
- Считаете Краскела-Уоллиса: получаете H, df и p.
- p > 0,05 → различий нет, останавливаетесь.
- p < 0,05 → делаете попарные сравнения Манна-Уитни с поправкой Бонферрони.
- Описываете группы медианой и квартилями, в выводе приводите H, df, p и какие пары различаются.
Короче: 3+ независимых группы → Краскел-Уоллис; если он значим — попарно Манна-Уитни с поправкой. Группы описываем медианой, а не средним.
Что ещё почитать
- Манна-Уитни или Краскел-Уоллис — две группы или больше.
- U, H или ANOVA: сколько групп — какой критерий под какое число групп.
- Множественные сравнения и поправка Бонферрони — почему пары нельзя сравнивать «насквозь».
- Обработка функциональных проб в дипломе — как оформить пробы Штанге, Генчи и подобные.
- Калькулятор критерия Краскела-Уоллиса — посчитать онлайн.
Не уверены в выборе критерия — посмотрите базу методов или закажите консультацию: эксперт подберёт метод и посчитает за вас.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию