Практика12 июня 2026·9 мин чтения

Как сравнить спортсменов разной квалификации

Три и больше групп — новички, разрядники, КМС — сравниваем критерием Краскела-Уоллиса и попарно с поправкой. Разбор на функциональной пробе, с примерами и FAQ.

Вы разделили спортсменов на группы по уровню подготовки — новички, разрядники, кандидаты в мастера — и хотите показать, что какой-то показатель (например, восстановление пульса или результат функциональной пробы) с ростом квалификации меняется.

Здесь нельзя просто «погонять» Стьюдента между каждой парой групп. Для трёх и более групп есть свой инструмент. Разберём, какой именно и как описать результат в дипломе.

В двух словах

Если групп три и больше и они независимы (разные люди, никто не попал сразу в две группы) — берите критерий Краскела-Уоллиса. Это «Манна-Уитни для нескольких групп».
Он отвечает на один вопрос: «Хоть где-то между группами есть различие?» Да или нет — но не говорит, какие именно группы отличаются.
Чтобы узнать, между какими группами разница, после него делают попарные сравнения (Манна-Уитни) с поправкой на множественность.

То есть это всегда два шага: сначала общий критерий, потом — уточняющие попарные сравнения.

Почему нельзя просто сравнивать пары Стьюдентом

Самая частая идея у студента: «У меня три группы — сравню новичков с разрядниками, разрядников с КМС, новичков с КМС, и всё». Это ошибка, и вот почему.

Каждое сравнение пары — это розыгрыш «повезёт / не повезёт» с риском ошибиться. Если порог значимости 0,05, то у одного сравнения шанс ложной находки — 5%. Но сравнений у вас не одно, а несколько, и риски складываются.

Пример. При трёх группах получается 3 пары, при четырёх — уже 6 пар. Чем больше сравнений, тем выше шанс, что хотя бы одно «выстрелит» случайно. На 6 сравнениях вероятность поймать ложное различие — около 26%, а не 5%.

Поэтому сначала проверяют одним общим критерием: есть ли различия в принципе. И только если он сказал «да», переходят к парам — уже с поправкой, которая компенсирует накопленный риск.

Осторожно

Гонять парный или независимый критерий Стьюдента по всем парам групп «насквозь» без общего теста и без поправки — грубая методическая ошибка. Рецензент это видит сразу.

Почему Краскел-Уоллис, а не дисперсионный анализ

У задачи «сравнить 3+ групп» есть два инструмента-родственника.

Дисперсионный анализ (ANOVA) — параметрический. Сравнивает средние и требует, чтобы данные были числовыми и распределены примерно нормально в каждой группе.
Критерий Краскела-Уоллиса — непараметрический. Сравнивает группы по рангам (по «местам в общем рейтинге»), нормальность ему не нужна.

Для спортивных и психологических дипломов Краскел-Уоллис обычно безопаснее: выборки часто небольшие, данные перекошены, а часть показателей вообще измеряется в баллах. О том, чем параметрические методы отличаются от непараметрических, есть отдельная статья — «Параметрические и непараметрические критерии».

Совет

Не уверены, нормальны ли данные в группах? Проверьте критерием Шапиро-Уилка (p > 0,05 — распределение близко к нормальному). Сомневаетесь — берите Краскела-Уоллиса: на нормальных данных он тоже корректен, просто чуть менее «чувствителен».

Что значит «по рангам»

Слово «ранги» пугает, хотя идея простая. Представьте, что вы выписали все результаты всех спортсменов в один общий список и расставили их по росту: 1-е место — самый маленький результат, последнее — самый большой. Номер в этом списке и есть ранг.

Дальше критерий смотрит: у какой группы ранги в среднем выше, у какой ниже. Если квалификация на показатель не влияет, ранги перемешаются равномерно и средние «места» у групп окажутся похожими. Если влияет — одна группа сядет в начало списка, другая в конец.

Пример. По пробе восстановления пульса у КМС значения лучше (восстановление быстрее), поэтому их результаты занимают «хорошие» места в общем рейтинге, а у новичков — «слабые». Средний ранг у КМС выходит заметно ниже (или выше — смотря как считаем показатель), и Краскел-Уоллис это улавливает.

Шаг 1. Общий критерий

Вы загружаете данные по всем группам сразу и получаете H-статистику и p-значение (что это такое — в статье «Что такое p-значение»).

Читается результат так:

p < 0,05 — между группами есть значимые различия (хотя бы где-то). Идём на шаг 2.
p > 0,05 — значимых различий нет. Останавливаемся: попарные сравнения делать уже незачем.

H — это сама величина критерия (по смыслу — «насколько сильно разъехались ранги между группами»). В дипломе её приводят вместе с числом степеней свободы df и p-значением. Здесь df = число групп минус один: для трёх групп df = 2.

Шаг 2. Попарные сравнения с поправкой

Если общий тест дал p < 0,05, вы знаете, что различие где-то есть, но пока не знаете, между кем. Теперь сравниваете группы по парам критерием Манна-Уитни: новички и разрядники, разрядники и КМС, новички и КМС.

Чтобы суммарный риск ложной находки не раздулся, к результатам применяют поправку. Самая простая — поправка Бонферрони: порог значимости делят на число сравнений.

Пример. Сравнений три → новый порог 0,05 / 3 ≈ 0,017. Значит, пара считается различающейся, только если у неё p < 0,017, а не привычные 0,05. Подробно про этот приём — в статье «Множественные сравнения и поправка Бонферрони».

Так вы получаете честную картину: возможно, новички значимо отличаются от КМС, но соседние группы (новички и разрядники) — нет.

Что писать в дипломе

Сначала — итог общего критерия, потом расшифровка по парам и таблица.

Готовые формулировки:

«Сравнение трёх групп по уровню квалификации выявило статистически значимые различия восстановления ЧСС (H = 11,4; df = 2; p = 0,003)».
«При попарном сравнении с поправкой Бонферрони значимые различия обнаружены между новичками и КМС (p < 0,017); группы новичков и разрядников значимо не различались».
Если общий тест незначим: «Статистически значимых различий между группами разной квалификации не выявлено (H = 2,1; df = 2; p = 0,35)».

Для каждой группы рядом приводят медиану и квартили (это устойчивые «середина» и «разброс» для непараметрики — см. «Медиана и квартили»), а не среднее со стандартным отклонением.

На таблицу в тексте ссылаются прямо: «Описательные статистики и результат критерия представлены в таблице 1». Подпись таблицы ставят сверху.

Таблица 1 — Время восстановления ЧСС (с) у спортсменов разной квалификации (критерий Краскела-Уоллиса)

Группа	n	Me	Q1–Q3	H (df = 2)	p
Новички	14	96	88–104	11,4	0,003
Разрядники	15	82	75–90
КМС	12	71	66–78

После таблицы — короткий вывод словами: «С ростом квалификации время восстановления ЧСС закономерно снижается; различия между группами статистически значимы (H = 11,4; p < 0,05)».

Для наглядности показатель по группам удобно изобразить столбиками.

Рисунок 1 — Медиана времени восстановления ЧСС по группам квалификации

Важно

В выводе всегда указывайте сам критерий, его статистику (H), число степеней свободы (df) и p-значение, а для пар — какие именно группы различаются. Фраза «с ростом разряда показатель улучшается» без этих цифр не считается доказанной.

Частые ошибки

Сравнивать все пары Стьюдентом без общего теста. Сначала Краскел-Уоллис, и только при p < 0,05 — пары.
Делать попарные сравнения без поправки. Тогда суммарный риск ложного результата завышен; нужна поправка (Бонферрони и т. п.).
Лезть в пары, когда общий тест незначим. Если H-критерий дал p > 0,05, попарные сравнения уже не делают.
Писать средние и стандартные отклонения. Для рангового критерия группы описывают медианой и квартилями.
Применять Краскела-Уоллиса к связанным замерам. Если это один и тот же спортсмен в трёх состояниях (например, в начале, середине и конце сезона) — нужен критерий Фридмана, а не Краскел-Уоллис.

Частые вопросы

Сколько нужно групп, чтобы брать Краскела-Уоллиса?

От трёх и больше. Если групп ровно две, общий критерий не нужен — сразу берите Манна-Уитни. Об этом подробно — в статье «Манна-Уитни или Краскел-Уоллис».

А если групп всего две, но я хочу «как у всех»?

Для двух групп Краскел-Уоллис даёт тот же ответ, что Манна-Уитни, так что смысла в нём нет — берите Манна-Уитни и не усложняйте.

Можно ли вместо Краскела-Уоллиса использовать ANOVA?

Можно, если данные числовые и в каждой группе распределены примерно нормально (проверка Шапиро-Уилка). Тогда сравнивают средние. Какой из двух выбрать при разном числе групп — в статье «U, H или ANOVA: сколько групп» и в руководстве по ANOVA.

Группы у меня разного размера — это проблема?

Нет. Краскел-Уоллис спокойно работает с группами разной численности (14, 15 и 12 человек — нормально). Главное, чтобы в каждой было хотя бы примерно по 5 наблюдений и больше.

Что делать, если у меня функциональная проба (Штанге, Генчи, проба Руфье)?

Это типичный случай для Краскела-Уоллиса: показатель числовой, выборки небольшие. Логика та же — общий тест, затем пары. Как вообще оформлять такие данные, разобрано в статье «Обработка функциональных проб в дипломе».

Короткий алгоритм

Сколько групп? Две → Манна-Уитни. Три и больше → дальше.
Группы независимы (разные люди)? Если это один человек в нескольких состояниях → Фридман.
Считаете Краскела-Уоллиса: получаете H, df и p.
p > 0,05 → различий нет, останавливаетесь.
p < 0,05 → делаете попарные сравнения Манна-Уитни с поправкой Бонферрони.
Описываете группы медианой и квартилями, в выводе приводите H, df, p и какие пары различаются.

Вывод

Короче: 3+ независимых группы → Краскел-Уоллис; если он значим — попарно Манна-Уитни с поправкой. Группы описываем медианой, а не средним.

Что ещё почитать

Манна-Уитни или Краскел-Уоллис — две группы или больше.
U, H или ANOVA: сколько групп — какой критерий под какое число групп.
Множественные сравнения и поправка Бонферрони — почему пары нельзя сравнивать «насквозь».
Обработка функциональных проб в дипломе — как оформить пробы Штанге, Генчи и подобные.
Калькулятор критерия Краскела-Уоллиса — посчитать онлайн.

Не уверены в выборе критерия — посмотрите базу методов или закажите консультацию: эксперт подберёт метод и посчитает за вас.

Не хотите разбираться со статистикой сами?

Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.

Заказать консультацию