StatBlank
Основы12 июня 2026·12 мин чтения

U, H или ANOVA: как число групп определяет критерий

Сколько групп сравниваете — две или три и больше? Показываем, как из этого и типа данных однозначно вытекает нужный критерий: Стьюдент, Манна-Уитни, ANOVA или Краскел-Уоллис. С примерами и FAQ.

Перед сравнением групп в дипломе вы каждый раз решаете одну и ту же задачу: какой критерий взять. Кажется, что вариантов много и легко запутаться. На самом деле выбор почти всегда сводится к двум вопросам.

Первый — сколько групп вы сравниваете: две или три и больше. Второй — что за данные и нормально ли они распределены. Ответите на оба — и критерий определится сам. Дальше разберём эту логику по шагам, с примерами и готовыми формулировками.

В двух словах

Сначала считаем группы, потом смотрим на данные:

Это четыре «рабочие лошадки» для независимых групп — то есть когда в группах разные люди. Если же вы измеряете одних и тех же людей несколько раз (до/после), критерии другие — о них чуть ниже.

Шаг 1. Считаем группы

Группа — это набор людей, которых вы сравниваете с другими по какому-то признаку. Контрольная и экспериментальная — две группы. Новички, разрядники и мастера спорта — три группы. Классы «А», «Б» и «В» — тоже три.

Здесь важно одно различие, которое студенты часто пропускают.

  • Независимые группы. В каждой группе — свои, разные люди. Контрольная и экспериментальная из разных студентов; мужчины и женщины; три возрастные подгруппы. Один человек попадает только в одну группу.
  • Связанные (зависимые) замеры. Это одни и те же люди, измеренные несколько раз. До тренинга и после; в начале, середине и конце семестра.
Важно

Сначала всегда отвечайте: у меня разные группы людей или один и тот же человек измерен несколько раз? От этого зависит вся ветка критериев. Перепутать их — классическая ошибка, из-за которой потом «не сходится» вся статистика в работе.

Дальше в разделах про две и три группы мы по умолчанию говорим про независимые группы (разные люди). Случай «одни и те же люди несколько раз» вынесен в отдельный раздел.

Шаг 2. Смотрим на данные

Когда с числом групп разобрались, остаётся понять, какие у вас данные и как они распределены. От этого зависит, брать ли «параметрический» критерий или его непараметрический аналог.

Не пугайтесь слов — смысл простой.

  • Параметрический критерий (Стьюдент, ANOVA) работает с самими числами и со средними значениями. Он точнее, но требует, чтобы данные были числовыми измерениями (рост, время, давление, пульс) и распределялись близко к нормальному — то есть основная масса значений группируется вокруг среднего, без сильных перекосов и выбросов.
  • Непараметрический критерий (Манна-Уитни, Краскел-Уоллис) работает с рангами — то есть с порядком, кто за кем по величине. Ему всё равно, нормальные ли данные, и он спокойно принимает баллы анкет и оценки.

Простое правило-ориентир: если данные — это баллы психологического опросника или порядковые оценки, почти всегда берите непараметрику (Манна-Уитни или Краскел-Уоллиса). Параметрические критерии для баллов формально некорректны, хотя на практике их часто (ошибочно) применяют.

Нормальность распределения проверяют отдельным критерием — Шапиро-Уилка: если p > 0,05, распределение можно считать нормальным. Подробнее — в статье «Как проверить нормальность распределения». А про саму разницу подходов есть отдельный разбор «Параметрические и непараметрические критерии».

Когда брать критерии для двух групп

Если групп ровно две (например, контрольная и экспериментальная) — выбор между двумя критериями.

  • Стьюдент. Сравнивает средние двух групп. Берите, если данные числовые, а в каждой группе распределение близко к нормальному. Это независимый (двухвыборочный) критерий Стьюдента.
  • Манна-Уитни. Сравнивает группы по рангам. Берите для баллов, оценок или когда данные ненормальные, есть выбросы, а выборка небольшая.

Пример. Сравниваете средний результат прыжка в длину у спортсменов двух секций (две группы, числа). Распределение в обеих группах нормальное → критерий Стьюдента.

Пример. Сравниваете уровень тревожности у юношей и девушек по шкале Спилбергера-Ханина (две группы, баллы анкеты) → критерий Манна-Уитни.

Этой паре посвящена отдельная статья — «Стьюдент или Манна-Уитни», там разбор подробнее.

Когда брать критерии для трёх групп и больше

Если групп три и больше (новички / разрядники / мастера; классы «А» / «Б» / «В»), пара меняется, но логика та же.

  • ANOVA (дисперсионный анализ). Параметрический критерий: сравнивает средние сразу во всех группах и отвечает на вопрос «отличается ли хоть одна группа от остальных». Берите для числовых нормальных данных. Считается в калькуляторе ANOVA.
  • Краскел-Уоллис. Непараметрический «аналог ANOVA»: сравнивает три группы и больше по рангам. Берите для баллов и ненормальных данных. Это критерий Краскела-Уоллиса.

Пример. Сравниваете выносливость (результат теста Купера, метры — это число) у трёх возрастных групп бегунов. Данные числовые и нормальные → ANOVA.

Пример. Сравниваете уровень школьной мотивации (баллы по методике Лускановой) в трёх классах. Это баллы → Краскел-Уоллис.

Про выбор внутри этой пары — статья «Манна-Уитни или Краскел-Уоллис» (как непараметрика для 2 и 3+ групп связана) и «ANOVA или Краскел-Уоллис».

Важно понимать, что́ именно отвечают эти два критерия. ANOVA и Краскел-Уоллис говорят только: «различия между группами есть» или «их нет». Они не уточняют, какие именно группы отличаются друг от друга — для этого после значимого результата делают апостериорные (post hoc) сравнения. Но для диплома часто достаточно и общего вывода о наличии различий.

Связанные замеры: один и тот же человек несколько раз

Отдельная ситуация — когда вы измеряете одних и тех же людей по нескольку раз. Здесь четыре «рабочие лошадки» выше не подходят, нужны их «парные» версии.

Логика зеркальная: Вилкоксон — это «связанный Манна-Уитни», а Фридман — «связанный Краскел-Уоллис». Поменялись только люди: вместо разных групп — одни и те же, измеренные несколько раз.

Полная схема выбора

Соберём всё вместе. Сначала вопрос про людей (разные группы или одни и те же), затем про число групп/замеров, затем про данные. Схема ниже ведёт от вопросов к конкретному критерию.

разные люди одни и те же 2 группы 3 и больше 2 замера 3 и больше Разные группы илиодни и те же люди? Независимые группы.Сколько групп? Связанные замеры.Сколько замеров? Стьюдент(числа)/ Манна-Уитни ANOVA(числа)/ Краскел-Уоллис Стьюдент пар.(числа)/ Вилкоксон ANOVA повт.(числа)/ Фридман В каждой паре: слева — для нормальных чисел, справа — для баллов и ненормальных данных
Рисунок 1 — Схема выбора критерия по числу групп и типу данных

Видно главное: тип данных (числа против баллов) лишь выбирает критерий внутри пары, а саму пару задаёт число групп и тип выборок. Поэтому считать группы стоит первым делом.

Почему нельзя сравнивать три группы попарными Стьюдентами

Самый частый соблазн при трёх группах — не разбираться с ANOVA, а просто прогнать критерий Стьюдента три раза: А с Б, А с В, Б с В. Так делать нельзя, и вот почему.

Каждое сравнение Стьюдента допускает 5% риск ошибиться — посчитать различие значимым там, где его на самом деле нет (это уровень значимости 0,05). Когда сравнений несколько, эти риски складываются, и шанс «поймать» хотя бы одно ложное различие резко растёт.

Таблица 1 — Как растёт риск ложного результата при множественных сравнениях Стьюдента

Число групп Сколько пар сравнивать Риск хотя бы одной ложной находки
2 1 около 5%
3 3 около 14%
4 6 около 26%
5 10 около 40%

Как видно из таблицы 1, уже для трёх групп вероятность ложного вывода почти втрое выше заявленных 5%, а для пяти групп — близка к каждому второму случаю. Поэтому при трёх и более группах берут один общий критерий — ANOVA или Краскел-Уоллиса, который держит риск под контролем.

Осторожно

«Прогнать все пары Стьюдентом» — заманчиво, но это методическая ошибка: вы раздуваете вероятность ложного «есть различия». Это и называется проблемой множественных сравнений. Для трёх групп и больше используйте ANOVA или Краскел-Уоллиса. Подробнее об ошибочных выводах — в статье «Ошибки первого и второго рода».

Что писать в дипломе

Главный показатель после расчёта — p-значение (как его читать — в статье «Что такое p-значение»):

  • p < 0,05 — различия статистически значимы;
  • p > 0,05 — значимых различий нет.

Готовые формулировки под каждый критерий:

  • «Различия среднего результата между группами статистически значимы (t = 2,8; p < 0,05)» — для Стьюдента.
  • «Уровень тревожности в группах статистически значимо различается (U = 132; p < 0,05)» — для Манна-Уитни.
  • «Выявлены статистически значимые различия выносливости между тремя группами (F = 5,1; p < 0,05)» — для ANOVA.
  • «Различия мотивации между классами статистически значимы (H = 9,4; p < 0,05)» — для Краскела-Уоллиса.
Заметка

В тексте всегда указывайте сам критерий, его статистику (t, U, F или H), число наблюдений и p-значение. Для параметрических критериев добавьте средние по группам, для непараметрических — медианы. Без этого вывод «группы различаются» не считается доказанным.

Частые ошибки

  • Сравнивать три группы попарными Стьюдентами вместо ANOVA. Раздувает риск ложного результата (см. таблицу 1 выше).
  • Применять Стьюдента и ANOVA к баллам анкет. Баллы — порядковая шкала, корректнее Манна-Уитни и Краскел-Уоллис. Про шкалы — статья «Шкалы измерения».
  • Путать независимые и связанные выборки. Для «одних и тех же людей дважды» нужен не Манна-Уитни, а Вилкоксон; не Краскел-Уоллис, а Фридман.
  • Не проверять нормальность перед параметрическим критерием. Перед Стьюдентом и ANOVA проверяйте распределение Шапиро-Уилком.
  • Делать вывод по одному среднему «у них больше». Без критерия и p-значения это не доказательство.

Частые вопросы

А если групп две, но данные ненормальные?

Тогда берите Манна-Уитни. Число групп (две) задаёт пару «Стьюдент / Манна-Уитни», а ненормальность данных выбирает внутри пары непараметрический вариант — Манна-Уитни.

ANOVA показала различия. Как понять, какие именно группы отличаются?

Сама по себе ANOVA этого не говорит — она лишь фиксирует, что «где-то различия есть». Чтобы узнать, между какими конкретно группами, делают апостериорные (post hoc) сравнения. Для диплома часто достаточно общего вывода о наличии различий плюс таблицы средних по группам.

Можно ли применить Краскел-Уоллиса к нормальным числовым данным?

Да, он останется корректным — просто будет чуть менее чувствительным, чем ANOVA. А вот наоборот (ANOVA к баллам) — некорректно. Поэтому при сомнениях для трёх групп безопаснее Краскел-Уоллис.

У меня две группы и три замера во времени одновременно. Что делать?

Это уже сложный план с двумя факторами (группа и время) — его считают через двухфакторную ANOVA. Такие случаи лучше обсудить с научным руководителем или заказать консультацию: подбор критерия зависит от деталей дизайна.

Сколько человек нужно в каждой группе?

Жёсткого минимума нет, но для устойчивого вывода желательно хотя бы по 15–30 человек в группе, а для ANOVA — сопоставимые по размеру группы. Подробнее — в статье «Сколько респондентов нужно для диплома».

Короткий алгоритм

  1. Разные люди или одни и те же? Разные группы → независимые критерии (ниже). Одни и те же измерены несколько раз → связанные (Вилкоксон / Фридман).
  2. Сколько групп? Две → пара «Стьюдент / Манна-Уитни». Три и больше → пара «ANOVA / Краскел-Уоллис».
  3. Что за данные? Числа с нормальным распределением (проверка Шапиро-Уилком) → параметрический критерий из пары (Стьюдент или ANOVA). Баллы или ненормальные данные → непараметрический (Манна-Уитни или Краскел-Уоллис).
Вывод

Короче: число групп задаёт пару критериев, тип данных выбирает внутри пары. 2 группы → Стьюдент или Манна-Уитни; 3+ группы → ANOVA или Краскел-Уоллис. И никогда не заменяйте ANOVA пачкой попарных Стьюдентов.

Что ещё почитать

Не уверены, что подобрали критерий правильно — загляните в базу методов или закажите консультацию: эксперт подберёт критерий под ваш дизайн и посчитает за вас.

Не хотите разбираться со статистикой сами?

Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.

Заказать консультацию