StatBlank
Руководства10 июня 2026·12 мин чтения

Дисперсионный анализ (ANOVA): полное руководство с формулами и примером

Что такое дисперсионный анализ простыми словами: когда применять для 3+ групп, идея, F-критерий Фишера, формула, степени свободы, ANOVA-таблица, пример, постхок и FAQ.

Дисперсионный анализ (ANOVA) — главный метод, когда в дипломе нужно сравнить средние не двух, а сразу трёх и более групп: например, успеваемость на трёх курсах или эффект трёх методик обучения. Стьюдент тут уже не годится — попарные сравнения накапливают ошибку.

В этом руководстве разберём всё по порядку: что такое дисперсионный анализ простыми словами, в чём его идея, формула F-критерия Фишера и степени свободы, условия применения, пошаговый алгоритм, разобранный пример с ANOVA-таблицей, постхок-сравнения и частые вопросы.

Если нужно просто посчитать — воспользуйтесь онлайн-калькулятором дисперсионного анализа. А здесь — теория, чтобы уверенно защититься.

🧮Онлайн-калькулятор дисперсионного анализа (ANOVA)Посчитайте свои данные за пару минут — нажмите, чтобы открыть

Что такое дисперсионный анализ простыми словами

Дисперсионный анализ (ANOVA, от англ. Analysis of Variance) — это параметрический метод, который проверяет, значимо ли различаются средние значения трёх и более групп. Он отвечает на вопрос: «Эти группы действительно отличаются по среднему — или разброс между ними случайный?»

Несмотря на название («анализ дисперсий»), ANOVA сравнивает именно средние. Парадокс снимается просто: чтобы понять, далеко ли разошлись средние групп, метод сопоставляет два вида разброса — между группами и внутри них.

Однофакторный дисперсионный анализ (one-way ANOVA) — это обобщение критерия Стьюдента на случай, когда групп больше двух. Для двух групп используют именно Стьюдента, а ANOVA нужен начиная с трёх.

Заметка

Дисперсионный анализ — параметрический метод: он требует количественных данных и близкого к нормальному распределения. Если данные — баллы анкет или распределение ненормальное, нужен непараметрический аналог — критерий Краскела-Уоллиса.

Когда применять дисперсионный анализ

Однофакторный ANOVA подходит, когда одновременно выполнены условия:

  1. Три и более независимые группы — разные люди в каждой группе (например, три разных курса или три метода).
  2. Данные — количественные измерения (баллы 0–100, время, рост, число).
  3. Сравниваются именно средние этих групп.
  4. Распределение в группах близко к нормальному, а дисперсии примерно равны.
Осторожно

Нельзя сравнивать три группы попарно несколькими t-критериями Стьюдента: при каждом сравнении накапливается риск ложного результата. Для 3+ групп — один общий тест ANOVA. Подробнее о выборе — в статье «Как выбрать статистический критерий».

Идея метода: межгрупповая и внутригрупповая дисперсия

Вся суть ANOVA — в разложении общей изменчивости на две части.

  • Межгрупповая изменчивость — насколько различаются средние самих групп (отражает эффект фактора).
  • Внутригрупповая изменчивость — случайный разброс значений внутри каждой группы (отражает «шум»).

Логика такая: если средние групп разошлись сильнее, чем колеблются значения внутри групп, — различия неслучайны. F-критерий и есть отношение этих двух разбросов.

Важно

Чем больше межгрупповая дисперсия по сравнению с внутригрупповой, тем больше F и тем вероятнее, что группы реально различаются. Если же разброс между группами не превышает «шум» внутри них — F близок к 1, и различий нет.

Гипотезы дисперсионного анализа

  • H₀ (нулевая гипотеза дисперсионного анализа): все групповые средние равны (μ₁ = μ₂ = μ₃ = …), различия случайны.
  • H₁ (альтернативная): хотя бы одно среднее отличается от остальных.

Важно: ANOVA говорит лишь, что различие где-то есть, но не указывает, какие именно группы отличаются. Это определяет постхок (см. ниже).

Формула F-критерия и степени свободы

F-критерий назван в честь британского статистика Рональда Фишера (отсюда — «дисперсионный анализ, критерий Фишера»). Считать вручную не обязательно — всё делает калькулятор. Но для защиты полезно знать суть.

Эмпирическое значение F — это отношение межгруппового среднего квадрата к внутригрупповому:

F = MS_межгр / MS_внутригр = (SS_b / df_b) / (SS_w / df_w)

где SS — суммы квадратов (sum of squares), MS — средние квадраты (mean square), а индексы b (between) и w (within) — «между группами» и «внутри групп».

Средние квадраты получают делением сумм квадратов на степени свободы:

  • df межгрупповая: df_b = k − 1, где k — число групп;
  • df внутригрупповая: df_w = N − k, где N — общее число наблюдений.
Совет

Правило вывода: различия значимы, когда F эмп ≥ F крит (что эквивалентно p < 0,05). Тогда хотя бы две группы различаются — какие именно, покажет постхок-критерий (например, критерий Тьюки).

Условия применения (допущения)

Чтобы результат ANOVA был корректным, проверяют три допущения:

  1. Нормальность распределения в группах (или остатков) — например, критерием Шапиро-Уилка; p > 0,05 говорит о нормальности. Как это сделать — в статье «Как проверить нормальность распределения».
  2. Однородность (равенство) дисперсий — тестом Левена; если p > 0,05, дисперсии можно считать равными.
  3. Независимость наблюдений — группы из разных людей, измерения не связаны.

Если нормальность или однородность дисперсий нарушены, переходят на непараметрический критерий Краскела-Уоллиса.

Алгоритм расчёта: как считать

1. Найти общее среднее и средние групп 2. Посчитать SS межгр. и SS внутригр. 3. Найти df: df_b = k − 1, df_w = N − k 4. MS = SS / df; F = MS_межгр / MS_внутригр 5. F эмп ≥ F крит → различия значимы
Рисунок 1 — Алгоритм однофакторного дисперсионного анализа

Разберём шаги подробнее:

  1. Средние. Считаем общее среднее по всем наблюдениям и среднее каждой группы.
  2. Суммы квадратов. SS_b — взвешенная сумма квадратов отклонений групповых средних от общего; SS_w — сумма квадратов отклонений значений от своих групповых средних.
  3. Степени свободы. df_b = k − 1, df_w = N − k.
  4. Средние квадраты и F. MS = SS / df для каждой строки, затем F = MS_b / MS_w.
  5. Сравнение. Сравниваем F эмп с F крит по df_b и df_w: если F эмп ≥ F крит (p < 0,05) — различия значимы.

Разбор примера с ANOVA-таблицей

Сравним успешность выполнения задания в трёх группах по 4 человека (баллы):

  • Группа 1: 4, 5, 4, 3 → M₁ = 4,0
  • Группа 2: 6, 7, 5, 6 → M₂ = 6,0
  • Группа 3: 8, 9, 7, 8 → M₃ = 8,0

Всего N = 12 наблюдений, k = 3 группы. Общее среднее = (4 + 6 + 8) / 3 = 6,0.

Межгрупповая сумма квадратов (по 4 значения в группе):

SS_b = 4·[(4−6)² + (6−6)² + (8−6)²] = 4·(4 + 0 + 4) = 32

Внутригрупповая сумма квадратов (отклонения внутри каждой группы):

SS_w = 2 + 2 + 2 = 6

(в каждой группе отклонения от среднего дают сумму квадратов 2).

Степени свободы: df_b = k − 1 = 2; df_w = N − k = 12 − 3 = 9.

Средние квадраты: MS_b = 32 / 2 = 16; MS_w = 6 / 9 ≈ 0,667.

F-критерий: F = 16 / 0,667 ≈ 24,0.

Сведём всё в стандартную таблицу дисперсионного анализа.

Таблица 1 — Таблица дисперсионного анализа (k = 3, N = 12)

Источник вариации SS df MS F F крит (p ≤ 0,05)
Межгрупповая (фактор) 32 2 16 24,0 4,26
Внутригрупповая (ошибка) 6 9 0,667
Общая 38 11

Критическое значение F крит(0,05; 2; 9) = 4,26. Сравниваем: 24,0 ≥ 4,26 → различия статистически значимы (p < 0,05).

баллы 4,0 Группа 1 6,0 Группа 2 8,0 Группа 3
Рисунок 2 — Средние значения трёх групп (N = 12)

Вывод для диплома: «Между группами выявлены статистически значимые различия по уровню показателя (F = 24,0; df = 2; 9; p < 0,05): средние составили 4,0; 6,0 и 8,0 балла соответственно».

Постхок-сравнения: критерий Тьюки

ANOVA показал, что различия есть, но не уточнил, между какими именно группами. Чтобы выяснить это, проводят постхок-сравнения (post hoc — «после того»).

Самый распространённый — критерий Тьюки (Tukey HSD). Он попарно сравнивает все группы и при этом контролирует общую ошибку, поэтому безопаснее серии t-тестов. В нашем примере Тьюки покажет, что значимо различаются все три пары (1–2, 2–3, 1–3).

Заметка

Постхок проводят только если общий F значим. Если ANOVA не нашёл различий (p > 0,05), попарные сравнения не делают.

Однофакторный и двухфакторный ANOVA

  • Однофакторный (one-way) дисперсионный анализ оценивает влияние одного фактора (например, «метод обучения» с тремя уровнями).
  • Двухфакторный (two-way) дисперсионный анализ оценивает влияние двух факторов сразу (например, «метод» и «пол») и, что важно, их взаимодействие — усиливает ли один фактор эффект другого.

В дипломах чаще всего нужен именно однофакторный вариант. Двухфакторный берут, когда в дизайне исследования заложены два независимых фактора.

Непараметрический аналог: критерий Краскела-Уоллиса

Если данные не количественные (баллы анкет, ранги) или распределение далеко от нормального, ANOVA применять нельзя — используют его непараметрический аналог, критерий Краскела-Уоллиса. Он сравнивает те же 3+ независимые группы, но работает с рангами, а не со средними.

Что выбрать в спорном случае — разобрано в статье «ANOVA или Краскел-Уоллис». О разнице между двумя семействами методов — «Параметрические и непараметрические критерии».

Дисперсионный анализ в SPSS, Excel и онлайн

  • В SPSS: «Анализ» → «Сравнение средних» → «Однофакторный дисперсионный анализ» (One-Way ANOVA); там же задаются тест Левена и постхок (Tukey). Программа выдаёт ANOVA-таблицу и p-значение.
  • В Excel: надстройка «Анализ данных» → «Однофакторный дисперсионный анализ» строит таблицу с SS, df, MS, F и F крит. Но Excel не проверяет нормальность и не делает постхок — это нужно отдельно.
  • Онлайн проще всего: калькулятор дисперсионного анализа сам считает SS, df, MS и F, берёт критическое значение, выдаёт p и готовый вывод.

Частые ошибки

  • Сравнивать 3+ группы попарно Стьюдентом. Это накапливает ошибку — нужен один общий ANOVA.
  • Применять ANOVA к балльным анкетам и ненормальным данным. Тогда корректнее Краскел-Уоллис.
  • Не проверять условия (нормальность, равенство дисперсий) перед расчётом.
  • Делать выводы о конкретных группах без постхока. Значимый F говорит лишь, что различие где-то есть.
  • Использовать ANOVA для двух групп. Для двух групп — критерий Стьюдента.

Частые вопросы

Что такое дисперсионный анализ простыми словами?

Это метод, который проверяет, реально ли различаются средние трёх и более групп или разброс между ними случаен. Он сравнивает изменчивость между группами с изменчивостью внутри них.

Чем ANOVA отличается от критерия Стьюдента?

Стьюдент сравнивает средние двух групп, а ANOVA — трёх и более сразу, одним тестом, без накопления ошибки. Для двух групп это, по сути, эквивалентные методы (F = t²).

Что показывает F-критерий?

F — это отношение межгрупповой дисперсии к внутригрупповой. Чем он больше, тем сильнее различаются группы. Если F эмп ≥ F крит (p < 0,05), различия значимы.

Какая нулевая гипотеза в дисперсионном анализе?

H₀: все групповые средние равны (μ₁ = μ₂ = μ₃ = …). Альтернативная H₁: хотя бы одно среднее отличается от остальных.

Что делать, если данные ненормальные?

Перейти на непараметрический аналог — критерий Краскела-Уоллиса. Он сравнивает те же 3+ группы, но по рангам.

Зачем нужен постхок после ANOVA?

ANOVA говорит лишь, что различие где-то есть. Постхок (например, критерий Тьюки) показывает, какие именно пары групп различаются. Его делают только при значимом F.

Что ещё почитать

Итог

Вывод

Дисперсионный анализ (ANOVA) сравнивает средние трёх и более независимых групп, раскладывая общую изменчивость на межгрупповую и внутригрупповую. Различия значимы, когда F эмп ≥ F крит (p < 0,05); какие именно группы отличаются, покажет постхок (Тьюки). Для ненормальных данных — Краскел-Уоллис, для двух групп — Стьюдент.

Посчитать свои данные за пару минут можно в калькуляторе дисперсионного анализа — он сам построит ANOVA-таблицу и оформит вывод. Подобрать метод под свою задачу поможет база методов, а если нужна вся статистика под ключ — консультация эксперта.

Не хотите разбираться со статистикой сами?

Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.

Заказать консультацию