Основы10 июня 2026·6 мин чтения

Ошибки I и II рода и мощность критерия простыми словами

Что такое ошибки первого и второго рода (α и β), что такое мощность критерия, от чего они зависят и как их снизить. С таблицей, схемой и примерами для диплома.

Когда вы проверяете гипотезу и получаете p-значение, вывод может оказаться неверным двумя способами: найти различие, которого нет, или пропустить реальное. Это и есть ошибки I и II рода.

Разберём, чем они отличаются, что такое мощность критерия и как сделать так, чтобы выводы в дипломе были надёжными.

В двух словах

Ошибка I рода (α) — нашли различие, которого на самом деле нет («ложная тревога»). Её вероятность равна уровню значимости, обычно 0,05.
Ошибка II рода (β) — пропустили реальное различие («ложный отбой»).
Мощность критерия (1 − β) — вероятность обнаружить эффект, который действительно есть. Хорошо, когда она ≥ 0,8.

Всё это связано с проверкой гипотез H₀ и H₁ — подробнее в статье «Гипотеза исследования: H₀ и H₁».

Ошибка I рода (α)

Ошибка I рода — это когда вы отвергаете нулевую гипотезу H₀, хотя она верна: объявляете различие (или связь) значимым, а на самом деле его нет.

Вероятность такой ошибки задаёте вы сами — это уровень значимости α (по умолчанию 0,05). Порог p < 0,05 означает: вы согласны ошибочно «найти» эффект не чаще, чем в 5% случаев.

Важно

Уровень значимости 0,05 — это и есть допустимая вероятность ошибки I рода. Хотите меньше ложных тревог — берите более строгий порог (0,01), но тогда вырастет риск ошибки II рода.

Ошибка II рода (β)

Ошибка II рода — это когда вы не отвергаете H₀, хотя верна H₁: реальное различие есть, но критерий его «не заметил».

Её вероятность обозначают β. Чаще всего она возникает из-за маленькой выборки или слабого эффекта — данных просто не хватает, чтобы доказать различие.

Заметка

«Не отвергли H₀» не означает «доказали, что различий нет». Возможно, эффект есть, но вы его пропустили (ошибка II рода). Отсутствие значимости — это «не нашли», а не «доказали отсутствие».

Мощность критерия (1 − β)

Мощность — это вероятность обнаружить эффект, который действительно существует: мощность = 1 − β. Чем она выше, тем реже вы пропускаете реальные различия.

Общепринятый ориентир — мощность не ниже 0,8 (то есть β ≤ 0,2). Именно от неё зависит, сколько респондентов нужно набрать.

Матрица решений: где какая ошибка

Всё удобно уложить в таблицу: по столбцам — что на самом деле (реальность), по строкам — какое решение вы приняли.

Таблица 1 — Возможные исходы проверки гипотезы

Ваше решение / Реальность	H₀ верна (эффекта нет)	H₁ верна (эффект есть)
Отвергли H₀ («эффект есть»)	❌ Ошибка I рода (α)	✅ Верно (мощность 1 − β)
Не отвергли H₀ («эффекта нет»)	✅ Верно (1 − α)	❌ Ошибка II рода (β)

Рисунок 1 — Два верных исхода и две ошибки при проверке гипотезы

Простая аналогия — медицинский тест: ошибка I рода = ложноположительный результат (здорового признали больным), ошибка II рода = ложноотрицательный (больного признали здоровым).

От чего зависят и как снизить

Уровень значимости α задаёте вы. Снизите α (с 0,05 до 0,01) — меньше ошибок I рода, но больше ошибок II рода (и ниже мощность). Это всегда компромисс.
Объём выборки. Чем больше респондентов, тем меньше β и выше мощность — это главный способ снизить ошибку II рода (см. «Сколько респондентов нужно»).
Размер эффекта. Чем сильнее реальное различие, тем легче его обнаружить (см. «Размер эффекта»).
Разброс данных. Чем меньше вариативность, тем выше мощность.

Совет

Хотите одновременно мало ложных тревог и высокую мощность? Главный рычаг — достаточная выборка. Менять только α бессмысленно: вы лишь перекладываете риск с одной ошибки на другую.

Что писать в дипломе

Чаще всего достаточно указать уровень значимости: «Различия считались значимыми при p < 0,05 (вероятность ошибки I рода — 5%)». Если работа серьёзная — упоминают и мощность или обосновывают объём выборки нужной мощностью (0,8).

Осторожно

Не делайте вывод «группы одинаковы» только потому, что p > 0,05. Корректная формулировка — «статистически значимых различий не выявлено»: возможно, эффект есть, но выборка мала (ошибка II рода).

Частые ошибки

Трактовать p > 0,05 как доказательство отсутствия эффекта. Это лишь «не нашли», а не «доказали, что нет».
Гнаться только за снижением α. Жёсткий порог повышает риск пропустить реальный эффект.
Игнорировать мощность и объём выборки. Маленькая выборка — главная причина ошибок II рода.
Множественные сравнения без поправки. Много тестов подряд раздувают суммарную вероятность ошибки I рода (нужна поправка, например Бонферрони).

Частые вопросы

Что опаснее — ошибка I или II рода?

Зависит от задачи. В медицине пропустить болезнь (II рода) часто опаснее ложной тревоги (I рода); в других случаях наоборот. Поэтому α выбирают осознанно.

Чему равна вероятность ошибки I рода?

Она равна уровню значимости α, который вы задаёте, — обычно 0,05 (5%).

Как связаны α и β?

Обратно: при фиксированной выборке уменьшение α увеличивает β (и снижает мощность). Снизить обе сразу позволяет только увеличение выборки.

Что такое мощность критерия?

Вероятность обнаружить реальный эффект: мощность = 1 − β. Желательный уровень — не ниже 0,8.

Как повысить мощность исследования?

Увеличить объём выборки, выбрать более чувствительный критерий, снизить разброс данных и ожидать больший размер эффекта.

Короткий алгоритм

Задайте уровень значимости (обычно α = 0,05) — это допустимая вероятность ошибки I рода.
Обеспечьте достаточную выборку, чтобы мощность была ≥ 0,8 (меньше ошибок II рода).
При p < 0,05 — отвергаете H₀; при p ≥ 0,05 — пишете «значимых различий не выявлено» (а не «их нет»).

Что ещё почитать

Гипотеза исследования: как сформулировать H₀ и H₁ — основа, к которой относятся ошибки.
Что такое p-значение простыми словами — связь с уровнем значимости.
Размер эффекта (d Коэна, r) — насколько велик эффект и как это влияет на мощность.
Сколько респондентов нужно для диплома — как объём выборки снижает ошибку II рода.

Подобрать метод и обосновать выборку поможет база методов, а посчитать всю статистику под ключ — консультация эксперта.

Не хотите разбираться со статистикой сами?

Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.

Заказать консультацию