Эмпирическое и критическое значение критерия: как сравнить
Чем отличается эмпирическое значение критерия от критического, и почему правило сравнения у t/F/хи-квадрат и у U/T противоположное — с таблицей-памяткой, примерами и FAQ.
Вы прогнали данные через критерий, получили два числа — и не знаете, какое из них с каким сравнивать, чтобы понять: значимо или нет. А ещё кто-то говорит «эмпирическое должно быть больше», а в вашем учебнике написано наоборот.
Оба правы — просто для разных критериев правило сравнения противоположное. Разберёмся, где «больше», где «меньше» и почему.
В двух словах
Эмпирическое значение — это то, что вы посчитали по своим данным. Критическое значение — табличный порог, который зависит от объёма выборки и уровня значимости α.
Сравниваете вы всегда эмпирическое с критическим. А вот направление сравнения зависит от критерия: у t-Стьюдента, F-Фишера и χ² значимость даёт «эмп > крит», а у U-Манна-Уитни и T-Вилкоксона — наоборот, «эмп < крит».
Любой калькулятор из каталога считает эмпирическое значение за вас и сразу пишет вывод, так что путаницы можно избежать. Но понимать логику всё равно полезно — её спросят на защите.
Что такое эмпирическое значение
Эмпирическое значение (его обозначают с индексом «эмп»: t_эмп, U_эмп, χ²_эмп) — это число, которое получается, когда вы подставляете свои данные в формулу критерия.
Оно одно на ваш конкретный набор данных. Чем сильнее различие между группами или сдвиг «до/после», тем дальше это число уходит от нуля.
Считать его руками по формуле долго и легко ошибиться. Поэтому эмпирическое значение почти всегда берут из программы или онлайн-калькулятора — туда вы вставляете цифры, а на выходе получаете готовое t_эмп, U_эмп и так далее.
Эмпирическое значение само по себе ничего не «доказывает». t_эмп = 2,1 — это много или мало? Ответ зависит от того, сколько у вас человек. Поэтому его всегда сравнивают с порогом — критическим значением.
Что такое критическое значение
Критическое значение (t_крит, U_крит, χ²_крит) — это граница-порог. Если эмпирическое значение «пересекает» эту границу, различие считается статистически значимым.
Критическое значение не вы считаете — оно уже подсчитано математиками и лежит в таблице критических значений в конце любого учебника по статистике. Чтобы найти нужную клетку, вам понадобятся два параметра.
- Объём выборки. Часто в таблицу заходят не по самому n, а по числу степеней свободы (df или k = n − 1, n − 2 — зависит от критерия). У непараметрических критериев — прямо по n или n₁ и n₂.
- Уровень значимости α. Это допустимый риск ошибиться. Стандартно берут α = 0,05 (риск 5%) и α = 0,01 (риск 1%).
Подробно, как не запутаться в строках и столбцах такой таблицы, разобрано в статье «Как читать таблицу критических значений».
Запомните разницу одним словом: эмпирическое — посчитанное (по вашим данным), критическое — табличное (по n и α). Первое вы получаете из калькулятора, второе ищете в таблице.
Главное: правило сравнения у критериев РАЗНОЕ
Вот здесь и спотыкается большинство студентов. Направление неравенства зависит от того, как устроен критерий.
Группа 1 — «чем больше, тем значимее» (эмп > крит → значимо). Сюда входят t-Стьюдента, F-Фишера, χ² (хи-квадрат), угловое преобразование Фишера φ*. У них большое эмпирическое значение означает большое различие. Поэтому различие значимо, когда эмпирическое превысило порог.
Группа 2 — «чем меньше, тем значимее» (эмп < крит → значимо). Сюда входят U-Манна-Уитни и T-Вилкоксона. Эти критерии устроены на рангах, и у них меньшее число означает большее различие. Поэтому значимость — когда эмпирическое опустилось ниже порога.
Таблица 1 — Памятка: с какой стороны сравнивать (α = 0,05)
| Критерий | Обозначение | Значимо, если | Калькулятор |
|---|---|---|---|
| Стьюдента | t_эмп | t_эмп > t_крит | открыть |
| Фишера (дисперсии/ANOVA) | F_эмп | F_эмп > F_крит | открыть |
| Хи-квадрат | χ²_эмп | χ²_эмп > χ²_крит | открыть |
| Угловой Фишера | φ*_эмп | φ*_эмп > φ*_крит | открыть |
| Манна-Уитни | U_эмп | U_эмп < U_крит | открыть |
| Вилкоксона | T_эмп | T_эмп < T_крит | открыть |
Вывод словами: критерии из верхней части таблицы «работают на увеличение» (значимость = превысить порог), а Манна-Уитни и Вилкоксона — «на уменьшение» (значимость = быть ниже порога). Перепутать направление — значит написать в дипломе противоположный вывод.
Самая частая ошибка курсовых и дипломов. Студент считает Манна-Уитни, видит U_эмп = 18 при U_крит = 56, и пишет «различия не значимы, так как 18 меньше 56». На самом деле всё наоборот: у Манна-Уитни «меньше критического» как раз и означает значимость. Сверяйтесь с таблицей 1.
Как это выглядит на оси
Удобно представить ось значений и порог на ней. Для критериев из первой группы зона значимости — справа от порога, для второй — слева.
Логика одна и та же: значимость — это когда эмпирическое значение попало в зелёную зону. Просто у разных критериев эта зона лежит по разную сторону от порога.
Разбор на двух примерах
Пример 1 — критерий Стьюдента (правило «больше»). Вы сравнили средний результат прыжка в длину в двух группах, n₁ = 15 и n₂ = 15. Калькулятор выдал t_эмп = 2,84.
Число степеней свободы: df = n₁ + n₂ − 2 = 28. В таблице на пересечении df = 28 и α = 0,05 стоит t_крит = 2,05.
Сравниваем: t_эмп = 2,84 > t_крит = 2,05. Эмпирическое превысило порог → различия значимы (p < 0,05). Группы действительно отличаются.
Пример 2 — критерий Манна-Уитни (правило «меньше»). Вы сравнили уровень тревожности в двух группах, n₁ = 12 и n₂ = 12. Калькулятор выдал U_эмп = 31.
В таблице для n₁ = 12 и n₂ = 12 при α = 0,05 стоит U_крит = 42.
Сравниваем: U_эмп = 31 < U_крит = 42. Эмпирическое оказалось ниже порога → различия значимы (p < 0,05). Если бы получилось U_эмп = 60, было бы 60 > 42 — и различия были бы не значимы.
Параметрические критерии (t, F) и непараметрические (U, T) проверяют значимость по-разному, но смысл вывода один: «значимо» = маловероятно, что такое различие возникло случайно. Связь этого правила с p-значением разобрана в статье «Что такое p-значение»: если эмп в зоне значимости, то p ≤ α.
Что писать в дипломе
Готовые формулировки — подставьте свои числа.
- «Эмпирическое значение критерия Стьюдента t_эмп = 2,84 превышает критическое t_крит = 2,05 (df = 28; α = 0,05), следовательно, различия между группами статистически значимы (p < 0,05)».
- «Эмпирическое значение U-критерия Манна-Уитни U_эмп = 31 меньше критического U_крит = 42 (n₁ = n₂ = 12; α = 0,05), что свидетельствует о значимости различий (p < 0,05)».
- «Поскольку χ²_эмп = 3,1 не достигает критического значения χ²_крит = 5,99 (df = 2; α = 0,05), нулевая гипотеза не отвергается: различия не значимы (p > 0,05)».
В тексте обязательно указывайте оба числа, степени свободы (или n) и уровень α — иначе вывод выглядит голословным.
Частые ошибки
- Сравнивать эмпирическое с эмпирическим. Сравнивают всегда эмп с крит, а не два эмпирических значения между собой.
- Применять правило «больше» ко всем критериям. Для Манна-Уитни и Вилкоксона значимость — это «меньше». Сверяйтесь с таблицей 1.
- Взять критическое значение не для того α. Для α = 0,01 порог строже (дальше), и вывод может смениться. Указывайте α явно.
- Перепутать строку в таблице (n вместо df). У t и χ² заходят по степеням свободы, а не по самому n.
- Писать вывод без чисел. «Различия значимы» без t_эмп, t_крит, df и α — не доказательство.
Частые вопросы
Какое число калькулятор называет «статистикой критерия»?
Это и есть эмпирическое значение — то, что посчитано по вашим данным. «Статистика критерия», «наблюдаемое значение», «эмп» — синонимы.
Зачем тогда p-значение, если есть критические значения?
Это два способа сказать одно и то же. Сравнение «эмп vs крит» — старый «ручной» метод по таблицам. P-значение — то же решение, но числом: если p ≤ α, различия значимы. Программы выдают p, потому что не нужно лазить в таблицы. Подробнее — в статье «Что такое p-значение».
Что если эмпирическое равно критическому?
Пограничный случай. Формально при «эмп = крит» принято считать различие на грани значимости; чаще его относят к значимым (p ≈ α). Но лучше посмотреть точное p-значение из калькулятора — оно снимет неоднозначность.
Почему у Манна-Уитни и Вилкоксона всё наоборот?
Эти критерии считают по рангам, и их статистика устроена так, что минимальное значение соответствует максимальному различию. Грубо: чем меньше «перемешаны» группы, тем меньше U или T. Поэтому маленькое эмпирическое = большое различие = значимость.
Как найти критическое значение, если в таблице нет моего n?
Берут ближайшее меньшее n (это строже — безопаснее) либо пользуются калькулятором, который считает точное p-значение и вообще обходится без таблиц. Все критерии из каталога делают это автоматически.
Короткий алгоритм
- Посчитайте эмпирическое значение — вставьте данные в нужный калькулятор.
- Определите параметры: df (или n) и уровень α (обычно 0,05).
- Найдите критическое значение в таблице — по статье «Как читать таблицу критических значений».
- Сравните, глядя в таблицу 1: для t/F/χ² значимо при «эмп > крит», для U/T — при «эмп < крит».
- Запишите вывод с обоими числами, df (или n) и α.
Коротко: эмпирическое — посчитанное, критическое — табличное. Для t, F, χ² значимо «эмп больше крит», для U Манна-Уитни и T Вилкоксона — «эмп меньше крит». Калькулятор посчитает и сразу скажет, в какую сторону сравнивать.
Что ещё почитать
- Как читать таблицу критических значений — где найти порог и как не перепутать строку.
- Что такое p-значение — современная альтернатива сравнению с критическим значением.
- Каталог калькуляторов — посчитать эмпирическое значение любого критерия онлайн.
- Критерий Стьюдента — пример правила «эмп > крит».
- Критерий Манна-Уитни — пример правила «эмп < крит».
Не уверены, в какую сторону сравнивать в вашем случае — посчитайте онлайн в каталоге калькуляторов: он сам выдаст вывод. А если нужен разбор под ключ, загляните в базу методов или закажите консультацию.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.