Критерий Стьюдента: полное руководство с формулами и примерами
Подробный разбор t-критерия Стьюдента: что это, когда применять, формулы для всех трёх видов, степени свободы, интерпретация, пример расчёта, ошибки и FAQ.
t-критерий Стьюдента — один из самых известных методов математической статистики. Его используют в дипломах по психологии, педагогике, медицине, биологии, экономике и спорту. В этом руководстве разберём всё: что это за критерий, когда он подходит, его формулы, как считать степени свободы, как интерпретировать результат и какие ошибки чаще всего допускают студенты.
Если нужно просто посчитать — воспользуйтесь онлайн-калькулятором критерия Стьюдента. А здесь — теория, чтобы уверенно защититься.
🧮Онлайн-калькулятор критерия СтьюдентаПосчитайте свои данные за пару минут — нажмите, чтобы открыть→
Что такое критерий Стьюдента
Критерий Стьюдента (t-критерий) проверяет, значимо ли различаются средние значения. Он отвечает на вопрос: «Найденное различие средних реально или это случайность выборки?»
Название происходит от псевдонима «Student», под которым в 1908 году публиковал работы британский статистик Уильям Госсет. Критерий основан на t-распределении — оно похоже на нормальное, но учитывает, что при малых выборках разброс оценивается менее точно.
Когда применяется критерий Стьюдента
Критерий подходит, когда одновременно выполнены условия:
- Данные — количественные измерения (баллы 0–100, рост, время, количество).
- Распределение данных близко к нормальному.
- Сравниваются средние (одной выборки с нормой, двух групп между собой или замеров «до/после»).
Если данные — это оценки, баллы анкеты или ранги, либо распределение далеко от нормального, критерий Стьюдента не подходит — нужны непараметрические аналоги (Манна-Уитни, Вилкоксона). Подробнее — в статье «Параметрические и непараметрические критерии».
Три вида критерия Стьюдента
Существует три разновидности — выбор зависит от дизайна исследования.
1. Одновыборочный
Сравнивает среднее одной выборки с заданным эталоном (нормой) μ₀. Например: отличается ли средний балл группы от норматива.
2. Для двух независимых групп
Сравнивает средние двух разных групп (разные люди). Например: контрольная и экспериментальная группа.
3. Парный (для связанных выборок)
Сравнивает два замера у одних и тех же людей — «до» и «после» воздействия. Например: тревожность до и после тренинга.
Формулы критерия Стьюдента
Считать вручную не нужно — всё делает калькулятор. Но для понимания (и для защиты) полезно знать формулы.
Обозначения: M — среднее, s — стандартное отклонение, s² — дисперсия, n — объём выборки.
Независимый t-критерий (равные дисперсии)
t = (M₁ − M₂) / (s_p · √(1/n₁ + 1/n₂))
где s_p — объединённое (pooled) стандартное отклонение:
s_p = √( ((n₁ − 1)·s₁² + (n₂ − 1)·s₂²) / (n₁ + n₂ − 2) )
Степени свободы: df = n₁ + n₂ − 2.
Парный t-критерий
Сначала для каждой пары считают разность d = (значение «до») − (значение «после»). Затем:
t = d̄ / (s_d / √n)
где d̄ — среднее разностей, s_d — стандартное отклонение разностей, n — число пар. Степени свободы: df = n − 1.
Одновыборочный t-критерий
t = (M − μ₀) / (s / √n)
где μ₀ — эталонное значение (норма). Степени свободы: df = n − 1.
Если дисперсии не равны — поправка Уэлча
Если разброс в двух группах сильно различается, применяют критерий Уэлча (модификация Стьюдента):
t = (M₁ − M₂) / √(s₁²/n₁ + s₂²/n₂)
Степени свободы при этом считаются по формуле Уэлча-Саттертуэйта (получаются дробными). Хороший калькулятор сам проверяет равенство дисперсий (тестом Левена) и при необходимости применяет поправку.
Степени свободы (df)
Степени свободы показывают, сколько значений в данных «свободно» варьируют. От них зависит критическое значение t. Запоминать просто:
- независимый критерий:
df = n₁ + n₂ − 2; - парный и одновыборочный:
df = n − 1.
Как интерпретировать результат
После расчёта вы получаете несколько чисел.
t-значение и критическое значение
Эмпирическое (рассчитанное) t сравнивают с критическим t_крит (берётся из таблицы по df и уровню значимости 0,05):
- если |t| > t_крит — различие статистически значимо;
- если |t| ≤ t_крит — значимых различий нет.
Например, при df = 8 критическое значение для p = 0,05 равно 2,306.
p-уровень
Главный показатель — p-значение (подробнее в статье «Что такое p-значение»):
- p < 0,05 — различия значимы;
- p > 0,05 — значимых различий нет.
Размер эффекта (d Коэна)
p-значение говорит, есть ли различие, но не насколько оно велико. Для этого считают размер эффекта d Коэна:
d = (M₁ − M₂) / s_p
Ориентир: 0,2 — малый эффект, 0,5 — средний, 0,8 и больше — большой.
Условия применения (допущения)
Чтобы результат был корректным, проверяют:
- Нормальность распределения — критерием Шапиро-Уилка (p > 0,05 — нормальное).
- Равенство дисперсий (для независимого) — тестом Левена; если не выполнено, применяют поправку Уэлча.
- Независимость наблюдений (для независимого варианта).
Если нормальность нарушена — переходите на ранговые критерии.
Разбор примера с расчётом
Сравним результаты двух групп по 5 человек.
- Группа 1: 5, 6, 7, 6, 5 → M₁ = 5,8; s₁² = 0,7
- Группа 2: 7, 8, 7, 9, 8 → M₂ = 7,8; s₂² = 0,7
Шаг 1. Объединённое отклонение:
s_p = √( (4·0,7 + 4·0,7) / 8 ) = √0,7 = 0,837
Шаг 2. Эмпирическое t:
t = (5,8 − 7,8) / (0,837 · √(1/5 + 1/5)) = −2 / 0,529 = −3,78
Шаг 3. Степени свободы: df = 5 + 5 − 2 = 8. Критическое t_крит(0,05; 8) = 2,306.
Шаг 4. Сравнение: |−3,78| = 3,78 > 2,306 → различие значимо, p < 0,05.
Шаг 5. Размер эффекта: d = −2 / 0,837 = −2,39 (большой эффект).
Вывод для диплома: «Различия между группами статистически значимы (t = −3,78; df = 8; p < 0,05), размер эффекта большой (d = 2,39)».
Критерий Стьюдента в Excel и онлайн
- В Excel есть функция
СТЬЮДЕНТ.ТЕСТ(илиT.TEST), которая сразу выдаёт p-значение. Но Excel не проверяет нормальность и равенство дисперсий — это надо делать отдельно. - Онлайн проще: калькулятор критерия Стьюдента сам проверяет условия, выбирает нужный вариант (классический или Уэлча), считает t, df, p, размер эффекта и пишет готовый вывод.
Частые ошибки
- Применять Стьюдента к балльным анкетам. Баллы — порядковая шкала, корректнее Манна-Уитни или Вилкоксон.
- Путать парный и независимый варианты. «До/после» у одних и тех же — это парный критерий, а не независимый.
- Не проверять нормальность перед расчётом.
- Сравнивать средние трёх и более групп попарно Стьюдентом — это накапливает ошибку; для 3+ групп нужен ANOVA или Краскел-Уоллис.
Частые вопросы
Чем отличается парный критерий от независимого?
Парный — для одних и тех же людей, измеренных дважды (до/после). Независимый — для двух разных групп.
Что делать, если данные ненормальные?
Использовать непараметрический аналог: Манна-Уитни (две группы) или Вилкоксон (до/после).
Сколько нужно данных?
Желательно хотя бы по 5–10 значений в группе, лучше больше — чем больше выборка, тем надёжнее вывод.
Что писать в дипломе кроме p?
Приводят t, степени свободы (df), p-уровень и размер эффекта (d Коэна), а также средние и стандартные отклонения групп.
Итог
Критерий Стьюдента сравнивает средние и подходит для нормальных количественных данных. Есть три его вида (одновыборочный, независимый, парный), у каждого своя формула и свои степени свободы. Результат оценивают по p-уровню (порог 0,05) и размеру эффекта.
Посчитать свои данные за пару минут можно в калькуляторе критерия Стьюдента — он сам проверит условия и оформит вывод. А если нужно сделать всю статистику под ключ — поможет консультация эксперта.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию