Степени свободы (df) в статистике простыми словами
Что такое степени свободы в статистике на бытовой аналогии: зачем нужны, как считать df для критерия Стьюдента, хи-квадрат и ANOVA. С примерами и FAQ.
При расчёте почти любого критерия рядом со статистикой всплывает загадочная буква df (или «число степеней свободы»). В таблицах диплома вы видите её как t(28) = 2,4 или χ²(3) = 8,1, а программа просит её, чтобы найти критическое значение.
Звучит страшно, а на деле это просто счётчик: сколько чисел в ваших данных могли «свободно» меняться. Разберёмся без формул и с примерами.
В двух словах
- Степени свободы (df, degrees of freedom) — это число значений, которые в расчёте могут варьироваться свободно, прежде чем остальные станут предопределёнными.
- df нужны, чтобы выбрать правильную строку в таблице критических значений — без них вы не поймёте, значим результат или нет (см. «Как читать таблицу критических значений»).
- Для большинства студенческих расчётов df считаются по простым формулам: чаще всего df = n − 1.
Хорошая новость: онлайн-калькуляторы — например, критерия Стьюдента — считают df и сразу выдают вывод сами. Но понимать, откуда берётся это число, всё равно полезно: на защите про df спрашивают часто.
Бытовая аналогия: пицца на компанию
Представьте, что вы заказали пиццу на 5 кусков и сели её делить вчетвером с друзьями — всего вас пятеро.
Первые четыре человека берут любой кусок — выбор свободный. А вот пятому выбирать не из чего: ему достаётся последний оставшийся кусок. Его «решение» предопределено выбором остальных.
Пример. Пять кусков, пять человек: свободно выбирают только 4. Пятый кусок «несвободен». Степеней свободы здесь — 4, то есть n − 1.
Та же логика в статистике. Если вы знаете среднее пяти чисел, то четыре из них могут быть любыми, а пятое уже жёстко определено — оно достраивает их до нужного среднего.
Главная идея: каждое условие, которое вы «навязываете» данным (например, фиксируете среднее), забирает одну степень свободы. Поэтому из общего числа наблюдений мы вычитаем количество таких ограничений.
Откуда берётся «минус один»
Давайте на конкретных числах. Возьмём четыре оценки: 4, 5, 3 и ?. Допустим, мы знаем, что их среднее равно 4 (значит, сумма должна быть 16).
Тогда последнее число уже не свободно: 4 + 5 + 3 = 12, и чтобы сумма стала 16, четвёртое число обязано быть 4. Выбора нет.
Получается, при четырёх числах и одном ограничении (фиксированное среднее) свободно меняются только три. Отсюда и формула df = n − 1: одно ограничение — минус одна степень свободы.
Чем больше параметров вы оцениваете по самой выборке (среднее, ещё одно среднее, линию регрессии), тем больше ограничений — и тем меньше остаётся степеней свободы.
Зачем степени свободы нужны на практике
Степени свободы — это не украшение отчёта, а ключ к таблице. Вот зачем они:
- Выбрать строку в таблице критических значений. У распределений t и χ² форма зависит от df. Для df = 5 и df = 50 «порог значимости» разный, поэтому критическое значение ищут именно по строке с вашим df. Подробно — в статье «Как читать таблицу критических значений».
- Сделать поправку на размер выборки. Маленькая выборка «капризнее»: на ней легче случайно получить большое различие. Чем меньше df, тем строже критический порог — это защита от ложных выводов.
- Правильно оформить результат. В тексте диплома df пишут прямо в скобках у статистики:
t(28) = 2,40; p < 0,05. Это сразу показывает, на какой выборке получен результат.
Почему это важно. Если вы считаете критерий по таблице вручную, без верного df вы возьмёте не ту строку — и можете объявить значимым результат, которого на самом деле нет (или наоборот). df напрямую влияет на главный вывод работы.
Как считать df для разных критериев
Формула зависит от критерия, но почти все они короткие. Ниже — самые частые случаи в студенческих работах (в таблице 1).
Таблица 1 — Как считаются степени свободы для основных критериев
| Критерий | Что сравниваем | Формула df | Пример |
|---|---|---|---|
| Стьюдент, одна выборка | среднее с эталоном | n − 1 | n = 30 → df = 29 |
| Стьюдент, парный (до/после) | два замера у одних людей | n − 1 (по парам) | 25 пар → df = 24 |
| Стьюдент, независимый | две разные группы | n₁ + n₂ − 2 | 15 и 18 → df = 31 |
| Хи-квадрат (таблица r×c) | связь признаков | (r − 1)·(c − 1) | таблица 2×3 → df = 2 |
| ANOVA, между группами | k групп | k − 1 | 4 группы → df = 3 |
| ANOVA, внутри групп | разброс внутри | N − k | N = 40, k = 4 → df = 36 |
Разберём ключевые строки чуть подробнее, чтобы было понятно, откуда берутся цифры.
Критерий Стьюдента
Одна и парная выборки — это df = n − 1. Логика та же, что с пиццей: одно фиксированное среднее забирает одну степень свободы. Для парного критерия n — это число пар (людей, измеренных дважды), а не число всех замеров.
Независимые группы — это df = n₁ + n₂ − 2. Здесь два средних (своё на каждую группу), значит, два ограничения — отсюда «минус два». Все формулы и примеры собраны в руководстве по критерию Стьюдента.
Пример. Сравниваете контрольную (15 человек) и экспериментальную (18 человек) группы. df = 15 + 18 − 2 = 31. По этому df и ищете критическое t в таблице.
Хи-квадрат
Для критерия хи-квадрат данные лежат в таблице сопряжённости: строки (r) — один признак, столбцы (c) — другой. Степени свободы тут — (r − 1)·(c − 1).
Почему так? Если известны итоги по строкам и столбцам, то заполнить свободно можно не всю таблицу: последние ячейки в каждой строке и столбце достраиваются автоматически (как пятый кусок пиццы).
Пример. Таблица «пол × три уровня мотивации» — это 2 строки и 3 столбца. df = (2 − 1)·(3 − 1) = 1·2 = 2.
Дисперсионный анализ (ANOVA)
У ANOVA степеней свободы две, и обе нужны, чтобы найти критическое F:
- между группами: df₁ = k − 1, где k — число групп;
- внутри групп: df₂ = N − k, где N — общее число людей.
Результат записывают с обоими числами: F(3; 36) = 4,1. Подробный разбор — в руководстве по дисперсионному анализу.
Не помните формулу для своего критерия? Не считайте df вручную: вбейте данные в нужный онлайн-калькулятор — он посчитает и степени свободы, и статистику, и p-значение, и сразу даст готовую формулировку.
Как df влияет на критический порог
Чем меньше степеней свободы, тем «выше планка»: на маленькой выборке нужно более сильное различие, чтобы признать его значимым. С ростом df порог снижается и стабилизируется.
Это видно на рисунке 1: для критерия Стьюдента критическое значение при малом df заметно больше, а после нескольких десятков наблюдений почти не меняется.
Вывод словами: на крошечной выборке df мало, и доказать различие труднее. Поэтому достаточный объём выборки — это не каприз научрука, а способ получить больше степеней свободы и более надёжный вывод.
Что писать в дипломе
Степени свободы почти никогда не описывают отдельным предложением — их указывают в скобках прямо у статистики критерия. Готовые шаблоны:
- «Различия между группами статистически значимы (t(31) = 2,40; p < 0,05)».
- «Связь признаков значима (χ²(2) = 8,15; p < 0,05)».
- «Влияние фактора подтверждено (F(3; 36) = 4,12; p < 0,05)».
Если оформляете методику расчёта, можно добавить фразу: «Число степеней свободы определено как df = n − 1 = 29». Этого достаточно — расписывать вывод формулы в дипломе не нужно.
Не путайте степени свободы и объём выборки: это разные числа. У парного критерия Стьюдента при 25 испытуемых n = 25, но df = 24. В скобках у статистики пишут именно df, а не n.
Частые ошибки
- Брать n вместо df. Самая частая ошибка при ручном расчёте по таблице: вы ищете строку по числу людей, а нужно по df = n − 1 (или другой формуле).
- Путать df для парных и независимых выборок. Для пар — это n − 1, для двух групп — n₁ + n₂ − 2. Это разные формулы и разные строки в таблице.
- Считать n всех замеров в парном критерии. 30 замеров «до» + 30 «после» — это 30 пар, значит df = 29, а не 59.
- Указывать у ANOVA только одну df. У дисперсионного анализа их две (между и внутри групп) — нужны обе:
F(df₁; df₂). - Считать df на калькуляторе и всё равно ошибаться в тексте. Перепишите число из калькулятора аккуратно — именно его и ставьте в скобки.
Частые вопросы
Что вообще означает буква df в результате?
df — это сокращение от degrees of freedom, «степени свободы». Это число показывает, сколько значений в расчёте могли меняться свободно, и по нему выбирают критическое значение в таблице.
Могут ли степени свободы быть дробными?
В простых студенческих критериях — нет, df всегда целое. Дробные df появляются в продвинутых поправках (например, в варианте критерия Стьюдента для групп с разным разбросом), но их считает программа, а не вы вручную.
Почему именно «минус один», а не минус два или три?
Сколько ограничений вы накладываете на данные — столько и вычитаете. Одно фиксированное среднее — минус один. Два средних (две группы) — минус два. У хи-квадрат и регрессии своя логика, но принцип тот же: каждый оценённый параметр стоит одной степени свободы.
Нужно ли вообще считать df вручную?
Нет, если пользуетесь онлайн-калькуляторами или SPSS — они выводят df сами. Понимать формулу полезно для защиты и чтобы перепроверить программу, но руками считать необязательно.
Где взять критическое значение по моему df?
В таблице критических значений для нужного критерия: находите строку с вашим df и столбец с уровнем значимости (обычно 0,05). Как это сделать пошагово — в статье «Как читать таблицу критических значений».
Короткий алгоритм
- Определите свой критерий и дизайн (одна выборка, пары, две группы, таблица, несколько групп).
- Посчитайте df по формуле: чаще всего n − 1; для двух групп — n₁ + n₂ − 2; для хи-квадрат — (r − 1)·(c − 1); для ANOVA — k − 1 и N − k.
- По этому df найдите критическое значение в таблице (или доверьтесь калькулятору).
- В тексте укажите df в скобках у статистики:
t(28) = 2,4; p < 0,05.
Короче: степени свободы — это «сколько чисел свободны». Обычно df = n − 1, для двух групп — n₁ + n₂ − 2. Они нужны, чтобы выбрать верную строку в таблице и правильно оформить результат.
Что ещё почитать
- Как читать таблицу критических значений — куда именно подставлять df.
- Руководство по критерию Стьюдента — все формулы df для t на примерах.
- Что такое p-значение простыми словами — как читать итог расчёта.
- Сколько респондентов нужно для диплома — почему объём выборки = степени свободы.
- Калькулятор критерия Стьюдента — посчитает df, статистику и вывод онлайн.
Не уверены, как посчитать df для своего метода — загляните в базу методов или закажите консультацию: эксперт подберёт критерий и посчитает всё за вас.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию