Критерий Стьюдента или Вилкоксона: что выбрать
Разбираем, когда для замеров «до/после» у одних и тех же людей брать парный критерий Стьюдента, а когда — критерий Вилкоксона. С примерами, формулировками для диплома и FAQ.
Вы измерили один и тот же показатель дважды — до и после тренинга, курса, занятий — и хотите доказать, что изменения не случайны. Здесь спорят два метода: парный критерий Стьюдента и критерий Вилкоксона.
Оба отвечают на один вопрос — «сдвиг есть или показалось?». Выбор между ними зависит от типа данных и их распределения. Разберём, как не ошибиться.
В двух словах
- Парный критерий Стьюдента сравнивает средние двух замеров у одних и тех же людей. Нужен для числовых данных, у которых разности распределены нормально.
- Критерий Вилкоксона (T-критерий) сравнивает замеры по рангам сдвигов. Подходит для баллов и оценок и не требует нормальности.
Вилкоксон — это непараметрический «аналог» парного Стьюдента для связанных выборок. О самой разнице параметрических и непараметрических методов — в статье «Параметрические и непараметрические критерии».
Когда брать парный Стьюдента
Все условия должны выполняться вместе:
- Данные — числовые измерения (вес, время реакции, давление, процент).
- Это одни и те же люди, измеренные дважды (до и после).
- Разности «после минус до» распределены близко к нормальному (проверьте Шапиро-Уилком: p > 0,05 — нормальное).
Пример. У 20 спортсменов замерили время бега на 100 м до и после месяца тренировок. Время — измерение, разности нормальны → парный Стьюдент.
Когда брать Вилкоксона
Берите его, если верно хотя бы одно:
- данные — баллы анкеты, оценки, ранги;
- разности ненормальны (выбросы, перекос);
- выборка маленькая (меньше ~30 человек), и нормальность не подтверждается.
Пример. У студентов замерили уровень тревожности (баллы по шкале Спилбергера) до и после психологического тренинга. Это баллы анкеты → Вилкоксон.
Сомневаетесь между методами для балльной анкеты? Берите Вилкоксона — он корректен и для нормальных данных тоже, а вот Стьюдент к баллам неприменим.
Чем отличаются по сути
- Стьюдент считает средний сдвиг и смотрит, далеко ли он от нуля относительно разброса разностей. Один выброс сильно искажает среднее — и результат может «поплыть».
- Вилкоксон ранжирует сдвиги по величине и смотрит, чего больше — улучшений или ухудшений и насколько они весомы. Выбросы почти не влияют, поэтому он устойчивее.
Простая логика: Стьюдент работает с самими числами, Вилкоксон — с порядком сдвигов.
Важное замечание: связанные или независимые выборки
И парный Стьюдент, и Вилкоксон — для связанных выборок, то есть когда измеряют одних и тех же людей дважды.
Если же вы сравниваете две разные группы (например, контрольную и экспериментальную из разных людей) — это другие методы:
- независимый критерий Стьюдента — для числовых нормальных данных;
- критерий Манна-Уитни — для баллов и ненормальных данных. Об этой паре — отдельная статья «Стьюдент или Манна-Уитни».
Перепутать связанные и независимые выборки — одна из самых частых ошибок в дипломе. Сначала ответьте себе: это одни и те же люди дважды или разные группы — и только потом выбирайте критерий.
Что писать в дипломе
После расчёта главный показатель — p-значение (подробнее в статье «Что такое p-значение»):
- p < 0,05 — сдвиг статистически значим;
- p > 0,05 — значимых изменений нет.
Примеры формулировок:
- «Сдвиг показателя после тренинга статистически значим (T = 18, p < 0,05)».
- «Статистически значимых изменений не выявлено (t = 1,3; p = 0,21)».
Для парного Стьюдента дополнительно приводят средние «до» и «после» и размер эффекта (d Коэна); для Вилкоксона — медианы «до» и «после».
В тексте обязательно указывайте сам критерий, его статистику (t или T), число наблюдений и p-значение — без этого вывод «стало лучше» не считается доказанным.
Как оформить таблицу и рисунок
На таблицу и рисунок в тексте ссылаются прямо: «Результаты сравнения представлены в таблице 1 и на рисунке 1». Подпись таблицы ставят сверху, подпись рисунка — снизу.
Таблица 1 — Динамика ситуативной тревожности до и после тренинга по критерию Вилкоксона (n = 24)
| Показатель | Me до | Me после | T эмп | T крит (p ≤ 0,05) | Вывод |
|---|---|---|---|---|---|
| Ситуативная тревожность | 48 | 39 | 42 | 81 | сдвиг значим (p < 0,05) |
После таблицы — короткий вывод словами: «Уровень ситуативной тревожности после тренинга значимо снизился (T = 42 < T₍₀,₀₅₎ = 81; p < 0,05)». Для Вилкоксона помните: значимость есть, когда T эмп меньше или равно T крит (в отличие от Стьюдента, где сравнивают наоборот).
Частые ошибки
- Применять Стьюдента к балльным анкетам. Баллы — порядковая шкала, корректнее Вилкоксон.
- Проверять нормальность не у разностей, а у самих значений. Для парного Стьюдента важна нормальность именно разностей «после − до».
- Брать Вилкоксона для двух разных групп. Для независимых выборок нужен Манна-Уитни.
- Делать вывод только по среднему «стало лучше». Без критерия и p-значения это не доказательство.
Частые вопросы
Что мощнее — Стьюдент или Вилкоксон?
При нормальных разностях парный Стьюдент чуть мощнее (легче находит реальный сдвиг). При ненормальных данных мощнее и корректнее Вилкоксон.
Можно ли применить Вилкоксона к нормальным числовым данным?
Да, он останется корректным. А вот применять Стьюдента к балльным или ненормальным данным некорректно — поэтому при сомнениях безопаснее Вилкоксон.
Сколько человек нужно для Вилкоксона?
Формально работает от ~6 пар наблюдений, но чем больше, тем надёжнее вывод. Пары, где «до» и «после» совпали (нулевой сдвиг), из расчёта обычно исключаются.
А если измерений три и больше (до, в середине, после)?
Для трёх и более связанных замеров берут критерий Фридмана, а не Вилкоксона.
Короткий алгоритм
- Одни и те же люди, измеренные дважды? Если нет — вам нужны Стьюдент для независимых или Манна-Уитни.
- Данные числовые, а разности нормальны (проверка Шапиро-Уилком)? → парный Стьюдент.
- Данные — баллы/оценки, разности ненормальны или выборка маленькая? → Вилкоксон.
Короче: числа + нормальные разности → парный Стьюдент; баллы или ненормальные разности → Вилкоксон. Для двух разных групп — Стьюдент для независимых или Манна-Уитни.
Что ещё почитать
- Как выбрать статистический критерий для диплома — общая схема выбора.
- Параметрические и непараметрические критерии — в чём принципиальная разница.
- Что такое p-значение простыми словами — как читать результат.
- Калькулятор критерия Вилкоксона и калькулятор критерия Стьюдента — посчитать онлайн.
Не уверены в выборе — посмотрите базу методов или закажите консультацию: эксперт подберёт критерий и посчитает за вас.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию