Как выбрать статистический критерий для диплома
Пошаговая инструкция: как по типу данных и дизайну исследования выбрать правильный статистический критерий — Стьюдента, Манна-Уитни, Вилкоксона и другие. С примерами и FAQ.
Самый частый вопрос студента: «Каким критерием обрабатывать мои данные?» Хорошая новость — выбор почти всегда сводится к двум простым вопросам: какой у вас тип данных и что вы сравниваете. Разберём по шагам, с примерами.
Шаг 1. Какой у вас тип данных?
От этого зависит, можно ли применять параметрические методы или нужны ранговые.
- Количественные измерения — рост, время, баллы теста 0–100, количество, скорость. Здесь возможны параметрические методы (если данные нормальны).
- Оценки, баллы анкеты, ранги — баллы 1–5, «низкий/средний/высокий», шкалы опросников (САН, Спилбергер и т. п.). Это порядковая шкала → нужны ранговые (непараметрические) методы.
- Категории — пол, «да/нет», тип, выбор A/B/C. Здесь сравнивают не средние, а доли.
Если у вас баллы анкеты или оценки — почти всегда корректны именно ранговые критерии. Этого часто требуют и научные руководители. Подробнее — в статье «Параметрические и непараметрические критерии».
Шаг 2. Что вы сравниваете?
Теперь определите дизайн исследования и найдите свой случай в таблице:
| Что сравниваете | Количественные (норм.) | Оценки / баллы (ранговые) |
|---|---|---|
| Две группы «до/после» (одни и те же) | Стьюдент парный | Вилкоксон |
| Две разные группы | Стьюдент | Манна-Уитни |
| Три и более замера (одни и те же) | повторный ANOVA | Фридман |
| Три и более групп | ANOVA | Краскел-Уоллис |
| Связь двух признаков | Корреляция Пирсона | Корреляция Спирмена |
| Сравнение долей / категорий | — | Критерий χ² или φ* Фишера |
«Одни и те же» (связанные, парные) — это когда вы измеряете одних и тех же людей дважды. «Разные группы» (независимые) — когда сравниваете разных людей.
Шаг 3. Проверьте нормальность (для количественных)
Если данные количественные и вы хотите параметрический критерий (Стьюдента, ANOVA), сначала проверьте, нормально ли распределены данные — критерием Шапиро-Уилка (для небольших выборок) или Колмогорова-Смирнова (для больших):
- p > 0,05 — распределение можно считать нормальным → параметрический критерий допустим;
- p < 0,05 — распределение ненормальное → берите ранговый аналог.
Для оценок и баллов нормальность не проверяют — там сразу ранговые методы.
Разбор примеров
Пример 1. Вы измерили тревожность по балльной анкете до и после тренинга у одних и тех же студентов.
- Тип данных — баллы (порядковая шкала) → ранговые методы.
- Дизайн — «до/после» у одних и тех же → критерий Вилкоксона.
Пример 2. Вы сравниваете средний рост у спортсменов и не спортсменов (две разные группы).
- Тип данных — измерение, распределено нормально → параметрические методы.
- Дизайн — две независимые группы → критерий Стьюдента.
Пример 3. Вы сравниваете успеваемость (баллы) в трёх группах.
- Тип данных — баллы → ранговые методы.
- Дизайн — три независимые группы → критерий Краскела-Уоллиса.
Пример 4. Вы проверяете, связан ли уровень мотивации с успеваемостью.
- Это поиск связи двух признаков (оценки) → корреляция Спирмена.
Частые ошибки
- Применять Стьюдента к балльным шкалам. Баллы анкет — порядковая шкала, корректнее ранговые критерии.
- Путать связанные и независимые выборки. «До/после» у одних и тех же — это Вилкоксон/парный Стьюдент, а не Манна-Уитни.
- Сравнивать средние там, где нужны доли. Если данные — категории (да/нет), нужен χ², а не Стьюдент.
- Не проверять нормальность перед параметрическим критерием.
Частые вопросы
А если у меня и числа, и баллы вперемешку?
Ориентируйтесь на тот показатель, который анализируете. Если основной результат — это баллы анкеты, выбирайте ранговый критерий.
Что выбрать, если сомневаюсь между параметрическим и ранговым?
Ранговый — безопаснее. Он работает почти всегда и не требует нормальности. Параметрический даёт чуть больше «мощности», но только при выполненных условиях.
Нужно ли считать описательную статистику до критерия?
Да, обычно сначала приводят описательную статистику (медианы/квартили или средние), а затем — критерий. Подробнее в статье «Как описать выборку в дипломе».
Коротко
- Определите тип данных (числа / баллы / категории).
- Определите дизайн (две группы, 3+, до/после, связь).
- Для количественных — проверьте нормальность.
- Найдите критерий по таблице выше.
Не уверены — посмотрите базу методов, где все критерии в одной таблице с подсказками, или закажите консультацию эксперта: подберём метод и посчитаем за вас.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию