StatBlank
Основы10 июня 2026·9 мин чтения

Нормальное распределение простыми словами

Что такое нормальное распределение (закон Гаусса): кривая-колокол, параметры μ и σ, правило трёх сигм, z-оценки и проверка нормальности — с примером, таблицей и FAQ.

Почти в любой студенческой работе по статистике рано или поздно всплывает фраза «данные распределены нормально». За ней стоит нормальное распределение — та самая симметричная «кривая-колокол», которую вы наверняка видели в учебниках. От неё зависит, какой критерий можно применять и как трактовать результаты.

Разберём без формул: что это за кривая, что задают её параметры μ и σ, как работает правило трёх сигм и почему нормальность так важна для выбора метода.

В двух словах

  • Нормальное распределение (оно же распределение, или закон, Гаусса) — симметричная колоколообразная кривая плотности. Большинство значений толпятся в центре, редкие — по краям.
  • Кривая полностью задаётся двумя числами: средним μ (где центр) и стандартным отклонением σ (насколько кривая широкая).
  • Действует правило трёх сигм: в μ ± 1σ попадает ≈ 68% значений, в μ ± 2σ ≈ 95%, в μ ± 3σ ≈ 99,7%.
  • Многие параметрические методы (Стьюдент, ANOVA, корреляция Пирсона) предполагают, что данные нормальны. Проверяют это критерием Шапиро-Уилка.

Что это и как выглядит

Представьте, что вы измерили рост у тысячи студентов. Очень низких и очень высоких людей мало, а большинство — где-то в середине, около среднего. Если нарисовать, сколько человек приходится на каждое значение роста, получится симметричный горб: высокий в центре и плавно спадающий к краям. Это и есть нормальное распределение.

Ключевые свойства кривой:

  • Симметрична относительно центра. Левая и правая половины — зеркальные.
  • Среднее = медиана = мода. Все три «центральные» меры совпадают и лежат на вершине горба.
  • Хвосты бесконечны. Кривая никогда не касается оси: теоретически возможны и очень редкие крайние значения, просто их вероятность ничтожна.
  • Один пик. Горб ровно один — если их два, распределение уже не нормальное.
μ −1σ +1σ −2σ +2σ 68% 95% 99,7% ±1σ ≈ 68% · ±2σ ≈ 95% · ±3σ ≈ 99,7%
Рисунок 1 — Кривая нормального распределения и правило трёх сигм

Параметры: μ (среднее) и σ (стандартное отклонение)

Главная красота нормального распределения в том, что вся кривая описывается всего двумя параметрами. Знаете их — знаете распределение целиком.

  • μ (мю) — среднее. Задаёт, где находится центр кривой на оси. Сдвигаете μ — горб целиком едет влево или вправо, форма не меняется.
  • σ (сигма) — стандартное отклонение. Задаёт, насколько широка кривая. Маленькая σ — узкий острый пик (значения плотно сгруппированы у среднего); большая σ — низкий растянутый колокол (значения разбросаны).
Заметка

μ отвечает за положение, σ — за разброс. Подробнее о том, как считается и что означает разброс, — в статье «Стандартное отклонение и дисперсия», а о том, почему в нормальном распределении среднее = медиана = мода, — в «Среднее, медиана, мода».

Правило трёх сигм

Самое полезное на практике свойство нормального распределения — правило трёх сигм (правило 68–95–99,7). Оно говорит, какая доля значений попадает в интервал вокруг среднего шириной в одну, две и три сигмы.

Таблица 1 — Правило трёх сигм: какая доля значений попадает в интервал

Интервал вокруг среднего Доля значений внутри За пределами (хвосты)
μ ± 1σ ≈ 68% ≈ 32%
μ ± 2σ ≈ 95% ≈ 5%
μ ± 3σ ≈ 99,7% ≈ 0,3%

Иначе говоря, при нормальном распределении почти все значения (99,7%) укладываются в коридор ±3σ от среднего. Выйти за него — большая редкость, поэтому выходящие за ±3σ точки часто считают выбросами.

Пример. Допустим, IQ в популяции распределён нормально со средним μ = 100 и стандартным отклонением σ = 15. Тогда: примерно 68% людей имеют IQ от 85 до 115 (100 ± 15), около 95% — от 70 до 130 (100 ± 30), и 99,7% — от 55 до 145 (100 ± 45). Человек с IQ 145 — один из примерно тысячи.

Стандартное нормальное распределение и z-оценки

Чтобы не пересчитывать всё заново для каждой пары μ и σ, придумали стандартное нормальное распределение — это нормальное распределение с μ = 0 и σ = 1.

Любое значение можно перевести «в стандартные единицы» с помощью z-оценки:

z = (x − μ) / σ

z показывает, на сколько стандартных отклонений значение x отстоит от среднего. z = 0 — это ровно среднее; z = +2 — на две сигмы выше среднего; z = −1 — на одну сигму ниже.

Пример. Студент набрал на тесте 130 баллов при μ = 100 и σ = 15. Его z = (130 − 100) / 15 = 2. Значит, результат лежит на 2σ выше среднего — по правилу трёх сигм выше примерно 97,5% остальных.

Совет

z-оценки удобны для сравнения «разнокалиберных» показателей: рост в сантиметрах и вес в килограммах напрямую не сравнить, а их z-оценки — можно, ведь обе измеряются в одних и тех же «сигмах».

Зачем это в статистике и как проверяют нормальность

Нормальное распределение — не абстракция из учебника, а рабочая развилка при выборе метода. Многие классические критерии построены в предположении, что данные нормальны.

  • Параметрические методыt-критерий Стьюдента, дисперсионный анализ (ANOVA), корреляция Пирсона — работают со средними и предполагают нормальность. Без неё их выводы могут быть некорректны.
  • Если нормальности нет — переходят на непараметрические (ранговые) методы: Манна-Уитни, Вилкоксон, Спирмен. Подробнее об этом выборе — в статье «Параметрические и непараметрические критерии».

Как проверяют нормальность на практике:

  • Критерий Шапиро-Уилка (калькулятор) — основной тест для малых и средних выборок. Правило чтения: p > 0,05 → распределение нормальное.
  • Критерий Колмогорова-Смирнова (калькулятор) — для больших выборок.
  • Визуально — гистограмма (похожа ли на колокол?) и график квантиль-квантиль (Q-Q plot, ложатся ли точки вдоль прямой?).
Важно

У критериев нормальности логика обратная: большое p (> 0,05) — это хорошо, оно говорит, что распределение можно считать нормальным. Маленькое p — наоборот, признак отклонения. Подробнее — в статьях «Что такое p-значение» и «Как проверить нормальность распределения».

Многие природные и психологические показатели близки к нормальному распределению — рост, вес, IQ, время реакции. Поэтому оно так часто и встречается в дипломных исследованиях.

Частые ошибки

  • Считать, что все данные обязаны быть нормальными. Это не так: доходы, время ожидания, число событий часто распределены асимметрично. Нормальность нужно проверять, а не предполагать.
  • Путать направление вывода теста. Для нормальности нужно p > 0,05, а не p < 0,05. Маленькое p говорит об отклонении от нормы.
  • Забывать, что σ задаёт ширину. Две кривые с одинаковым средним, но разной σ — это разные распределения: одно узкое, другое размазанное.
  • Принимать любой «горб» за нормальное распределение. Симметричный пик — необходимое, но не достаточное условие. Два горба или сильный перекос — уже не норма.
  • Применять параметрический критерий без проверки. Сначала нормальность, потом выбор метода, а не наоборот.

Частые вопросы

Чем отличается нормальное распределение от гауссова?

Ничем — это два названия одного и того же. «Распределение Гаусса» и «нормальный закон распределения» — синонимы нормального распределения.

Что означают параметры μ и σ простыми словами?

μ (среднее) — где находится центр колокола. σ (стандартное отклонение) — насколько кривая широкая: маленькая σ даёт узкий острый пик, большая — низкий растянутый. Этих двух чисел достаточно, чтобы задать всю кривую.

Что такое правило трёх сигм?

Это свойство нормального распределения: в интервал μ ± 1σ попадает ≈ 68% значений, в μ ± 2σ ≈ 95%, в μ ± 3σ ≈ 99,7%. Значения за пределами ±3σ — большая редкость и часто считаются выбросами.

Зачем нужны z-оценки?

z-оценка z = (x − μ) / σ показывает, на сколько стандартных отклонений значение отстоит от среднего. Она переводит любое нормальное распределение к стандартному (μ = 0, σ = 1) и позволяет сравнивать показатели в разных единицах измерения.

Как понять, нормальны ли мои данные?

Прогоните критерий Шапиро-Уилка (для малых/средних выборок) или Колмогорова-Смирнова (для больших) и посмотрите p: если p > 0,05 — распределение можно считать нормальным. Подкрепите гистограммой и Q-Q plot. Пошагово — в статье «Как проверить нормальность распределения».

Что делать, если распределение не нормальное?

Использовать непараметрические (ранговые) методы — Манна-Уитни, Вилкоксон, Спирмен. Они не требуют нормальности. Иногда данные «выправляют» преобразованием (например, логарифмированием), но для студенческих работ проще перейти на непараметрику.

Короткий алгоритм

  1. Запомните форму. Нормальное распределение — симметричный колокол с одним пиком; среднее = медиана = мода.
  2. Держите в голове два параметра. μ — центр, σ — ширина. Их достаточно, чтобы описать кривую.
  3. Применяйте правило трёх сигм. ±1σ ≈ 68%, ±2σ ≈ 95%, ±3σ ≈ 99,7%.
  4. Проверяйте, а не предполагайте. Шапиро-Уилка для малых выборок, Колмогорова-Смирнова — для больших; p > 0,05 → нормально.
  5. Выбирайте метод по итогу. Нормально → параметрические критерии; ненормально → непараметрические.
Вывод

Нормальное распределение — это колокол, заданный средним μ (центр) и стандартным отклонением σ (ширина). Правило трёх сигм: 68% значений в ±1σ, 95% в ±2σ, 99,7% в ±3σ. Прежде чем брать параметрический критерий, проверьте нормальность критерием Шапиро-Уилка.

Что ещё почитать

Не уверены, нормальны ли ваши данные и какой критерий брать, — загляните в базу методов или закажите консультацию: эксперт проверит распределение и подберёт корректный метод.

Не хотите разбираться со статистикой сами?

Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.

Заказать консультацию