Асимметрия и эксцесс: что говорят о форме распределения
Скошенность и островершинность распределения простыми словами: как читать асимметрию и эксцесс, нормы ±1 и ±2 и что делать при перекосе. С примерами и FAQ.
Вы посчитали среднее и стандартное отклонение, а научный руководитель спрашивает: «А распределение-то нормальное? Какая асимметрия, какой эксцесс?» И тут многие зависают.
На самом деле это два простых числа, которые описывают форму вашего распределения: насколько оно перекошено в сторону и насколько вытянуто вверх. Разберём, что они значат и как их использовать.
В двух словах
- Асимметрия (skewness) показывает скошенность: перекошено ли распределение влево или вправо. Ноль — идеально симметрично, как нормальное.
- Эксцесс (kurtosis) показывает островершинность: насколько распределение «остроконечное» или, наоборот, плоское по сравнению с нормальным.
Оба коэффициента считаются автоматически в калькуляторе описательной статистики. Если оба близки к нулю (в пределах ±1) — форма похожа на нормальную. Это первый, быстрый признак нормальности; строгую проверку даёт критерий Шапиро-Уилка.
Что такое асимметрия простыми словами
Представьте гистограмму — столбики, показывающие, сколько у вас человек с каждым значением. Если её можно сложить пополам, как бабочку, и половинки совпадут — распределение симметрично, асимметрия равна нулю.
Если же у распределения есть длинный «хвост» в одну сторону — оно скошено.
- Правосторонняя асимметрия (положительная, > 0). Хвост тянется вправо, к большим значениям. Основная масса данных слева. Так выглядят, например, зарплаты: большинство получает немного, и редкие очень высокие доходы растягивают хвост вправо.
- Левосторонняя асимметрия (отрицательная, < 0). Хвост тянется влево, к маленьким значениям. Так выглядят оценки на лёгком экзамене: почти все сдали на хорошо и отлично, а редкие двойки уводят хвост влево.
Пример. Вы замерили время реакции у 40 человек. Большинство уложилось в 200–300 мс, но несколько замешкавшихся дали 600–800 мс. Хвост уехал вправо → асимметрия положительная, около +1,2.
Простой ориентир: асимметрия показывает, в какую сторону «свисает» хвост. Знак коэффициента совпадает с направлением хвоста.
Что такое эксцесс простыми словами
Эксцесс отвечает на другой вопрос: насколько данные сгрудились у среднего и какие у них хвосты.
- Положительный эксцесс (> 0) — распределение островершинное: пик выше, чем у нормального, значения тесно сжаты вокруг среднего, но при этом «тяжёлые» хвосты (редкие, но сильные выбросы).
- Отрицательный эксцесс (< 0) — распределение плосковершинное: пологое, размазанное, без выраженного пика. Значения распределены более-менее равномерно.
- Эксцесс около нуля — вершина как у нормального колокола.
Пример. Двум группам дали тест. В первой почти все набрали около среднего балла — узкий острый пик, эксцесс положительный. Во второй баллы размазаны от низких до высоких почти поровну — плоская «спина», эксцесс отрицательный.
Будьте внимательны: в одних программах эксцесс считают так, что у нормального распределения он равен 0 (это избыточный эксцесс, его и используют чаще всего), а в других — 3. Наш калькулятор и большинство учебников дают избыточный эксцесс, где эталон — ноль. Если у вас вдруг «3» при нормальных данных — программа просто не вычла тройку.
Как это выглядит на рисунке
Три формы удобно держать в голове как картинку: симметричный колокол, перекос вправо и перекос влево.
У симметричного распределения среднее, медиана и мода совпадают. При правосторонней асимметрии среднее уезжает вправо вслед за хвостом и становится больше медианы. Подробнее об этой троице — в статье «Среднее, медиана и мода».
Какие нормы считаются допустимыми
Сами по себе цифры асимметрии и эксцесса ничего не «нарушают» — вопрос в том, можно ли при них считать распределение приближённо нормальным. Здесь работают два распространённых порога.
- Строгий порог ±1. Если и асимметрия, и эксцесс по модулю меньше 1, форму уверенно считают близкой к нормальной. Это самый частый ориентир в студенческих работах.
- Мягкий порог ±2. Многие источники допускают значения в пределах ±2 — особенно при небольших выборках, где коэффициенты «прыгают» от случайности. За пределами ±2 отклонение от нормальности уже серьёзное.
Таблица 1 — Как читать асимметрию и эксцесс
| Значение | Асимметрия | Эксцесс |
|---|---|---|
| ≈ 0 (в пределах ±1) | симметрично, близко к норме | вершина как у нормального |
| больше 0 | хвост справа, перекос к малым значениям | острый пик, тяжёлые хвосты |
| меньше 0 | хвост слева, перекос к большим значениям | плоская, размазанная форма |
| по модулю > 2 | сильная асимметрия, нормальность под вопросом | сильное отклонение формы |
Как видно из таблицы, знак отвечает за направление, а величина — за силу отклонения. Но запомните главное: эти пороги — лишь ориентир «на глаз».
Асимметрия и эксцесс в пределах ±1 — это подсказка, а не доказательство нормальности. Это лишь два числа из многих. Окончательный вывод делают по специальному критерию: Шапиро-Уилка (до ~50 человек) или Колмогорова-Смирнова (для больших выборок). Как их применять — в статье «Как проверить нормальность распределения».
Что делать при сильной асимметрии
Допустим, проверка показала перекос: асимметрия +1,8, эксцесс далеко за единицу, Шапиро-Уилк дал p < 0,05. Распределение не нормальное. Что дальше?
Не паникуйте — это не ошибка и не повод переделывать сбор данных. Просто меняется набор инструментов.
- Описывайте данные медианой, а не средним. При перекосе среднее «уезжает» за хвостом и перестаёт отражать типичного респондента. Медиана и квартили устойчивее — о них есть отдельная статья «Медиана и квартили».
- Берите непараметрические критерии. Они не требуют нормальности: Манна-Уитни вместо независимого Стьюдента, Вилкоксона вместо парного, Краскела-Уоллиса вместо ANOVA. В чём разница — в статье «Параметрические и непараметрические критерии».
- Для связей — корреляция Спирмена. Вместо Пирсона при ненормальных данных берут ранговую корреляцию Спирмена.
Не нужно «исправлять» данные ради красивых цифр. Сильная асимметрия — это нормальное свойство многих психологических и физиологических показателей. Честно напишите, что распределение отличается от нормального, и используйте непараметрику. Это не слабость работы, а грамотный выбор метода.
Пример. В дипломе по психологии измеряли уровень агрессии по опроснику Басса-Дарки. Асимметрия вышла +1,5: большинство с умеренными баллами, немного «пиковых». Вывод: данные ненормальны, для сравнения групп берём Манна-Уитни, описываем медианой.
Что писать в дипломе
Асимметрию и эксцесс приводят в разделе описательной статистики — обычно в общей таблице вместе со средним, стандартным отклонением и медианой. Как её собрать — в статье «Описательная статистика в дипломе».
Готовые формулировки:
- «Коэффициент асимметрии (As = 0,42) и эксцесса (Ex = −0,31) не превышают по модулю единицы, что свидетельствует о приближении распределения к нормальному».
- «Положительная асимметрия (As = 1,76) указывает на смещение распределения в область малых значений; нормальность не подтверждается, поэтому применялись непараметрические критерии».
- «Распределение показателя характеризуется выраженной островершинностью (Ex = 2,1), что отражает концентрацию значений вблизи среднего».
Самая сильная формулировка связывает коэффициенты с критерием: «асимметрия и эксцесс в пределах ±1, что согласуется с результатом критерия Шапиро-Уилка (p = 0,28); распределение можно считать нормальным». Связка двух аргументов убедительнее одного.
Частые ошибки
- Считать нормальность доказанной по двум числам. Асимметрия и эксцесс — только намёк на форму, а не критерий. Всегда подкрепляйте их Шапиро-Уилком.
- Путать направление перекоса. Положительная асимметрия — хвост вправо, а основная масса данных слева. Многие интуитивно понимают наоборот.
- Описывать перекошенные данные средним. При сильной асимметрии типичное значение лучше передаёт медиана.
- Сравнивать с эталоном 3 вместо 0. Если ваша программа даёт эксцесс «около 3» для нормальных данных — это неизбыточный эксцесс, вычтите тройку для сравнения с порогом ±1.
- Игнорировать размер выборки. На маленькой выборке (меньше ~30) коэффициенты неустойчивы, и большие значения могут быть просто случайностью.
Частые вопросы
Какая асимметрия считается нормальной для диплома?
По модулю меньше 1 — уверенно близко к норме, меньше 2 — обычно ещё допустимо. Но финальный вывод о нормальности всё равно делают по критерию Шапиро-Уилка, а не по одной асимметрии.
Чем отличается асимметрия от эксцесса?
Асимметрия — про сторону: куда скошено распределение, влево или вправо. Эксцесс — про высоту: насколько острый или плоский у него пик. Это два независимых свойства формы.
Что важнее проверять — асимметрию или эксцесс?
Обычно смотрят оба, но к нарушению нормальности чаще приводит сильная асимметрия. Если она велика, на эксцесс уже можно особо не смотреть — вы всё равно уйдёте в непараметрику.
Где взять асимметрию и эксцесс?
Их автоматически считает калькулятор описательной статистики: вставляете данные — получаете асимметрию, эксцесс, среднее, медиану и стандартное отклонение в одной таблице.
Можно ли «исправить» сильную асимметрию?
Существуют преобразования данных (например, логарифмирование), но в студенческой работе это редко требуется и часто усложняет интерпретацию. Проще и честнее перейти на непараметрические методы и медиану.
Короткий алгоритм
- Посчитайте асимметрию и эксцесс в калькуляторе описательной статистики.
- Оба по модулю меньше 1 (в крайнем случае меньше 2)? Форма похожа на нормальную — это хороший знак.
- Подтвердите вывод критерием Шапиро-Уилка: p > 0,05 — распределение нормальное.
- Если перекос сильный и p < 0,05 — описывайте данные медианой и берите непараметрические критерии.
- В тексте укажите значения As и Ex и свяжите их с результатом критерия нормальности.
Короче: асимметрия — куда скошено, эксцесс — насколько острый пик. Оба в пределах ±1 — форма близка к нормальной, но финальное слово за Шапиро-Уилком. Сильный перекос → медиана и непараметрика.
Что ещё почитать
- Нормальное распределение простыми словами — что это за «колокол» и почему он так важен.
- Как проверить нормальность распределения — полная процедура с критериями.
- Среднее, медиана и мода — почему при перекосе берут медиану.
- Описательная статистика в дипломе — как собрать таблицу с показателями.
- Калькулятор описательной статистики — посчитать асимметрию и эксцесс онлайн.
Не уверены, нормальны ли ваши данные и какой метод брать — загляните в базу методов или закажите консультацию: эксперт проверит распределение и подберёт критерий за вас.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию