Медиана и квартили (Me, Q1–Q3): как описывать данные
Что такое медиана, квартили и межквартильный размах, как посчитать их руками и записать в дипломе как Me [Q1; Q3]. С примерами, боксплотом и FAQ.
Вы посчитали результаты опросника или замеры теста и теперь надо коротко описать выборку: каким был «типичный» балл и насколько данные разбросаны. Если выборка маленькая или в ней есть аномальные значения, среднее ± стандартное отклонение тут подведёт.
Честнее работает тройка медиана и квартили: середина ряда и его «плечи». В дипломах по психологии и спорту это самая частая запись для описания данных — Me [Q1; Q3]. Разберём, что это, как посчитать руками и как оформить.
В двух словах
Это три числа, которые описывают, где центр данных и как широко они разбросаны, не завышая результат из-за выбросов.
- Медиана (Me) — значение ровно посередине упорядоченного ряда: половина данных меньше, половина больше.
- Q1 (нижний квартиль) — граница, ниже которой лежат 25% значений; Q3 (верхний квартиль) — граница, ниже которой лежат 75%.
- Межквартильный размах (IQR) = Q3 − Q1 — ширина «средних 50%» данных, мера разброса вокруг медианы.
Посчитать всё сразу — в калькуляторе описательной статистики: вводите числа и получаете медиану, квартили и размах в готовой таблице. Чем медиана отличается от среднего и моды — в статье «Среднее, медиана и мода».
Что такое квартили на пальцах
Представьте, что вы выстроили всех участников в шеренгу по росту — от самого низкого к самому высокому. Медиана — это человек ровно в середине шеренги. А квартили делят ту же шеренгу на четыре равные части по числу людей.
- Q1 стоит на границе первой четверти: четверть людей ниже него, три четверти — выше.
- Q2 — это и есть медиана (середина).
- Q3 стоит на границе третьей четверти: три четверти людей ниже, верхняя четверть — выше.
Слово «квартиль» от латинского quartus — «четвёртый», как «квартал» города. Q1 ещё называют 25-м перцентилем, медиану — 50-м, Q3 — 75-м: перцентиль просто говорит, какой процент данных лежит ниже этой точки. И сразу уберём путаницу: точек-границ всего три (Q1, Q2, Q3), а режут они ряд на четыре равные по количеству части — поэтому фразы вроде «четвёртый квартиль» обычно лишние.
Как посчитать медиану руками
Медиана берётся только из упорядоченного ряда — это главное. Алгоритм:
- Отсортируйте значения по возрастанию.
- Если значений нечётное число (n) — медиана это центральное значение.
- Если чётное — медиана это среднее двух центральных значений.
Пример (нечётное n). Баллы тревожности у 7 студентов: 32, 41, 38, 55, 47, 44, 39. Сортируем: 32, 38, 39, 41, 44, 47, 55. Значений 7, центральное — четвёртое: Me = 41.
Пример (чётное n). Время бега на 100 м у 6 спортсменов (сек): 13,9; 14,2; 13,5; 15,1; 14,0; 14,4. Сортируем: 13,5; 13,9; 14,0; 14,2; 14,4; 15,1. Два центральных — третье и четвёртое: Me = (14,0 + 14,2) / 2 = 14,1 сек.
Подробный разбор медианы с моддой и средним мы делали в отдельной статье «Среднее, медиана и мода» — там же про то, почему медиана честнее для скошенных данных.
Как посчитать квартили руками
Способов считать квартили существует несколько (отсюда лёгкие расхождения между Excel, SPSS и калькуляторами), но для диплома достаточно простого и понятного метода медиан половин:
- Найдите медиану всего ряда — она делит его на нижнюю и верхнюю половины.
- Q1 — это медиана нижней половины.
- Q3 — это медиана верхней половины.
- При нечётном n саму медиану в половины не включают (отбрасываем центральное значение).
Покажем на ряду из 9 баллов опросника выгорания.
Пример. Баллы: 12, 9, 15, 7, 20, 11, 14, 8, 13. Сортируем по возрастанию: 7, 8, 9, 11, 12, 13, 14, 15, 20. Значений 9 (нечётно), медиана — пятое значение: Me = 12. Нижняя половина (без медианы): 7, 8, 9, 11 → её медиана Q1 = (8 + 9) / 2 = 8,5. Верхняя половина: 13, 14, 15, 20 → её медиана Q3 = (14 + 15) / 2 = 14,5. Межквартильный размах IQR = 14,5 − 8,5 = 6.
Соберём расчёт в таблицу 1, чтобы было видно всю картину сразу.
Таблица 1 — Описательные показатели по баллам выгорания (n = 9)
| Показатель | Обозначение | Значение | Что означает |
|---|---|---|---|
| Минимум | min | 7 | самый низкий балл |
| Нижний квартиль | Q1 | 8,5 | ниже него 25% участников |
| Медиана | Me | 12 | середина ряда (50%) |
| Верхний квартиль | Q3 | 14,5 | ниже него 75% участников |
| Максимум | max | 20 | самый высокий балл |
| Межквартильный размах | IQR | 6 | ширина средних 50% данных |
Читается так: типичный участник набрал около 12 баллов, а «средние» половина людей уложилась в коридор от 8,5 до 14,5. Значение 20 заметно оторвалось от остальных — кандидат в выбросы (как их находят — чуть ниже).
Чтобы не запутаться при нечётном n, держите в голове образ: медиана — «забор» посередине, который не входит ни в левый, ни в правый двор. Q1 — хозяин левого двора (его середина), Q3 — хозяин правого. При чётном n забора между конкретными точками нет, и половины берутся целиком.
Зачем нужен межквартильный размах
Медиана говорит, где центр, но ничего не говорит о разбросе. Два класса могут иметь одинаковую медиану 12 баллов, но в одном все около 11–13, а в другом — от 2 до 20. IQR показывает именно это: насколько кучно или широко лежат средние 50% значений вокруг медианы.
Почему берут именно средние 50%, а не весь размах (max − min)? Потому что обычный размах зависит от двух крайних значений и от одного выброса «раздувается». IQR же отбрасывает по 25% с каждого края и потому устойчив: одна аномальная цифра его почти не двигает. Это родственник медианы по духу — оба «не ведутся» на выбросы.
Запомните связку: медиану всегда сопровождают мерой разброса, и для медианы это квартили (или IQR), а не стандартное отклонение. Пара «среднее ± стандартное отклонение» и пара «медиана [Q1; Q3]» — это два разных комплекта, смешивать их в одной строке не нужно.
Бонус: по IQR ищут выбросы. Классическое правило — выброс это значение ниже Q1 − 1,5·IQR или выше Q3 + 1,5·IQR. В нашем примере: 14,5 + 1,5·6 = 23,5, так что балл 20 формально ещё не выброс, хотя и стоит особняком.
Почему для малых выборок берут медиану, а не среднее
Вот главная причина, по которой Me [Q1; Q3] так любят в дипломах по психологии и спорту.
- Среднее ± SD чувствительно к выбросам. Одно аномальное значение тянет за собой и среднее, и стандартное отклонение. На выборке из 8–15 человек один «странный» испытуемый способен исказить картину.
- Медиана и квартили устойчивы. Они опираются на порядок значений, а не на их абсолютную величину, поэтому выброс почти не сдвигает их.
- Баллы анкет — это порядковая шкала. Строго говоря, у баллов опросника интервалы между делениями неравны (разница между «3» и «4» не обязательно равна разнице между «4» и «5»). Для такой шкалы среднее не вполне корректно, а медиана с квартилями — да.
Покажем устойчивость на простом сравнении. Возьмём ряд из 8 значений и испортим в нём одну цифру выбросом.
Пример. Ряд 4, 5, 5, 6, 6, 7, 7, 8. Здесь Me = 6, среднее = 6. Теперь заменим последнюю 8 на 80 (испытуемый ошибся, или это редкий случай). Среднее подскочит до 15, а медиана останется 6. Квартили тоже почти не дрогнут.
Поэтому правило: числовые симметричные данные без выбросов → можно среднее ± SD; малые выборки, баллы, скошенность или выбросы → медиана [Q1; Q3]. Как формально проверить симметрию, написано в статье «Как проверить нормальность распределения».
Самая частая ловушка: посчитать по баллам анкеты среднее ± стандартное отклонение «как все» и не заметить, что распределение скошено. Если медиана и среднее заметно расходятся — это сигнал асимметрии, и описывать данные надо медианой с квартилями.
Что такое боксплот (ящик с усами)
Все пять чисел — min, Q1, Me, Q3, max — удобно показать одной картинкой. Это боксплот («ящик с усами», box plot): прямоугольник-«ящик» тянется от Q1 до Q3, линия внутри — медиана, а «усы» дотягиваются до минимума и максимума (или до границ выбросов). Схема — на рисунке 1.
Чем длиннее ящик — тем больше разброс (шире IQR). Если линия медианы смещена к одному краю ящика — распределение скошено. А отдельные точки за усами — это и есть выбросы. Боксплот особенно хорош, когда надо сравнить несколько групп на одной картинке: например, тревожность в контрольной и экспериментальной группах.
Что писать в дипломе
Стандартная запись описания через медиану — Me [Q1; Q3], то есть медиана, а в квадратных скобках через точку с запятой нижний и верхний квартили. Иногда пишут Me (Q1; Q3) в круглых скобках — оба варианта допустимы, держитесь одного по всему тексту.
Готовые формулировки:
- «Уровень ситуативной тревожности в экспериментальной группе составил Me = 12 [8,5; 14,5] балла».
- «Медиана времени бега на 100 м — 14,1 [13,9; 14,4] сек».
- «Поскольку распределение баллов отличалось от нормального (по Шапиро-Уилку p < 0,05), данные описаны медианой и квартилями».
Это описательная часть. Если дальше вы сравниваете группы или замеры «до/после», к медианам добавляют непараметрический критерий — например, Вилкоксона для связанных выборок или Манна-Уитни для двух независимых групп, и приводят их статистику с p-значением. Как собрать всю описательную часть целиком — в статье «Описательная статистика в дипломе».
Минимально полное описание показателя по медиане выглядит так: название, Me, [Q1; Q3] и число наблюдений (n). Этого достаточно, чтобы научный руководитель увидел и центр, и разброс ваших данных.
Частые ошибки
- Искать медиану в неотсортированном ряду. Сначала сортировка по возрастанию, потом середина — иначе число будет неверным.
- Сопровождать медиану стандартным отклонением. К медиане идут квартили (IQR), а ± SD — это пара для среднего. Смешивать комплекты не нужно.
- Писать квартили без скобок и сепаратора. Формат —
Me [Q1; Q3]; «12 8,5 14,5» прочитать невозможно. - Считать средние по баллам анкет и забывать про скошенность. Для порядковых данных и малых выборок честнее медиана.
- Путать «25% ниже Q1» с «Q1 = 25 баллов». Q1 — это значение-граница, а 25% — доля участников ниже неё.
- Брать весь размах (max − min) как меру разброса при выбросах. Он раздувается одной цифрой; устойчивее IQR.
Частые вопросы
Чем медиана отличается от среднего?
Среднее — сумма всех значений, делённая на их количество; оно учитывает каждое число и потому чувствительно к выбросам. Медиана — значение посередине упорядоченного ряда, на неё крайние значения почти не влияют. На симметричных данных они близки, при скошенности расходятся. Подробнее — в статье «Среднее, медиана и мода».
Как вычислить Q1 и Q3 вручную?
Найдите медиану всего ряда — она делит его пополам. Q1 — это медиана нижней половины, Q3 — медиана верхней. При нечётном числе значений саму медиану в половины не включают. Быстрее всего посчитать в калькуляторе описательной статистики.
Почему мои квартили в Excel немного отличаются от калькулятора?
Потому что существует несколько методов оценки квартилей (например, функции КВАРТИЛЬ.ВКЛ и КВАРТИЛЬ.ИСКЛ в Excel считают по-разному). На небольших выборках расхождения в десятые доли — это норма. Главное — пользуйтесь одним методом по всей работе и укажите инструмент, которым считали.
Что такое межквартильный размах простыми словами?
Это ширина «средних 50%» данных: IQR = Q3 − Q1. Он показывает, насколько кучно лежат значения вокруг медианы, и, в отличие от обычного размаха, не раздувается из-за одного выброса.
Сколько нужно значений, чтобы посчитать квартили?
Формально хватает и 4–5 значений, но осмысленно квартили работают примерно от 8–10 наблюдений: на совсем крошечном ряду они «прыгают» от каждой цифры. Сколько респондентов нужно в целом — в статье «Сколько респондентов нужно для диплома».
Можно ли считать медиану и квартили для баллов анкеты?
Да, и это даже предпочтительнее среднего. Баллы опросников — порядковая шкала, для неё медиана с квартилями корректнее, чем среднее со стандартным отклонением.
Короткий алгоритм
- Отсортируйте ряд по возрастанию.
- Найдите медиану: центральное значение (нечётное n) или среднее двух центральных (чётное n).
- Посчитайте Q1 (медиана нижней половины) и Q3 (медиана верхней половины); IQR = Q3 − Q1.
- Запишите как Me [Q1; Q3] и укажите n.
- Не считайте руками — калькулятор описательной статистики выдаст всё сразу.
Что ещё почитать
- Среднее, медиана и мода — три меры центра и какую выбрать.
- Описательная статистика в дипломе — как собрать всю описательную часть и оформить таблицу.
- Стандартное отклонение и дисперсия — пара разброса для среднего, когда оно уместно.
- Как проверить нормальность распределения — чтобы выбрать между средним и медианой.
- Калькулятор описательной статистики — медиана, квартили и размах онлайн.
Не уверены, какие показатели приводить и как оформить практическую часть — загляните в базу методов или закажите консультацию: эксперт подберёт описание и посчитает за вас.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию