Доверительный интервал простыми словами
Что такое 95% доверительный интервал, как рассчитать его для среднего по формуле Стьюдента, как интерпретировать и что написать в дипломе. С примером и FAQ.
Вы посчитали средний балл по выборке — например, 24,5. Но это всего лишь оценка по вашим 30 студентам. А каким будет среднее у всех студентов вообще? Точно вы не знаете, но можете указать диапазон, в котором оно почти наверняка лежит. Этот диапазон и есть доверительный интервал.
В двух словах
Доверительный интервал (ДИ) — это диапазон значений, в котором с заданной надёжностью (обычно 95%) находится истинное значение параметра в генеральной совокупности — чаще всего среднего.
Выборочное среднее — это одно число (точечная оценка). Доверительный интервал дополняет его «вилкой»: не просто «среднее = 24,5», а «среднее лежит между 22,8 и 26,2». Посчитать его проще всего в калькуляторе описательной статистики — он сразу выдаёт границы.
Что это и зачем
Когда вы берёте выборку, вы изучаете не всех людей на свете, а только часть. Среднее по выборке (обозначают M или x̄) почти никогда не совпадает с истинным средним всей генеральной совокупности (его обозначают μ, «мю»). Возьмёте другую выборку — получите чуть другое число.
Доверительный интервал честно признаёт эту неопределённость. Вместо того чтобы делать вид, что одно число — это истина, он показывает коридор правдоподобных значений.
- Точечная оценка (M) — ваше лучшее единственное предположение о среднем.
- Доверительный интервал — диапазон вокруг неё, учитывающий разброс данных и размер выборки.
Чем шире интервал — тем меньше определённости в оценке. Узкий интервал означает, что вы оценили среднее точно; широкий — что данных мало или разброс большой, и истинное значение может быть где угодно в широких пределах.
Как рассчитать (для среднего)
Для среднего одной выборки 95% доверительный интервал считают по формуле:
ДИ = M ± t · (s / √n)
Разберём по частям:
- M — выборочное среднее;
- s — стандартное отклонение (как считается — в статье про стандартное отклонение и дисперсию);
- n — объём выборки (сколько человек);
- √n — корень из объёма выборки;
- s / √n — это стандартная ошибка среднего (на сколько в среднем «гуляет» наша оценка);
- t — критическое значение распределения Стьюдента для нужной надёжности и числа степеней свободы df = n − 1.
Величину t · (s / √n) называют погрешностью (или половиной ширины интервала). Её прибавляют и вычитают из M — так получаются нижняя и верхняя границы.
Для больших выборок (примерно от 100 человек) t для 95% надёжности ≈ 1,96. На маленьких выборках t заметно больше: например, при n = 10 (df = 9) t ≈ 2,26. Поэтому на малых выборках интервал шире — и это правильно.
Пример расчёта по шагам
Допустим, измерили уровень мотивации у n = 25 студентов. Получили среднее M = 48 баллов и стандартное отклонение s = 10. Считаем 95% ДИ.
- Стандартная ошибка: s / √n = 10 / √25 = 10 / 5 = 2,0.
- Степени свободы: df = 25 − 1 = 24. Для них t (95%) ≈ 2,06.
- Погрешность: t · (s/√n) = 2,06 · 2,0 ≈ 4,1.
- Границы: 48 − 4,1 = 43,9 и 48 + 4,1 = 52,1.
Вывод: 95% доверительный интервал для среднего — [43,9; 52,1].
Таблица 1 — Расчёт 95% доверительного интервала для среднего (n = 25)
| Шаг | Что считаем | Формула | Результат |
|---|---|---|---|
| 1 | Стандартная ошибка | s / √n = 10 / 5 | 2,0 |
| 2 | t-критическое (df = 24) | таблица Стьюдента | 2,06 |
| 3 | Погрешность | t · (s/√n) | 4,1 |
| 4 | Нижняя граница | M − погрешность | 43,9 |
| 5 | Верхняя граница | M + погрешность | 52,1 |
Вручную считать таблицу Стьюдента не нужно: калькулятор описательной статистики выдаёт границы ДИ автоматически вместе со средним и стандартным отклонением.
Как интерпретировать
Формулировка для нашего примера звучит так:
С надёжностью 95% истинное среднее значение мотивации в генеральной совокупности лежит в пределах от 43,9 до 52,1 балла.
То есть мы почти уверены (на 95%), что настоящее среднее всех студентов — где-то внутри этого коридора, а не строго равно 48.
Ниже показано, как это выглядит на числовой оси: точка — выборочное среднее, отрезок вокруг неё — доверительный интервал.
Распространённое заблуждение: «есть 95% вероятность, что среднее попадёт именно в этот интервал». Строго говоря, истинное среднее — фиксированное число, оно либо в интервале, либо нет. 95% относится к методу: если повторить исследование много раз, то 95% таких интервалов накроют истинное значение. Но для диплома достаточно «бытовой» формулировки про надёжность 95%.
Влияние объёма выборки и надёжности
Ширина интервала зависит от двух вещей:
- Объём выборки n. Чем больше n, тем УЖЕ интервал — оценка точнее (в формуле растёт √n в знаменателе, погрешность падает).
- Уровень надёжности. Чем выше надёжность (99% вместо 95%), тем ШИРЕ интервал — за бóльшую уверенность приходится платить менее точными границами.
В таблице 2 видно, как сужается интервал при росте n (для M = 48, s = 10, надёжность 95%).
Таблица 2 — Как объём выборки влияет на ширину 95% ДИ (M = 48, s = 10)
| n | Стандартная ошибка s/√n | t (df = n−1) | Погрешность | 95% ДИ |
|---|---|---|---|---|
| 10 | 3,16 | 2,26 | 7,1 | [40,9; 55,1] |
| 25 | 2,00 | 2,06 | 4,1 | [43,9; 52,1] |
| 100 | 1,00 | 1,98 | 2,0 | [46,0; 50,0] |
| 400 | 0,50 | 1,97 | 1,0 | [47,0; 49,0] |
При увеличении выборки в 4 раза интервал сужается примерно вдвое: чтобы оценить среднее точнее, нужно ощутимо больше данных.
Связь с p-значением
Доверительный интервал и проверка гипотез — две стороны одной медали.
- Одна выборка. Если эталонное значение μ₀ (например, норматив по тесту) НЕ попадает в доверительный интервал — значит, ваше среднее значимо от него отличается (p < 0,05). Это и проверяет t-критерий для одной выборки.
- Две группы. Если 95% ДИ для разности средних НЕ включает 0 — различие между группами значимо (p < 0,05). Если 0 внутри интервала — значимых различий нет. Эту разность считает критерий Стьюдента.
Доверительный интервал информативнее одного p-значения: он показывает не только «значимо/незначимо», но и насколько велик эффект и насколько точно вы его измерили. Поэтому ДИ всё чаще требуют в дипломах и научных работах в дополнение к p.
Что писать в дипломе
Доверительный интервал приводят рядом со средним. Готовые формулировки:
- «Среднее значение мотивации составило M = 48 баллов (95% ДИ: 43,9–52,1)».
- «Для экспериментальной группы получен 95% доверительный интервал среднего [43,9; 52,1], что свидетельствует о достаточной точности оценки».
- «Разность средних между группами составила 5,2 балла (95% ДИ: 1,1–9,3), интервал не включает 0, различия статистически значимы (p < 0,05)».
В тексте обычно указывают уровень надёжности (95%), сами границы и при необходимости — что интервал означает для гипотезы.
Частые ошибки
- Путают доверительный интервал со стандартным отклонением. Стандартное отклонение описывает разброс данных, а ДИ — точность оценки среднего. Это разные вещи: интервал у́же, чем размах ±s.
- Берут z вместо t на малой выборке. На маленьких n нужно брать t-распределение Стьюдента (с df = n − 1), а не фиксированные 1,96. Иначе интервал получится обманчиво узким.
- Говорят «95% данных лежат в интервале». Нет: в интервале с надёжностью 95% лежит истинное СРЕДНЕЕ, а не отдельные наблюдения.
- Указывают интервал без уровня надёжности. Всегда пишите, какой это ДИ — 95%, 99% и т.д., иначе границы непонятны.
- Считают вручную и ошибаются в t. Таблицу Стьюдента легко прочитать неверно. Надёжнее — калькулятор.
Частые вопросы
Чем 95% доверительный интервал отличается от 99%?
99% ДИ шире: вы требуете большей уверенности, поэтому коридор расширяется. Для студенческих работ стандарт — 95%, более строгий 99% берут реже, когда важна повышенная надёжность вывода.
Как посчитать доверительный интервал в Экселе?
Можно использовать функцию ДОВЕРИТ.СТЬЮДЕНТ(0,05; стандартное_отклонение; n) — она вернёт погрешность, которую нужно прибавить и вычесть из среднего. Но проще загрузить данные в калькулятор описательной статистики: он сразу выдаст готовые границы и формулировку.
Что такое доверительный интервал Стьюдента?
Так называют интервал для среднего, рассчитанный по распределению Стьюдента (t-распределению). Это стандартный способ для одной выборки, когда стандартное отклонение генеральной совокупности неизвестно — то есть почти всегда в реальных исследованиях.
Можно ли строить доверительный интервал не для среднего?
Да. ДИ строят и для доли (процента), разности средних, коэффициента корреляции и других параметров. Принцип тот же: точечная оценка плюс «вилка» вокруг неё. Но в студенческих работах чаще всего нужен именно интервал для среднего.
Мой интервал очень широкий — что делать?
Широкий интервал означает либо маленькую выборку, либо большой разброс данных. Главный способ сузить его — увеличить n (см. таблицу 2). Иногда стоит проверить, нет ли в данных выбросов, раздувающих стандартное отклонение.
Как связаны границы доверительного интервала и значимость различий?
Если сравниваете с эталоном μ₀: он внутри интервала — различий нет, вне — есть (p < 0,05). Если сравниваете две группы по ДИ их разности: интервал включает 0 — различий нет, не включает — есть.
Короткий алгоритм
- Посчитайте среднее M, стандартное отклонение s и объём n.
- Найдите стандартную ошибку: s / √n.
- Возьмите t для надёжности 95% и df = n − 1 (или используйте калькулятор).
- Погрешность = t · (s/√n); границы = M ± погрешность.
- Запишите вывод: «95% ДИ: нижняя–верхняя».
Что ещё почитать
- Описательная статистика в дипломе — как описать выборку до анализа.
- Стандартное отклонение и дисперсия — что такое s в формуле ДИ.
- Что такое p-значение — как связаны интервал и проверка гипотез.
- Калькулятор описательной статистики — посчитает ДИ автоматически.
- t-критерий для одной выборки — сравнение среднего с эталоном через интервал.
Если не уверены, как посчитать или оформить доверительный интервал, загляните в базу методов или закажите консультацию эксперта — посчитаем и опишем результаты за вас.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию