Как описать выборку в исследовании: образец для диплома
Что указать про выборку исследования: объём N, пол, возраст M±σ, критерии включения и базу. Готовая таблица состава и фразы для диплома — с примерами и FAQ.
Вы провели исследование, собрали данные — и в главе «Организация исследования» нужно описать, на ком вы всё это делали. Часто студенты пишут одну строчку: «В исследовании приняли участие 30 человек» — и получают правку от научного.
Описание выборки — это не одно число. Это абзац (а лучше абзац + таблица), который отвечает на вопрос: кого, сколько, какого пола и возраста вы изучали и почему именно их.
В двух словах
Чтобы правильно описать выборку в исследовании, укажите шесть вещей: объём (N), пол, возраст, критерии включения и исключения, базу исследования и время сбора данных. Возраст подайте как M ± σ или диапазоном, а состав группы сведите в таблицу.
Средний возраст и стандартное отклонение для строки «M ± σ» удобно посчитать в калькуляторе описательной статистики — он же пригодится для всей описательной части. А сколько вообще человек брать, разобрано в статье «Сколько респондентов нужно для диплома».
«Сколько респондентов» и «опиши выборку» — это разные вопросы
Студенты часто путают два вопроса, и из-за этого описание получается куцым.
«Сколько респондентов?» — это вопрос про одно число (N). Ответ: «60 человек». Этого достаточно для разговора в коридоре, но не для главы диплома.
«Опиши выборку» — это вопрос про характеристику группы. Ответ должен дать читателю возможность представить ваших участников и понять, можно ли переносить ваши выводы на других людей.
Описание выборки нужно для воспроизводимости и репрезентативности. Другой исследователь должен по вашему тексту понять, кого вы изучали, и при желании повторить отбор. Поэтому «30 человек» — это не описание, а только его первая строчка.
Что обязательно указать: шесть пунктов
Пройдитесь по этому чек-листу — каждый пункт превращается в одно-два предложения.
- Объём выборки (N). Сколько всего человек и как делятся на группы. Например: «Всего 60 человек: экспериментальная группа (ЭГ) — 30, контрольная (КГ) — 30».
- Пол. Сколько мужчин и женщин (или мальчиков/девочек), лучше с долями. «18 девушек (60%) и 12 юношей (40%)».
- Возраст. Самый «диагностичный» пункт. Подаётся как среднее ± стандартное отклонение либо диапазоном. О формате — отдельный раздел ниже.
- Критерии включения и исключения. Кого вы брали в выборку, а кого отсеяли и почему. Это показывает, что выборка не случайный набор людей.
- База исследования. Где собирали данные: конкретная организация, город, иногда период. «На базе МБОУ СОШ № 7 г. Перми».
- Время и способ сбора. Когда проводили и как набирали участников (сплошной отбор класса, добровольцы, случайная выборка).
Простая проверка: прочитайте свой абзац и спросите — «смог бы незнакомый человек по этому тексту понять, кого я изучал, и набрать похожую группу?». Если да — описание полное.
Возраст: формат M ± σ или диапазон
Возраст — место, где чаще всего теряют баллы. Есть два корректных способа его подать.
Способ 1 — среднее со стандартным отклонением (M ± σ). Подходит, когда участники близки по возрасту (студенты, спортсмены одной категории).
M ± σ, где M — среднее арифметическое возраста, σ — стандартное отклонение (разброс возраста вокруг среднего).
Пример: возраст участников 20,4 ± 1,3 года. Это значит, что в среднем им около 20 лет, и большинство укладывается примерно в 19–22 года.
Способ 2 — диапазон (от и до). Подходит, когда возраст разнородный или важны границы. Пример: «возраст от 18 до 24 лет».
Часто пишут оба: «возраст участников — от 18 до 24 лет (M = 20,4; σ = 1,3)».
Пример расчёта. У вас 5 участников: 19, 20, 21, 22, 20 лет. Среднее M = (19+20+21+22+20) ÷ 5 = 102 ÷ 5 = 20,4 года. Стандартное отклонение σ ≈ 1,14. В диплом пишете: «средний возраст 20,4 ± 1,1 года». Эти два числа за секунду считает калькулятор описательной статистики — вводите возрасты и берёте M и σ.
Запись «M ± σ» в норме читается так: примерно две трети участников попадают в интервал от M − σ до M + σ. Не путайте σ (стандартное отклонение, описывает разброс данных) со стандартной ошибкой среднего m — для описания выборки берут именно σ.
Таблица состава выборки
Когда групп больше одной (экспериментальная и контрольная, разные курсы, мужчины и женщины), состав удобнее показать таблицей. Это разгружает текст и сразу видно, что группы сопоставимы.
Таблица 1 — Состав выборки исследования (N = 60)
| Группа | N | Юноши | Девушки | Возраст, M ± σ |
|---|---|---|---|---|
| Экспериментальная (ЭГ) | 30 | 12 | 18 | 20,3 ± 1,2 |
| Контрольная (КГ) | 30 | 13 | 17 | 20,6 ± 1,4 |
| Всего | 60 | 25 | 35 | 20,4 ± 1,3 |
После таблицы обязательно дайте вывод словами: «Как видно из таблицы 1, экспериментальная и контрольная группы сопоставимы по объёму, полу и возрасту, что позволяет корректно сравнивать их результаты». Именно эта фраза показывает научному, что вы понимаете, зачем таблица нужна.
Критерии включения и исключения
Это пункт, который превращает «набор знакомых» в осмысленную выборку. Достаточно одной-двух фраз.
Критерии включения — признаки, по которым человек попадает в выборку. Пример: «студенты 2 курса очного отделения, давшие согласие на участие».
Критерии исключения — за что вы участника отсеивали. Пример: «из выборки исключались студенты с пропуском более одного из замеров, а также академический отпуск».
Не путайте критерии исключения с «выбыванием». Критерии исключения — это правило отбора до эксперимента. А если человек начал, но не дошёл до конца (заболел, бросил) — это «выбывание (attrition)», его указывают отдельно: сколько начали, сколько дошли. На рисунке 1 это два разных сужения воронки.
Что писать в дипломе
Готовый абзац для главы «Организация исследования» — подставьте свои числа:
«Исследование проводилось на базе [организация, город] в период с [месяц, год] по [месяц, год]. В исследовании приняли участие 60 человек в возрасте от 18 до 24 лет (M = 20,4; σ = 1,3), из них 25 юношей (42%) и 35 девушек (58%). Участники были разделены на две группы: экспериментальную (n = 30) и контрольную (n = 30), сопоставимые по полу и возрасту (таблица 1). Критерием включения являлось обучение на 2 курсе очной формы и согласие на участие; из выборки исключались лица, пропустившие один из этапов диагностики».
Отдельные готовые фразы:
- «Объём выборки составил N = 60 человек».
- «Средний возраст участников — 20,4 ± 1,3 года».
- «Гендерный состав: 42% юношей и 58% девушек».
- «Формирование выборки осуществлялось методом сплошного отбора учебных групп».
- «Экспериментальная и контрольная группы статистически не различались по возрасту (что позволяет считать их сопоставимыми)».
Сопоставимость групп по возрасту можно не только заявить, но и подтвердить: сравните возраст ЭГ и КГ критерием Манна-Уитни (или Стьюдента для нормального распределения). Если различий нет (p > 0,05) — группы сопоставимы, и это сильный аргумент.
Частые ошибки
- Описать выборку одним числом. «Участвовало 30 человек» — это не описание. Нужны пол, возраст, критерии, база.
- Забыть про σ или диапазон возраста. «Средний возраст 20 лет» без разброса — неполно. Пишите M ± σ или «от 18 до 24».
- Не указать базу исследования. Без места сбора непонятно, на кого распространяются выводы.
- Перепутать N групп и общий N. Если групп две по 30, то общий N = 60, а n каждой группы = 30. Не теряйте это различие.
- Пропустить критерии включения/исключения. Тогда выглядит, будто вы взяли случайных знакомых.
- Округлить проценты так, что сумма ≠ 100%. Перепроверяйте: 42% + 58% = 100%.
Частые вопросы
Чем отличается выборка от генеральной совокупности?
Генеральная совокупность — все, кого вы в принципе изучаете (например, «все студенты вуза»). Выборка — те, кого вы реально обследовали (например, «60 студентов 2 курса»). В дипломе описывают выборку, а в выводах осторожно говорят, насколько она представляет совокупность — об этом статья «Репрезентативность выборки».
Писать «выборка» или «респонденты»?
«Респонденты» — обычно про опросы и анкетирование. «Испытуемые» / «участники» — про эксперименты и тестирование. «Выборка» — обобщающий термин для всей группы. В тексте лучше держаться одного слова, а N называть «объём выборки».
Нужно ли указывать возраст, если все одного года?
Да. Даже если все «второкурсники», их возраст всё равно отличается (18, 19, 20…). Посчитайте M и σ — это займёт минуту в калькуляторе описательной статистики. Если возраст реально одинаковый (редко), так и напишите: «все участники — 19 лет».
Сколько человек должно быть в выборке?
Зависит от метода и дизайна. Для сравнения групп обычно ориентируются на 25–30+ в каждой, для корреляций — от 30. Подробно с расчётом — в статье «Сколько респондентов нужно для диплома».
Как доказать, что группы сопоставимы?
Сравните их по «фоновым» признакам (возраст, пол) и покажите, что различий нет. Возраст — критерием Манна-Уитни или Стьюдента, доли по полу — критерием хи-квадрат. Отсутствие различий (p > 0,05) и есть доказательство сопоставимости.
Короткий алгоритм
- Назовите объём: общий N и n каждой группы.
- Укажите пол в количестве и процентах.
- Посчитайте возраст как M ± σ (или диапазон) в калькуляторе.
- Пропишите критерии включения и исключения.
- Назовите базу и время сбора данных.
- Сведите состав в таблицу и добавьте вывод словами о сопоставимости групп.
Коротко: выборка = N + пол + возраст (M ± σ) + критерии + база. Одно число «30 человек» — это только начало. Полное описание = абзац + таблица состава + фраза о сопоставимости групп.
Что ещё почитать
- Сколько респондентов нужно для диплома — как обосновать объём выборки.
- Репрезентативность выборки — можно ли переносить выводы на генеральную совокупность.
- Описательная статистика в дипломе — как описать данные после выборки.
- Калькулятор описательной статистики — посчитать M и σ возраста за секунду.
- База методов и калькуляторов — выбрать критерий для сравнения групп.
Не уверены, как описать свою выборку или доказать сопоставимость групп — загляните в базу методов или закажите консультацию, поможем оформить главу под ключ.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.