StatBlank
Руководства18 июня 2026·8 мин чтения

Обработка открытых вопросов анкеты: как закодировать

Как провести обработку открытых вопросов анкеты: кодирование ответов, категории, подсчёт частот и перевод в проценты, оформление в таблицу. С примерами и FAQ.

Закрытые вопросы анкеты обрабатываются легко: посчитал галочки — и готова таблица. А вот открытые вопросы («Что вам больше всего нравится в занятиях?») дают пёструю кучу формулировок, и непонятно, что с ней делать.

Главное правило: открытые ответы нельзя просто пересказать — их нужно превратить в числа. Для этого их кодируют, группируют в категории и считают частоты. Разберём всю цепочку на живом примере.

В двух словах

Обработка открытых вопросов анкеты — это перевод свободных текстовых ответов в числа через кодирование. Вы читаете ответы, выделяете повторяющиеся смыслы, объединяете их в категории, считаете, сколько человек попало в каждую, и переводите в проценты.

По сути это мини-контент-анализ. Итог сводят в частотную таблицу, доли можно добить в калькуляторе описательной статистики, а если хотите сравнить две группы по доле какого-то ответа — пригодится критерий Фишера или хи-квадрат.

Чем открытый вопрос отличается от закрытого

Закрытый вопрос уже содержит готовые варианты ответа. Респондент выбирает из списка, а вы просто считаете, сколько раз выбран каждый вариант. Категории заданы заранее — обработка чисто арифметическая.

Открытый вопрос не предлагает вариантов: человек пишет своими словами. Категории заранее не известны — их нужно вывести из самих ответов уже после сбора данных. Это и есть кодирование.

Заметка

Открытые вопросы дают живой, неожиданный материал и хороши, когда вы не знаете заранее всех вариантов. Плата за это — ручная обработка: программа не посчитает свободный текст за вас, кодировать придётся головой.

Шаг 1. Кодирование ответов

Кодирование — это присвоение каждому ответу короткой смысловой метки (кода). Цель — свести разные формулировки одной мысли к одному коду.

Допустим, на вопрос «Что вам нравится в тренировках?» вы получили такие ответы:

  • «нравится играть в команде»
  • «командные игры»
  • «общение с ребятами»
  • «новые упражнения»
  • «разные задания, не скучно»
  • «тренер хороший»

Первые три — про одно и то же (общение и команда), четвёртый и пятый — про разнообразие. Вы присваиваете коды: «командность/общение», «разнообразие занятий», «личность тренера».

Совет

Заведите таблицу из двух колонок: слева — дословный ответ, справа — код. Так вы не запутаетесь и сможете показать научнику, как именно сворачивали формулировки. Это и есть «прозрачность кодирования», которую любят проверяющие.

Один ответ может содержать несколько смыслов («нравится общение и новые упражнения») — тогда ему ставят сразу два кода. Решите заранее: считаете вы людей или упоминания, и держитесь одного варианта по всей анкете.

Шаг 2. Категоризация

Когда близкие коды складываются в более крупные смысловые группы — это категории. Категория объединяет несколько кодов одного уровня.

Хорошая система категорий отвечает двум требованиям:

  • Полнота — любой ответ можно куда-то отнести (на крайний случай заведите категорию «Другое»).
  • Непересекаемость — один ответ не должен с равным правом попадать в две категории. Если попадает — границы категорий размыты, их надо переформулировать.
Осторожно

Не плодите категории. Если их получилось 15 на 30 анкет — большинство будет с частотой 1–2, и анализировать нечего. Оптимально 4–7 содержательных категорий плюс «Другое». Слишком мелкие группы объединяйте.

Шаг 3. Подсчёт частот и перевод в проценты

Когда категории готовы, проходите по всем анкетам и считаете, сколько ответов попало в каждую категорию. Это абсолютная частота (f).

Затем переводите в проценты — относительную частоту:

P = f ÷ N × 100%

где f — число ответов в категории, N — общее число ответов (или респондентов — смотря что вы считали). Проценты нужны, чтобы результат не зависел от размера выборки и читался с первого взгляда.

Пример. В категорию «командность/общение» попало 12 ответов из 30 опрошенных. Доля: P = 12 ÷ 30 × 100% = 40%. То есть для 40% респондентов главное в тренировках — общение и команда.

Важно

Если вы разрешали несколько кодов на один ответ, сумма процентов превысит 100% — это нормально, но обязательно подпишите в таблице: «сумма больше 100%, так как один респондент мог дать несколько ответов». Иначе проверяющий решит, что вы ошиблись в арифметике.

Шаг 4. Оформление в таблицу

Итог обработки открытого вопроса — частотная таблица: категории, абсолютные частоты и проценты. Возьмём наш пример с 30 опрошенными.

Таблица 1 — Что нравится респондентам в тренировках (n = 30, один ответ на человека)

Категория ответа Частота, f Доля, %
Командность и общение 12 40,0
Разнообразие занятий 8 26,7
Личность тренера 5 16,7
Физический результат 3 10,0
Другое 2 6,7
Всего 30 100,0

После таблицы — обязательно вывод словами: чаще всего респонденты ценят в тренировках командность и общение (40%) и разнообразие занятий (26,7%); реже всего звучит мотив конкретного физического результата (10%). На это и стоит опереться в выводах.

Долю по категориям можно наглядно показать столбиками — это убедительнее текста.

40% 27% 17% 10% 7% общение разнообр. тренер результат другое
Рисунок 1 — Распределение ответов по категориям, % от числа опрошенных

Что писать в дипломе

Готовые формулировки — подставьте свои числа:

  • «Ответы на открытый вопрос обрабатывались методом контент-анализа: близкие по смыслу формулировки кодировались и объединялись в категории».
  • «Выделено 5 категорий ответов; распределение по ним представлено в таблице 1».
  • «Наиболее частой категорией стала “командность и общение” — 12 ответов (40,0% опрошенных)».
  • «Полученные данные переведены в относительные частоты для сопоставимости результатов».

Если разрешали несколько ответов на человека, добавьте оговорку: «Сумма долей превышает 100%, так как респондент мог указать несколько вариантов».

Совет

Опишите процедуру кодирования в разделе «Методы», а таблицу с частотами — в «Результатах». Так проверяющий видит, что числа не взяты с потолка, а получены по понятной процедуре.

Частые ошибки

  • Пересказывать ответы вместо подсчёта. «Многие написали про общение» — это не результат. Результат — «40% (12 человек) указали общение».
  • Слишком много категорий. 15 категорий с частотой 1 невозможно анализировать. Укрупняйте.
  • Категории, которые пересекаются. Если ответ с равным правом идёт в две группы — границы размыты, переформулируйте.
  • Проценты без указания базы. Всегда пишите, от чего считаете долю: от числа людей или от числа упоминаний.
  • Терять «Другое». Редкие и непонятные ответы не выбрасывайте — складывайте в категорию «Другое», иначе сумма не сойдётся.
  • Кодировать на ходу без записи. Без таблицы «ответ → код» вы не воспроизведёте логику и не защитите её перед научником.

Частые вопросы

Чем обработка открытого вопроса отличается от закрытого?

В закрытом вопросе категории заданы заранее — вы просто считаете выборы. В открытом категорий нет: их нужно вывести из самих ответов через кодирование, и только потом считать частоты. Закрытый — арифметика, открытый — сначала смысловой анализ, потом арифметика.

Сколько категорий оптимально?

Обычно 4–7 содержательных плюс «Другое». Меньше — теряется детализация, больше — категории мельчают и анализировать нечего. Ориентируйтесь на то, чтобы в каждой основной категории было хотя бы 3–4 ответа.

Что делать, если в одном ответе несколько мыслей?

Поставьте ему несколько кодов. Тогда считайте не людей, а упоминания, и в подписи к таблице укажите, что сумма долей может превышать 100%. Главное — выбрать один принцип (люди или упоминания) и держаться его по всей анкете.

Можно ли сравнить две группы по открытому вопросу?

Да. Закодируйте ответы единым набором категорий для обеих групп, посчитайте доли в каждой и сравните долю интересующей категории критерием Фишера (для одной доли) или хи-квадратом (для всего распределения по категориям).

Нужна ли проверка кодирования вторым человеком?

В строгом исследовании — да: два кодировщика независимо размечают часть ответов, и считают согласованность. В студенческом дипломе обычно достаточно прозрачно описать процедуру и привести таблицу «ответ → код». Подробнее — в статье про контент-анализ.

Короткий алгоритм

  1. Выпишите все ответы списком — дословно.
  2. Закодируйте: рядом с каждым ответом поставьте короткую смысловую метку, близкие сводите к одному коду.
  3. Сгруппируйте коды в 4–7 категорий плюс «Другое»; проверьте полноту и непересекаемость.
  4. Посчитайте частоты f по каждой категории.
  5. Переведите в проценты: P = f ÷ N × 100%.
  6. Сведите в таблицу, добавьте вывод словами; при сравнении групп — Фишер или хи-квадрат.
Вывод

Коротко: прочитать → закодировать → объединить в категории → посчитать частоты → перевести в проценты → таблица с выводом. Открытый вопрос превращается в такие же числа, как закрытый, просто категории вы делаете сами.

Что ещё почитать

Не уверены, как закодировать ответы и оформить таблицу для своей работы — загляните в базу методов или закажите консультацию.

Не хотите разбираться со статистикой сами?

Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.