Корреляционная плеяда: как построить по матрице связей
Как построить корреляционную плеяду из матрицы корреляций: узлы — признаки, линии — значимые связи, толщина и цвет — сила и знак. С примером таблицы, схемой и FAQ.
Вы посчитали корреляции между десятком показателей и получили таблицу-«шахматку» из чисел. Глазами в ней связи не видно: где сильное, где случайное, что с чем связано — всё сливается.
Корреляционная плеяда переводит эту таблицу в наглядную схему: кружки-признаки, соединённые линиями только там, где связь значима. Сразу видно, какой показатель «центральный», а какой стоит особняком.
В двух словах
Корреляционная плеяда — это граф значимых связей: узлы (кружки) — ваши признаки, линии между ними — статистически значимые корреляции. Толщина или цвет линии показывают силу и знак связи.
Строят плеяду в два шага: сначала считают матрицу корреляций (все пары признаков), потом оставляют на схеме только значимые связи. Посчитать коэффициенты можно в калькуляторе корреляции Пирсона, а силу связи расшифровать по шкале Чеддока.
Что такое матрица корреляций
Матрица корреляций — это квадратная таблица, где в каждой клетке стоит коэффициент связи между двумя признаками. Строки и столбцы — это одни и те же показатели.
На главной диагонали всегда стоит 1 (признак коррелирует сам с собой идеально), а таблица симметрична: связь «А с Б» равна связи «Б с А». Поэтому реально читают только половину — верхний или нижний треугольник.
Каждое число — это коэффициент корреляции (чаще всего Пирсона r или Спирмена ρ) в диапазоне от −1 до +1:
- знак говорит о направлении: «+» — растёт один, растёт другой; «−» — растёт один, падает другой;
- модуль говорит о силе: ближе к 1 — связь сильнее, около 0 — связи практически нет.
Матрица сама по себе ещё не плеяда. Плеяда — это её «очищенная» картинка: мы убираем единицы на диагонали, дубли-зеркала и все незначимые связи, а оставшееся рисуем линиями. Матрица — данные, плеяда — визуализация.
Какие связи оставить на схеме
Если соединить все пары подряд, получится «клубок», в котором ничего не разобрать. Поэтому на плеяду наносят только связи, прошедшие два фильтра.
Фильтр 1 — значимость. Связь должна быть статистически достоверной (p ≤ 0,05). Незначимые корреляции — это шум, рисовать их нельзя: они могли возникнуть случайно.
Фильтр 2 — сила (по желанию). Часто дополнительно отсекают слабые связи и оставляют только умеренные и выше (|r| ≥ 0,3 или ≥ 0,5) — чтобы схема не пестрела тонкими ниточками. Порог вы выбираете сами и указываете его в тексте.
Значимость удобно проверять по критическому значению: для уровня p ≤ 0,05 есть табличное r-крит, зависящее от размера выборки. Если |r| ≥ r-крит — связь значима.
Чтобы не искать r-крит по таблицам вручную, считайте каждую пару в калькуляторе корреляции Пирсона: он сразу выдаёт r, p-значение и вывод о значимости. Останется перенести в плеяду только то, что значимо.
Пример: от матрицы к плеяде
Возьмём учебный пример. Исследуем 5 показателей у спортсменов (n = 30): сила, выносливость, скорость, тревожность, мотивация. Посчитали все пары и получили матрицу.
Таблица 1 — Матрица корреляций пяти показателей (Пирсон, n = 30; r-крит = 0,36 при p ≤ 0,05)
| Показатель | Сила | Выносл. | Скорость | Тревожн. | Мотивация |
|---|---|---|---|---|---|
| Сила | 1 | 0,62 | 0,48 | −0,15 | 0,21 |
| Выносл. | 0,62 | 1 | 0,55 | −0,12 | 0,38 |
| Скорость | 0,48 | 0,55 | 1 | −0,41 | 0,19 |
| Тревожн. | −0,15 | −0,12 | −0,41 | 1 | −0,58 |
| Мотивация | 0,21 | 0,38 | 0,19 | −0,58 | 1 |
После таблицы — обязательно вывод словами. Сравниваем каждое число с r-крит = 0,36. Значимы (|r| ≥ 0,36): сила—выносливость (0,62), сила—скорость (0,48), выносливость—скорость (0,55), выносливость—мотивация (0,38), скорость—тревожность (−0,41), тревожность—мотивация (−0,58). Связи 0,21; −0,15; −0,12; 0,19 — незначимы и на схему не пойдут.
Теперь рисуем плеяду: 5 узлов, и между ними — только эти 6 значимых линий. Положительные связи дадим сплошными зелёными, отрицательные — пунктирными красными, а толщину привяжем к силе.
По схеме видно то, что в таблице терялось: выносливость — центральный узел (от неё три связи), а тревожность связана с остальными только отрицательно (чем выше тревожность, тем ниже скорость и мотивация).
Толщина и цвет линий — это не украшение, а часть данных. Обязательно делайте легенду (что значат цвет и толщина) рядом со схемой или в подписи рисунка. Без легенды плеяда не читается.
Как описать плеяду в дипломе
Плеяда — это иллюстрация, но доказывают связи числа из таблицы. Поэтому в тексте всегда идут вместе: таблица матрицы → рисунок плеяды → описание словами.
В описании двигайтесь от сильного к слабому и группируйте по смыслу: какой узел центральный, какие «кусты» связей образовались, есть ли изолированные признаки (без значимых связей вообще).
Силу каждой связи называйте словами по шкале Чеддока: 0,3–0,5 — умеренная, 0,5–0,7 — заметная, 0,7–0,9 — высокая. Это переводит сухие коэффициенты в понятный вывод.
Что писать в дипломе
Готовые формулировки — подставьте свои показатели и числа:
- «Для выявления взаимосвязей между показателями был проведён корреляционный анализ по Пирсону; результаты сведены в корреляционную матрицу (таблица 1)».
- «На основе матрицы построена корреляционная плеяда (рисунок 1), на которую вынесены только статистически значимые связи (p ≤ 0,05, |r| ≥ 0,36)».
- «Выявлена заметная положительная связь между силой и выносливостью (r = 0,62; p < 0,05)».
- «Обнаружена значимая отрицательная связь тревожности с мотивацией (r = −0,58; p < 0,05): рост тревожности сопровождается снижением мотивации».
- «Центральным элементом плеяды выступает выносливость, образующая наибольшее число значимых связей с другими показателями».
Корреляция — это не причинность. Линия в плеяде говорит «эти признаки меняются согласованно», но не «один вызывает другой». Пишите «связан с», «сопровождается», а не «влияет» и «приводит к» — иначе на защите справедливо спросят про доказательства причины.
Частые ошибки
- Рисовать все связи подряд. На плеяду идут только значимые (p ≤ 0,05). Незначимые корреляции — шум, их не наносят.
- Забыть про знак. Положительные и отрицательные связи надо различать цветом или типом линии, иначе вывод исказится.
- Нет легенды. Если не подписать, что значат цвет и толщина линий, схему невозможно прочитать.
- Путать r и ρ. Для нормальных количественных данных берут Пирсона, для рангов или ненормальных — Спирмена. В подписи указывайте, какой коэффициент использован.
- Делать вывод о причине. «Связаны» ≠ «один влияет на другой».
- Сравнивать «голые» r без проверки значимости. r = 0,4 на выборке из 10 человек может быть случайным, а на 100 — нет. Всё решает p-значение.
Частые вопросы
Сколько признаков можно вынести на плеяду?
Оптимально 5–12. Меньше 4 — плеяда не нужна, хватит пары предложений. Больше 12–15 узлов превращают схему в «паутину»: тогда разбивают на несколько плеяд по смысловым блокам или оставляют только сильные связи (|r| ≥ 0,5).
Какой коэффициент использовать — Пирсона или Спирмена?
Если признаки количественные и распределены нормально — Пирсон. Если данные ранговые, порядковые или распределение далеко от нормального — Спирмен. Главное — для всей матрицы один и тот же коэффициент, не смешивайте.
Какой порог силы брать для линий?
Стандартного нет, вы задаёте его сами. Частый вариант: рисовать все значимые связи, а толщиной показывать силу. Если связей слишком много — оставляют только |r| ≥ 0,3 (умеренные и выше). Выбранный порог обязательно указывают в подписи рисунка.
Чем плеяда лучше обычной таблицы?
Таблица точна, но в ней не видно структуры: какой признак центральный, какие группируются вместе. Плеяда показывает это с одного взгляда. Поэтому в дипломе оставляют оба: таблицу — как доказательство, плеяду — как наглядный итог.
В чём рисовать саму схему?
В дипломе достаточно нарисовать узлы и линии в любом редакторе (PowerPoint, Word с фигурами, любой векторный графический редактор). Это не расчёт, а оформление — главное, чтобы числа в основе были посчитаны корректно. Про оформление рисунков есть отдельная статья «Таблицы и рисунки в дипломе».
Короткий алгоритм
- Посчитайте корреляции всех пар признаков — соберите матрицу (таблица 1).
- Отметьте значимые связи (p ≤ 0,05), сравнив каждый r с r-крит для вашего n.
- При желании отсеките слабые: оставьте, например, |r| ≥ 0,3.
- Нарисуйте узлы-признаки и соедините их линиями только по значимым связям.
- Закодируйте знак (цвет/тип линии) и силу (толщину); добавьте легенду.
- Опишите словами: центральный узел, «кусты» связей, изолированные признаки — от сильного к слабому.
Коротко: матрица корреляций → отсев незначимых связей → узлы и линии с легендой → описание от сильного к слабому. Числа считает калькулятор Пирсона, силу называет шкала Чеддока.
Что ещё почитать
- Калькулятор корреляции Пирсона — посчитать r, p-значение и значимость каждой пары.
- Шкала Чеддока: сила связи — как назвать связь словами (слабая, умеренная, заметная, высокая).
- Калькулятор корреляции Спирмена — для ранговых и ненормальных данных.
- Таблицы и рисунки в дипломе — как правильно оформить матрицу и плеяду.
- Описательная статистика в дипломе — характеристики показателей перед корреляцией.
Не уверены, какие связи значимы и как описать плеяду — посчитайте корреляции в калькуляторе, а если нужна помощь под ключ, загляните в базу методов или закажите консультацию.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.