Частная (парциальная) корреляция: что это и пример
Что такое частная парциальная корреляция, зачем убирать влияние третьей переменной (возраста, стажа) и как отличить настоящую связь от ложной. С формулой, примером и FAQ.
Вы посчитали корреляцию между двумя переменными и получили красивый коэффициент. Но что, если на обе влияет что-то третье — возраст, стаж, рост — и вся связь держится именно на нём?
Частная (парциальная) корреляция отвечает на этот вопрос: она показывает связь двух переменных, когда влияние третьей «заморожено».
В двух словах
Частная (парциальная) корреляция — это связь между X и Y при условии, что мы убрали влияние третьей переменной Z. Её ещё называют «корреляция при контроле Z».
Если обычная (парная) корреляция между X и Y высокая, а частная — почти нулевая, значит связь была не настоящей: её создавала Z. Это прямой способ поймать ложную корреляцию.
Парную корреляцию для пар X-Y, X-Z, Y-Z удобно посчитать в калькуляторе корреляции Пирсона — из этих трёх чисел и получается частный коэффициент.
Зачем убирать влияние третьей переменной
Представьте, что вы изучаете связь словарного запаса ребёнка и размера его стопы. Корреляция выйдет высокой — но это бессмыслица. На оба показателя влияет возраст: старшие дети и говорят лучше, и ногу имеют больше.
Стоит «зафиксировать» возраст — сравнивать детей одного возраста между собой — и связь словарного запаса со стопой исчезает. Вот это и делает частная корреляция математически, без ручного деления на возрастные группы.
Контролируемая переменная Z — это та, чьё влияние вы хотите вычесть. Чаще всего в дипломах это:
- Возраст — влияет почти на всё в психологии и физиологии;
- Стаж / класс / курс — растёт вместе со многими показателями;
- Рост и вес — тянут за собой силовые и функциональные пробы;
- Пол — иногда контролируют как фоновый фактор.
Контролировать можно не только одну переменную. Если убираете влияние сразу двух и более — это уже частная корреляция высокого порядка. Но в студенческих работах почти всегда хватает одной Z (это «частная корреляция первого порядка»).
Формула: как считается частная корреляция
Чтобы получить частный коэффициент, не нужны сырые данные — достаточно трёх обычных корреляций Пирсона между всеми парами переменных:
r(XY·Z) = (r(XY) − r(XZ) · r(YZ)) / √((1 − r(XZ)²) · (1 − r(YZ)²))
где:
- r(XY) — обычная (парная) корреляция X и Y;
- r(XZ) — корреляция X с контролируемой переменной Z;
- r(YZ) — корреляция Y с контролируемой переменной Z;
- r(XY·Z) — искомая частная корреляция X и Y при контроле Z (точка с Z читается «при фиксированном Z»).
Идея формулы простая: из связи X-Y вычитают ту часть, которую можно объяснить через Z (это произведение r(XZ)·r(YZ)), а знаменатель нормирует результат обратно в диапазон от −1 до +1.
Считать вручную не обязательно. Посчитайте три парные корреляции в калькуляторе Пирсона, подставьте в формулу — и получите частный коэффициент за минуту. Главное не перепутать, какая переменная контролируется (стоит после точки).
Развёрнутый пример с числами
Студентка изучает связь тревожности (X) и успеваемости (Y) у студентов. Подозревает, что обе зависят от уровня стресса перед сессией (Z).
Шаг 1. Считаем три парные корреляции (например, в калькуляторе Пирсона):
Таблица 1 — Исходные парные корреляции (n = 40)
| Пара | Что связываем | Коэффициент r |
|---|---|---|
| X-Y | тревожность ↔ успеваемость | −0,52 |
| X-Z | тревожность ↔ стресс | 0,70 |
| Y-Z | успеваемость ↔ стресс | −0,60 |
Видно, что «на первый взгляд» тревожность заметно связана с успеваемостью: r(XY) = −0,52, связь средней силы.
Шаг 2. Убираем влияние стресса. Подставляем в формулу:
r(XY·Z) = (−0,52 − 0,70 · (−0,60)) / √((1 − 0,70²) · (1 − 0,60²))
Числитель: −0,52 − (−0,42) = −0,52 + 0,42 = −0,10.
Знаменатель: √((1 − 0,49) · (1 − 0,36)) = √(0,51 · 0,64) = √0,3264 ≈ 0,571.
r(XY·Z) = −0,10 / 0,571 ≈ −0,18
Шаг 3. Сравниваем. Было −0,52, стало −0,18. Связь почти растворилась.
Вывод примера: бо́льшую часть связи тревожности и успеваемости объяснял стресс. Когда мы его «заморозили», самостоятельная связь между тревожностью и успеваемостью оказалась слабой (−0,18). Делать вывод «тревожность портит оценки» было бы преувеличением — корень в стрессе.
Как интерпретировать результат
Сравнение парного и частного коэффициента даёт три типичных сценария.
- Частная ≈ 0, а парная была сильной. Связь была ложной: её целиком создавала Z. Самостоятельной связи X и Y нет (как в нашем примере: −0,52 → −0,18).
- Частная заметно меньше парной, но не ноль. Z объясняет часть связи. Остаток — собственная связь X и Y.
- Частная почти не изменилась. Связь X и Y настоящая и от Z не зависит — это сильный аргумент в дипломе.
Силу самого частного коэффициента читают по тем же порогам, что и обычный: до 0,3 — слабая, 0,3–0,5 — умеренная, 0,5–0,7 — заметная, выше 0,7 — сильная.
Связь с ложной корреляцией
Ложная (мнимая) корреляция — это когда X и Y коррелируют не потому, что связаны друг с другом, а потому, что оба зависят от общей причины Z. Классика — «мороженое и утопления»: оба растут летом, общая причина — жара.
Частная корреляция — это инструмент проверки на такую ловушку. Вы берёте подозрительную переменную Z (жару, возраст, стаж), контролируете её — и смотрите, осталась ли связь.
Частная корреляция проверяет только ту Z, которую вы сами вписали. Если настоящая общая причина — другая переменная, а вы её не измерили и не проконтролировали, метод её не поймает. Поэтому Z подбирают с опорой на теорию, а не наугад.
Подробный разбор самого явления и других способов с ним бороться — в статье «Ложная корреляция».
Что писать в дипломе
Готовые формулировки — подставьте свои числа:
- «Для исключения влияния возраста рассчитана частная корреляция тревожности и успеваемости при контроле уровня стресса».
- «Парная корреляция составила r = −0,52 (p < 0,05); после контроля переменной "стресс" частный коэффициент снизился до r(XY·Z) = −0,18 и утратил значимость».
- «Снижение коэффициента при контроле третьей переменной указывает на то, что значительная часть исходной связи опосредована уровнем стресса».
- «Частная корреляция сохранилась на уровне r = 0,48, что подтверждает самостоятельный характер связи независимо от стажа».
Коротко для диплома: укажите парный коэффициент, контролируемую переменную, частный коэффициент и вывод — стала связь слабее, исчезла или устояла. Этого достаточно, чтобы показать: вы проверили данные на скрытую причину.
Частые ошибки
- Контролировать переменную «для красоты». Z выбирают по теории (есть причина думать, что она влияет на X и Y), а не перебором всех подряд.
- Путать, что контролируется. В записи r(XY·Z) после точки стоит убираемая переменная. Поменяете местами — получите другой смысл.
- Считать частную корреляцию причинностью. Даже устоявшая связь — это всё ещё корреляция, а не доказательство «X вызывает Y».
- Брать частную корреляцию Пирсона на ненормальных данных. Формула — для линейных связей и количественных шкал; для рангов и порядковых шкал берут ранговый вариант (на основе Спирмена).
- Контролировать слишком много переменных при маленькой выборке. На каждую Z нужны «лишние» наблюдения, иначе результат неустойчив.
Частые вопросы
Чем частная корреляция отличается от обычной?
Обычная (парная) корреляция меряет связь X и Y «как есть», вместе со всеми посторонними влияниями. Частная — ту же связь, но с вычтенным влиянием выбранной переменной Z. Это как сравнивать людей одного возраста вместо всех подряд.
Сколько переменных можно контролировать?
Сколько угодно, но на практике в студенческих работах хватает одной (реже двух). Каждая добавленная Z требует больше данных и усложняет интерпретацию. Если контролируемых факторов много, удобнее перейти к множественной регрессии.
Можно ли считать частную корреляцию для рангов?
Да. Если данные порядковые или связь нелинейная, считают три ранговые корреляции Спирмена и подставляют их в ту же формулу — получится частная ранговая корреляция.
Если частная корреляция выросла, а не упала — это нормально?
Да, такое бывает. Это значит, что Z «маскировала» связь (эффект подавления). После её контроля настоящая связь X и Y проявилась сильнее. Редкий, но валидный результат — опишите его честно.
Чем частная корреляция отличается от регрессии?
Частная корреляция отвечает на вопрос «есть ли связь X и Y без учёта Z». Множественная регрессия идёт дальше — строит уравнение, по которому Y можно прогнозировать сразу по нескольким предикторам. Если задача — именно прогноз, берите регрессию.
Короткий алгоритм
- Назовите переменные: X и Y (что связываем) и Z (что хотим «заморозить»).
- Посчитайте три парные корреляции — r(XY), r(XZ), r(YZ) — в калькуляторе Пирсона.
- Подставьте их в формулу частной корреляции r(XY·Z).
- Сравните частный коэффициент с парным: исчез → связь была ложной; ослаб → Z влияет частично; устоял → связь настоящая.
- Опишите вывод словами и укажите, какую переменную контролировали.
Что ещё почитать
- Калькулятор корреляции Пирсона — посчитать три парные корреляции для формулы.
- Ложная корреляция — почему две переменные «связаны» через скрытую третью и как это ловить.
- Множественная регрессия — когда контролируемых факторов много и нужен прогноз.
- Корреляция Спирмена — ранговый вариант для порядковых данных.
- База методов StatBlank — все калькуляторы и методики в одном месте.
Не уверены, какую переменную контролировать и как описать результат в дипломе — загляните в базу методов или закажите консультацию.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.