ПАРНАЯ КОРРЕЛЯЦИЯ
ы | [r,~yf | |
п I ы | л-1 тт 1 | |
J§(*.-*)lf |
J=j л- 1 |
*
642 |
В этих уравнениях X и X обозначают выборочные средние, а и Л',.
— соответствующие стандартные отклонения. Г01 представляет собой ытарняшш (соуапапсе) между Xи Y, являясь мерой чпннснмоеш Л'и Y. Ковариация (соуапапсе) Систематическая взаимосвязь между двумя переменными, при ксторсй изменение одной переменной вызывает соответствующее изменение другой переменной (ООУху). Ковариация может быть как положительной, так и отрицательной. Деление на ^5,.приводит к нормированному виду, так что коэффициент корреляции г находится в пределах от минус 1 до плюс 1. Обратите внимание, что коэффициент корреляции никак не связан с единицами измерения, в которых выражены переменные. Предположим, что исследователь хочет выяснить, зависит ли отношение респондента к местожительству от длительности проживания его в этом городе. Отношение выражают в II балльной шкале (1— не нравится город, 11 — очень нравится город), а продолжительность проживания измеряют количеством лет, которые респондент прожил в этом городе. Полученные от I ? респондентов данные приведены в табл. 17.1. Таблица 17.1 Отношение i сти проживания в нем Номер респондента Отношение к городу Длнгеяшшь проживания Влияние погодных условий1 | 6 | 10 | 3 |
2 | 9 | 12 | 11 |
3 | 8 | 12 | 4 |
4 | 3 | 4 | 1 |
5 | 10 | 12 | 11 |
6 | 4 | 6 | 1 |
1 | 5 | В | 7 |
8 | 2 | а | 4 |
9 | 11 | 13 | 8 |
10 | 9 | 9 | 10 |
11 | 10 | 17 | 8 |
12 | 2 | 2 | 5 |
Коэффициент корреляции можно вычислить по формуле: —_ (10+12+12+ 4+12+6 + 8+ 2+18+ 9+17+2)_( :_9,333 12 г (6 + 9+8+ 3 + 10 + 4 + 5+ 2+ 11+9+ 10 + 2) 6,583 12 £(*, -*)(*; - У) = (Ю - 9,33) (6 - 6,58) + (12 - 9,33) (9 - 6,58)+ !=1
643 |
+ ( 12 - 9,33) (8 - 6,58) + (4 - 9,33) (3 - 6,58)+ + (12 - 9,33) (10 -6,58) + (6 - 9,33) (4-6,58)+ + (8 - 9,33) (5 - 6,58) + (2 - 9,33) (2 -6,58)+ + (18 - 9,33) (11 - 6,58) + (9 - 9,33)(9 - 6,58)+ + (17 - 9,33) (10 - 6,58) + (2 - 9,33) (2 - 6,58)+ = - 0,3886 + 6,4614 + 3,7914 + 19,0814+ + 9,1314+ 8,5914 + 2,1014 + 33,5714+ + 38,3214 - 0,7986 + 26,2314 + 33,5714 - 179,6668 Глава Корреляция и регрессия -У) = |6- 6,58)2 + (9 - 6,58)3 + (8 - 6,58)2 + (3 - 6,58) г-1 +(10 - 6,58)2 + (4 - 6,58)2 + (5 - 6,58)2 + (2 - 6,58)2+ + (11 - 6,58)2 + (9 -6,58)2 + (10 - 6,58)2 + (2 -6,58)2= = 0,3364 + 5,8564 + 2,0164 + 12,8164+ + 1 1,6964 + 6,6564 + 2,4964 + 20,9764 + + 19,5364 + 5,8564 + 1 1,6964 + 20,9764 = 120,9168 Таким образом 179.6668 = 0,9361 л/(304.66б8)(120.9168) В этом примере = 0,9361, что близко к 1. Это означает, что отношение респондента к своему городу сильно зависит от времени проживания в нем.
Более того, положительный знак указывает на прямую связь (прямонропорциональную): чем дольше респондент проживает в городе, тем больше он ему нравится, и наоборот. Так как коэффициент корреляции показывает меру, в которой вариация значений одной переменной зависит от вариации другой, то можно выразить через разложение полной вариации (см. главу 16). Другими словами, объяснимое изменение г = полная вариация _ полная вариация - вариация ошибки _ полная вариацияЛ' ) = (10 - 9,33)2 + (12 -9,33)2 + (12 -9,33)2 + (4 - 9,33)2 |
Ы + (12 9,33)2 + (6 -9,33)2 + (8 -9,33)2 + (2 -9,33)2 + + (18 -9,33)3 + (9 -9,33)2 + (17 -9,33)2 + (2-9,33)г = = 0,4489 + 7,1289 + 7,1289 + 28,4089+ + 7,1289 + 11,0889 + 1,7689 + 53,7289+ + 75. 1689 + 0,1089 + 58,8289 + 53,7289 = 304,6668 |
Следовательно, г показывает, какая доля вариации одной переменной обусловлена вариацией другой. Иг, и г являются симметричными показателями связи между переменными. Иначе говоря, корреляция между Л' и га же, что и корреляция между X. Корреляция не зависит от того, какая из переменных взята в качестве зависимой, а какая в качестве независимой. Коэффициент корреляции является мерой линейной зависимости, и он не предназначен для измерения силы связи в случае нелинейной зависимости. Таким образом, г = 0 просто означает отсутствие линейной зависимости между Xи У Это не означает, что X и У не взаимосвязаны. Между ними может существовать нелинейная зависимость, которую нельзя определить с помощью коэффициента корреляции (рис.
644 |
Если коэффициент корреляции вычисляют не для выборки, а для всей генеральной совокупности, то он обозначается греческой буквой р (ро).
Коэффициент г — это оценка р. Обратите внимание, что расчет предполагает, что Xи У— метрические переменные, кривые распределения которых имеют одинаковую форму. Если эти допущения не удовлетворяются, то значение уменьшается и р получается недооцененным. В маркетинговых исследованиях данные, полученные с использованием относительной шкалы при небольшом числе категорий, могут не быть строго интервальными. Это приведет к снижению и недооценкер [3].
Рис. 1. Нелинейная зависимость, для которой г = О Статистическую значимость связи между двумя переменными, измеренную коэффициен том корреляции г. можно легко проверить. Гипотезы имеют такой вид: //,:>!* О Статистику, лежащую в основе критерия для проверки гипотезы, вычисляют по формуле: / = г 1 -г которая имеет /-распределение с п — 2 степенями свободы [4]. Для коэффициента корреляции, вычисленного на основе данных, приведенных в табл. ! 7,1, значение / статистики равно:
I = 0,9361 |
= 8,414 , |
12-2 (0.9361)2
а число степеней свободы: — 12 — 2 = 10. Из таблицы ;-распределения (табл. 4 Статистического приложения) критическое значение (-статистики для двусторонней проверки и уровне значимости а = 0,05 равно 2,228. Следовательно, нулевую гипотезу об отсутствии связи между переменными .V и У отклоняют. Это наряду с положительным знаком коэффициента корреляции показывает, что отношение респондента к своему городу прямо пропорционально зависит от проде:1ж.ителв'гЮстн проживания его в городе. Более того, высокое значение показывает, что эта связь
645 |
При выполнении многомерного анализа данных часто полезно изучить простую корреляцию между каждой парой переменных.
Эти результаты представляют в форме корреляционной матрицы, которая показывает коэффициент корреляции между каждой парой данных. Обычно, рассматривают только самую нижнюю треугольную часть матрицы. Все элементы по диагонали равны так как переменная коррелирует сама с собой. Верхняя треугольная часть матрицы — зеркальное отражение нижней треугольной части матрицы, поскольку симметричный показатель связи между переменными. Форма корреляционной матрицы для пяти переменных от до представлена ниже:
Уг | 0,5 | |||
ъ | 0,3 | 0,4 | ||
Уа | 0,1 | 0,3 | 0,6 | |
V, | 0,2 | 0,5 | 0,3 | 0,7 |
Хотя шприца простых коэффициентов корреляций позволяет уяснить суть попарных связей, иногда исследователю хочется изучить связи между двумя переменными при условии управления одной или несколькими переменными. В последнем случае следует оценивать частную корреляцию .
Еще по теме ПАРНАЯ КОРРЕЛЯЦИЯ:
- 5.1. Способ парной корреляции
- Корреляция
- 1.3. Расчет коэффициента парной корреляции и его статистическая проверка
- 1.4. О ложной корреляции (влияние «третьего фактора»)
- § 1. Понятие статистических взаимосвязей и причинности
- § 3. Парная линейная корреляция
- § 1. Понятие статистических взаимосвязей и причинности
- § 3. Парная линейная корреляция
- § 16.7.1. Испытание гипотезы для оценки линейности связи на основе оценки коэффициента корреляции в генеральной совокупности
- 12.4. Парный регрессионный анализ
- 37. Метод корреляции трендов
- 7.3.2. Модифицированный метод парной регрессии
- ПАРНАЯ КОРРЕЛЯЦИЯ
- ЧАСТНАЯ КОРРЕЛЯЦИЯ
- НЕМЕТРИЧЕСКАЯ КОРРЕЛЯЦИЯ
- ПАРНАЯ РЕГРЕССИЯ
- СТАТИСТИКИ, СВЯЗАННЫЕ С ПАРНЫМ РЕГРЕССИОННЫМ АНАЛИЗОМ
- ВЫПОЛНЕНИЕ ПАРНОГО РЕГРЕССИОННОГО АНАЛИЗА
- 3.8. Частные уравнения регрессии. Частная корреляция