<<
>>

ПАРНАЯ КОРРЕЛЯЦИЯ

Часто при проведении маркетингового исследования нас интересует связь между двумя метрическими переменными, как, например, в следующих ситуациях. • Насколько сильно связан объем продаж с расходами на рекламу? • Существует ли связь между долей рынка и количеством торгового персонала? • Связано ли восприятие качества товаров потребителями с их восприятием цены? В таких ситуациях наиболее широко используемой статистикой является коэффициент пар­ной корреляции, г (product moment correlation г), который характеризует степень тесноты связи между двумя метрическими (измеряемыми с помощью интервальной или относительной шкал) переменными, скажем, .Y и Y.
Этот коэффициент используют, чтобы определить, суще­ствует ли между переменными линейная зависимость. Он показывает степень, в которой ва­риация одной переменной Xсвязана с вариацией другой переменной Y, т.е. меру зависимости между переменными и Коэффициент парной корреляции (product moment correlation r) Статистический показатель, характеризующий степень тесноты связи между скими переменными. Поскольку этот коэффициент первоначально предложил Карл Пирсон (Karl Pearson), его также называют коэффициентом корреляции Пирсона. Кроме того, он известен как простой коэф­фициент корреляции, линейный коэффициент корреляции или просто коэффициент корреляции, Имея выборку, размером п наблюдений, коэффициент парной корреляции для переменных X п У можно вычислить по формуле: 1 1«! ы Разделив числитель и знаменатель на (п ~ 1) получим: ±(Xi-X)(v,-y) 1=1___
ы [r,~yf
п I ы л-1 тт 1
J§(*.-*)lf

J=j л- 1

*

642

В этих уравнениях X и X обозначают выборочные средние, а и Л',.

— соответствующие стандартные отклонения. Г01 представляет собой ытарняшш (соуапапсе) между Xи Y, явля­ясь мерой чпннснмоеш Л'и Y. Ковариация (соуапапсе) Систематическая взаимосвязь между двумя переменными, при ксторсй изменение одной переменной вызывает соответствующее изменение другой переменной (ООУху). Ковариация может быть как положительной, так и отрицательной. Деление на ^5,.приво­дит к нормированному виду, так что коэффициент корреляции г находится в пределах от ми­нус 1 до плюс 1. Обратите внимание, что коэффициент корреляции никак не связан с едини­цами измерения, в которых выражены переменные. Предположим, что исследователь хочет выяснить, зависит ли отношение респондента к ме­стожительству от длительности проживания его в этом городе. Отношение выражают в II балльной шкале (1— не нравится город, 11 — очень нравится город), а продолжительность проживания измеряют количеством лет, которые респондент прожил в этом городе. Получен­ные от I ? респондентов данные приведены в табл. 17.1. Таблица 17.1 Отношение i сти проживания в нем Номер респондента Отношение к городу Длнгеяшшь проживания Влияние погодных условий
1 6 10 3
2 9 12 11
3 8 12 4
4 3 4 1
5 10 12 11
6 4 6 1
1 5 В 7
8 2 а 4
9 11 13 8
10 9 9 10
11 10 17 8
12 2 2 5

Коэффициент корреляции можно вычислить по формуле: —_ (10+12+12+ 4+12+6 + 8+ 2+18+ 9+17+2)_( :_9,333 12 г (6 + 9+8+ 3 + 10 + 4 + 5+ 2+ 11+9+ 10 + 2) 6,583 12 £(*, -*)(*; - У) = (Ю - 9,33) (6 - 6,58) + (12 - 9,33) (9 - 6,58)+ !=1

643

+ ( 12 - 9,33) (8 - 6,58) + (4 - 9,33) (3 - 6,58)+ + (12 - 9,33) (10 -6,58) + (6 - 9,33) (4-6,58)+ + (8 - 9,33) (5 - 6,58) + (2 - 9,33) (2 -6,58)+ + (18 - 9,33) (11 - 6,58) + (9 - 9,33)(9 - 6,58)+ + (17 - 9,33) (10 - 6,58) + (2 - 9,33) (2 - 6,58)+ = - 0,3886 + 6,4614 + 3,7914 + 19,0814+ + 9,1314+ 8,5914 + 2,1014 + 33,5714+ + 38,3214 - 0,7986 + 26,2314 + 33,5714 - 179,6668 Глава Корреляция и регрессия -У) = |6- 6,58)2 + (9 - 6,58)3 + (8 - 6,58)2 + (3 - 6,58) г-1 +(10 - 6,58)2 + (4 - 6,58)2 + (5 - 6,58)2 + (2 - 6,58)2+ + (11 - 6,58)2 + (9 -6,58)2 + (10 - 6,58)2 + (2 -6,58)2= = 0,3364 + 5,8564 + 2,0164 + 12,8164+ + 1 1,6964 + 6,6564 + 2,4964 + 20,9764 + + 19,5364 + 5,8564 + 1 1,6964 + 20,9764 = 120,9168 Таким образом 179.6668 = 0,9361 л/(304.66б8)(120.9168) В этом примере = 0,9361, что близко к 1. Это означает, что отношение респондента к сво­ему городу сильно зависит от времени проживания в нем.

Более того, положительный знак указывает на прямую связь (прямонропорциональную): чем дольше респондент проживает в городе, тем больше он ему нравится, и наоборот. Так как коэффициент корреляции показывает меру, в которой вариация значений одной переменной зависит от вариации другой, то можно выразить через разложение полной вариа­ции (см. главу 16). Другими словами, объяснимое изменение г = полная вариация _ полная вариация - вариация ошибки _ полная вариация
Л' ) = (10 - 9,33)2 + (12 -9,33)2 + (12 -9,33)2 + (4 - 9,33)2

Ы + (12 9,33)2 + (6 -9,33)2 + (8 -9,33)2 + (2 -9,33)2 + + (18 -9,33)3 + (9 -9,33)2 + (17 -9,33)2 + (2-9,33)г = = 0,4489 + 7,1289 + 7,1289 + 28,4089+ + 7,1289 + 11,0889 + 1,7689 + 53,7289+ + 75. 1689 + 0,1089 + 58,8289 + 53,7289 = 304,6668

Следовательно, г показывает, какая доля вариации одной переменной обусловлена вариа­цией другой. Иг, и г являются симметричными показателями связи между переменными. Иначе говоря, корреляция между Л' и га же, что и корреляция между X. Корреляция не за­висит от того, какая из переменных взята в качестве зависимой, а какая в качестве независи­мой. Коэффициент корреляции является мерой линейной зависимости, и он не предназначен для измерения силы связи в случае нелинейной зависимости. Таким образом, г = 0 просто оз­начает отсутствие линейной зависимости между Xи У Это не означает, что X и У не взаимо­связаны. Между ними может существовать нелинейная зависимость, которую нельзя опреде­лить с помощью коэффициента корреляции (рис.

644

Если коэффициент корреляции вычисляют не для выборки, а для всей генеральной сово­купности, то он обозначается греческой буквой р (ро).

Коэффициент г — это оценка р. Обрати­те внимание, что расчет предполагает, что Xи У— метрические переменные, кривые распре­деления которых имеют одинаковую форму. Если эти допущения не удовлетворяются, то зна­чение уменьшается и р получается недооцененным. В маркетинговых исследованиях данные, полученные с использованием относительной шкалы при небольшом числе категорий, могут не быть строго интервальными. Это приведет к снижению и недооценкер [3].

Рис. 1. Нелинейная зависимость, для которой г = О Статистическую значимость связи между двумя переменными, измеренную коэффициен том корреляции г. можно легко проверить. Гипотезы имеют такой вид: //,:>!* О Статистику, лежащую в основе критерия для проверки гипотезы, вычисляют по формуле: / = г 1 -г которая имеет /-распределение с п — 2 степенями свободы [4]. Для коэффициента корреля­ции, вычисленного на основе данных, приведенных в табл. ! 7,1, значение / статистики равно:

I = 0,9361

= 8,414 ,

12-2 (0.9361)2

а число степеней свободы: — 12 — 2 = 10. Из таблицы ;-распределения (табл. 4 Статистического приложения) критическое значение (-статистики для двусторонней проверки и уровне значи­мости а = 0,05 равно 2,228. Следовательно, нулевую гипотезу об отсутствии связи между пере­менными .V и У отклоняют. Это наряду с положительным знаком коэффициента корреляции показывает, что отношение респондента к своему городу прямо пропорционально зависит от проде:1ж.ителв'гЮстн проживания его в городе. Более того, высокое значение показывает, что эта связь

645

При выполнении многомерного анализа данных часто полезно изучить простую корреля­цию между каждой парой переменных.

Эти результаты представляют в форме корреляционной матрицы, которая показывает коэффициент корреляции между каждой парой данных. Обыч­но, рассматривают только самую нижнюю треугольную часть матрицы. Все элементы по диаго­нали равны так как переменная коррелирует сама с собой. Верхняя треугольная часть мат­рицы — зеркальное отражение нижней треугольной части матрицы, поскольку симметрич­ный показатель связи между переменными. Форма корреляционной матрицы для пяти переменных от до представлена ниже:

Уг 0,5
ъ 0,3 0,4
Уа 0,1 0,3 0,6
V, 0,2 0,5 0,3 0,7

Хотя шприца простых коэффициентов корреляций позволяет уяснить суть попарных свя­зей, иногда исследователю хочется изучить связи между двумя переменными при условии управления одной или несколькими переменными. В последнем случае следует оценивать ча­стную корреляцию .

<< | >>
Источник: Нэреш К. Малхотра. Маркетинговые исследования. Практическое руководство. 3-е изд., пер. с англ. - М.: — 960 с.. 2002

Еще по теме ПАРНАЯ КОРРЕЛЯЦИЯ:

  1. 5.1. Способ парной корреляции
  2. Корреляция
  3. 1.3. Расчет коэффициента парной корреляции и его статистическая проверка
  4. 1.4. О ложной корреляции (влияние «третьего фактора»)
  5. § 1. Понятие статистических взаимосвязей и причинности
  6. § 3. Парная линейная корреляция
  7. § 1. Понятие статистических взаимосвязей и причинности
  8. § 3. Парная линейная корреляция
  9. § 16.7.1. Испытание гипотезы для оценки линейности связи на основе оценки коэффициента корреляции в генеральной совокупности
  10. 12.4. Парный регрессионный анализ
  11. 37. Метод корреляции трендов
  12. 7.3.2. Модифицированный метод парной регрессии
  13. ПАРНАЯ КОРРЕЛЯЦИЯ
  14. ЧАСТНАЯ КОРРЕЛЯЦИЯ
  15. НЕМЕТРИЧЕСКАЯ КОРРЕЛЯЦИЯ
  16. ПАРНАЯ РЕГРЕССИЯ
  17. СТАТИСТИКИ, СВЯЗАННЫЕ С ПАРНЫМ РЕГРЕССИОННЫМ АНАЛИЗОМ
  18. ВЫПОЛНЕНИЕ ПАРНОГО РЕГРЕССИОННОГО АНАЛИЗА
  19. 3.8. Частные уравнения регрессии. Частная корреляция