Этапы выполнения факторного анализа приведены на рис. Рис. 19 I. Выполнение факторного анализа |
Первый этап состоит в формулировании проблемы факторного анализа и определении переменных, подвергаемых факторному анализу. Затем строится корреляционная матрица переменных и выбирается метод факторного анализа. Исследователь выбирает число факторов, которые следует выделить, и метод вращения факторов. Далее повернутые факторы следует интерпретировать. В зависимости от целей, можно вычислить значения факторов или отобрать псремстшые-зачснители для представления факторов в последующем многомерном анализе. И наконец, смотрят, насколько хорошо подогнана факторная модель. Мы обсудим эти этапы подробнее в следующих разделах [5]. Формулировка проблемы Формулировка проблемы включает несколько задач. Во-первых, четкое определение целей факторного анализа. Переменные, подвергаемые факторному анализу, задаются исходя из прошлых исследований, теоретических выкладок и по усмотрению исследователя. Важно, чтобы переменные измерялись в интервальной или относительной шкале. Выборка должна быть подходящего размера. Опыт подсказывает, что рекомендуется брать выборку, по крайней мере, в четыре или пять раз больше, чем число переменных [6]. Часто при маркетинговых исследованиях размер выборки мал, и это отношение значительно меньше. В таких случаях следует осторожно интерпретировать результаты. Для иллюстрации факторного анализа предположим, что исследователь хочет определить основные преимущества, которые потребители хотят получить, покупая определенную зубную пасту. Маркетологи опросили в торговом центре 30 респондентов. Их попросили указать, используя семибалльную шкалу (1 — полностью несогласен, 7 — полностью согласен), степень согласия со следующими утверждениями: У1 — важно приобрести зубную пасту, которая предотвращает развитие кариеса; У2 — мне нравится зубная паста, которая придает зубам белизну; — зубная паста должна укреплять десна; У4 — я предпочитаю зубную пасту, которая освежает дыхание; У} — предотвращение порчи зубов не является важным преимуществом данной зубной пасты; Уь — наиболее важной причиной покупки данной зубной пасты является способность зубной пасты улучшать внешний вид зубов.
Полученные данные приведены в табл. 19.1. На основании этих оценок построена корреляционная матрица. Таблица Рейтинги характеристик зубной пасты ло семибалльной шкале Номер респондента | V, | Чг | V, | V, | V! | V* |
1 | 7,00 | 3,00 | 6,00 | 4,00 | 2,00 | 4,00 |
2 | 1,00 | 3,00 | 2,00 | 4,00 | 5,00 | 4.00 |
3 | 6,00 | 2,00 | 7,00 | 4,00 | 1,00 | 3,00 |
4 | 4,00 | 5,00 | 4,00 | 6,00 | 2,00 | 5,00 |
5 | 1,00 | 2,00 | 2,00 | 3,00 | 6,00 | 2,00 |
6 | 6,00 | 3,00 | 6,00 | 4,00 | 2 ,00 | 4,00 |
7 | 5,00 | 3,00 | 6,00 | 3,00 | 4,00 | 3,00 |
а | 6,00 | 4,00 | 7,00 | 4,00 | 1,00 | 4,00 |
9 | 3,00 | 4,00 | 2,00 | 3,00 | 6,00 | 3,00 |
10 | 2,00 | 6,00 | 2,00 | 6,00 | 7,00 | 6,00 |
11 | 6,С0 | 4,00 | 7,00 | 3,00 | 2,00 | 3,00 |
12 | 2,00 | 3,00 | 1,00 | 4,00 | 5,00 | 4.00 |
13 | 7,00 | 2,00 | 6,00 | 4,00 | 1,00 | 3,00 |
14 | 4,00 | 6,00 | 4,00 | 5,00 | 3,00 | 6,00 |
15 | 1,00 | 3,00 | 2,00 | 2,00 | 6,00 | 4,00 |
16 | 6,00 | 4,00 | 6,00 | 3,00 | 3,00 | 4,00 |
17 | 5,00 | 3,00 | 6,00 | 3,00 | 3,00 | 4,00 |
18 | 7,00 | 3,00 | 7,00 | 4,00 | 1,00 | 4,00 |
19 | 2,00 | 4,00 | 3,00 | 3,00 | 6,00 | 3,00 |
20 | 3,00 | 5,00 | 3,00 | 6,00 | 4,00 | 6,00 |
21 | 1,00 | 3,00 | 2,00 | 3,00 | 5,00 | 3,00 |
22 | 5,00 | 4,00 | 5,00 | 4,00 | 2,00 | 4,00 |
23 | 2,00 | 2,00 | 1,00 | 5,00 | 4,00 | 4,00 |
24 | 4,00 | 6,00 | 4,00 | 6,00 | 4,00 | 7,00 |
25 | 6,00 | 5,00 | 4,00 | 2,00 | 1,00 | 4,00 |
26 | 3,00 | 5,00 | 4,00 | 6,00 | 4,00 | 7,00 |
27 | 4,00 | 4,00 | 7,00 | 2,00 | 2,00 | 5,00 |
28 | 3,00 | 6,00 | 2,00 | 6,00 | 4,00 | 3,00 |
29 | 4,00 | 7,00 | 3,00 | 7,00 | 2,00 | 7,00 |
30 | 2,00 | 3,00 | 2,00 | 4,00 | 7,00 | 2,00 |
Построение корреляционной матрицы В основе нашего анализа лежит матрица корреляций между переменными.
Ее анализ дает маркетологам ценную информацию. Целесообразность выполнения факторного анализа определяется наличием корреляций между переменными. На практике так обычно и бывает. Если же корреляции между всеми переменными небольшие, то факторный анализ бесполезен. Следует также ожидать, что переменные, тесно взаимосвязанные между собой, должны также тесно коррелировать с одним и тем же фактором или факторами. Для проверки целесообразности использования факторной модели анализа зависимости перменных существует несколько статистик. С помощью критерия сферичности Бартлетта проверяется нулевая гипотеза об отсутствии корреляций между переменными в генеральной совокупности: другими словами, рассматривается утверждение о том, что корреляционная матрица совокупности — это единичная матрица, в которой все диагональные элементы равны 1, а все остальные равны 0. Проверка с помощью критерия сферичности основана на преобразовании детерминанта корреляционной матрицы в статистику хи-квадрат. При большом значении статистики нулевую гипотезу отклоняют. Если же нулевую гипотезу не отклоняют, то целесообразность выполнения факторного анализа вызывает сомнения. Другая полезная статистика — критерий адекватности выборки Капчсра-Мснора-Олкииа (КМО). Данный коэффициент сравнивает значения наблюдаемых коэффициентов корреляции со значениями частных коэффициентов корреляции. Небольшие значения указывают на то, что корреляции между парами переменных нельзя объяснить другими переменными и что использование факторного анализа нецелесообразно. Корреляционная матрица, построенная на основании данных, полученных из рес пондентов о преимуществах различных видов зубной пасты, показана в табл. 19.2. Таблица 19.2. Корреляционная матрица Переменные | VI | V: | V, | V* | V* | Ув | |
V, V: 1/а | 1,00 - 0,053 0,873 | 1,00 -0,155 | 1,00 | | | | |
1/д | - 0,086 | 0,572 | - 0,248 | 1,00 | | | |
| - 0,858 | 0,020 | - 0,778 | -0,007 | 1,00 | | |
| 0,004 | 0,640 | -0,018 | 0,640 | -0,136 | 1,00 | |
Из данных табл.
19.2 видно, что относительно высокое значение корреляции наблюдается между (предотвращение кариеса), (укрепление десен) и (предотвращение порчи зубов). Можно ожидать, что эти переменные коррелируют с одним и тем же набором факторов. Аналогично, относительно высокие корреляции наблюдаются между (отбеливание зубов), (свежее дыхание) и (привлекательность внешнего вида зубов). Также можно ожидать, что эти переменные коррелируют с одними и теми же факторами [7]. Результаты факторного анализа приведены в табл. 19.3. Нулевую гипотезу о том, что корреляционная матрица совокупности является единичной матрицей, отклоняют в соответствии с критерием сферичности Бартлетта. Приближенное значение статистики хи-квадрат равно 111,314 с 15-ю степенями свободы, она является значимой при уровне 0,05. Значение статистики КМО (0,660) также большое (> 0,5). Таким образом, факторный анализ можно рассматривать как приемлемый метод для анализа корреляционной матрицы табл. 19.2. Таблица 19.3. Результаты анализа главных компонент Критерий сферичности Барі лоті а Приближенное значение статистики ки-яаздрат -• 111,314; число степеней свободы - 15; значимость - 0,00000 Критерий адекватности выборки Кайзера-Меііера-Омина - 0,660 Общности
Часть III. Сбор, подготовка и анализ данных |
Переменная Начальная Выделенная 1,000 0,926 1,000 0,723 ^ 1,000 0,894 1,000 0,739 1,000 0,878 1,000 0,790 Исходныесо&таскныезначения • Фактор Собсгвёхшов значение Процент дисперсии Кумулятивный процент 1 2,731 45,520 45,520 2 2,215 36,969 82,488 3 0,442 7,360 89,848 4 0,341 5,688 95,536 5 0,183 3,044 98,580 6 0,085 1,420 100,000 Сумма ивэдрагов нагрузок для выделенных факторов Фактор Собственное значение Процент дисперсии Кумулятивный процент 1 2,731 45,520 45,520 2 2,218 36,969 82,488 Матрица факторных нагрузок Фактор 1 Фактор 2 0,928 0,253 0,795 0,936 0,131 - 0,342 0,789 1/5 - 0,869 - 0,351 -0,177 0,871 Суммы квадратов факторных нагрузок после вращения факторов Фактор Собственное значение Процент дисперсии Кумулятивный процент 1 2,688 44,802 44,802 2 2,261 37,687 82,488 Матрица фа* торны* нагрузок после вращения факторов Фактор 1 Фактор 2 ^ 0962 - 0,027 \1г -0,057 0,848 П 0,934 V* -0,098 0,854 V; -0,933
0,083 0,885 Матрица коэффициента значения факторов
Фактор 1 Фактор 2 0,358 | | 0,011 | | | | V2 -0,001 | | 0,375 | | | | V3 0,345 | | - 0,043 | | | | I'.i -0,017 | | 0,377 | | | | Vs - 0,350 | | - 0,059 | | | | Vs 0,052 | | 0,395 | | | | Вычисленная хорреляцтннататрица | | | | | Vі | Ь | Ь | v4 | V) | V» | V, 0,926е | 0,024 | - 0,029 | 0,031 | 0,038 | - 0,053 | - ao/s | 0,723* | 0,022 | -0,158 | 0,038 | -0,105 | V, 0,902 | -0,177 | 0,894* | - 0,031 | 0,081 | 0,033 | V4 -0,117 | 0,730 | -0,217 | 0,739* | - 0,027 | -0,107 | - 0,895 | -0,01В | 0,859 | 0,020 | 0,878* | 0,016 | 0,057 | 0,746 | -0,051 | 0,748 | -0,152 | 0,790* | |
"Нижний левый треугольник содержит вычисленную корреляционную матрицу; диагональ - общности; верхний правый треугольник — остатки между наблюдаемыми и вычисленными корреляциями.
Определение метода факторного анализа Поскольку установлено, что факторный анализ подходит для анализа данных, необходимо выбрать соответствующий метод его выполнения. Различные методы факторного анализа различают в зависимости от подходов, используемых для выделения коэффициентов значения факторов. Существует два метода — анализ главных компонент и анализ общих факторов. При анализе главных компонент (principal components analysis) учитывают всю дисперсию данных. Анализ главных компонент (principal components analysis) Метод факторного анализа, который учитывает всю дисперсию данных. Диагональ корре.тяшюпнои матрицы состоит из единиц, и вся ди(:переия..1(псдена в матрицу факторных нагрузок. Анализ главных компонент рекомендуется выполнять, если основная задача исследователя — определение минимального числа факторов, которые вносят максимальный вклад в дисперсию данных, чтобы в последующем использовать их в многомерном анализе. Эти факторы называют s.-итны.vu компонентами (principal component). В анализе обит\ факторов (common factor analysis) факторы определяют только на основании общей дисперсии. Общности располагаются на диагонали корреляционной матрицы. Этот метод подходит. если основной задачей является определение латентных переменных и общей дисперсии. Этот метод также известен как pwnawiът матрицы (principal axis factoring). Диализ общих факторов (common factor analysis) Метод факторного анализа, который оцеиит-ает факторы только по общей (для всех ров) дисперсии. Существуют и другие методы опенки общих факторов. Они включают: метод невзвешенных наименьших квадратов, обобщенный метод наименьших квадратов, метод максимального правдоподобия, алъфа-флкгорныи метод, распознования образов. Эти методы сложнее, и их не рекомендуется использовать неопытным аналитикам В табл. 19.3 показано применение анализа главных компонент. В колонке "Исходные" (часть таблицы под названием "Общности") видно, что значения общностей для каждой переменной от до равны 1, поскольку единицы введены в диагональ корреляционной матрицы. Часть табл. 19.3 под названием "Исходные собственные значения" дает собственные значения факторов, которые снижаются при переходе от первого фактора к шестому. Собственное значение фактора указывает полную дисперсию, присущую данному фактору. Полная дисперсия для всех шести факторов равна 6, т.е. числу переменных. Дисперсия, обусловленная влиянием первого фактора, равна 2,731 или 45,52% от полной дисперсии (2,731/6). Аналогично, дисперсия, обусловленная влиянием второго фактора, равна (2,218/6) или 36,97% от полной дисперсии, и два фактора вместе объясняют 82,49% полной дисперсии. Для определении числа факторов, которые необходимо использовать в анализе, существует несколько методов. Определение числа факторов Можно вычислить столько главных компонент, сколько имеется переменных, но это неэкономично. Чтобы обобщить информацию, в исходных переменных, лучше выделить небольшое число факторов. Вопрос в том: сколько? Для определения числа факторов предлагается несколько процедур: определение, основанное на предварительной информации; определение, основанное на собственных значениях факторов; критерий "каменистой осыпи"; определение на основе процента объясненной дисперсии; метод расщепления и критерии значимости. Определение, основанное на предварительной информации. Иногда, руководствуясь предварительной информацией, исследователь знает, сколько факторов можно ожидать, и таким образом, может заранее определить число выделяемых факторов. После извлечения желаемого числа факторов их выделение прекращают. Большинство компьютерных программ позволит пользователю определить число факторов, значительно упрошая применение этого метода. Определение, основанное на собственных значениях факторов. В этом методе учитывают только факторы, собственные значения которых выше 1,0; остальные факторы в модель не включают. Собственное значение представляет дисперсии, обусловленной действием этого фактора. Следовательно, рассматривают только факторы с дисперсией выше 1,0. Если число переменных меньше 20, то этот метод завышает число факторов. Определение, основанное на критерии "каменистой осыпи". Графическое изображение критерия осыпи" представляет собой график зависимости собственных значений факторов от их номеров в порядке выделения. Для определения числа факторов используют форму графика. Обычно график имеет четкий разрыв между крутой частью кривой, где факторам свойственны собственные значения, и плавной хвостовой частью кривой, связанной с остальными факторами (в этом месте убывание значений факторов слева направо максимально замедляется). Это плавное убывание собственных значений называется осыпь (scree). Опыт показывает, что точка, с которой начинается осыпь, указывает на действительное число факторов. Обычно число факторов, определенное по графику "каменистой ш-Г, на единицу или несколько единиц больше числа факторов, полученных методом, основанным на собственных значениях. Определение на основе процента объясненной дисперсии. В этом методе число выделяемых факторов определяют так. чтобы кумулятивный процент дисперсии, выделяемой факторами, достиг удовлетворительного уровня. Какой уровень дисперсии считать удовлетворительным, зависит от поставленной задачи. Однако рекомендуется выделять такое число факторов, которое объясняют, по крайней мере, 60% дисперсии. Определение, основанное на оценке надежности, выполняемой растстенисм. В этом методе выборку расщепляют напополам и факторный анализ выполняют для каждой половины. При этом оставляют только факторы с высокой степенью соответствия факторных нагрузок в двух подвыборках. Определение, основанное на критериях значимости. Можно определить статистическую значимость отдельных собственных значений и оставить только статистически значимые факторы. Недостаток этого метода в том, что при больших размерах выборок (больше 200) многие факторы, вероятно, статистически значимые, хотя с практической точки многие из них объясняют небольшую долю полной дисперсии. В табл. 19.3, исходя из собственных значений факторов, превышающих единицу (по умолчанию), будет выделено два фактора. Из опыта (предварительная информация) мы знаем, что зубную пасту покупают по двум основным причинам. График "каменистой осыпи" приведен на рис. 19.2.
![]() |
Число факторов Рис. 19.2, График "каменистой осыпи ' На графике четкий разрыв виден в области трех факторов. И наконец, из значения кумулятивного процента объясненной дисперсии видно, что два первых фактора объясняют 82,49% дисперсии, и увеличение этого значения при переходе к трем факторам будет предельным. Кроме того, метод расщепления выборки также указывает на два фактора. Таким образом, в данной ситуации целесообразно рассмотреть:;!!.! фактора. Во второй колонке части табл. 19.3 под названием "Общности" дана информация после выделения желаемого числа факторов. Общности в колонке '"Выделенная" отличаются от значений в колонке "Начальная", поскольку всю дисперсию, соответствующую этим переменным, нельзя о.оънанігь, если не оставить в модели все факторы. В части таблицы под названием квадратов нагрузок выделенных факторов" даны дисперсии, соответствующие рам, которые оставили в модели. Обратите внимание, что их значения совпадают со значениями дисперсий в колонке "Исходные собственные значения". Это характерно для анализа главных компонент. Процент дисперсии, объясненной фактором, определяют, разделив соответствующее собственное значение на число факторов и умножив полученное значение на 100. Таким образом, первый фактор объясняет (2,731/6) х 100, или 45,52%, от дисперсии, соответствующей шести переменным. Аналогично, второй фактор объясняет (2,218/6) х 100, или 36,969% полной дисперсии. Интерпретация решения часто становится более ясной после вращения факторов. Вращение факторов Важный результат факторного ^ках^ s; — матрица факторных нагрузок, также называемая матрицей факторного отображения (factor pattern matrix). Она содержит коэффициенты, используемые для выражения нормированных переменных через факторы. Эти коэффициенты, называемые факторными нагрузками, представляют корреляции между факторами и переменными. Коэффициент с высоким абсолютным значением показывает, что фактор и переменная тесно взаимосвязаны. Коэффициенты матрицы факторных нагрузок можно использовать для интерпретации факторов. Несмотря на то, что матрица исходных или неповернутых факторов указывает на взаимосвязь факторов и отдельных переменных, она редко приводит к факторам, которые можно интерпретировать, поскольку факторы коррелируют со многими переменными. Например, в табл. 19.3 фактор 1, по крайней мере, частично связан с пятью из шести переменных (абсолютное значение факторной нагрузки больше 0,3). Как интерпретировать этот фактор? В такой сложной матрице это трудно. Поэтому вращением матрицу факторных коэффициентов преобразуют более простую, которую легче интерпретировать. При правієм им факторов желательно, чтобы каждый фактор имел ненулевые или значимые нагрузки (коэффициенты) только для небольшого числа переменных. Аналогично, желательно, чтобы каждая переменная имела ненулевые или значимые нагрузки с небольшим числом фактором, если можно, то с одним фактором. Если несколько факторов имеют высокие значения факторных нагрузок с одной и той же переменной, то их трудно интерпретировать. Вращение не влияет на общности и процент объясненной полной дисперсии. Однако процент дисперсии, обусловленной влиянием каждого фактора, изменяется. Это видно из данных табл. 19.3. В результате вращения дисперсия, объясняемая каждым фактором, перераспределилась. Следовательно, разные методы вращения помогают интерпретировать различные факторы. Rp iincimu называют ортогональным вращением (orthogonal rotation), если при вращении сохраняется прямоугольная система координат. Ортогональное вращение (orthogonal rotation) Вращение факторов, при котором сохраняется прямоугольная система координат. Самый распространенный метод вращения — метод варимакс (вращение, максимизирующее дне I it реи to) (va г i m а ч procedure). Метод . i или вращение, максимизирующее (varimax procedure) Ортогональный метод вращения факторов, который минимизирует число переменных с высокими значениями нагрузок, усиливая тем самым интерпретируемость факторов. Это ортогональный метод вращения, который минимизирует число переменных с высокими значениями нагрузок, усиливая тем самым интерпретируемость факторов [9]. В результате ортогонального вращения получают некоррелированные факторы. Вращение называют косоугольным вращением (oblique rotation), если i к сохраняется прямоугльная система координат и в результате получают коррелированные факторы. Косоугольное вращение (oblique rotation) Вращение факторов, при котором не сохраняется прямоугольная система координат. Иногда, допустив некоторую корре.іянию между факторами, можно упростить матрицу факторной модели. Косоугольное вращение не пользуется тогда, когда факторы в генеральной совокупности, вероятно, тесно взаимосвязаны. Сравнив в табл. 19.3 матрицу фамирныл нагрузок, полученную после применения метода вращения варимакс, с матрицей факторных нагрузок до вращения (часть таблицы под названием "Матрица факторных нагрузок"), мы увидим, как вращение упрощает и усиливает интерпретируемость факторов. В то время как в неповернутой матрице пять переменных коррелируют с фактором I, после вращения с фактором 1 коррелируют только переменные V-,, ¥.,. Остальные переменные У2> К и К коррелируют с фактором 2. Более того, ни одна из переменных не коррелирует достаточно сильно с обоими факторами. Повернутая матрица создает основу для интерпретации факторов. Интерпретация факторов Для интерпретации факторов необходимо определить переменные, которые имеют высокие значения нагрузок по одному и тому же фактору. А затем этот фактор следует проанализировать с учетом этих переменных. Другое полезное средство интерпретации — графическое изображение переменных, координатами которых служат величины факторных нагрузок. Так, в конце оси расположены переменные, которые имеют большие нагрузки только в связи с этим фактором и, следовательно, характеризуют его. Переменные в начале координат имеют небольшие нагрузки в связи с обоими факторами. Переменные, расположенные вдали от осей, связаны с обоими факторами. Если фактор нельзя четко определить с точки зрения связи с исходными переменными, то его следует пометить как неопределяемый или генеральный (общий для всех переменных). 1,0
4® -1.0 -0,5 0,0 0,5 1 Фа>:| ор 1 Рис, 19.3. Диаграмма факторных нагрузок В повернутой матрице из табл. 19.3 фактор 1 имеет высокие коэффициенты для переменных (предотвращение кариеса), (укрепление десен), и отрицательный коэффициент для переменной (предотвращение порчи зубов не считается важным при покупке зубной пасты). Следовательно, этот фактор можно назвать фактором, укрепляющим здоровье. Обратите внимание, что отрицательный коэффициент для негативной переменной ведет к положительной интерпретации этого фактора, а именно, предотвращение порчи зубов будет важным при покупке зубной пасты. Фактор 2 тесно связан с переменными (белизна зубов), (свежее дыхание) и У6 (привлекательность внешнего вида зубов). Таким образом, фактор 2 можно по- метить как фактор, огиечаюшми за внешний вид. Диаграмма факторных нагрузок на рис. 19,3 подтверждает эту интерпретацию факторов. Переменные К. 1-'. (обозначенные на диаграмме 1, 3 и 5 соответственно) находятся на конце горизонтальной оси, причем точка, соответствующая находится на конце, противоположном месту расположения точек, соответствующих и В то же время переменные и (обозначенные на диаграмме 2, 4 и 6 соответственно) расположены на конце вертикальной оси (фактор 2). Можно обобщим, данные, сделав вывод, что потребители, по-видимому, стремятся извлечь двойную пользу из зубной пасты: укрепить здоровье и приобрести хороший внешний вид. Вычисление значения фактора После интерпретации факторов необходимо вычислить их значения. Факторный анализ имеет собственную ценность. Однако если цель факторного анализа заключается в снижении исходного числа переменных до небольшого набора составных переменных (факторов), которые в дальнейшем используются в многомерном то имеет смысл вычислить для каждого респондента значение фактора. Фактор представляет собой линейную комбинацию исходных переменных. Значение для Л-го фактора можно вычислить по формуле F, - W/jXt + иу, + WJC, +... + . Обозначения в этой формуле аналогичны приведенным выше. Веса или коэффициенты значения фактора, используемые для объединения нормированных переменных, получают из матрицы коэффициентов значения фактора. Большинство компьютерных программ позволяет вычислить значения факторов. Только в анализе главных компонент можно вычислить точные значения факторов.
![]() |
Значение фактора (factor scores) Суммарное значение, полученное для каждого респондента на основании всех фа |
Более того, в анализе главных компонент эти значения не взаимосвязаны. В анализе общих факторов оценки значений факторов получают, но нет гарантии, что факторы не будут коррелировать между собой. Значения факторов можно использовать вместо исходных переменных в последующем многомерном анализе. Например, используя матрицу коэффициентов значения фактора в табл. 19.3, можно шчпеліпь два значения фактора для каждого респондента. Если нормированные значения переменной умножить на соответствующий коэффициент значения фактора, то получится значение данного фактора. Отбор переменных-заменителей Иногда, вместо вычисления значений факторов, исследователь может выбрать переменные-заменители. Выбор переменных-заменителей (surrogate variables), заключается в выделении нескольких из исходных переменных для использования их в последующем анализе, Переменные-заменители (surrogate variables) Часть набора исходных переменных, выбрак^ы* для последующего анализа. Это позволит выполнить последующим анализ и интерпретировать результаты с точки зрения исходных переменных, а не значения факлорот;. Из матрицы факторных коэффициентов можно выбрать для каждого фактора переменную с наивысшим значением нагрузки на данный фактор. Затем эту переменную используют в качестве перемен:юй-замените,! а для соответствующего фактора. Этот процесс протекает гладко, если одна из факторных нагрузок переменной значительно выше остальных. Однако сделать выбор не так легко, если нагрузки двух или больше переменных одинаково высокие. В таком случае выбор осуществляют, исходя из теоре- тических предпосылок. Например, теоретически предполагают, что переменная с несколько меньшей нагрузкой важнее, чем переменная с несколько большей нагрузкой. Аналогично, если переменная имеет несколько меньшую, но более точно измеренную нагрузку, то в качестве переменной-имитатора следует выбрать именно ее. В табл. 19.3 переменные и имеют высокие нагрузки в связи с фактором 1, причем достаточно близкие по величине. Переменная имеет относительно самое высокое значение и поэтому должна была бы оказаться вероятным кандидатом в переменные-имитаторы. Однако, исходя из предварительной информации, самым важным при выборе зубной пасты является ее способность порчу зубов, и поэтому в качестве переменной-заменителя для фактора 1 должна быть выбрана переменная Осуществить выбор переменной-заменителя для фактора 2 также непросто. Переменные К, V. и имеют сопоставимо высокие значения нагрузок на этот фактор. Если предварительная информация свидетельствует, что привлекательность внешнего вида зубов — важнейший аспект обше| о внешнего вида, то следует выбрать переменную Определение подгонки модели Последняя стадия факторного анализа заключается в определении соответствия модели факторного анализа исходным данным, т.е. степени ее подгонки. Основное допущение, лежащее в основе факторного анализа, состоит в том, что наблюдаемая корреляция между переменными может быть свойственна общим факторам. Следовательно, корреляции между переменными можно вывести или воспроизвести из определенных корреляций между переменными и факторами. Изучив разности между наблюдаемыми корреляциями (данными в исходной корреляционной матрице) и вычисленными корреляциями (определенными из матрицы факторных нагрузок), можно определить соответствие модели исходным данным. Эти разности называют остатками (residuals). Если много остатков с большими значениями, то факторная модель не обеспечивает хорошее соответствие данным и требует пересмотра. Из данных табл. 19.3 видно, что только значение пяти остатков превышает 0,05, свидетельствуя тем самым о приемлемом соответствии модели данным. Следующий пример иллюстрирует анализ главных компонент с точки зрения продвижения товара. ПРИМЕР. Компоненты, влияющие на продвижение на рынок промышленных товаров Цель этого исследования — определить достаточно большой набор контролируемых производителем переменных, имеющих отношение к продвижению его товаров в розничную торговую сеть, и показать, что существует связь между этими переменными и решением розничного торговца о поддержке усилий производителя по продвижению товара. Решения о поддержке определяли по отношению розничного торговца к усилиям по продвижению товара.
Факторный анализ выполнили по объясняющим переменным, руководствуясь главной целью — снизить количество переменных. Методом главных компонент с использованием метода вращения варимакс уменьшили 30 объясняющих переменных до 8 факторов с собственными значениями выше 1,0. Для интерпретации каждый фактор включал в себя переменные с нагрузками на этот фактор от 0,40 и выше. В двух случаях, когда переменные имели нагрузки 0,40 и выше на два фактора, каждой переменной присвоили один фактор, нагрузка на который была выше. Только одна переменная "легкость погрузочно-разгрузочных работ, накопление запасов в торговых точках" не имела нагрузки, по крайней мере, равной 0,4, ни на один из факторов. В целом, 8 факторов объясняли 62% суммарной дисперсии. Интерпретация матрицы факторных нагрузок оказалась несложной. В табл. 1 перечислены факторы в порядке их выделения. Т
Таблица 1. Факторы, влияющие на принятие решения о поддержке в продвижении товара фактор Интерпретация фактора Нагрузка Переменные, включенные в фактор (объясненный процент дисперсии} ь | товара (16,3%) | 0,77 | Товар достаточно важен да* того, чтобы гарантировать | | | | его продвижение | | | 0,75 | Данная категория товара хорошо реагирует на рекламу | | | 0,66 | В'.-рс^аю. наиболее близкий конкурент занимается про | | | | движением данного товара | | | 0,64 | Значимость продвигаемой категории товара | | | 0,59 | Товар имеет постоянный объем продаж | | | 0,57 | Сделка соответствует требованиям обеспечения продви- | | | | жения товара | | Эластичность продвижения товара на | | Оценка покупателями у^шчения объема продаж основа | | рынок (9,3/15) | | на на следующем: | | | 0,В6 | Снижение цены и демонстрация товара | | | 0,82 | Только демонстрация товара | | | 0,80 | Только снижение цены | | | 0,70 | Снижение цены, демонстрация, рекламная кампания | | Поддержка торговой марки произво | | Поддержка торговой марки производителем в форме: | | дителем (8,2%) | | | | | 0,65 | Купонов | | | 0,81 | Радио- и телевизионной рекламы | | | 0,80 | Рекламы в газетах | | | 0,75 | Содействие продвижению товара в местах его продажи | | | | (например, выставки) | | Репутация производителя (7,3%) | О 72 | Общая репутация производителя | | | 0,72 | Производитель идет навстречу пожеланиям торговли | | | 0,64 | Производитель сотрудничает с продавцом в случае экс | | | | тренных заказах, встречного пробега и т.д. | | | 0,55 | Качество представления продаж | | | 0,51 | Суммарное качество товара производителя | к | Истощение продвижения товара | 0,93 | Чрезмерное продвижение категории | | (6,4%) | | | | | 0.93 | Избыток конкретного товара | к | Оборачиваемость продаж (5,4%) | -0,81 | Ранг доли рынка торговой | | | 0,69 | Постоянный объем продаж (данного) товара5 | | | 0,46 | Постоянный объем продаж (данного) товара | ■ Г; | Рекгаб8.>.чость товара (4,5%) | 0,79 | Постоянная валовая прибыль (от продажи) товара | | | 0,72 | Постоянная валовая прибыль продажи) | | | 0,49 | Разумность требований по выполнению соглашения | | Сумма поощрения (4,2%) | 0,83 | Абсолютная сумма скидок по соглашениям | | | 0,81 | Скидки по соглашениям как процент регулярной торговой | | | | стоимости (цены)а | | | 0,49 | Абсолютная сумма скидок по | |
Приводится по объективным показателям. |
Для того чтобы определить, какой из восьми факторов (если такой фактор существует) предсказывает содействие продвижению товара на рынок в статистически значимой степени, выполнен пошаговый дискриминантный анализ. Значения всех восьми факторов выступают объясняющими переменными. Зависимая переменная состоит из ■ щенки (рейтинга) розничным торговцем деловых отношений с производителем, которую разбивают на три группы, в зависимости от степени содействия в продвижении товара (низкая, средняя, высокая). Результаты дискриминантного анализа приведены в табл. 2.
Таблица 2. Результаты дискриминантного анализа: анализ по рейтингу и эффективности = 564) Фактор | | Функция 1 | Функция Z | Р\ | Важность товара | 0,861 | - 0,253 | а | Эластичность продвижения товара на рынок | 0,081 | 0,398 | ь | Поддержка торговой марк'/ производителем | 0,127 | -0,036 | н | Репутация производителя | 0,394 | 0,014 | г6 | Истощение прадвиждая товара | - 0,207 | 0,380 | | Оборачиваемость продаж | 0,033 | - 0,665 | | Реыаёе.-ЬЧХТь товара | 0,614 | 0,357 | к | Сумма поощрения | 0,461 | 0,254 | |
Коэффициент (для каждого фактора) — все ЗчЗНиаы при р < 0,001 Значения Р-статистик для многомерной выборки — все значимы при р < 0,001 Процент правильно классифицированных случаев — 65% (Г = 14,4; р < 0,001) |
Все восемь факторов присутствуют в днскмми.чантных функциях. Критерии согласия указали н.* то, что все восемь факторов дискриминировали (различали) высокий, средний и низкий уровни содействия продажи для многомерной выборки, зывающие на степень дискриминации между каждой парой групп, были значимыми при р < 0,001. 65% случаев было верно отнесено к высокому, среднему и низкому уровню содействия продвижению товаров. Использовался порядок введения в дискриминантный анализ. I Для того чтобы определить относительную важность факторов, влияющих на содействие торговле, факторы в дискриминантную функцию вводили в порядке, указанном в ]' табл. 3 [10], Таблица 3. Относительная важность факторов, влияющих на содействие торговле i (показано с помощью порядка ввода в дискриминантный анализ) I Анали3 рейтинга I Порядок ввода Название фактора 1 Важность товара 2 Эластичность продвижения ТОВЗрй на рынок 3 Поддержка торговой марки производителем 4 Репутация производителя Истощение лрсде^женж товара о Оборачиваемость продаж
Нормированные коэффициенты дискриминантом функции |
7 Рентабельность товара
поощрения В следующем разделе описан анализ общих факторов с примерами применения этого метода.