<<
>>

12.4. Парный регрессионный анализ

Методы регрессии применяются для определения количе­ственной зависимости между двумя и более переменными ве­личинами, в частности, если анализируется влияние одного из показателей (фактор) на не который результативный по­казатель (признак-фактор), следует применять модели пар­ного регрессионного анализа, если факторов несколько "мо­дели много факторного регрессионного анализа.

В качестве факторов следует выбирать показатели, отве­чающие следующим требованиям:

1) наличие логической связи с результативным показа­телем;

2) количественная измеримость показателя, принятого в качестве фактора;

3) наличие источников информации для расчета фак­торов;

4) отсутствие функциональной связи между факторами, включенными в модель.

Уравнение парной регрессии линейного характера имеет общий вид:

у = а + Ъх, (12.16)

где х - фактор, влияющий на результативный показатель; у - признак-фактор;

Ь - коэффициент регрессии, характеризующий степень

влияния а: на у; а — постоянная для данной совокупности исходных дан­ных величина, не зависящая от влияния включенно­го в анализ фактора х.

Линия регрессии —это линия наибольшего соответствия, проходящая через точки разброса фактических значений, расположенных в системе координат.

Группа предметов или явлений, объединенных каким-либо общим признаком, называется статистической совокупностью.

Различают понятия генеральной и выборочной совокуп­ности.

Генеральная совокупность — это бесконечный набор зна­чений изучаемой случайной величины.

Выборочной совокупностью называют часть случайных величин генеральной совокупности, отобранных из генераль­ной совокупности для получения сведений о ней. Для того чтобы выполнить задачу выявления закономерностей, выбо­рочная совокупность должна быть репрезентативной (выбор­ка должна быть достаточной и отражать все признаки гене­ральной совокупности).

Рассмотрим пример, построив регрессионную парную ли­нейную модель зависимости стоимости 1 кв. м общей площа­ди жилья от фактора удаленности объекта от центра города. Исходные данные и промежуточные значения для расчетов приведены в таблице 12.13.

Таблица 12.13 Исходные данные и промежуточные расчеты
№ объекта Стоимость 1 Мг, ДОЛЛ. Расстояние до центра, (Х)км. X* У* ХУ
1 170 12 144 28900 2 040
2 210 7 49 44100 1470
3 220 6 36 43400 1320
4 170 13 169 • 28900 2 210
5 2TG 8 64 44100 1 680
6 200 7 49 40000 1400
7 200 7 49 40 000 1400
8 220 6 36 48400 1320
9 199 10 100 10000 1 900
10 180 11 121 32 400 1 980
11 210 6 36 44100 1260
12 220 6 36 48 400 1320
13 180 11 121 32400 1 980
14 200 7 49 40000 1400
15 210 6 36 44100 1260

Окончание табл.
12.13
16 220 5 25 48400 1 100
Сумма 3 210 12В 1120 643 700 25 040
Среднее значение 200,6 8,0

Параметры уравнения регрессии определяются по следу­ющим формулам:

ь = пШ-^Щу ,

г&'СЕр:)3 ' {иЛ7>

1у ЬТ>

а = ^------ (12М

где « - объем выборочной совокупности.

Полученное уравнение имеет вид:

У = 253,968 ~ 6, 667X (12.19)

Коэффициент регрессии Ь = — 6,667 имеет отрицательное значение, что свидетельствует об обратной связи между X и У : чем больше удаленность объекта от центра, тем ниже сто­имость. Количественное значение 6,667 показывает, что с из­менением удаленности объекта на 1 км стоимость снизится на 6,667 долл/м*.

Насколько достоверно уравнение отражает реальную кар­тину линейности полученной зависимости, можно определить С помощью линейного коэффициента корреляции К. Пирсона:

______ п^ху - Т^Т-У____

В нашем примере г = - 0,953. Значение коэффициента корреляции может изменяться в пределах от -1 до +1.

Если связь между показателями прямая г > 0, если обрат­ная г < 0.

Чем ближе абсолютное значение г к 1, тем теснее связь между показателями.

По мере того, как возрастает сила линейной связи, точки на графике будут лежать более близко к прямой линии, а ве­личина т будет ближе к 1, и наоборот.

Вторым показателем, способным характеризовать тесноту связи, является коэффициент детерминации (гг):

Т(уг-у)г

где У " значение переменной У в каждой точке, исчисленное на основе уравнения регрессии; У - среднее значение У; У - фактическое значение У.

Расчет произведен в таблице 12.14.

Таблица 12.14 Расчет коэффициента детерминации

л/п У X У = 253,968

- 6,667Х

V-? У-У" (У-Ю*
1 170 12 174,0 -26,6 709,5 -30,6 936,4
2 7 207,3 6,7 44,9 9,4 88,4
3 220 6 214,0 , 13,4 178,6 19,4 376,4
4 170 13 167,3 -33,3 1 109,1 -30,6 936,4
5 210 8 200,6 0 0 9,4 88,4
6 200 7 207,3 6,7 44,9 -0,6 0,4
7 £00 7 207,3 6,7 44,9 -0,6 0,4
8 £20 6 214,0 13,4 178,6 19,4 376,4
Э 190 10 187,3 . -13,3 1 109,1 -10,6 112,4
10 180 11 180,6 -20 400 -20,6 424,4
11 Р 6 214,0 13,4 178,6 9,4 88,4
12 220 6 214,0 13,4 178.6 19,4 376,4
13 180 11 180,6 -20 400 -20,6 424,4
14 200 7 207,3 6,7 44,9 -0,6 0.4
15 210 6 214,0 13,4 178,6 9,4 88.4
16 220 5 220,0 ГО 400 19,4 376,4
Сумма 3 210 128 4 267,1 4 693.8
200,Е 8,0

Данный показатель характеризует отношение той части вариации У, которая объясняется влиянием X, к общей вари­ации. Б нашем случае указанная доля составляет 95,9%.

Для определения значимости коэффициента корреляции между изучаемыми показателями в случае малой выборки исходных статистических данных целесообразно использо­вать ^критерий Стьюдента.

Его применение основано на проверке двух гипотез: 1- Между У и X не существует линейной связи (Р = 0). 2. Между У и X существует некоторая линейная связь и X помогает в прогнозировании У (РФ 0).

Расчетное значение критерия определяется по формуле:

(12.21)

где (п - 2) - число степеней свободы;

г - линейный коэффициент корреляции. Если расчетное значение ( будет больше, чем табличное, то гипотеза о нулевом значении коэффициента корреляции в генеральной совокупности не подтверждается; если расчет­ное значение ниже табличного - в генеральной совокупности корреляция может не наблюдаться,

В нашем примере расчетное значение критерия: Табличное значение г (0,025;14) = 2,144

I (- 0.953)'-(16-2) і = (І,- (- О,053)г) =п,820.

Полученное расчетное значение выше, следовательно, установленная закономерность может проявляться в гене­ральной совокупности.

Достоверность полученных результатов анализа во мно­гом зависит от полноты и достоверности исходных данных.

Чтобы определить требуемую величину объема выбор­ки, следует первоначально определиться, какой уровень до­верительной вероятности нам необходим (например, цд 95 или '99%).

Во многих практических ситуациях зависимость между двумя переменными может иметь нелинейный характер.

В частности, параболическая зависимость между показа­телями имеет вид:

у ^а + Ьх + сх2. (12.22)

Система нормальных уравнений, из которой можно полу­чить неизвестные параметры а, Ъ и с, имеет вид:

па + ЪУх + с^х2 = Ту ; а£х + йре2 + = ; (12.23)

Ь^а,-' + сУ;е4 = У ух2 ;

Теснота связи, характеризующая точность аппроксимации •параболы, характеризуется корреляционным отношением:

I

3 = Г~ 1(У ~ У Г , (12.24)

Корреляционное отношение имеет диапазон от 0 до + 1; если И>г, то парабола точнее характеризует закономерность связи показателей, нежели прямая линия.

У-Vе

Дополнительной оценкой точности аппроксимации в нели­нейных моделях является средняя относительная ошибка ап­проксимации:

X 100, (12.25)

У

Рассмотрим пример моделирования параболической за­висимости на основе следующих исходных данных (табли­ца 12.15).

Система уравнений:

12а + 37Ъ+ 129с = 25 200 37 а + 129Ъ + 493с = 7800

129а + 493Ь + 2 025с = 26 220

Таблица 12.15 Выборочные данные и промежуточные расчеты
№ п/п Стоимость КВ. м, ДОЛЛ. V Этаж­ность дома, X X2 Xі X' ХУ т
1 170 5 25 125 625 850 4 250
2 230 3 9 27 81 690 2 070
3 240 3 9 27 81 720 2160
4 250 3 9 27 81 750 2 250
5 230 2 4 8 16 460 920
6 200 3 9 27 81 600 1 800
7 190 4 16 64 256 760 3040
В 170 5 25 125 625 850 4 250
9 240 3 9 27 81 720 2160
10 240 2 4 8 16 480 960
11 240 3 9 27 81 720 2160
12 200 1 1 1 1 200 200
Итого 2 520 37 129 493 2 025 7 800 26 200

Отсюда методом подстановки получим:

а = 183,37;

Ь = 43,025; с =

Уравнение зависимости стоимости жилой недвижимости от этажа квартиры имеет вид:

У = 183,370 + 43,025 Х - 9,138Х2. (12.26)

Полученное уравнение показывает, что чем выше этаж квартиры, тем выше стоимость, но до определенного преде­ла (таблица 12.16).

Таблица 12.16 Усредненные показатели стоимости 1 кв. м (определены на основе формулы 12.26)
Этаж Стоимость,
долл.
1 217
2 233
3 230
4 209
5 170

Первая производная уравнения (12.23) определится сле­дующим образом:

= 43,025 -2 * 9,138 X.

Приравняв полученное уравнение к нулю, получим опти­мальное значение X:

43,025-2 х 9,138 Х=0.

X =2,3, т.е. наиболее высокую стоимость имеют кварти- ры, находящиеся на 2-3 этажах.

Проверим тесноту связи с помощью корреляционно­го отношения, определив его основные параметры в табли­це 12.17.

Таблица 12.17

Параметры для расчета показателя тесноты связи
У У (У-У)г (У-У)г (У-У)А
п/п (уравнение 12.24)
1 2 3 4 5 6
1 2 3 А 5 6
1 170 170 0 2180,9 0
2 230 230 0 176,9 0

Окончание табл. 12.17
3 240

230

100 542,9 0,041
4 250 230 400 1108;9 0,079
5 230 233 9 176,9 0,012
6 ГШ 230 900 278,9 0,151
7 190 209 361 712,9 0,101
8 170 170 0 2 130,9 0
9 240 230 100 542,9 0,041
10 240 233 49 542,9 0,029
11 240 230 100 542,9 0,011
12 200 217 283 278,9 0,086
Сумма 2 600 X 2 308 9 266,7 0,581
Ср.зн. 216,7 X X X X

з Ггшо V 9266,7

Теснота связи высокая, так как корреляционное отноше­ние близко к единице.

Средняя относительная ошибка аппроксимации

Е = 0,581-100 = 4,8%.

Для определения достаточности объема выборочной со­вокупности можно воспользоваться методом уточненной вы­борки.

<< | >>
Источник: Н. Е. Симионова, Р. Ю. Симионов. Оценка бизнеса: теория и практика. — Ростов н/Д.: «Феникс», — 576 с.. 2007

Еще по теме 12.4. Парный регрессионный анализ:

  1. Бараз В.Р.. Корреляционно-регрессионный анализ связи показателей коммерческой деятельности с использованием программы Excel, 2005
  2. 3.3. Ошибки прогнозирования (определение качества регрессионного анализа)
  3. Глава 4 ОСНОВЫ РЕГРЕССИОННОГО АНАЛИЗА И ПРОГНОЗИРОВАНИЯ
  4. 4.3. Исходные предпосылки регрессионного анализа и свойства оценок
  5. 3. Анализ (обобщение статистического материала на основе средних, индексных, выборочных методов; метода рядов динамики; кор-реляционного анализа и корреляционно-регрессионного анализа)
  6. Метод корреляционно-регрессионного анализа
  7. § 16.8. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ В ЛИНЕЙНОМ РЕГРЕССИОННОМ АНАЛИЗЕ
  8. 12.4. Парный регрессионный анализ
  9. 6.2.1. Модель, основанная на методе регрессионного анализа
  10. 4.4.2. Регрессионный анализ
  11. § 36.8. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ В ЛИНЕЙНОМ РЕГРЕССИОННОМ АНАЛИЗЕ
  12. РЕГРЕССИОННЫЙ АНАЛИЗ
  13. СТАТИСТИКИ, СВЯЗАННЫЕ С ПАРНЫМ РЕГРЕССИОННЫМ АНАЛИЗОМ
  14. ВЫПОЛНЕНИЕ ПАРНОГО РЕГРЕССИОННОГО АНАЛИЗА
  15. ВЫПОЛНЕНИЕ МНОЖЕСТВЕННОГО РЕГРЕССИОННОГО АНАЛИЗА
  16. 8.3. Корреляционный и регрессионный анализ
  17. РЕГРЕССИОННЫЙ АНАЛИЗ
  18. 2.3.7. Асимптотический линейный регрессионный анализ для интервальных данных
  19. 2. Парный регрессионный анализ