Множественная регрессия
Сложные проблемы всегда имеют простые, легкие для понимания неправильные решения.
(Закон Мэрфи)
До сих пор нами рассматривалась ситуация, когда на зависимую переменную (функцию) воздействовал только один фактор (аргумент).
Подобное прогнозирование принято называть простой регрессией. Такие зависимости мы уже рассмотрели ранее.Однако в подавляющем большинстве случаев приходится иметь дело с экспериментальными данными, касающимися влияния более чем одного фактора. Прогнозирование единственной переменной у на основании нескольких переменных xk называется множественной регрессией. В этом случае математическая модель процесса представляется в виде уравнения регрессии с несколькими переменными величинами, т.е. у = f (b0, ..., xk).
Общий вид уравнения множественной регрессии обычно стараются представить в форме линейной зависимости:
у = b + b1X1 + b2X2 + ... + bkXk,
где b0 - свободный член (или сдвиг); b1, b2 , ..., bk - коэффициенты регрессии, которые подлежат вычислению методом наименьших квадратов.
При анализе уравнения множественной регрессии (как и в случае простой регрессии) используется также такое понятие, как ошибка прогнозирования Ау. Последняя понимается как разность между рассчитанным (теоре-тическим) значением функции уi и ее измеренным (опытным) значением у,, т.е. Ау = У, -У,-.
Статистический вывод о пригодности (значимости) уравнения обычно проверяется в следующей последовательности.
Сначала проводится общая проверка методом F-теста, целью которой является выяснение, объясняют ли х-переменные значимую долю вариации у, т.е. превалирует ли влияние факторов xk на изменение функции у над ее колебаниями случайного порядка; если регрессия не является значимой, то говорить больше не о чем.
Если регрессия оказывается значимой, то можно продолжить анализ, используя t-тесты для отдельных коэффициентов регрессии; в этом случае пытаются выяснить, насколько значимой является влияние той или иной переменной х на параметр у при условии, что все другие факторы xk остаются неизменными.
Построение доверительных интервалов и проверка гипотез на адекватность для отдельного коэффициента регрессии основывается на определении стандартной ошибки. Каждый коэффициент регрессии имеет свою стандартную ошибку Sb1, Sb2,..., Sbk.Рассмотрим конкретный пример.
Замечательная корова кота Матроскина радовала превосходными надоями, и поэтому он вознамерился излишки молока продавать. При этом Матроскин решил выяснить, каким образом объем ежедневной продажи молока у (литров в день) зависит от а) присутствия среди покупателей бабушек с внучками (их доля от общего числа покупателей х\, %) и б) участия в коммерции пса Шарика (относительное время х2, когда он помогал работать за прилавком, %). Тщательные наблюдения Матроскин вел в течение 20 рабочих дней, результаты которых представил в табличной форме (табл.7). При этом порядковые номера торговых дней были расположены в случайном порядке и никак формально не отражали какое-либо внятное изменение объема продажи молока.
Требуется помочь коту Матроскину:
написать уравнение множественной регрессии;
оценить статистическую значимость уравнения;
определить значимость коэффициентов регрессии и пояснить характер влияния исследуемых факторов.
Если поставленную задачу сформулировать в более понятных для кота категориях, то нужно выяснить, влияют ли указанные факторы на его коммерческую деятельность в области молочного бизнеса, а если это так, то насколько ощутимо.
Еще по теме Множественная регрессия:
- 3. Множественная регрессия
- Множественная регрессия
- 3.1. Расчет коэффициентов регрессии и представление уравнения множественной регрессии
- 2. Множественная регрессия
- 2. Нелинейная регрессия
- Проверка статистической надежности уравнения множественной регрессии.
- S 16.4. ПРЕДСКАЗАНИЯ И ПРОГНОЗЫ НА ОСНОВЕ ЛИНЕЙНОЙ МОДЕЛИ РЕГРЕССИИ
- S 16.9. РЕГРЕССИЯ И Excel
- 12.5. Модели множественной регрессии
- § 36.4. ПРЕДСКАЗАНИЯ И ПРОГНОЗЫ НА ОСНОВЕ ЛИНЕЙНОЙ МОДЕЛИ РЕГРЕССИИ