3.3. Ошибки прогнозирования (определение качества регрессионного анализа)
Можно воспользоваться двумя приемами для оценки добротности выполненного нами регрессионного анализа. В статистике для этого используют:
стандартную ошибку (S у), которая дает представление о приблизительной величине ошибки прогнозирования;
2
коэффициент детерминации (R ), указывающий, какой процент вариации функции у объясняется воздействием факторов хк.
Рассмотрим оба подхода более подробно.
1. Результаты статистического расчета показывают, что стандартная ошибка для функции составляет 0,65. Этот результат применительно к наше- му примеру следует рассматривать следующим образом: фактическая величина объема продаж молока отличается от прогнозируемых показателей не более чем на 0,65 л/день. Однако ценность этого показателя невелика, если не надежность этого утверждения. При условии сохранения нормального распределения можно полагать, что примерно 2/3 фактических данных будут находиться в пределах S у от прогнозируемых показателей; примерно 95 % - в пределах 2S у и т.д.
Эта стандартная ошибка S у равная 0,65, указывает отклонение фактических данных от прогнозируемых на основании использования воздействующих факторов х1 и х2 (влияние среди покупателей бабушек с внучками и высокопрофессионального вклада Шарика). В то же время мы располагаем обычным стандартным отклонением Sn, равным 1,06 (см. табл.8), которое было рассчитано для одной переменной, а именно: сами текущие значения уги величина среднего арифметического у, которое равно 6,01. Легко видеть, что S у< Sn; следовательно, ошибки прогнозирования, как правило, оказываются меньшими, если использовать уравнение регрессии (учитывается вклад факторов х1 и х2), а не ограничиваться только значением у.
Сказанное можно истолковать следующим образом. Если бы нам ничего не было известно про переменные х1 и х2, то в качестве оптимальной приблизительной величины среднего уровня продаж пришлось бы использовать показатель у = 6,01 л/день и полагать, что наши прогнозы дают ошибку Sn, равную 1,06 л/день. Однако если нам известны такие характеристики, как влияние особой категории покупателей (бабушки с внучками) и роль высококвалифицированной помощи Шарика, то для прогнозирования можно воспользоваться уравнением регрессии.
В этом случае наши предсказания будут давать ошибку уже примерно в 0,65 л/день.Такое сокращение погрешности прогнозирования с 1,06 до 0,65 и является одним из преимуществ использования регрессионного анализа.
2. Если вновь обратиться к нашему примеру, то коэффициент детерминации R (на рис.17 славный Excel его подает как R-квадрат) равен 0,67, что составляет 67 %. Этот результат следует толковать так: все исследуемые воздействующие факторы (влияние особой категории покупателей и коммерческий талант Шарика) объясняют 67 % вариации анализируемой функции (объема проданного молока). Остальное же (33 %, что весьма прилично!) остается необъясненным и может быть связано с влиянием других, неучтенных факторов.
Для нашего примера показатель R (67 %) считается умеренным, поэтому можно полагать, что именно эти два фактора в данном конкретном случае оказывают наиболее значительное влияние на y~.
Итак, нами получено уравнение множественной регрессии, коэффициенты которого b; формально показывают, как и в каком направлении действуют (пока лишь вероятно!) исследуемые факторы хк t и какой процент изменчивости функции у объясняется влиянием именно этих факторов.
Теперь нам надлежит определить статистическую значимость полученного аналитического выражения.
Еще по теме 3.3. Ошибки прогнозирования (определение качества регрессионного анализа):
- Бараз В.Р.. Корреляционно-регрессионный анализ связи показателей коммерческой деятельности с использованием программы Excel, 2005
- 3.3. Ошибки прогнозирования (определение качества регрессионного анализа)
- Глава 4 ОСНОВЫ РЕГРЕССИОННОГО АНАЛИЗА И ПРОГНОЗИРОВАНИЯ
- 4.3. Исходные предпосылки регрессионного анализа и свойства оценок
- 2. Классификация методов прогнозирования
- Метод корреляционно-регрессионного анализа
- 2.3. Способы определения качества товаров, работ и услуг
- Определение рамок финансового анализа
- 12.4. Парный регрессионный анализ
- 6.2.1. Модель, основанная на методе регрессионного анализа
- 4.4.2. Регрессионный анализ
- РЕГРЕССИОННЫЙ АНАЛИЗ
- СТАТИСТИКИ, СВЯЗАННЫЕ С ПАРНЫМ РЕГРЕССИОННЫМ АНАЛИЗОМ
- ВЫПОЛНЕНИЕ ПАРНОГО РЕГРЕССИОННОГО АНАЛИЗА
- ВЫПОЛНЕНИЕ МНОЖЕСТВЕННОГО РЕГРЕССИОННОГО АНАЛИЗА
- 8.3. Корреляционный и регрессионный анализ
- РЕГРЕССИОННЫЙ АНАЛИЗ
- 2.3.7. Асимптотический линейный регрессионный анализ для интервальных данных
- 2. Парный регрессионный анализ