Модель множественной регрессии
Лекция 8. Тема: Модель множественной регрессии
2. Оценка параметров классической регрессионной модели методом
наименьших квадратов.
3. Проверка адекватности модели.
Вопрос 2. Оценка параметров классической регрессионной модели
методом наименьших квадратов.
Многофакторный корреляционный и регрессионный анализ может быть использован в экономико-статистических исследованиях:
• для приближенной оценки фактического и заданного уровней;
• в качестве укрупненного норматива (для этого достаточно в уравнение регрессии подставить вместо фактических значений факторов их средние значения);
Рекомендуемые материалы
• для выявления резервов производства;
• для проведения межзаводского сравнительного анализа и выявления на его основе скрытых возможностей предприятий;
• для краткосрочного прогнозирования развития производства и др.
Вопрос 3. Проверка адекватности модели.
Проверка адекватности модели включает себя ряд этапов
1. Расчет парных коэффициентов корреляции.
Для измерения тесноты связи между двумя из рассматриваемых переменных (без учета их взаимодействия с другими переменными) применяются парные коэффициенты корреляции. Методика расчета таких коэффициентов и их интерпретация аналогичны методике расчета линейного коэффициента корреляции в случае однофакторной связи. Если известны средние квадратические отклонения анализируемых величин, то парные коэффициенты корреляции можно рассчитать проще по следующим формулам:
Они находятся по следующим формулам:
(1)
(2)
(3)
где – средние квадратичные отклонения, определяемые следующим образом:
(4)
(5)
(6)
2. Расчет частных коэффициентов корреляции
Однако в реальных условиях все переменные, как правило, взаимосвязаны. Теснота этой связи определяется частными коэффициентами корреляции, которые характеризуют степень и влияние одного из аргументов на функцию при условии, что остальные независимые переменные закреплены на постоянном уровне. В зависимости от количества переменных, влияние которых исключается, частные коэффициенты корреляции могут быть различного порядка: при исключении влияния одной переменной получаем частный коэффициент корреляции первого порядка; при исключении влияния двух переменных – второго порядка и т.д. Парный коэффициент корреляции между функцией и аргументом обычно не равен соответствующему частному коэффициенту.
Частный коэффициент корреляции первого порядка между признаками х1 и у при исключении влияния признака х2 вычисляют по формуле:
(7)
(8)
(9)
где r – соответствующие парные коэффициенты корреляции.
3. Расчет совокупного коэффициента множественной корреляции.
Показателем тесноты связи, устанавливаемой между результативными и двумя или более факторными признаками, является совокупный коэффициент множественной корреляции Ryx1x2. В случае линейной двухфакторной связи совокупный коэффициент множественной корреляции может быть рассчитан по формуле:
(10)
где rух1, rух2, rх1х2 – линейные (парные) коэффициенты корреляции, применяемые для измерения тесноты между рассматриваемыми факторами.
Совокупный коэффициент множественной корреляции измеряет одновременное влияние факторных признаков на результативный. Его значения находятся в пределах - 1 до +1. Чем меньше наблюдаемые значения изучаемого показателя отклоняются от линии множественной регрессии, тем корреляционная связь является более интенсивной, а, следовательно, значение R ближе к единице.
Совокупным коэффициентом множественной детерминации называется величина R2, которая показывает, какая доля вариации изучаемого показателя объясняется влиянием факторов, включенных в уравнение множественной регрессии. Значение совокупного коэффициента множественной детерминации находится в пределах от 0 до 1. Поэтому, чем ближе R2 к единице, тем вариация изучаемого показателя в большей мере характеризуется влиянием отобранных факторов.
4. Выполнение многошагового регрессионного анализа.
Однако показатели множественной регрессии и корреляции могут оказаться подверженными действию случайных факторов. Поэтому только после проверки адекватности уравнения оно может быть пригодно, например, для выявления резервов повышения производительности труда.
Общая оценка адекватности уравнения может быть получена с помощью дисперсионного F-критерия Фишера. Применение же в этих целях множественного коэффициента корреляции недопустимо ввиду того, что многофакторный регрессионный анализ оперирует случайными наблюдениями, но не обязательно распределенными по многомерному нормальному закону (этому закону должны подчиняться отклонения фактических значений функции от расчетных). Совокупный коэффициент множественной детерминации определяет только качество выравнивания по уравнению регрессии.
Проверку значимости уравнения регрессии производят на основе вычисления F-критерия Фишера:
(11)
где m – число параметров в уравнении регрессии; п – объем выборки; σост. – среднее квадратическое отклонение результативного признака у от выровненных значений ŷ.
(12)
Полученное значение критерия Fрасч. сравнивают с критическим (табличным) для принятого уровня значимости 0,05 или 0,01 и чисел степеней свободы v1 = m-1, v2 = n-m. Если оно окажется больше соответствующего табличного значения, то данное уравнение регрессии статистически значимо, то есть доля вариации, обусловленная регрессией, намного превышает случайную ошибку.
Считается, что уравнение регрессии пригодно для практического использования, если Fрасч. > Fтабл. не менее, чем в четыре раза.
Для оценки значимости коэффициентов регрессии (а1…i) при линейной зависимости у от двух факторов (х1 и х2) используют t-критерий Стьюдента при n-m-1 степенях свободы:
(13)
(14)
Проверку адекватности уравнения регрессии можно также провести на основе расчета существенности совокупного коэффициента корреляции, сравнив его затем с критической величиной, взятой из таблицы Стьюдента. При этом используется следующая формула:
(15)
Значение берется по модулю. Если табличное значение t-критерия при 5%-ом уровне значимости меньше полученного в ходе эксперимента, то построенную модель признают пригодной для практического применения.
В свою очередь, если результаты проверки адекватности привели к отрицательным результатам, то в этом случае в исследовании, скорее всего, были либо неверно определены факторы, оказывающие влияние на исследуемый процесс, либо неправильно выбрана сама модель исследования.
А если результаты проверки адекватности привели к положительным результатам, то далее следует проверить эффективность ее применения на малой выборке, и, в случае получения положительных результатов, распространить на всю генеральную совокупность.
Значения оцениваемых a1,a2, Ryx1x2 берутся по модулю.
Если в уравнении все коэффициенты регрессии значимы, то данное уравнение признают окончательным и применяют в качестве модели изучаемого показателя для последующего анализа.
Оценку значимости коэффициентов регрессии с помощью t-критерия используют для завершения отбора существенных факторов в процессе многошагового регрессионного анализа. Он заключается в том, что после оценки значимости всех коэффициентов регрессии из модели исключают тот фактор, коэффициент при котором незначим и имеет наименьшее значение критерия. Затем уравнение регрессии строится без исключенного фактора, и снова проводится оценка адекватности уравнения и значимости коэффициентов регрессии. Такой процесс длится до тех пор, пока все коэффициенты регрессии не окажутся значимыми, что свидетельствует о наличии в регрессионной модели только существенных факторов. В некоторых случаях расчетное значение tрасч находится вблизи tтабл., поэтому с точки зрения содержательности модели такой фактор можно оставить для последующей проверки его значимости в сочетании с другим набором факторов.
Последовательный отсев несущественных факторов рассмотренным выше приемом (или последовательным включением новых факторов) составляет основу многошагового регрессионного анализа.
5. Экономическая интерпретация
многофакторной регрессионной модели
Чтобы иметь возможность судить о сравнительной силе влияния отдельных факторов и о тех резервах, которые в них заложены, должны быть вычислены частные коэффициенты эластичности Эi, а также бета-коэффициенты – βi и дельта коэффициенты – Δi.
В общем виде коэффициент эластичности определяется следующим образом:
(16)
где аi – коэффициент регрессии при i-ом факторе; – среднее значение i-го фактора;
– среднее значение изучаемого показателя.
Частные коэффициенты эластичности показывают, на сколько процентов в среднем изменяется анализируемый показатель с изменением на 1% каждого фактора при фиксированном положении других факторов.
Для определения факторов, в развитии которых заложены наиболее крупные резервы улучшения изучаемого показателя, необходимо учесть различия в степени варьирования вошедших в уравнение факторов. Это можно сделать с помощью β-коэффициентов, которые вычисляют по формуле:
(17)
где σxi — среднее квадратическое отклонение i-го фактора; σy - среднее квадратическое отклонение показателя.
β-коэффициент показывает, на какую часть среднего квадратического отклонения изменяется результативный признак с изменением соответствующего факторного признака на величину его среднего квадратического отклонения.
Исходя из соотношения и принимая во внимание то, что коэффициент множественной детерминации R2 есть доля изучаемых факторов в наличном приращении результативного показателя в анализируемой совокупности, можно сделать вывод, что произведение
(1≤i≤n) является показателем силы влияния соответствующего фактора на данный показатель.
Обратите внимание на лекцию "24 Решение матричных игр в смешанных стратегиях с помощью Excel".
Поделив произведение ; на коэффициент множественной детерминации R2, получим коэффициент, который показывает какова доля вклада анализируемого фактора в суммарное влияние всех отобранных факторов. Обозначив этот коэффициент Δi, получим
Δi (18)
На основании частных коэффициентов эластичности Эi βi и Δi - коэффициентов можно судить о резервах роста производительности и эффективности исследуемого процесса, которые заложены в том или ином факторе.
Увеличение числа существенных факторов, включаемых в модель исследуемого показателя, позволяет выявить дополнительные резервы производства.
Для этого могут быть использованы трех-, четырех- (и т.д.), п-факторные регрессии.