183731 (629918), страница 4
Текст из файла (страница 4)
Определитель матрицы парных коэффициентов корреляции между факторами равен 0,2, что достаточно близко к 0, следовательно, между оставшимися факторами наблюдается мультиколлинеарность.
Продолжим удаление факторов, являющихся самыми неинформативными, регулярно сопоставляя значения множественного коэффициента корреляции и детерминации (который оценивает качество построенной модели в целом) и проверяя значимость уравнения регрессии.
В следующих таблицах представлены результаты регрессионного анализа после исключения факторов х1, х5, х8, х10.
ВЫВОД ИТОГОВ | |
Регрессионная статистика | |
Множественный R | 0,999530603 |
R-квадрат | 0,999061427 |
Нормированный R-квадрат | 0,995307133 |
Стандартная ошибка | 29,05134237 |
Наблюдения | 6 |
Дисперсионный анализ | |||||
| df | SS | MS | F | Значимость F |
Регрессия | 4 | 898372,4 | 224593,0982 | 266,111717 | 0,045939839 |
Остаток | 1 | 843,9805 | 843,9804935 | ||
Итого | 5 | 899216,4 |
|
|
|
| Коэффициенты | Стандартная ошибка | t-статистика | P-Значение |
Y-пересечение | 30538,08691 | 1623,46624 | 18,81042319 | 0,03381216 |
x1 | -26,94728304 | 1,07745261 | -25,01017937 | 0,02544087 |
x5 | 0,007316604 | 0,00087595 | 8,352752758 | 0,07585572 |
x8 | -242,9957642 | 101,983594 | -2,382694665 | 0,25297163 |
x10 | -81,66075105 | 21,2523898 | -3,842426757 | 0,16208611 |
По данным вычислениям уравнение регрессии будет иметь вид:
ŷ =30538,09-26,95*x1+0,007*x5-242.996*x8-81,66*x10.
б) Оценка практической значимости и надежности полученного уравнения.
Для оценки значимости параметров уравнения используется t- критерий Стьюдента. С помощью t-критерия Стьюдента для каждого из оставшихся факторов можно выяснить, формируется ли он под воздействием случайных величин (является ли фактор информативным).
Его можно определить как:
,
где - частный F- критерий Фишера, который определяется по формуле:
,
где - множественный коэффициент детерминации всего комплекса р факторов с результатом;
- тот же показатель детерминации, но без введения в модель фактора xi.
n- число наблюдений;
m- число параметров в модели (без свободного члена).
При этом определяются две гипотезы:
Н0 - коэффициент статистически незначим;
Н1 - коэффициент статистически значим.
Затем сравнивается факторное значение t- критерия, т.е. вычисленное, и табличное, определенное по специальной таблице t-критерия. Если факторное значение окажется больше табличного, то гипотеза Н0 отклоняется и коэффициент признается статистически значимым.
В полученном уравнении tтабл: n-m-1=7-4-1=2, tтабл =4,3
Следовательно коэффициенты при факторах х1, х5 являются статистически значимыми, для них значение t-критерия больше 4,3, следовательно, можно сделать вывод о существенности данных параметров, которые формируются под воздействием неслучайных причин, а коэффициенты при х8, х10, соответственно, незначимы.
P-значение характеризует вероятность случайного характера формирования параметра. Из рассчитанных значений видно, что наибольшей вероятностью случайной природы факторов обладают b8 , поэтому этот фактор можно исключить из уравнения регрессии. Также удаляем фактор b10 (так как он не является значимым).
Проведём анализ данных для оставшихся двух факторов:
ВЫВОД ИТОГОВ | |
Регрессионная статистика | |
Множественный R | 0,99242 |
R-квадрат | 0,984897 |
Нормированный R-квадрат | 0,974828 |
Стандартная ошибка | 67,28282 |
Наблюдения | 6 |
Дисперсионный анализ | |||||
| df | SS | MS | F | Значимость F |
Регрессия | 2 | 885635,4 | 442817,7 | 97,8175049 | 0,001856086 |
Остаток | 3 | 13580,93 | 4526,978 | ||
Итого | 5 | 899216,4 |
|
|
|
| Коэффициенты | Стандартная ошибка | t-статистика | P-Значение |
Y-пересечение | 287,2650033 | 1821,254 | 14,04644 | 0,00078146 |
x1 | 2,866255447 | 2,231529 | -12,4227 | 0,00112406 |
x5 | -0,145583563 | 0,001402 | 6,384305 | 0,00778112 |
Проверим еще раз наличие мультиколлинеарности оставшихся факторов. Для парных коэффициентов корреляции между факторами х1, х5 матрица имеет вид:
Определитель матрицы парных коэффициентов корреляции между факторами приближенно равен 1 что говорит об отсутствии мультиколлинеарности между оставшимися факторами.
Теперь из модели исключены явно коррелированные факторы, следовательно, можно приступать к оценке модели множественной регрессии. Значимость и надежность всего уравнения в целом определяется с помощью
F- критерия Фишера:
,
где R2- коэффициент (индекс) множественной детерминации;
n- число наблюдений;
m- число параметров при переменных х.
После вычисления F-критерия факторное значение сравнивается с табличным. Если факторное значение больше табличного, то уравнение статистически значимо и надежно.
Полученное уравнение ŷ = 287,265 +2,86*х1 -0,145*х5 является надежным и статистически значимым, т.к. Fфакт = 97,82 > Fтабл=6,94 (для определения Fтабл m=2, n-m-1=7-2-1=4).
Итак, окончательная математическая модель будет выглядеть следующим образом:
ŷ = 287,265 +2,86*х1 -0,145*х5.
Из полученного уравнения видно, что на производство рыбной продукции, тыс. тонн (фактор у) в большей степени влияют такие факторы как численность населения, на тыс. человек (фактор х1) и денежные доходы, млн. руб. (фактор х5). Причем при увеличении численности населения на тыс. человек на единицу производство рыбной продукции увеличится на 2,86 тонн, а при увеличении денежных доходов на 1 млрд руб. – уменьшится на 0,009 тонн.
2.2. Построение производственных функций
Рассмотрим некоторые производственные функции, их предназначение и свойства.
Название производственной функции | Двухфакторная производственная функция | Использование |
1.Функция с |
| Предназначена для моделирования строго |
2. ПФ Кобба - |
| Используется для описания среднемасштабных |
3. Линейная ПФ |
| Применяется для моделирования |
4. ПФ Аллена |
| Предназначена для описания производственных |
5. ПФ постоянной |
| Применяется в случаях, когда отсутствует точная |
Из описания представленных выше производственных функций можно сделать вывод, что для моделирования производственного процесса выпуска рыбной продукции могут подойти три из них: Линейная ПФ и ПФ Кобба – Дугласа.
| 1999 | 2000 | 2001 | 2002 | 2003 | 2004 | 2005 |
Выпуск, тонны | 2201 | 1913 | 1384 | 1067 | 961 | 1172 | 918 |
Себестоимость сырья | 1563 | 1721 | 2004 | 1245 | 1321 | 1276 | 1436 |
Отработанные человеко-часы | 314,1 | 315,53 | 321,262 | 322,7 | 321,26 | 301,183 | 304,05 |
Проведем исследование с помощью метода наименьших квадратов в программе MathCAD.
1. ПФ Кобба – Дугласа.