Диссертация (1141467), страница 47
Текст из файла (страница 47)
При этом система нормальных уравнений будет иметьвид:rx1y=β1+rx1x2•β2 + ... + rx1xm•βmrx2y=rx2x1•β1 + β2 + ... + rx2xm•βm...rxmy=rxmx1•β1 + rxmx2•β2 + ... + βmДля наших данных (берем из матрицы парных коэффициентов корреляции):0.993 = β1 -0.547β2 + 0.737β3 + 0.136β4 -0.666β5-0.529 = -0.547β1 + β2 + 0.146β3 + 0.525β4 + 0.772β50.74 = 0.737β1 + 0.146β2 + β3 + 0.625β4 -0.166β50.122 = 0.136β1 + 0.525β2 + 0.625β3 + β4 + 0.576β5-0.698 = -0.666β1 + 0.772β2 -0.166β3 + 0.576β4 + β5Данную систему линейных уравнений решаем методом Гаусса: β1 = 1.468; β2 = 0.573; β3 = -0.743; β4 =0.374; β5 = -0.501;Стандартизированная форма уравнения регрессии имеет вид:ty = 1.468x1 + 0.573x2 -0.743x3 + 0.374x4 -0.501x5Найденные из данной системы β–коэффициенты позволяют определить значения коэффициентов врегрессии в естественном масштабе по формулам:4153.
Анализ параметров уравнения регрессии.Перейдем к статистическому анализу полученного уравнения регрессии: проверке значимостиуравнения и его коэффициентов, исследованию абсолютных и относительных ошибок аппроксимацииДля несмещенной оценки дисперсии проделаем следующие вычисления:Несмещенная ошибка ε = Y - Y(x) = Y - X*s (абсолютная ошибка аппроксимации)YY(x)ε = Y - Y(x)ε2(Y-Yср)2|ε : Y|10094.2915.70932.595188232.020.0571312303.858.1566.42349220.5920.0261455452.0912.9098.4656218.4490.00639950937.81712.183148.427173174.8780.012812001182.65917.341300.713443746.3060.0145550538.51611.484131.874260.5920.0209170164.8195.18126.845132392.020.0305715.341993244.8570.168Средняя ошибка аппроксимацииОценка дисперсии равна:se2=(Y-Y(X))T(Y-Y(X))=715.341Несмещенная оценка дисперсии равна:Оценка среднеквадратичного отклонения (стандартная ошибка для оценки Y):Найдем оценку ковариационной матрицы вектора k = S2 • (XTX)-135755.074-35.781-47746.99968.129-233.063-3181.665416-35.7810.055881.882-0.1352.315-72.325-47746.99881.881132972.771-211.7544314.867-157779.43968.129-0.135-211.7540.359-7.969267.325-233.0632.3154314.866-7.969284.676-9742.178-3181.667-72.322-157779.439267.325-9742.18398431.893Дисперсии параметров модели определяются соотношением S2i = Kii, т.е.
это элементы, лежащие наглавной диагонали6. Проверка общего качества уравнения множественной регрессии.F-статистика. Критерий Фишера.Проверим гипотезу об общей значимости - гипотезу об одновременном равенстве нулю всехкоэффициентов регрессии при объясняющих переменных:H0: R2 = 0; β1 = β2 = ... = βm = 0.H1: R2 ≠ 0.Проверка этой гипотезы осуществляется с помощью F-статистики распределения Фишера(правосторонняя проверка).Если F < Fkp = Fα ; n-m-1, то нет оснований для отклонения гипотезы H0.Табличное значение при степенях свободы k1 = 5 и k2 = n-m-1 = 7 - 5 - 1 = 1, Fkp(5;1) = 230Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим иуравнение регрессии статистически надежно.417В результате расчетов было получено уравнение множественной регрессии: Y = -86.6472 + 1.4422X1 +1117.2342X2-1.6839X3 + 56.6082X4-2687.5646X5.
Возможна экономическая интерпретация параметровмодели: увеличение X1 на 1 ед.изм. приводит к увеличению Y в среднем на 1.442 ед.изм.; увеличениеX2 на 1 ед.изм. приводит к увеличению Y в среднем на 1117.234 ед.изм.; увеличение X3 на 1 ед.изм.приводит к уменьшению Y в среднем на 1.684 ед.изм.; увеличение X4 на 1 ед.изм. приводит кувеличению Y в среднем на 56.608 ед.изм.; увеличение X5 на 1 ед.изм.
приводит к уменьшению Y всреднем на 2687.565 ед.изм. Статистическая значимость уравнения проверена с помощьюкоэффициента детерминации и критерия Фишера. Установлено, что в исследуемой ситуации 99.93%общей вариабельности Y объясняется изменением факторов Xj.ЧАСТЬ 2 Оценка уравнения регрессии для 2-ого классификационногокластера1. Оценка уравнения регрессии.Определим вектор оценок коэффициентов регрессии. Согласно методу наименьших квадратов,вектор sполучается из выражения: s = (XTX)-1XTYК матрице с переменными Xj добавляем единичный столбец:11800.950250.6212001.335070.42127018070.515800.88070.6813501.416040.5515241.5150150.6314201.3100130.2812501.110050.24Матрица Y418160150200239264400388223Матрица XT111111111802002705803505244202500.91.310.81.41.51.31.1503508080160150100100257774151350.620.420.50.680.550.630.280.24Умножаем матрицы, (XTX)827749.31070833.92277411176763253348600278201425.224199.3325311.25133394.74.491107034860013332059009510506.9832782094.79510120743.193.921425.224.491506.943.192.1086В матрице, (XTX) число 8, лежащее на пересечении 1-й строки и 1-го столбца, получено как суммапроизведенийэлементов1-йстрокиматрицыXT и1-гостолбцаматрицыУмножаем матрицы, (XTY)20247721302449.525896021338984.08Находим обратную матрицу (XTX)-15.93114.8E-5-3.56790.00159-0.0153-3.52774.8E-51.1E-5-0.003039.0E-69.8E-5-0.00546-3.5679-0.003034.1526-0.00728-0.037552.35230.001599.0E-6-0.007283.3E-50.000176-0.00515-0.01539.8E-5-0.037550.0001760.00444-0.09088-3.5277-0.005462.3523-0.00515-0.090888.8108X420Вектор оценок коэффициентов регрессии равенY(X) = (XTX)-1XTY =-84.99790.4555243.0273-0.343.3911-194.4607Уравнение регрессии (оценка уравнения регрессии)Y = -84.9979 + 0.4555X1 + 243.0273X2-0.34X3 + 3.3911X4-194.4607X53.
Анализ параметров уравнения регрессии.Перейдем к статистическому анализу полученного уравнения регрессии:проверке значимости уравнения и его коэффициентов, исследованиюабсолютных и относительных ошибок аппроксимацииДля несмещенной оценки дисперсии проделаем следующие вычисления:Несмещенная ошибка ε = Y - Y(x) = Y - X*s (абсолютная ошибкааппроксимации)YY(x)ε = Y - Y(x)ε2(Y-Yср)2|ε : Y|160162.93-2.938.58586490.0183150145.0964.90424.052106090.0327200180.32419.676387.13128090.0984421239237.9271.0731.1521960.00449264266.878-2.8788.2841210.0109400395.5864.41419.479216090.011388377.88810.112102.262182250.0261223232.494-9.49490.1329000.0426641.077631180.244Средняя ошибка аппроксимацииОценка дисперсии равна:se2=(Y-Y(X))T(Y-Y(X))=641.077Несмещенная оценка дисперсии равна:Оценка среднеквадратичного отклонения (стандартная ошибка для оценки Y):Найдем оценку ковариационной матрицы вектора k = S2 • (XTX)-11901.1510.0154-1143.6360.508-4.905-1130.7570.01540.00359-0.970.002970.0314-1.749-1143.636-0.971331.085-2.332-12.037754.0130.5080.00297-2.3320.01040.0563-1.651-4.9050.0314-12.0370.05631.423-29.131-1130.757-1.749754.013-1.651-29.1312824.219Дисперсии параметров модели определяются соотношением S2i = Kii, т.е.
это элементы, лежащие на422главной6.диагоналиПроверкаобщегокачествауравнениямножественнойрегрессии.КритерийF-статистика.Фишера.Проверим гипотезу об общей значимости - гипотезу об одновременном равенстве нулю всехкоэффициентоврегрессииR2 =H0:0;приβ1 =β2 =объясняющих...=переменных:βm =0.R ≠H1:0.2Проверка этой гипотезы осуществляется с помощью F-статистики распределения Фишера(правосторонняяЕслиF<проверка).Fkp =Fα;,n-m-1тонетоснованийдляотклонениягипотезыH0.Табличное значение при степенях свободы k1 = 5 и k2 = n-m-1 = 8 - 5 - 1 = 2, Fkp(5;2) = 19.3Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим иуравнение регрессии статистически надежно.В результате расчетов было получено уравнение множественной регрессии:Y = -84.9979 + 0.4555X1 + 243.0273X2-0.34X3 + 3.3911X4-194.4607X5.Статистическая значимость уравнения проверена с помощью коэффициента детерминации и критерияФишера.
Установлено, что в исследуемой ситуации 98.98% общей вариабельности Y объясняетсяизменением факторов Xj.ЧАСТЬ 3 Оценка уравнения регрессии для 3-ого классификационногокластера423Оценкауравнениярегрессии.Определим вектор оценок коэффициентов регрессии. Согласно методу наименьших квадратов, вектор sполучаетсяизвыражения:s=(XTX)-1XTYК матрице с переменными Xj добавляем единичный столбец:11300.633040.6111301.082040.8112000.547560.6512000.544050.5412360.783560.616200.548020.7416000.465030.914000.664050.4712700.755030.3211200.676070.3711000.678070.39Матрица Y13480200155424885234851201607863Матрица XT111111111111301302002002366206004002701201000.63 1.080.540.540.780.540.460.660.750.670.673020754035805040506080446562353770.610.810.650.540.60.740.90.470.320.370.39Умножаем матрицы, (XTX)1130067.32560526.4300611711961847.08162060120461920.87.321847.085.154353.834.854.2427425560162060353.8327502700318.25521204634.85270027428.696.41920.84.2427318.2528.694.0722В матрице, (XTX) число 11, лежащее на пересечении 1-й строки и 1-го столбца, получено как суммапроизведенийэлементов1-йстрокиматрицыXT и1-гостолбцаматрицыУмножаем матрицы, (X Y)T20868417081230.3511851079271397.59Находим обратную матрицу (XTX)-112.2506-0.00588-6.8968-0.02666-0.6538-2.6033-0.005881.0E-50.00352-1.7E-50.000637-0.00223-6.89680.003526.56380.019160.161-0.2926-0.02666-1.7E-50.019160.000397-0.001650.01064-0.65380.0006370.161-0.001650.089330.05864-2.6033-0.00223-0.29260.010640.058644.4466X426ВектороценоккоэффициентоврегрессииравенY(X) = (XTX)-1XTY =137.30270.2676-208.13922.3103-34.6167277.1541Уравнениерегрессии(оценкауравнениярегрессии)Y = 137.3027 + 0.2676X1-208.1392X2 + 2.3103X3-34.6167X4 + 277.1541X52.МатрицапарныхкоэффициентовкорреляцииR.Число наблюдений n = 11.