341_4- Сборник задач по математике для втузов. В 4-х ч. Ч.4_ (ред) Ефимов А.В, Поспелов А.С_2003 -432с (987780), страница 58
Текст из файла (страница 58)
Сначала длл каждой переменной находят суммы наблюдаемых значений, суммы квадратов, а также суммы попарных произведений. Затем вычисляют Яю ()х„|.~„„,6~„ю (~„„, используя формулы „, (~ )',,„,, (~..ч)' — х,р, я (~ х||) ~~ хг|) Я„„= ~~~ хнхж— у' = 1, 2. я Далее вычисляют матрицы АтА=( Ю*' 6)*'*' ) ((тА)-' = Ю*' 1",1„ 1, -Ю*,*, ,~'Ъ'=( - ). — Д„„~ 1 / ~.гл~ х 9 = до+ д|х Найти оценки параметров 7уо и 771. 5. Множественная линейная регрессия (случай двух независимых переменных).
Предположим, что зависимость между переменными имеет вид Р = |го + |3|х| + |8гхг, (38) где переменные х| и хг принимают заданные фиксированные значенил, причем между переменными х| и хг нет линейной зависимости. Результаты наблюдения (хн, хги 9|), | = 1, 2, ..., п, представллютсл в виде 9| = 11о+)3|хи+)3гхг;+со 3 7. Элементы регрессвоняого анализа 331 р (4тА)-~А~т = Оценка параметра До вычисляется по формуле )го = у — )ггпу! — Лги.
(39) Остаточная сумма квадратов с„), вычисляется по формуле — )ч Агу Предположим, что ошибки наблюдений е, независимы, имеют равные дисперсии и нормально распределены. В этом случае можно проверить гипотезу Но . Д = )гг = О. Эта гипотеза позволяет установить, находятся ли переменные хг и хг во вааимосвязи с У. Статистикой критерия для проверки гипотезы Но является отношение )3 АтУ/2 Сг,/(и — 3) (40) Если выборочное значение этой статистики Р, ) Р1 „(2, и — 3), то гипотеза Но отклоняется; в противном случае следует считать, что взаимосвязи У с переменными хг и хг нет.
Границы доверительных интервалов для параметров д и )уг определяются по формуле уеду .4:1г а/г(и — 3) а, /агу, у' = 1, 2, (41) где а" — диагональный элемент матрицы (А А), в = ~) т -г Юе 1) и — 3 При использовании модели (38) для представления данных необходимо решить вопрос о целесообразности включения переменной хг или хг в модель. Для этого проверяютсягипотезыНо . )31 = О, у = 1, 2. О). Очевидно, эти гипотезы могут быть проверены непосредственно по доверительным интервалам для параметров д и )уг. если доверительный интервал для Д, у = 1, 2, накрывает нуль, то гипотеза Но . д = 0 О).
принимается. В противном случае Ноф) отклоняется. Коэффициент множественной корреляции, характеризующий отклонение результатов наблюдений от плоскости регрессии у = )уо + Ахг + + )угхг, опрелеляется по формуле ,9 АтУ Ят (42) Чтобы исключить потерю точности при использовании элементов матрицы (АтА) ', деление этой матрицы на определитель )АтА! следует выполнять в последнюю очередь. Вектор оценок определяется по формуле Гл.
19. Математическая статистика 332 П ример 7. Температура объекта У зависит от процентного содержания х1 компоненты А в теплоносителе и температуры окружающей среды хэ. Ниже приведены результаты 11 замеров этих данных. Используя эту выборку, выполнить следующие задания: а) найти оценки н доверительные интервалы параметров модели у !60 + 1!1х! + !!2х2 ° б) проверить взаимосвязь У с переменными х1 и хт, в) проверить гипотезы Но® ! (1 = О, у = 1, 2; г) вычислить коэффициент множественной корреляции.
Предполагается,что ошибки наблюдений не коррелированы, имеют равные дисперсии и распределены по нормальному закону. Принять уровень значимости а = 0,10. с2 а) Предварительно вычислим хм = 66, ~~! хтя = — 22, ~у! = 33, ~~~ х21; — 506, хсяхн = — 346, ~ х22; = 484, ~ уэ = 289, ~у!х1! = 85, ~~ у;х21 — — 142, у = 3, х! — — 6, хт — — — 2.
Палее находим / 110 -214 ! Матрица А А = ~ — » 440 (, !А А! = 2604. Найдем матрицу (А! А) ', имеем т -1 1 ( 440 214 !1 ( 0 169 0 082 ~ 2604 1 214 110 / 1 0,082 0,042 г' ' 662 = 506 — — = 110, 11 332 1'')т = 289 — — = 190, 11 33 ° 66 Я, т = 85 — — = -113 и Я„, = 484 — = 440, ( — 22) 2 11 Ю*!*2 = — 346 — = — 214 66 ( — 22) 11 Я„„= 142 — = 208. 11 3 7. Элементы регрессионного анализа 333 / — п3 Так как .4~У = ) ), вектор оценок равен () 0,082 0,042 208 -0,530 Найдем оценку параметра 1)о. По формуле (38) имеем До = 3 — ( — 2,041) 6 — ( — 0,530) ( — 2) = 14,186. Таким образом, уравнение плоскости регрессии имеет вид у = 14,186 — 2,041х1 — 0,53хэ. Определим доверительные интервалы для параметров 61 и бт.
Для этого находим остаточную сумму квадратов: Ц (А, Дэ) = 190 — ( — 2,041 — 0,530) ' ~ ) = 69,607. / — 113 1 Далее вычисляем оценку дисперсии ошибок наблюдений: 69,607 — — — — 8,7, а 2,95. я — 3 11 — 3 По таблице Пб нахопим 1о,ээ(8) = 1,860. Доверительные интервалы опре- деляем по формуле (40). Для параметра Д1 имеем — 2,041 х 1,86 2,95 ~/0,1б9 а — 2,041 х 0,927, следовательно, параметр )71 накрывается интервалом ( — 2,968; — 1,114). Для параметра 1)э имеем — 0,53 х 1,86 2,95 т/0,042 — 0,53 х 1,124.
Следовательно, параметр )уэ накрывается интервалом ( — 1,654; 0,594). б) Для проверки гипотезы Но . А =,9э = 0 вычислим выборочное т т / -113 значениестатистикиГ. Танкан)3 А Ъ'= ( — 2,041 — 0,53) ( 208 ) = = 120,393, по формуле (39) имеем à — 120'3931 2 6 918 69,607/(11 — 3) так как это значение больше Го,эо(2,8) = 3,113 (таблица П7), гипотеза Но отклоняется.
Гл. 19. Математическая статистика 334 в) Проверим значимость переменных х» и хэ. Доверительный интервал для параметра 1»» не накрывает нуль, следовательно, переменная х, значима. Доверительный интервал для параметра 1)э накрывает нуль, следовательно, переменная хз может быть исключена из рассмотрения. г) Коэффициент множественной корреляции вычисляется по формуле (42): 120,393 190 Для приведенных ниже данных (задачи 19.382 — 19.385) выполнить следующие задания: з) найти уравнение плоскости регрессии и доверительные интервалы для параметров ))г и»Зз,' б) пРовеРить гипотезУ: Но .
)У» = »8з = 0; в) проверить гипотезы Но . /3; = О, у = 1, 2; 11) . г) вычислить коэффициент множественной корреляции. Предполагается, что ошибки наблюдений не коррелированы, имеют равные дисперсии и распределены по нормальному закону. Уровень значимости сг задается. 19.382. ,'» хн =20, у хз; = — 12, 2 у; = 36, ,'» х㻠— — 186, хз = 302, "„у у = 496, ~» хихз' = — 35, ~ хг»у' = 215, хз»у; = 118; гх = 0,10.
19.383. у хи = 4, ~хе; = 34, ~» у, = 13, ~ хзг = 94, ,'» хз; — — 516» ~у»- = 4, ~~» хнх»н = — 174, хну» = уу~ ~~~ хз»У» = 216; гг = 0,10. З 7. Элементы регрессионного анализа 335 19.384. ~> хи = 274, ~хг, = 198, ~~~ д, = 223,6, ~) хги = 9488, ~д~ = 8911,76, ~~~ хихг, = 6875,6, хг, = 5979,08, ~> хид, = 8049,2, ~> хг,д, = 6954,7; а = 0,05. 19.385. ~~) хи = 297, ~~ хг; = 331, ~~) д, = 274,3, ~) хгн = 14627, Я хгг, = 14207, ~ дг = 13 108,47, ~ хихг; — 9926, хид; = 13451,6, ~~~ хг,д; = 8972,9; ст = 0 05. 19.386. Записать систему нормальных уравнений для нахождения оценок параметров плоскости регрессии (38) по результатам наблюдений (хи, хг„д,), 1 = 1, 2, ..., н. 6.
Вычисление и статистический анализ оценок параметров линейной модели прн коррелированных и неравноточных наблюдениях. В некоторых случаях ошибки наблюдений со 1 = 1, 2, ..., п, случайной зависимой переменной У имеютп различные дисперсии и коррелираеаны. Так случается, когда измерения проводятся при помощи приборов, имеющих разную точность, либо когда ошибки измерения зависят от значений независимой переменной х и т.д. В этих случаях вычисление и статистический анализ МНК-оценок параметров проводится следующим образом.
Предположим, что ошибки наблюдений ео 1 = 1, 2,..., и, имеют нулевые математические ожидания и ковариациоиную матрицу агИ', Гл. 19. Математическая статистика 336 где Иг — известная симметрическая положительно определенная мат- рица е). Система нормальных уравнений (23) для нахождения оценок параметров модели (21) записывается в виде АтИг-гА)3 АтИг-~У Вектор оценок параметров вычисляется по формуле ,В = (А'И -'А)-'А'И -'У Остаточная сумма квадратов находится из соотношения утИ -~у ~~Ат)4г-гу (43) Ковариационная матрица оценок вычисляется по формуле К = от(А~И' 'А) (44) Обычно величина оэ неизвестна. Оценка этой величины по результатам наблюдений определяется по формуле оэ ьее п — )с (45) 1 О шг 1 шэ где ш„г' = 1, 2,..., и — заданные «веса» дисперсий ошибок наблюде- ний.
В атом случае обратная матрида Иг ' имеет вид О шп е ) Симметрическая матрица положительно определена тогда и только тогда, когда все ее главные миноры положительны (крптерий Сильвестра). где )с — число оцениваемых параметров. В случае, когда ошибки наблюдений ес не иоррелироваим, матрида И' имеет диагональный вид: 7.
Элементы регрессионного анализа 337 до~и;+ Д ~ ~ю,х +А~~~ ю,х, = ~~~ ю,у„ до~~' и1хи+ А ~~' юЖ +А~' ю1х; = ~~' юэхэуа ~Зо ~~ ю,х, + д ~~~ и;х; + )уэ ~~ ю;х, = Си;х;уь (46) Статистический анализ опенок параметров проводится аналогично тому, как это было сделано в и. 2 настоящего параграфа.
Пример 8. Предположим, что в условиях примера 4 веса дисперсий ошибок наблюдений распределены следующим образом: ю~ — — 2; юэ = 1,5; юэ — — ю4 = юэ -— 1; ио — — 1,5; ют — — 2, т.е. ошибки наблюдений не коррелированы, но их дисперсии зависят от модуля значения независимой переменной х.
При условии, что ошибки наблюдений е, имеют и нормальное распределение Ф О, — /, 1 = 1, 2, ..., и, найти оценки параметров модели у = ро+Дх+рэх, оценку ковариационной матрицы ошибок наблюдений, а также доверительные интервалы для параметров. Принять а = 0,05. О Используя данные и результаты решения примера 4, вычислим коэффициенты системы (46): ю;х; = О, ~ ~и;хэ = 50, Д~~ и;хэ = О, ~~~ и;х~ = 374, ю,у, = -8, ~~~ и;х;у; = 54, ~ ю,хэу, = - 196, ~~~ и; = 10. Система нормальных уравнений (46) имеет вид 10Цо + 50~3э = — 8, 5081 = 54, 506о + 374А = — 196 (47) Решая эту систему, получим До = 5,49, А = 1,08, А = -1,258 Найдем остаточную сумму квадратов.
Предварительно вычислим Ъ'~Ит 'У = ~ ~ю;уэ = 271. — 8 Так как правая часть нормальной системы (47) равна 54, по -196 формуле (43) находим / — 8 Я, = 271 — (5,49 1,08 — 1,258) 54 = 10,032. -196 / и, в частности, для модели у = ро+ Дх+ рэх получим систему нормальных уравнений в виде (см. (7)) Гл. 19. Математическая статистика 338 Оценка ковариационной матрицы по формулам (44) и (45) равна 80 0 ) 0 — 0,040 0,02 0 0 8 06, 10-з 0,303 а 2,508 0 — 0,040 0,756 0 — 0,101 0 0,5 0 — 0,101 0 0,02 Определим доверительные интервалы для параметров модели.