4 часть (1081361), страница 59
Текст из файла (страница 59)
Доверительные интервалы опре- деляем по формуле (40). Для параметра Д1 имеем — 2,041 х 1,86 2,95 ~/0,1б9 а — 2,041 х 0,927, следовательно, параметр )71 накрывается интервалом ( — 2,968; — 1,114). Для параметра 1)э имеем — 0,53 х 1,86 2,95 т/0,042 — 0,53 х 1,124. Следовательно, параметр )уэ накрывается интервалом ( — 1,654; 0,594). б) Для проверки гипотезы Но . А =,9э = 0 вычислим выборочное т т / -113 значениестатистикиГ.
Танкан)3 А Ъ'= ( — 2,041 — 0,53) ( 208 ) = = 120,393, по формуле (39) имеем à — 120'3931 2 6 918 69,607/(11 — 3) так как это значение больше Го,эо(2,8) = 3,113 (таблица П7), гипотеза Но отклоняется. Гл. 19. Математическая статистика 334 в) Проверим значимость переменных х» и хэ. Доверительный интервал для параметра 1»» не накрывает нуль, следовательно, переменная х, значима. Доверительный интервал для параметра 1)э накрывает нуль, следовательно, переменная хз может быть исключена из рассмотрения. г) Коэффициент множественной корреляции вычисляется по формуле (42): 120,393 190 Для приведенных ниже данных (задачи 19.382 — 19.385) выполнить следующие задания: з) найти уравнение плоскости регрессии и доверительные интервалы для параметров ))г и»Зз,' б) пРовеРить гипотезУ: Но .
)У» = »8з = 0; в) проверить гипотезы Но . /3; = О, у = 1, 2; 11) . г) вычислить коэффициент множественной корреляции. Предполагается, что ошибки наблюдений не коррелированы, имеют равные дисперсии и распределены по нормальному закону. Уровень значимости сг задается. 19.382. ,'» хн =20, у хз; = — 12, 2 у; = 36, ,'» х㻠— — 186, хз = 302, "„у у = 496, ~» хихз' = — 35, ~ хг»у' = 215, хз»у; = 118; гх = 0,10. 19.383. у хи = 4, ~хе; = 34, ~» у, = 13, ~ хзг = 94, ,'» хз; — — 516» ~у»- = 4, ~~» хнх»н = — 174, хну» = уу~ ~~~ хз»У» = 216; гг = 0,10. З 7.
Элементы регрессионного анализа 335 19.384. ~> хи = 274, ~хг, = 198, ~~~ д, = 223,6, ~) хги = 9488, ~д~ = 8911,76, ~~~ хихг, = 6875,6, хг, = 5979,08, ~> хид, = 8049,2, ~> хг,д, = 6954,7; а = 0,05. 19.385. ~~) хи = 297, ~~ хг; = 331, ~~) д, = 274,3, ~) хгн = 14627, Я хгг, = 14207, ~ дг = 13 108,47, ~ хихг; — 9926, хид; = 13451,6, ~~~ хг,д; = 8972,9; ст = 0 05. 19.386. Записать систему нормальных уравнений для нахождения оценок параметров плоскости регрессии (38) по результатам наблюдений (хи, хг„д,), 1 = 1, 2, ..., н. 6.
Вычисление и статистический анализ оценок параметров линейной модели прн коррелированных и неравноточных наблюдениях. В некоторых случаях ошибки наблюдений со 1 = 1, 2, ..., п, случайной зависимой переменной У имеютп различные дисперсии и коррелираеаны. Так случается, когда измерения проводятся при помощи приборов, имеющих разную точность, либо когда ошибки измерения зависят от значений независимой переменной х и т.д. В этих случаях вычисление и статистический анализ МНК-оценок параметров проводится следующим образом. Предположим, что ошибки наблюдений ео 1 = 1, 2,..., и, имеют нулевые математические ожидания и ковариациоиную матрицу агИ', Гл.
19. Математическая статистика 336 где Иг — известная симметрическая положительно определенная мат- рица е). Система нормальных уравнений (23) для нахождения оценок параметров модели (21) записывается в виде АтИг-гА)3 АтИг-~У Вектор оценок параметров вычисляется по формуле ,В = (А'И -'А)-'А'И -'У Остаточная сумма квадратов находится из соотношения утИ -~у ~~Ат)4г-гу (43) Ковариационная матрица оценок вычисляется по формуле К = от(А~И' 'А) (44) Обычно величина оэ неизвестна. Оценка этой величины по результатам наблюдений определяется по формуле оэ ьее п — )с (45) 1 О шг 1 шэ где ш„г' = 1, 2,..., и — заданные «веса» дисперсий ошибок наблюде- ний. В атом случае обратная матрида Иг ' имеет вид О шп е ) Симметрическая матрица положительно определена тогда и только тогда, когда все ее главные миноры положительны (крптерий Сильвестра).
где )с — число оцениваемых параметров. В случае, когда ошибки наблюдений ес не иоррелироваим, матрида И' имеет диагональный вид: 7. Элементы регрессионного анализа 337 до~и;+ Д ~ ~ю,х +А~~~ ю,х, = ~~~ ю,у„ до~~' и1хи+ А ~~' юЖ +А~' ю1х; = ~~' юэхэуа ~Зо ~~ ю,х, + д ~~~ и;х; + )уэ ~~ ю;х, = Си;х;уь (46) Статистический анализ опенок параметров проводится аналогично тому, как это было сделано в и. 2 настоящего параграфа. Пример 8. Предположим, что в условиях примера 4 веса дисперсий ошибок наблюдений распределены следующим образом: ю~ — — 2; юэ = 1,5; юэ — — ю4 = юэ -— 1; ио — — 1,5; ют — — 2, т.е.
ошибки наблюдений не коррелированы, но их дисперсии зависят от модуля значения независимой переменной х. При условии, что ошибки наблюдений е, имеют и нормальное распределение Ф О, — /, 1 = 1, 2, ..., и, найти оценки параметров модели у = ро+Дх+рэх, оценку ковариационной матрицы ошибок наблюдений, а также доверительные интервалы для параметров. Принять а = 0,05.
О Используя данные и результаты решения примера 4, вычислим коэффициенты системы (46): ю;х; = О, ~ ~и;хэ = 50, Д~~ и;хэ = О, ~~~ и;х~ = 374, ю,у, = -8, ~~~ и;х;у; = 54, ~ ю,хэу, = - 196, ~~~ и; = 10. Система нормальных уравнений (46) имеет вид 10Цо + 50~3э = — 8, 5081 = 54, 506о + 374А = — 196 (47) Решая эту систему, получим До = 5,49, А = 1,08, А = -1,258 Найдем остаточную сумму квадратов. Предварительно вычислим Ъ'~Ит 'У = ~ ~ю;уэ = 271. — 8 Так как правая часть нормальной системы (47) равна 54, по -196 формуле (43) находим / — 8 Я, = 271 — (5,49 1,08 — 1,258) 54 = 10,032.
-196 / и, в частности, для модели у = ро+ Дх+ рэх получим систему нормальных уравнений в виде (см. (7)) Гл. 19. Математическая статистика 338 Оценка ковариационной матрицы по формулам (44) и (45) равна 80 0 ) 0 — 0,040 0,02 0 0 8 06, 10-з 0,303 а 2,508 0 — 0,040 0,756 0 — 0,101 0 0,5 0 — 0,101 0 0,02 Определим доверительные интервалы для параметров модели. Так как ~о эм(4) = 2,776, то по формуле (30) получим границы доверительных интервалов: для 4> . 5,49 х 2,776 ь/2,508 8/0,303; для 732: 1,08 х 2,776 ~/2,508 ~/0,02; 6: -1,28862,776 2,808 278,06 10 или )уо 6 (3,08; 7,90), Д 6 (0,46; 1,70), ()0 Е ( — 1,65; — 0,87). ~> 19.387. Решить задачу 19.345, если ошибки наблюдений не коррелированы, а веса дисперсий ошибок наблюдений заданы следующим образом: и7~ = ц77 = 2; ц7э = гое = 175; п0з =ц04 = ц0э =1. Найти оценку дисперсии результатов наблюдений.
19.388. Масса тела т определяется по результатам и независимых взвешиваний гя1, тт, ..., т„, причем результат 4-го взвешивания имеет дисперсию, равную с7 /ю„где щ — заданные значения, 4 = 1, 2, ..., и. Найти оценку массы тела по этим результатам. Определить дисперсию полученной оценки. 19.389. Пусть для оценки параметра )3 модели д = Дх используется выборка (х,, у;), 0' = 1, 2, ..., и.
Предполаким, что дисперсия наблюдаемой случайной величины У пропорциональна х. Найти оценку параметра,9 и дисперсию этой оценки. 19.390. Решить задачу 19.389, если дисперсия У пропорциональна хт. 19.391. Используя результаты, полученные при решении задачи 19.389 и 19.390, найти опенку параметра )3 модели у =,Зх по выборке 38. Непарамстрические методы математической статистики 339 если а) результаты наблюдений имеют равные дисперсии; б) дисперсия результатов наблюдений пропорциональна х; в) дисперсия результатов наблюдений пропорциональна х~.
Вычислить дисперсии оценки параметра, если коэффициент пропорциональности в б) и в) равен единице. 3 8. Непарйметрические методы математической статистики 1. Основные понятия. Критерий знаков. В практике обработки результатов наблюдений распределение генеральной совокупности часто неизвестно либо (для непрерывных случайных величин) отличается от нормального распределения, так что применение методов из 3 3 — 5 настоящей главы не обосновано н может привести к ошибкам. В этих случаях применяют методы, ие эависли4ие (или свободные) вт распределения генеральной совокупности, называемые также непараметрическими методами. Непараметрические методы используют не сами численные значения элементов выборки, а структурные свойства выборки (например, отношения порядка между ее элементами).
В связи с этим теряется часть информации, содержащаяся в выборке, поэтому, например, мощность не- параметрических критериев меньше, чем мощность их аналогов из 3 4. Однако непараметрнческне методы могут применяться при более общих предположениях и более просты с точки зрения выполнения вычислений. Большая группа непараметрнческих критериев используется для проверки гипотезы о принадлежности двух выборок хы хэ, ..., х„, и уы уэ, ..., у„, одной и той же генеральной совокупности, т.е.