М.В. Козлов, А.В. Прохоров - Введение в математическую статистику (1115302), страница 15
Текст из файла (страница 15)
Итак, чтобы дисперсия оценок коэффициентов Оь !=-1,...,г, была минимальна, надо, если это выполнимо, орган!!зовать взвешивание так, чтобы, во-первых, вектора х! не содержалн нулевых компонент, т. е. при каждом взвешивании участвовали все предметы, и, во-вторых, матрица Х'Х была диагоналю!а, т. е. столбцы Х ортогональиы друг другу. Минимальное значение дисперсии одинаково для всех оценок н равно от/а. Если л=гл, то дисперсия взвешиваний от/а в г раз меньше, чем дисперсия о'/л при й-кратном взвешивании отдельных предметов и том же общем числе взвешиваний и. Приведем пример ортогональной матрицы нз элементов +1: 1 1 1 1 1 — 1 1 — 1 1 1 — 1 — 1 ! — 1 — 1 1 При г=а=4 эксперимент с Х=А приводит к дисперсии оценок ь-/4; прн г — -4, и 8, взяв Х'=[А', А'1, получим дисперсию о'/8, э то время как при вззешиваиин по отдельности эти дисперсии равны соответственно от и от/2. 5.
Каноническая форма линейной модели. рассмотрим линейную модель следующего частного вида: (/,=Ф!+обо !=-1,,з; У;=обо !'=э+1,...,и, Яб!=-О, ! =.1..., л; 1т'б==/, г,.-е 11 = (Гь..., !!„) — вск!ор наблюдений, ф= (!р!,...,ф.) — векГо!! неизвестных коэфчьнцпентов.
Теория наилучшего несмещенио- 84 го оценивания для модели (7) сильно упрощается по сравнению с обшей моделью предыдущего параграфа. Чтобы статистика и % л ) Ь~Ус = 7 Ьгф+ о )" Ь,б~ несмещенно оценивала, скажем, фь очевидно, необходимо и достаточно выполнение условия Ь~=1, Ь =...=Ь,=О. Чтобы ее дисл персия о'~' Ьг| была минимальна, надо положить еще Ь„~=...
1 1 Ь„О. Таким образом, наилучшие песмещениые оценки коэффициентов ф; равны ~ф= Уь 1=1,..., з. 1 кч 2 ох= — у Ую, а $ (8) которая, очевидно, является несмещенной. Покажем, что линейную модель общего вида: У=ОХ'+ ов, Ма,=о, 1=1, ..., а, )те==7, Х=(х,', х,', ..., х,'], 9=(Е,, Е,, ..., Е,), (9) ортогональной заменой переменных можно привести к виду (7), который называют канонической формой модели (9), н получить заново оценки 9 исходя из оценок ф. Обозначим через з ранг матрицы Х. Выберем ортонормированный базис в пространстве У размерности з, порожденном столбцами матрицы Х, и дополним его до ортонормированного базиса всего пространства 1т".
Обозначим через С ортогональную матрицу перехода к новым координатам: н=уС, н (иь...,и„), у=(уь...,у„). (10) Домпожим обе части соотношения (9) иа матрицу С, положим (1 ='тс, б=еС. Так как вектор среднего т1=9Х' лежит в пространстве ~, то его новые координаты можно представить в виде (4ь...,ф„о,...,о), а новые параметры 4ч,...,4, связаны со старыми соотношением т)С вЂ” — 9Х'С = (4 ь..., 4 „О,..., О) . (1 1) Такие же рассуждения показывают, что наилучшей оценкой параметрической функции а~4ч+...+а,4., будет а++...+а,~~,. Из второй группы соотношений (7) сама собой напрашивается оценка дисперсии Замечая, что (см.
(1)) га=г =СЛ,С=С7С=(, от модели (9) приходим к (7). Подставляя ф!=и!, г=1,...,з, вместо ф! в (1!), получим следуюшие соотношения для нахождения В: вх'с= (и,..., и„о,..., о). (12) Умножая обе части равенства (12) на С'Х, имеем ВХ'Х = (У!,..., У„О,..., 0) С'Х (13) (У!, ..., У„О, ..., 0)[с'х!', ..., С'х',]. По условию выбора нового ортонормироваиного базиса новые координаты любого вектора у из т' начиная с з+1-й нулевые: ус=(и!,...,и., 0,...,0).
Следовательно, все векторы х;С, г=1,...,г, имеют последние и — з координат нулевые, и потому (13) не изменится, если вектор (и!,..., У„О,..., 0) заменить на (У!„... У ): ВХ Х- (иь..., и.) С'Х-УСС'Х-УХ. (14) Матричное уравнение (14) совпадает с нормальной системой уравнений (24) $ 9. 6. Оцениваиие дисперсии. Пользуясь канонической формой (7) модели (9), выразим оценку от пз соотношения (8) через исходные величины Уь != = 1,...,и.
Из ортогональности матрицы С вытекает л п ~и! =~ ),"-, ! ! а из (12) получаем, что ~' У! = ЦВХ'СЦт = ВХ'СС'ХВ' = ВХ'ХВ'. ! 1 Таким образом, а В = — (~'и,' — ~~)),'и',) = — (~ У! — ВХ'ХВ' ) = — '(ЦТЦ' — ЦВХ'Ц'). (15) л — а ~4Ы / ЛФ ! 86 Воспользовавшись равенствами ОХ =пРуУ, У.=ПР//У+ ПРалетУ, ]]т'1]' = ]]прЩ'+ ]]пра е „Щ', перепишем (15) в следующей форме: 1 1 оз = — ]]пР ~ гЩ~= — ]] "т' — ОХ']]~ = // з аег и-з Л Г = — ~~)~ ~~У/ — ~ О/л// ), 1 ( ! Отметим, что оценка о' — несмещенная (см.
(8)). (16) 7. Обобщениан линейная модель. Обобщим линейную модель, допуская, что компоненты вектора в коррелированы: //=ОХ Ф ив, Ма =О, /те =Я= [/7!о 1, 1 = 1~ ° ° °, и], (17) ц= в'в, (18) где  — невырожденная //Х//-матрица. Умножая обе части (17) на В-', получаем т В-/ ОХ'В-'+оеВ-'. Вектор б=аВ-' имеет единичную коварнационную матрицу (см.
(1)): В,=(В- ) В,В- .—-. (В')- (В В) В- =1. Полагая и=иВ-/, Г=Х В-, приходим к обычной линейной модели: Ь = 9()т' + об, Мб = О, Яа- - 7, (19) причем матрица (Р имеет полный ранг. Покажем, как получить наилучшие иесмешенные оценки в обобщенной модели (!7), пользуясь уже известными нам результатами для обычной линейной подели (10). Пусть сР()' — оценка с минимальной дисперсией, /есмещеино оценивающая а0'.
Тогда д'(В ')'У'=д''ь)' 87 но при этом будем предполагать, что матрица Я известна и положительно определена. Рассмотрим только случай, когда матрица Х полного ранга. Представим матрицу ковариации вектора е в виде (см. (4)) является линейной несмещенной оценкой аО' в модели (17), и мы покажем, что она имеет минимальную дисперсию. Допустим, что Ь5'т" — такая несмещенная оценка аО', что РЬ,У (Рд*(В-1)т=()д~() . (20) Поскольку Ь,В'и=Ь,У Оценка дисперсии принимает вид (см. (16)) 1 пт.—.— (и — 9)Р )(и — Ойг) = Л вЂ” 5 = — (У вЂ” ОХ')В-' (В-')' (У вЂ” ОХ')' = Л 5 — — ( т' — ОХ') Я-5 ( т' — ОХ')'. ° Л вЂ” 5 (24) Представляется полезным дать еще н независимое изложение теории наилучшего несмещенного оценивания для обобщенной .пинейной модели (17).
Используем прн этом геометрический подход. Итак, необходимо минимизировать дисперсию линейной оценки ЬУ) параметрической функции аО'. 0ЬУ' = ЫтЬ' =- п5 ЬЯЬ' (25) при условии несмещенности ЬХ=а. (26) Определим в пространстве Р" скалярное произведение по формуле (27) л к, у) хну' несмещенно оценивает аО', а ввиду (20) 1)Ь,В'1)=ОЬ У'(()д Ц, то оценка (Ь~В')15 имеет дисперсию, меньшую минимально возможной.
Полученное противоречие доказывает, что наилучшая несмещенная оценка аО' в модели (17) имеет вид дл(В ')'5", (21) где д* находится из условия, что д'М' является наилучшей несмещенной оценкой ай' в модели (19). Используя формулу (5) наилучших несмещенных оценок, получаем 9=1111(Ф"йУ)-5 =УВ '(В ')'Х(Х'В '(В ')'Х) '=- =- 5Я-5Х(Х'Я 'Х) '. (22) Матрица ковариаций оценок 9 равна (см.
(5)) В;=п5(Ф"ИУ) '=.пт(Х'В '(В-')'Х) '=п5(Х'Я-5Х)-5. (23) и перепишем условие (26) в виде ЬЯ(Я-'Х) =а. (28) Задача минимизации квадратичной формы (26) при линейных ограничениях (28) решается в полной аналогии со случаем обычной линейной модели: Я=/. Пусть вектор Ь удовлетворяет (28), тогда вектор Ь', получаемый проектированием Ь в смысле скалярного произведения (27) на подпространство, порожденное столбцамн матрицы Я-'Х, также удовлетворяет (28) и в то же время нмеез минимальный квадрат длины: (Ь*, Ь*) Ь*ЯЬ*', Следовательно, вектор Ь, приводящий к наилучшей несмещенной оценке, лежит в линейном подпространстве, порожденном столбцами ()-'Х (ср. (!6) $9): Ь= с(Я-'Х)'=сХ'(!',1-')'.
(29) Подставляя (29) в (28), находим с: сХ'(1;1-')'Х а, с=а(Х'(Я-')'Х)-', таким образом, наилучшая несмещенная оценка имеет вид ЬУ'= тЬ' 'УЯ-'Х(Х'Я-'Х)-'а', что совпадает с (22). й 11. ПОРЯДКОВЫЕ ЛИНЕИНЫЕ ОДЕНКИ ДЛЯ ПАРАМЕТРОВ СДВИГА И МАСШТАБА 1. Обобщенная линейная модель для семейства сдвига-масштаба. Рассмотрим независимую выборку с обшей ф.
р. Ц(х — р)/о); ф. р. г(и) стандартизованных сл. в. У! (Х,— р)/о, 1=1,...,л, (2) считается известной, параметры н и п)0 неизвестны. Порядко. вые статистики сл. в. (1) и (2) связаны формулой Уп1 (Хш — р)/о, 1=1,...,л, и так как ф. р. г'(и) сл.
в. У; известна, то в принципе любые характеристики Уго могут быть рассчитаны. Положим МУп~=сть сот(Упь У~п) =дн, 1,/=1,...,а, 89 и, учитывая (3), запишем Хп>=п+оУ»> >>+оа>+о(У<о — а>), >=1,...,л. (4) Полагая Хю у;; У<» — а> = е>, > = 1,..., н, (5) представим (4) в виде обобщенной линейной модели: У;=и+па>+оеь > 1,...,н, (6) нли в векторной форме: т' = (», о) ~ 1! + ое, Г11 (а1 1 =. (1, ..., 1), а=-(а>, ..., а„), Ме =-О, А>е=- =()= ь, 2. Наилучшие несмещенные оценки. Оценки >>, о находятся по формулам (22) $10: (р, о)=Щ т]!', а'](~ 1() т]1', а'])-т.
(а ! (8) Производя перемножение, преобразуем последний сомножитель в (8) к 2Х2-матрице и найдем обратную матрицу: с !Я т1' 1Я та' -' > ГаЯ-та> — ао-т1' 1 аЯ->!' аЯ-та* Ь ~ — 1Я та' 1Я-т1' ~ где Л= М-т) ( Е-'а') — Юча')'. (1О) Матричный множитель прн векторе т' в формуле (8) равен произ- ведению л Х 2.матрицы (11) >',»(1', а'] Я->1', Я->а'] — Щ-1' (аЯ->а') + ()->а' ( — 1Я->а'), Ь Я->! ' ( — аЯ->1') + Я->а' (1Я->!')] = = — [Я-> (1'а — а'1) Я->а', ()-> ( — 1'а+ а'! ) Я->!']. Ь на 2Х2-матрицу (9).
Результатом пх перемножения будет нХ2- матрица, столбцы которой являются линейной комбинацией столб- цов матрицы (11): Таким образом. (р, о) = — (УГа', — т'Г1'), Г= Я-'(1'а — а'1)Я-'. (12) Ь Ковариационная матрица вектора оценок (н, о) равна 1,, -~ ~а ая-1и' — ая-г1' (см. (23) $10). ° Для дальнейшего полезно иметь в виду равенство ч е Я !)ю=ЯЦ »~! 1 ! Взяв математические ожидания н дисперсии от обеих частей равенства, получаем !а'=пМУ» 1Я1' пОУ, =п. (14) 3. Симметричное распределение. Рассмотрим случай симметричного распределения выборки (1), и пусть р МХ» Стандартизованные сл.