4. Математическая статистика. Ивченко_ Медведев (1984) (1186157), страница 46
Текст из файла (страница 46)
к. являются олтвывльяымв в кявссе лвявйвых оценок. Дяя схемы нормальной рсгрессвв справедливо более сядь. !92 все утверждевве: о. я. я. являются оптимальными в классе всех (ве только линейных) яссыешевных оцсяох Озссывтрвввемых параметрических фувкцвй. Найдем оценку максимального правдоподобия дв для остаточ- ной дисперсии а'.
Подставив в (5.41) вместо () оценку 1) и про. логарифмировав, находим, что бв — это то значение а', которое минимизирует выражение 5 ф)/ах+и )па'. Отсюда имеем дв = 5 ф)/и. (5.42) Но, как было показано !см. (5.!4)), в общем случае несмещенная оценка для а' имеет вид 5(р)/(п — й), поэтому о.
м. и, д' оказы- вается смещенной и ее смещение Ей — а = Е ~ — а ) — а =: — — 1)а'= — — а' я я (л й я! я /л й ~ й л / ( л / л убывает с ростом числа наблюдений п. Таким образом, оценка (5.42) является асимптотически несмещенной (что характерно для о. м. и.). 3. Основная теорема. Докажем следующую важную теорему теории нормальной регрессии, которая будет неоднократно исполь. зоваться в дальнейшем. Теорема 5.4. Случайные ееличинь( () и 5(р), а также 5ф) и Я=5 ф) — 5(р) независимы; при мппм ,Е'з()!) =вг ф, аЯА-'), йз(5(р)/ах) = =ух (и — Ф), ХвЩ/ав! = у" (й).
(5.43) (з Введем нормированный вектор ошибок е*=е/а: 2;(еь!= вл( (О, Ел)); тогда равенство (5.1) принимает вид Х = Х'р -!- ае'", (5.44) а равенство (5.6) — следующий вид: )) = () + аА-'2еь. (5.45) Подставив вместо Х его выражение (5.44) в (5.!6), получим 5ф)/а'=е" Ве*, (5.46) поскольку ХВ = ВТ' =О !матрица В определена в (5.15)).
Наконец, иэ тождества (5.8) имеем следующее представление для ф Ю-5Ф) — 5ф) =(Р— ())'А(6 — ()) (5.4?) Независимость () и 5ф) следует из представлений (5.45) и (5.46), легко устанавливаемого факта А-'ХВ =О и леммы 1.2. Далее, из представления (5.4?) имеем, что случайная вели- чина Я зависит от выборки Х лишь через (); следовательно, в силу независимости () и 5(р) случайные величины Я и 5 ф) также не зависимы. Первая часть теоремы доказана, Докажем теперь утверждения (5.43) о распределениях рас- сматриваемых случайных величин. Так как)! — линейная функция КИ вЂ” '~= /-(0, 1) / Р— й/'1 ~, о)/ви) (5. 48) и ()/ не зависит от 5(()).
Поэтому из определения распределения Стьюдента (см. п. 4 Ь 1.5) и из теоремы 5.4 следует, что п;и любом и Хе !х= ~г — (()/ — 5/)1=5(п — й). / и — д (5.49) С лед ст в и е 2. Из определения распределения Снедекора (см. п. 5 9 1.5) и теоремы 5.4 имеем, что при любом я Ж~ ~г =: — ) =5 (й, и — й). в — д я (5.50) 3(й) 4. Доверительное оценивание параметров нормальной регрессии. Найдем доверительный интервал для коэффициента регрессии ()/. Иэ соотношения (5.48) следует, что статистика 8~ имеет распределение /" (()/, о'ар), Следовательно, имеет место задача оценивания неизвестного среднего нормального закона с неизвестной дисперсией (так как и' неизвестно) по наблюдению над случайной величиной р/. На основании (5.49) стьюдентово отношение !т является центральной статистикой для оценивания ~~ (см.
и 2 з 2.б), поэтому у-доверительный интервал для (1/ строится по схеме примера 2.30 и имеет вид (- / ал ()/ ~ !и+тих,л-д1/ „д 5 Ф)). (5.51) Это симметричный интервал относительно точки ()/ длины аи 2!< тпм — 1/ в х 5(Р). Чтобы построить доверительный интервал для остаточной дисперсии о', воспользуемся вторым из соотношений (5.43), из которого следует, что 5 ()))/о' — нужная центральная статистика. Искомый у-доверительный интервал строится здесь по схеме при- !94 нормального вектора !см. представление (5.45)], то закон распределения р также нормален. Первые и вторые моменты вектора () вычислены в п. 2 3 5.2. Закон распределения Я/о" устанавливается на основании представления (5.47), факта нормальности вектора р и теоремы 1.9.
Наконец, закон распределения 5 ((1)/ов устанавливается на основании представления (5.4б) и леммы 1.4, поскольку !г В = 1г Š— 1г (Х'А-'У) = и — 1г (ХХ'А-') =и — !гЕ„= п — й. ° Следствие !. Из первого соотношения в (5.43) имеем, что для любого !=1, ..., Д мера 2.30 и имеет вид 5 (Р)/у/1+.>~, »-. ( о"-'5 (Р)/7) —.нь, Итак, можно построить доверительный интервал для каждого из коэффициентов регрессии ~ь ..., ()ь Если построить Д таких интервалов с одним и тем же уровнеч у, то среднее значение ~ясла интервалов, накрывающих соответствующие значения 8, равно йу. Оценим вероятность одновременного накрытия построен- ными интервалами соответствующих параметров. 5. Обозначим через А/ событие, состоящее в том, что интер то интервал Р А-=- ( .51), в котором у заменено на 7/, накрывает параметр 8/, т.
е. ~( /) =-у/, /=1„..., я. Тогда вероятность совместного осущест. вления событий А„ ..., А» можно записать так: Р~ (А, ... А„) = 1 — Р, (А, ()... () Ад). Но (5.52) Рв (4 () " () А ) ~ ~ Р, (А!) = ~ч '„(1,/) /=1 ПОЭтому (5.53) д д Р~(Аз...А,)~1 — ~ (1 7) 'у'. А+1 / ! !' = ! Если выбРать все У/ Равными 1 — (1 — у)/Д при некотором „то Р~ (А, ... А,) ~ у. (5.54) ФоРмУлы (5.53) и (5.54) позволяют оценить вероятность пра. вильного Реп|ения (одновременное накрытие доверительными инте- валами всех параметров), однако желательно иметь более точный результат, т.
е. уметь строить (случайную) доверительную область бт в евклидовом пространстве /!д, накрывающую неизвестную параметрическую точку ~=(Ц, ..., (1„) с вероятностью у. Такую тате (5. 50). область в данном случае можно построить, основываяс на Действительно, если г д „, есть у-квантиль распределения 5(й, и — я), то из (5.47) и (5.50) следует, что при любом я У=Рв(с -гт, ив-в) =Рю(й в=с)т(Х)), где (5.55) !/т(Х = (()):(р — !))'А((! — Р)( — „д 5(()) гт д ф (5-55) Тем самыч построена искомая у-доверительная область для р.
Это внутренность эллипсоида с центром в точке (1, граница которого задается уравнением (Р !!)' А((1 ()) =от (Х) = в д 5(())Рт к«-» (5.57) Пример 5.4 (простая регрессия, доверительное оиепивание паривмтров). Найдем доверительный интервал уровня у для наклона (1, простой регрессии (см. пример 5.1). Из (5.51) и (5.27) — (5.28) следует, что это интервал < л ),»)и, „,, )) я)»)~<) — 2) Х )),— !)!) ! ! Аналогично, из (5.55) — (5.57) и формул примера 5.1 имеем, что внутренность эллипса л («.-«.) +И(«,-«,)(«.-Ь+-„у, («,-«.)г= 1 л (л — 2) 2 в плоскости переменных («„«») с вероятностью у содержит неизвестную точку «.
5. Доверительная область для линейных комбинаций параметров «„..., «». Пусть требуется оценить одновременно т=й линейных комбинаций 1=(1„..., 1 ):1=Т«, где Т вЂ” заданная матрица размером тхй н гапку=т. Тогда из теоремы 5.4 следует, что о. н. к.
(=Т«имеет распределение -) (1, о'0), где матрица 0 определена в (5.10). Отсюда по теореме 1.9 имеем Ж»(1Ет/о») =7'(т), где (2т=Ят(Х, 1)=(1-1)' 0-'(1 — 1) (5. 58) При этом Дт как функция «ие зависит от 5(«). Следовательно, отношение Снедекора Р в данном случае имеет вид л-Ь цт Р= — —, л) 5 («) н прн этом 2!(г) =5 (т, и — й). Таким образом, как и в случае оценивания «, получаем следующий у-доверительный эллипсоид для 1: От (Х)=(1)(Т« — 1)'0 '(Т« — 1]< „5(«)Рт,,л-»~ (559) При Т=Е» полученное решеш)е сводится к (5.56). Отметим некоторые частные случаи общего решения (5.59).
При т=( речь идет об оценивании одной линейной комбинации Л'« = У, Л!«р В этом случае эллипсоид (5.59) вырождается в интер! ! вал ~ '«=~~ («)Р .— (Л'-')1п') (5. 60) Распределение Снедекора 5 (1, 'п — й) совпадает с распределением квадрата случайной величины, имеющей распределение Стьюдента 5(п — я), поэтому Рт м»=!))ьт)дь»и выражение(5.60) можно записать в виде Л«! 1)ыт)гк»)) „— 5(«)(Л'А-'Л)). (5.61) Пусть матрица Т имеет следующую структуру: в каждой строке только один элемент отличен от нуля, при этом в г-й строке на месте 1, стоит единица, г=1, ..., т, /»<!»«...! . Тогда Т«=(«),, ..., «! )=«(т) и, следовательно, речь идет об одновременном оценивании части координат параметрического вектора «. В этом случае матрица 0 [см.
(5.10)) представляет собой минор А-'(!м ..., 1 ) =А(т) матрицы А-', получающийся вычеркиванием всех строк и столбцов с номерами, отличными от !м ..., 1, и из (5.59) получаем, что у-доверительный эллипсоид для параметров «(т) имеет вид бтт(Х) («(т): («(т) — «(т))' А-'(т) (!) (л1) — «(л!)) «- ° .— „, 5(«) Р,,-..—.~. (5.62) Пример 5.5 (доверительный интервал для ординаты линии регрессии). Построим доверительный интервал для ординаты )р (1) = = )р (1; «) = «д+ «,Г линии регрессии в произвольной точке в случае простой регрессии (см. пример 5.1).
Используя обозна- » пение в'(1) = — ~), (1! — 7)», из формул примера 5.1 получаем, что ! ) при Л=(1, !) Л'А-'Л= — <1+< — 1 ~, Кроме того, )р(1; «)-Л'«=Х+(! — !) «,. Отсюда н из (5.61) окончательно имеем, что искомый у-доверительный интервал имеет вид <)(+(1 — 0«»~!! т)!К.— л(л 2) 5(«)<1+<,(!),) ~) 6. Совместные доверительные интервалы. В каждом конкретном случае построение эллипсондов в (5.56) и (5.59) — трудная вычислительная задача.
Поэтому предпочтительнее иметь (более точный, чем (5.54)! результат, позволяющий строить доверительные интервалы для отдельных компонент оцениваемого вектора, с заданной вероятностью одновременно накрывающие соответствующие координаты, или, другими словами, систему совместных доверительных интервалов, Решение этой задачи нетрудно полу- нить из уже известных результатов. Для этого понадобится следующее утверждение из теории квадратичных форм. Теорема 5.5. Пусть  — положительно определенная матрица и 1, Л вЂ” вектор-столбцы'. Тогда 1'В! гпах „—, (Л'!)» (5.63) 197 С) Представим В в виде В =НН'.
Это всегда можно сделать, выбрав Н = ОАп', где () — ортогональная матрица, приводящая В к диагоналыюму виду А. Положим теперь Х=Н'1, У=Н-%; тогда Х' т'=1'Л, Х'Х = !'В1, У' т'= Л'В-%. Но, по неравенству Коии — Буняковского, (Х'У)' ~ (Х'Х) (У' т'), причем знак равенства имеет место только когда векторы Х и У линейно зависимы. Отсюда и из предыдущих соотношений имеем (Л'1)'~(1'В1) (Л'В-%), или 1'В1 )(Л'1)'/(Л'В-'Л). Отсюда следует (5.63). ° Положим теперь в соотношении (5.63) 1=(! — р, В=А; тогда соотношения (5.55) — (5.57) можно записать в виде р,~ „"в-ь' «,,сь)=Р,~::а  — п~« „и; ч, п~, где ит(Х; Л) =ат(Х) ~'Л'А-'Л. (5.64) Таким образом, для любого 6 выполняется соотношение Р~(Л'(! — и„(Х; Л) ~ Л'() ~Л'()+и, (Х; Л), ч'Л)=7. (5.65) Соотношения (5.64) — (5.65) позволяют решить задачу о построении системы совместных доверительных интервалов для всех линейных функций Л'().