Учебник_Бочаров_Печинкин (846435), страница 57
Текст из файла (страница 57)
1 2 во' — — п!щ Π— ! !то....т„!е1, Аналогично, статистика 4= ппп бзн,...,п~ !е! ' представляет собой квадрат расстояния от точки (Х!,...,Х„) до подпространства 2,', а значит, ,2 очз !О П О Теперь для применения критерия Фишера, проверяющего гипотезу Но, осталось составить отношение в! м= 2 во и сравнить его с критическим значением С = чо! Как уже говорилось, при практической реализации критерия надпространства Е и Ь' задаются системой базисных векторов о! — !гч! ! д!н) о! — (д1! д!я) и сг!=Ж! "а! )" сг! =!аг! "а!я). Тогда задача нахождения в2* сводится к задаче нахождения минимума квадратичного функционала: (т! — ))в~2 = ппп ~'(Х, — д!д1, — ., — д!д1,')2 = ппп Яз(д!,..., д!). ' ~=.! Значение вз* достигается при подстановке в Я~(д!,..., д!) коэффипиентов д*,,..., д;, определяемых из системы линейных уравнений, которые получаются дифференцированием Я~!д!,..., д!) по д, и приравниванием производных нулю: ~'(!У"!д!, + ...
+ д;й2здо = ~' дч.Х,. б. Общая линейная модель, метод наименыиих квадратов 267 Аналогично вычисляется значение статистики Н22. Для этого сначала решается система (1), в которой вместо д,* и 41 подставлены д,'," и г)', а затем полагается Яз = Ь' (д",,...,д1,'). П р и м е р 7. Обратимся к решению поставленной в примере 6 задачи.
Как мы уже говорили, подпространство й задается двумя базисными век- торами: г! ! = (1,, 1, О,, О), с!з = (О,, О, 1,..., ! ) . Система уравнений (!) в данном случае имеет вид т и! и!д*! .= ~ ' Х, д,* = ~ ' Х = т'*, и! т=! ! пьдв = ~ Хм д! = ~' Лт = гпн*. ,! = ! ! т ! "'-',=, -!-! Поэтому !пНа(д!,де) = ' ~~ (Х,— '")е+ ~" (Х,— и-! Аналогично, подпространство Ь' порождается вектором с1' = (1,...,1), а система (1) состоит из единственного уравнения ! (п! + пе)д!* = 2 кЛ, д!* = — 2 кХ = т*. и ю ! Отсюда ы Ьа — (и — 2)вь 2 я в! 2 †! Перейдем к задаче оценки неизвестных параметров.
Напомним ее постановку. Пусть вектор тп представим в виде суммы нт = ~ д с1„ г=! где г), — известные базисные векторы подпространства Ь, а д, неизвестные параметры. Задача заключается в опенке д, и построении для них доверительных интервалов. И эта задача решается наиболее просто в случае, когда Й, представляют собой ортонормированную (или хотя бы ортогональную) систему и Я~ = !пшив(д!) = ~ (Х, — т*)", в,' т:= ! Простейшие подсчеты показывают, что статистику в;* можно записать также в виде: в! = и!(т* — т ) + и!(т — т ) . Сам критерий уровня значимости а заключается в следующем: мы должны 7* принять гипотезу Нь, если м = в!*)в.,* < зы, где !р, — а-квантиль Р-распределения с параметрами ! и п — 2 (1, табл. 3.5), и отвергнуть в противном случае.
гл 268 Гл. 4. Некоторые задачи, связанные с нормальными выборками векторов. Действительно, выбирая новый ортонормированный базис ч ч е, =- с1ы..., е~ = с1и еььы..., е„ и вводя в рассмотрение новый вектор Х' = (Х,', ...,Х„'), состоящий из координат вектора Х в новом базисе е,'....,е„', получаем, что величины Х,' являются независимыми и нормально распределенными с неизвестной одинаковой дисперсией в~ и средними МХ,'=.ды..., МХ,'=ди МХ,'„—....=МХ„'=О. Как известно (см. пример 25 в гл.
2), эффективные оценки д," параметров д, задаются простейшей формулой д; .= Х,. Однако для построения доверительных интервалов для д, необходимо знать дисперсию оа нормального закона или хотя бы ее оценку. Но такая оценка в~', не зависящая от д;,..., д,* и с точностью до множителя (и — 1)/о~ распределенная по закону чсз с и — 1 степенями свободы, легко находится из рассмотрения координат Х,'+ ы ...,Х„': и ', ~- (х,')'. з =ьь! Таким образом, величина д,* — д, Гз.
имеет 1-распределение с и — 1 степенями свободы, а симметричный доверительный интервал доверительной вероятности сс для д, задается (см. пример 30 в гл. 2) границами: з ч где 1 — ст-квантиль 1-распределения с и — 1 степенями свободы. Как и при проверке статистических гипотез, трудности возникают тогда, когда векторы с1ы ...,с4 не являются ортогональными, и эти трудности также легко обходятся с помощью метода наименьших квадратов. По-прежнему, рассмотрим квадратичный функционал 5 (д~ -- дй = ~.(х д|а1 дАЗ зависящий от некоторых (абстрактных) аргументов ды..., ди Оценки д;,...,д~' по методу наименьших квадратов параметров ды...,д~ получаются как значения аргументов ды..., дп доставляющих минимум квадратичному функционалу Я~(ды ., д~), т.е.
определяются из системы линейных уравнений (1). Перечислим основные свойства оценок, полученных по методу наименьших квадратов. 5. Общая линейная модель, метод наименьших квадратов 269 1. Оценки д,* являются линейными, т.е. выражаются в виде линейной комбинации и д; =- ~соХ Э=с от наблюдений Хс,..., Х„, и нормально распределенными как линейные комбинации нормально распределенных наблюдений Хс,..., Х„.
2. Оценки д,* являются аффективными, в частности, несмещенными и имеющими минимальную дисперсию среди всех возможных оценок. Свойство 2 показывает, что оценки д,* могут быть получены методом максимального правдоподобия, что нетрудно выявить и прямыми вычислениями; впрочем, это мы фактически и делали в случае ортонормированных векторов Йс,...,г1с. Следует отметить также, что если векторы г1с,...,г1с неортогональны, то оценки д*,,...,дс зависимьс. Одномерные доверительные интервалы для неизвестных параметров дс,..., дс строятся следующим образом. Как было показано, статистика во = — щщ Я Яс,",дс) = б" (дс,",дс) и — с в,....,в, в — с представляет собой несмещенную оценку неизвестной дисперсии вз, не зависЯщУю от д;,..., дс* и с точностью до множитела Си — Ц,соз имеющую ~з-распределение с и — 1 степенями свободы.
Далее, поскольку д;=2'ссХ, Э=с то дисперсия оценки д,* задается формулой (2) ОсЭ* = о=с Значит, величина д,* — сЭ, И4' имеет 1-распределение с и — 1 степенями свободы, а границы симметричного доверительного интервала доверительной вероятности гх для д, имеют вид з ч с где, как обычно, 1 — о-квантиль 1-распределения с и — 1 степенями свободы.
270 Гл. С. Некоторьсе задачи, связанные с нормальными выборками При мер 8 Решим сформулированную в примере 5 задачу. Найдем сначала оценки д*, и д,*, неизвестных параметров д! и д . Система уравнений (1) принимает в данном случае вид и пд;-ь йсч, сс =~ х, 2=! откуда д", = ') с!,Х,, с=! д.,"=~ сс,Х,, 2=! где для краткости введены обознзчения и 2 ' с'ь — с, 2 ' с„ ь=! ь=! ос ь=! с!, = с'„— (') сс) ь=! ь=! — ('> сс) ь=! 2" с2, ь=! Отметим, что вычисления оценок д; и д.*, существенно упрощаются, если з качестве начала отсчета выбрано время Со = 2 С2Сп.
Приступим теперь к построению доверительных интервалов доверительной вероятности о для неизвестных параметров д! и д . Статистика в~с* (называемая также остаточной дисперсией) с точностью до множителя (и — 2)с!о с имеет Х -распределение с 'и — 2 степенями свободы и задается формулой 2 вс,* = Е(хс — д", — д;С,)2 и — 2 2=! Значения коэффициентов с', и сс определяются из общей формулы (2); С! = 2 С! , Сс = 2 Сс , 2.—.:! а нижняя и верхняя границы симметричного доверительного интервала доверительной вероятности а для параметра д, задаются формулой (3), в которой С вЂ” о-кваитиль распределения Стьюдента с п — 2 степенями свободы. П Несомненным достоинством метода наименьших квадратов является то, что он применим для оценки неизвестных параметров и в том случае, когда наблюдения Хс,...,Х„ распределены не обязательно по нормальному закону.
Более того, наблюдения Хс,...,Х„ могут быть разнораспределенными и даже зависимыми. Необходимо только, чтобы Х, имели одинаковую дисперсию ос и были некоррелированными. Естественно, процедура построения оценок остается неизменной. Свойства 1 и 2 оценок д;,..., дс*, полученных по методу наименьших квадратов, заменяются в этом случае на следующие: !'. Оценки д,* являются линейными. 2'. Оценки д; являются несмещенными и имеют минимальную дисперсию в классе всех линейных оценок. б. Регрессионный анализ 271 Разумеется, в случае наблюдений Хы...,Хп, распределенных не по нормальному закону, использование с -распределения и 1-распределения для проверки гипотез и построения доверительных интервалов неправомочно. 6.
Регрессионный анализ Прежде чем переходить к рассмотрению простейших статистических задач регрессионного анализа, попробуем разобраться в самом понятии «регрессияч. Для этого возвратимся к терминам теории вероятностей и рассмотрим двумерную случайную величину (с, у). Пусть случайная величина у приняла значение у. Что в этом случае можно сказать о значении случайной величины ~7 Из курса теории вероятностей известно (см.















