4. Математическая статистика. Ивченко_ Медведев (1984) (1186157), страница 17
Текст из файла (страница 17)
В соотношениях (2.58) — (2.61) вторые мамонты предельных распределений зависят от неизвестного параметра О. Часто эту неопределенно" гь бывает необходимо исключить, т, е. затсенить неизвестные характеристики оценками, когорые можно вычислить по выборочным данным, и прн жом так, чтобы нормальная форма предельного распределевня не изменилась Такое преобразование можно сделать на основании утверждений зэ н И [см. соотношения !2.55) н (2.57)], заменив 9 на его о.
м. п. 8». Сохранение формы преэельного распределения гарантируется при этом условием непрерывности по 6 вторых моментов. Так, например, если с'(8) и т' (6) — непрерыв. ные функции, то справедливо вытекающее из (2.6Ц соотношение ,Хгв (0») = а4" (6, 1гл). Рассмотрим оценку Х при',Х:- а„, ( ЬХ при Х[«,а», где константа а, -ьо, но 9 лсс„-» аз нрн л-»со. Найдем предельный закон храспределения этой оценки.
Имеем Рв(1' «(Т» — 8) сях)=р„ра(1' л (Х вЂ” 8) =х)+(1 — р») Рв()' л (ЬХ вЂ” 9)-.х), где Р„= Ра ( Х с =-' а,) = Ф ()' л (Π— а»)) -] Ф ( — Р «(8+ а )) „- С 1 прн;9; ~0, ~ О при 9=0. Танич образозг. при л-»со для г91 0 и В=-О соответственно ниеесс Жа(1' л (Тй — 8))-» яг' (О, !), Хгв(К « Т„)-г- . с'" (О, Ьс), 1 $ прн Вг>0, Оценка Т„удовлетворяет условию (2.63) с ог (В) =~ Следова(т Ьз и р н 0 = О.
тельно, ее аснмптотичсская эффлктнвсгость (см. табл. 2.1) еп (Тгб В) = $ при В ' ь О, 1/Ьэ при 8=0. При ,'Ь ' ( 1 еп (Тга 6) -. 1 со строгим неравевствои в точке 6=0. Причина этого заключается в данном случае в нарушении непрерыиностм функцмн ас (9) в нуле. Точки 6, в которых еп (Т»Л 6) = 1, называют глас«ам« сэгрхзффехглиэнасэш. В рассмотренноы примере это точка 8=0. Как показал Ле Кач (1953 г.), ,множество точек сверхэффективности ие более чем счетно, поэтому явление сверхзффективнаста не играет существенной роли в теории оценивання.
Известны дополнительные условия регулярности, которые исключают это явление. Так, Рео доказал, что для этого достаточно потребовать равноиер- ности по параметру 6 в предельном соотношении (2.63). В заключение рассмотрим асимптотическую эффективность оценивания среднего 6 нормальной модели $ (6, ов) с помощью выбоРочной медианы, т.
е. когда Т„= Хс(.гз!+ $1. В силУ соотношения (1.24) выборочная медиана удовлетворяет условию (2.63) с ау (6) =- паз)2, а так как в данном случае с (6) = [газ (см. табл. 2.2), то еВ(Т„; 6)=2гп=0,637 .... Это означает, что при больших и выборочное среднее Х (= 6„) для выборки объема и' —.2«тп оценивает истинное значение 6 с такой же точностью, что н выбоРочнаЯ медиана Л,(»м) су выбоРки объема л, независимо от значений 0 и а'. в 2.5. Метод моментов н другие методы, основанные нв группнрованных данных 1. Метод моментов. Кроме рассмотренных в предыдущих параграфак общих подходов для оценивания неизвестных параметров распределений на практике используют и другие методы получения оценок.
г[4сторнчески первым общим методом точечного оценивании неизвестных параметров является мерид моменгпоа, предложенный К. Пирсонам. Суть этого метода состоит в следующем. Пусть, как обычно, Х =(Х„..., Х„) — выборка из распределения .У(8) ен У =(г" (х; 8), 6 ен В), где 0'=(9„..., 9,) и В с= )с'. Предположим, что у ирблюдаемой случайной величины 6 существуют первые г момейтов сс„=Е8", й'=1, ..., г. Они являются функциями от неизвестных параметров О: !хл = !х, (О). Рассмотрим соответствующие выборочные моменты А„ь(Х) (см.
п. 1 8 1,2); пусть аь=-А„„(х) — значения этих величин для наблюдавшейся реализации х выборки Х. Тогда метод моментов состоит в приравннванин значений аь и теоретических моментов: ал(8)=ам 0=1, ". !' (2,Б6) Решая эти уравнения относительно 6,....., б„получаем значения оценок параметров по методу моментов. Обоспуем этот метод. Известно (см.
$ 2.3), что выборочные ,;;,моменты А.,(Х) являются несмещенными н состоятельными оцен' ками теоретических моментов с!л (9). Предположим, что соответствие между 8„..., 6, н а,, ..., а, взаимно однозначное и взаимно непрерывное, т. е. существуют непрерывные функции 8!!, ..., 8!, такие, что 8,=8!!(а„..., а,), !=1, ..., г. Тогда решения уравнений (2.66) можно записать в виде 9,(х)=<р;(а„..., а,), != = 1, ..., г, а соответствующие оценки 6! (Х)=!р! (Аго (Х), ..., А,, (Х)) в силу теоремы 1.5 при каждом 8 будут сходиться по вероятности (по распределению Р,) при п- со к бь т.
е, статистики б!(Х) являются состоятельнымн оценками 8!, ! =1, ..., г. Таким образом, метод моментов при определенных условиях приводит к состоятельным оценкам; прн этом уравнения (2,Б6) во многих случаях просты и их решение (в отличие, например, от метода максимального правдоподобия) не связано с большими вычислительнымн трудностями. Пример 2.27 (л!адель гамма, оценивание параметров методом моментов). Рассмотрим модель гамма Г (6„6..), когда оба параметра неизвестны (здесь Й=(0=(б„бь): 9!)О, ! =1, 2)). Имеем (см. табл. В.1) и = ( хэ + ь- 'е — '!е !(х/Г (9 ) 8!Ь = 0" .й=, Г (О!) о — 8",9(9 +1)...(9 +й 1).
В частности, а1=-8!бм а! =8;9. (бь+ 1), откуда 9! =(а, — а;)!а„ б,=о!!',!(с!э — !х!). Окончательно имеем, что оценками параметров по методу моментов являются в данном случае статистики (сы. формулы (1.10) и (1.12)1 Отметим, что метод моментов неприменим, когда теоретические моменты нужного порядка не существуют (например, для распределения Коши). Кроме того, оценки метода моментов, вообще говоря, неэффективны. Поэтому их часто используют только в качестве первых приближений, ссновывавсь на которых можно находить последующие приближения с большей эффективностью.
2. Метод минимума хи-квадрат. Систему различных методов построения оценок можно получить, конструируя тем илн иныь! способом меру вд отклонения эмпирической функции распределения г"„(х) от Р(х; 6). В любом случае такая мера является функцией от выборки Х=(Х„..., Х„) и параметра б: .й =Ы(Х; 0). Если такая мера имеется, то в качестве оценки параметра 0 следует взять значение, минимизирующее меру Ю. Рассмотрим в качестве примера одну из наиболее известных и употребительных мер — меру хи-квадрат, предложенную К.
Пирсоном. Это мера определяется следующим образом. Разобьем множество е! возможных значений наблюдаемой случайной величины $ на !у непересекающихся подмножеств е!, ..., Жн, (Х = =Ж1()" () еп о !) в!= 3 ! чь1), и пусть ту — число элементов выборки Х =(Х„..., Х,), попавших в подмножество о!! чу =- = )(й Х!вне!) (, 1'=1, ..., !т' (ч! — , '...+чн=..п). Обозначим через ру (9) вероятность попадания в подмножество Ж!.
р! (8)=Р! (э ен е,)=- =- ~ дг(х; 8), 1=1, ..., !у(р,(О)+...+рх (8) =1). Относительная в, частота ч!1п попадания в подмножество 5! является состоятельной оценкой вероятности р> (8), поэтому мерой отклонения выборочных данных от теоретическйх значений может быть мера 'Р = ~ с, Я)п — рв(6))'. у=! Если здесь положить веса су=п1р, (О), то получим меру хнквадрат: н н —,— — р (8) ! =.,и ' ' = ~ ' — и.
(2.67) и /чу 'Д ЧП (чт пР. (ЮР л'.в р, (91 ', и !' ! ~.~ пр! (9),~, пр! (8) !'=- ! /=-! В дальнейшем иногда будем также использовать для этой меры название мера икс-квадрат и обозначать ее через Х'„обозначая символом 1(г величину, имеющую распределение хи-квадрат. Оценку О, полученную из условия обращения меры Х' в минимум, называют оценкой по л!стаду л!инимума;~~. При достаточно общих условиях эта оценка оказывается состоятельной, асимптотнческн нормальной н асимптотически эффективной (как н опенка максимального правдоподобия).
Для нахождения указанной оценки надо решить систему уравнении — =6, 0=1, ..., г (8=(бь ..., 8,)). вп, (8) ! Однако это трудно сделать даже в простейших случаях, поэтому вместо нее обычно рассматривают систему л,(9) вз» »! — — =-О, Й=1, ..., г. (2.68) » —. ! решение которой находить, как правило, гораздо проще. Оценки параметров О, получающиеся как решение системы (2.68), называют оценкти!»и по видоизмененному методу минимума Х». При весьма общих условиях последний метод позволяет получать оценки, обладающие в случае больших выборок теми же асимптотнческими свойствами, что и оценки, найденные с помощью метода минимума т», 3. Мультииоминальные оценки максимального правдоподобия. Описанные в и.
2 способы оценивания параметров предполагают использование не самих исходных наблюдений Х ==(Х», ..., Х„), а частот «=(»», ..., «н) попадания элементов выборки в соответствующие подмножества 8», ..., Фн. Такой «частотный!» способ представления статистических данных называют мемедом группировки наблюдений, а подмножества Ж„..., Ек — многкествал»и (или инп»ервалими, если йт — интервалы на действительной прямой) группировки. В каждом конкретном случае метод группировки полностью определяется разбиением о =е! ()... () ек. Если такое разбиение построено, то тем самым однозначно определены вероятности р =р (О) =(р,(О), ..., рн (О)) попадания результата каждого наблюдения в соответствующие подмножества е» и каждая реализация х =-(к„..., х„) выборки Х = =-(Х„..., Х„) однозначно определяет соответствующую реали.
зацию Ь=(й„..., йн) вектора частот «=(»„..., ън). Обозначим через Т.„,, множество всех реализаций вектора «, т. е, 1 «к =(1! =(1»! ° ° ° йл) ° )»/ =0~ 1 ° . ~ пг 1 = 1 й»+ +Ьк =по (2.69) и найдем вероятности Р»(«=Ь), Ь~ 1.„,. Число различных способов зафиксировать й» элементов выборки, попавших в подмножество 8„...; йн элементов выборки, попавших в подмножество Жн, очевидно, равно ь!»» лн и! ѫѫ'-»" С.-л-...-»„,=ь! », ! 1 Вероятность того, что йт элементов выборки попадут в подмножество Жм 1=1, ..., 1»», в силу независимости испытаний равна Ц р»т(О) и не зависит от конкретных номеров испытаний. »=! Следовательно, 1',( =й)=Е!' ((!; О)=„, "'„, $[р". (О), )! (.„н. (2.70) !' ''' н »=! 80 Полученное распределение случзйного вектора «=(«», ..., «и) называется полиномиальным или мультиномиальным распределением с параметрами п=«,+...+»и и р»=р,(0), 1=1, ..., й1, и обозначается символом М(н, р=(рм ., рн)).