Б.А. Севастьянов - Курс теории вероятностей и математической статистики (1119910), страница 32
Текст из файла (страница 32)
Определение 4. Если оценка О, при пчоо ( Ее 1 асимптотически нормальна с параметрами ~6, =). ~,я) то ее асимптотической эффективностью называется отношение ез(6„) = 1 т, (6) ов т. е. в этом случае за математическое ожидание и дисперсию оценки 6 мы принимаем математическое ожидание и дисперсию аппроксимирующего нормального закона распределения. Аналогично, если ез(О) = 1, то оценка будет называться асииптотически эффективной. С понятием асимптотической эффективности асимптотически нормальных оценок мы встретимся в следующем параграфе.
6 62. Методы нахождения оценок До сих пор мы занимались свойствами оценок параметров, не затрагивая вопроса о способах их нахождения. Сейчас мы познакомимся с некоторыми методами нахождения оценок. 1. Метод моментов. Пусть хь ..., х, — независимая выборка из распределения с плотностью р(х; Оь ..., 6,), зависящей от г параметров 61, ..., Оп Предположим, что все моменты и (О„..., 6,)=~х'р(х; Оо ..„6,)йх, А=1,..., г, конечны и что система уравнений Ь =п1з(Оо ..., 6,), 5 м.
методы нАхОждения Оценок однозначно разрешима, причем ее решение О = т;,' (Ь„..., Ь,). й = 1, ..., г, дается непрерывными обратными функциями т„-'. При этих условиях имеет место Теорема 5. Оценки Ом й=1, ..., г, получаемые как решение системы 19»=т»(01, . ° ., 0„), А=1, ..., г, (28) где гй» = — ~ х; — выборочные моменты, состоятельны. и 1-1 Доказательство. Согласно нашим предположе- ниям система (28) имеет единственное решение О„= =т-'(т„..., т„), причем т-' — непрерывные функ- ции. По усиленному закону больших чисел гй» сходятся п. н. к т, а из непрерывности функций т„-' отсюда следует, что О» при и- ОО п. н. сходятся к О».
Теорема доказана, Метод нахождения оценок, описанный в теореме 1, носит название метода моментов. Этот метод дает со- стоятельные оценки, но часто их эффективность и асимп- тотическая эффективность меньше единицы, 2. Метод наибольшего правдоподобия. Пусть хь ... ..., х„— независимая выборка из распределения с плот- ностью р(х; О), зависящей от параметра О.
Совместную плотность Ь(х; О) = р(х1, '9) ... р(х„; О), рассматриваемую как функцию параметра О, называют функцией правдоподобия. Оценкой наибольшего правдоподобия называется оценка 6=9(х1, ..., х„). которая обращает в максимум функцию правдоподобия: Ь (х; 6) = гпах Е (х; 0). е Если функция правдоподобия (.(х; 0) дифференцпруема по О, то оценку наибольшего правдоподобия 0 можно найти, решив относительно 0 уравнение правдоподобии дб (х; В) (29) да Гл. 1а Оценки пАРАметРОВ Установим некоторые свойства оценок наиболыпего правдоподобия. Будем предполагать, что выполнены следующие условия: 1) Пусть параметр 0 изменяется в интервале 01 ( ( 0 ( ех и истинное значение параметра О, лежит внутри этого интервала.
Предположим, что в этом ин. др дАр д~р тервале существуют производные —,, —. —. дв ' дво ' дв' ' 2) Интеграл ~ р(х; 0)йх можно два раза дифференцировать под знаком интеграла, так что ~ — айхале, ~ —,„Р с(х— = О. 3) т'1(ео) = $ ~ — '~ Р ) р (х; О) дх ! ) %+ ~ (Н(х), н МВН (') = ~ Н (х) р (х; О) с(х л(, где л( не зависит от О. Теорема 6.
При выполнении условий 1), 2), 3) уравнение привдоподобия (29) имеет решение О, которое при и — оо сходится по вероятности к ео. Зта оценки нипбольшего правдоподобия исимптотачески нормальна и исимптотически эффективна. Доказательство. Уравнение правдоподобия (29) равносильно уравнению о 1 дб д1ов!. ~ д1оя р (хн О) В дв до ~.г дО А! д)он р 1х; О) Разложим ' по формуле Тейлора в окрестности точки О,: + '","' ЬН(х), (31) где )Ь) (1. Разделив (30) на и и воспользовавшись разложением (31), имеем — „' '";„' =в,+в,(0 — е,)+ —,'ь в,(0 — О,)', (32) $М.МЕТОДЫ НАХОЖДЕНИЯ ОЦЕНОК зз1 где 1 ~-~ д!он р(кк! 8) ~ В, =-„р Ф т 1 ~ З*1оар(кк! Е) ~ А 1 л Вз — — — „~ Н (хз).
Р Р По закону больших чисел Во — МВ,=О, В,— МВ!=- = — ),(О,) (с . (23) из О О(), В, — МВН !МВЕ!=Л. Пусть теперь Ь > О и е > О фиксированы. Выбираем ао таким, чтобы при всех а >ио РЦВ,( Ь') < —,.', Р(В,> — — "'," ~< —,',, Р (~ Вз ~ > 2М) < 7. (ЗЗ) Обозначим через 5 событие, состоящее в том, что од. новремеино выполняются неравенства ) Во~ Ь', В! < — ~ ~ ° ! Вк!~ ~2Ь( В силу (33) Р(В)<е и Р(5)>1 — е.
Прн О=О,=пЬ уравнение (32) преобретает вид В, ~ В,Ь+ — ЬВ,11- = О, (34) В множестве 5 ~ Во+ —, ЬВ,Ьз ~ <(И + )))!2, и при Ь < Е(Ак ! знак левой части (3() опред ляется д (Вл! 2 (Ал + 11 1 д!оя 1. знаком члена =Р В!Ь. Так как — непрерывно зал оа висит от О, то в интервале (΄— Ь, Оо+Ь) прн п>по с вероятностью «! — е существует корень О. Таким образом, мы доказали перву о часть теоремы. Пере- Гл. оа.
Оценкя пАРАметРОВ 232 пишем равенство в,+в,(е — е,)+ ~,*' (е — е,)'=О в слсдуизшем виде: 1 тч о)!ои р (ха' 8) )/У (8о) и ~-, 'ой 1Е-Е, (е — е ) ~/у; (е,) . (зй) Ио 1 6-8, — — — — бв уо (Оо) 2 Уо (Оо) Числитель в (35) по центральной предельной теореме аснмптотнчески нормален с параметрами (О, 1), а знаменатель при гт-иоо сходится по вероятности к 1, Поэтому случайная величина (оа — Еа) ~/У7(Ео) л асимптотнчески нормальна с параметрами (О, 1), что и доказывает теорему. Задачи 1. Случайная величина р подчиняется биномиальному закону распределения Р (р й) С„р (! — р)" .
Найти несмещенные о а оценки й и о' математического ожидания а лр н дисперсия о' = лро) этога распределения, считая параметр р неизвестным. 2. Случайная величина $ имеет геометрическое распределение Р(оь й) ро), о)=1 — р,а=0,1,2, ... Найти выраженные через 1 несмещенные оценки б н Оо тех же величин а=яр и по=про), что и в задаче 1.
3. Случайная величина $ имеет распределение Пуассона Р Я=а) = ь = П (а( й) — а . Найти несмещенную оценку Чозо (й) вероята И ности П(яоо; О) е "'о в законе Пуассона со значением параметра то, где го=2, 3 ... 4. Пусть хо, хо, ..., х„— независимая выборка нз семейства распределений У, Найти достаточные статистики в случае, когда У а" есть: а) семейство пуассонавских распределений р„ — е А! л = О, 1. 2,,; б) семейство показательных распределений с плотностью )оа "х, х о 0; в) семейство равномерных распределений с плотностью если 0 ~ х < с, 1 р(х)= с' 0 в остальных случаях.
ЗАДАЧИ 5. По независимой выборке «ц ..., х» из иормальпого распре. деления с параметрами (а, 1) построена иесмещеивая оцеяка а хы л 1 ч'л Найтв иесмещеипую оценку б М (х1 ) й), где х — ~ хг — доста Ю ! точная статистика. б. Пусть хо ..., х — иезависимая выборка из равномерного в (О, 9) распределевив. Найти оценку 9 ваиболынего правдополобия параметра 9. Г л а в а 1б. ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ $63. Определение доверительнык интервалов Пусть х1 ю ха †выбор (далее мы всегда будем предполагать, что она независимая) из некоторого распределения с плотностью р(х; О) = р(хь ..., х„; О), зависящей от параметра О, который может изменяться в интервале Оа «с. ( О < Оь Пусть у(хь ..., х„) — некоторая статистика (т.
е. функция от выборки) н г" (х; 0)=Р(т1(х)— функция распределения случайной величины = у(хь ..., х„), когда выборка (1) имеет распределе. нне с плотностью р(хь ..., х„; О). Предположим, чго Р(х; О) есть убывающая функция от параметра О. Обозначим х„(0) квантиль распределения Р(х; О), т. е. корень уравнения Г (х; О) = 1 — у. В этом случае квантнль х (О) есть возрастающая функция от О.
Зададимся малым числом а) О, например, сс= 0,05 нлн а = 0,01. Пусть а=а~+ ив При каж. дом О неравенства х, . (О) ~ Ч ~ х„,(0) (2) выполняются с вероятностью 1 — а, близкой к единице. Обозначим функцию, обратную к х (О), т. е. решение уравнения у =ха(0), через О=х '(р), Тогда неравенства (2) можно записать иначе: х„-,'(й) <О <х;1.,(Ч) 5 ю ОПРедечение довеРительных иитГРВллов яаб Таким образом, неравенства (3) при любом О выполняются с вероятностью 1 — а.
Обозначим х !(!))=О(т!), х, ' (т))=0(!)) и запишем (3) в следу!ощем виде: Р,(О(ц)(0(0(ц)) =1 — . (4) Интервал 0(п)(0 О(т!) называется доверительньеминтервалон для параметра О, а вероятность 1 — а — дов .- рительной вероятностью. Следует различать смысл неравенств (2) и (3). В неравенстве (2) при любом и случайная величина !) попадает в указанный интервал с вероятностью 1 — а. В неравенстве (3) параметр 0 неслучайный, а концы интервала случайны, поэтому правильнее будет говорить, что при любом О доверительный интервал (со случайными концами) покрывает параметр 0 с доверительной вероятностью 1 — а. Доверительный интервал (4), кроме доверительной вероятности ! — а, имеет еще одну характеристику — среднюю длину М [0(т)) — О(т!И.
Мы должны старатьсч среди всех доверительных интервалов с доверительной вероят. постыл 1 — а выбрать тот, который имеет наименьшую длину. Если статистика т! = у(хь ..., х„) уже выбрана, то мы можем варьировать разложение а на сумму а!+аэ В дальнейшем мы встретимся со следующими двумя случаями. Сл у ч а й 1. Функция распределения Г(х; 0) имсет вид р(х — О).
В этом случае Г(х — О) убывает с ростом О. Легко видеть, что при этом х (0)=0+ х (О) и х-' (д)=н — х (О), поэтому доверительный интервал (3) имеет вид т! — х, (О) (О ~( т! — х! ь (0). (б) С л у ч а й 2. Параметр 0 положителен, н Г (х; О) = =Г[ — ), р(0)=0. В этом случае Г Я при х) 0 убывает с ростом О, и х (О) =Ох (1), х,'(д) =— т т ' 'т хт(Ц Доверительный интервал (3) в этом случае имеет вид ,„(!) (0( „, „(!) 236 гл. м, доввгительные интегвалы и 64.
Доверительные интервалы для параметров нормального распределения Пусть независимая выборка (1) взята нз нормального распределения с параметрамн (а, и). а) Доверительный интервал для а при известном о. Возьмем за статистику и среднее арифметическое х.Это разумно, так как х есть достаточная статистика относительно а и является аффективной оденкой а. Как известно, х имеет нормальное распределение с парамета рами (а„— ~.