В.П. Чистяков - Курс теории вероятностей (1115264), страница 26
Текст из файла (страница 26)
0 (т (1) ( Э(О) «) = С!+ о (1) . Определить постоянные А, В, С. Указание: воспользоваться представлением (9,3.Ь), решением задачи 5 и формулой (9.2.3), 7'". Доказать, что для любого а > О где т(1) н А определены в задаче б. ГЛАВА !О ЗЛКй4ВНТЫ ййЛТВМДТИЧВСКОй СТАТИСТИКИ 5 1. Задачи математической статистики. 1!онятне выборки Пусть требуется измерить некоторую величину а. Результаты измерений х„(м), х,(ы), ...„ х„(а) естественно рассматривать как зйачення случайных вели. чин, х„ х„ ..., х„, полученные в данном опыте с исходом вк Если измерительный прибор не дает систематической ошибки, то можно предпопожить, что Мх = =а. Таким образом, по результатам наблюдений х„ х„..., х„нужно определить неизвестный параметр а.
Зто типичная задача оценки неизвестных параметров. Общая ошибка измерения часто складывается нз большого числа ошибок, кахчдая из которых невелика. В такой ситуации на основании центральной предельной теоремы становится правдоподобным следующее предположение (гипотеза): случайные величины х„ имеют нормальное распределение. Таким образом, мы пришли к задаче статистической проверки гипотезы о законе распределения.
В $ 4 гл. ! рассматривались две различные модели (модель ! н модель 2) подбрасывания двух монет, Вероятность выпадения монет одинаковыми стороиамн в модели ! оказалась равной 2,'3, а в модели 2 — равной 1,,'2. По результатам подбрасываний двух монет требуется выбрать одну из двух моделей (или гипотез). В перечисленных выше задачах оценка неизвестного параметра или выбор гипотезы проводится по результатам наблюдений или измерений. Математической моделью и независимых измерений является совокупность нз и независимых случайных величин. Назовем случайной выборкой объема и (или просто выборкой) случайный вектор х„ х„ ..., х„, где хы 1те влементы мзтемьтическои статистики (гл, га й =1... л,— независимые случайные величины с одинаковой функцией распределения Р(х,С.)=р(х), я=1,2,,„, В задачах, связанных с измерением, часто оказы- вается, что Р (х) является нормальным распределе- нием.
В задаче с подбрасыванием двух монет имеем Р(х„1) р„р(х„=О) 1 — р„1=1, 2; й = 1, 2, ..., л, где хз 1, если в Ф-и испытании монеты выпали оди- каковыми сторонами; р, =2)3, р,=1Г2. Иногда требуется рассматривать выборки с зави- симымн наблюдениями. Прн оценке доли брака в пар- тии изделии используется схема выбора без возвра- щения (см, $ 6 гл.
1). В атом случае наблюдения оказываются завнсимымн. и 2. Оценка неизвестных параметров распределения по выборке 2.1. Точечные оценки. Предположим, что функция распределения, соответствующая выборке х„х„..., х„, зависит от неизвестного параметра 6: Р(х "х)=Р(х; 6). Оценкой О„параметра 6 называется произвольная функция О„=*О„*(х„х„..., х„). Таким образом, О; является случайной величиной™. Естественно потребовать, чтобы значения оценки в болыпиистве опытов были близки к значению оцениваемого параметра, Будем называть оценку 6„" несмещенной оценкой параметра О, если при любом л МОе = 6. (2.1) Оценка О„называется состоятельной, если для любого а>0 при л — со Р(16„' — 6,( < а)- 1. (2.2) Условиям (2.1) и (2.2) может удовлетворять несколько разных оценок одного и того же параметра.
Тогда зм ОЦЕНКИ НЕИЗВЕСТНЫХ ЙЛРАМЕТРОЗ $77 из них естественно выбрать ту, у которой дисперсии наименьшая, Лля широкого класса распределекнй можно указать точную нижнюю грань дисперсий оценок одного и того же параметра (см. [101, гл. 32, стр. 521, (32.3,3а)). Рассмотрим два примера. Прил1ер !. Пусть О=а=Мхи. Положим 22+х2+ ° ..
+х„ 0„'=0„'(х„х„, ...,хи)=х= и 0'=0„'(х,. х„..., х„)=х,. Нснользуя свойства математического ожидания, легко проверить, что обе оценки являются иесмещенными: М0„' =-(Мх,+ Мх, +... +Мх„) = — =а, ии М0;,:=Мх, =а. Оценка 0„', очевидно, не является состоятельной, Най- дем 170„". Так как х„,,„х, независимы, то 2 ии2 ВА Ю„'=из((7х, +... +»Ухи) =З- — --, где оА=ЬХА, й=1, 2, ..., и. По неравенству Чебы- шева Р(»х — а»>е) = —, Отсюда следует, что 0„" =х является состоятельной оценкой параметра 0=а Мх„.
Пример 2, Найдем оценку функции распределения Г(х) = Р(хА < х), й = 1, 2, ..., и, в точке х. Пусть р„(х) — число элементов выборки, меньших х. Для каждого элемента выборки х„может произойти одно нз двух событий: (х <х), (хи~эх». Вероятности этих событий, очевидно, равны Р . Р (хи < х) = Р (х), л = Р (хи:: х) - 1 — Р (х). Таким образом, всевозможные произведения, составленные нз событий указанных двух тинов, образуют !тв элементы мхгемкгичесхоп стягнстпмн !гл, !о схему Бернулли, в которой р„(х) — число наступле- ний события (х < х).
Покажем, что функция (2.3) является несмещенной н состоятельной оценкой г (х), В схеме Бернулли Мр, =пр, Следовательно, ! ! Мр„(х) = — Мр„(х) — „пр = г (х). Несыещениость доказана. Состоятельность оценки Р„(х) следует из теоремы 2,4 гл, 6. 2.2. Метод наибольшего правдонодобня для нахож- дения оценок параметров, Метод моментов. Если функ- ция распределения Р(х, О)=Р(х„~х), А )...,, п, имеет плотность р (х, О), то функцией правдоподобия называется Е.
Е (х„..., к„„О) = р (хо О) р (к., О)... р (.х„, О). (2.4) Д»я выборки, свето»и!ей ив дискретных вет!чин х„, и= (, ..., и, с распределением Р(х,=ЕЕ) =р,(О), функция правдоподоби» определяется равенством Е, = Е,(хг, х„ ..., х„, О) =р„,(О) р„, (О) ... р„ (О), (2.5) При фиксированных х,..., х„функцию Е. будем рассматривать как функцию параметра О.
По методу наибольшего правдоподобия за оценку параметра и принимается значение аргумента О, при котором Е имеет максимальное значение. Метод наибольшего правдоподобия для широкого класса распределений приводит н состоятельным оценкам, распределенным асимптотически нормально и имеющим наименьшую дисперсию по сравнению с другими оценками того же параметра. Оценки наибольшего правдоподобия удовлетворяют уравнению д!пь — =О ве лг! оцвнкл нвизввстиых плэлмвтвов 179 если Π— одномерный параметр. Если О=(О„„„О,), то оценки параметров О„ ..., О, удовлетворяют аисте. ме уравнений — =О, й=), 2..., дйл П р и и е р 3.
Пусть величины хл, А = (, 2, ..., и, имеют нормальное распределение. Неизвестнымн параметрамн являются а=Мха, Ь=о*=-Охл. Найдем нх оценки наибольшего правдоподобия. По формуле (2.3) л,=г.(х„...,х„,АЬ)=~=~ ехр Г (хл-а)г!! 2пь У л ! н л ! ~~ )пА= — -((п2я+!пЬ) — — ~ (хл — а)г, 2 2Ь 2.е л Отсюда для оценок а и Ь' получим систему -т — =-,~~!~ (х» — а') =О, д!па ! А ! д!па л ! — — — + — ~ (х — а")а= О. да 2Ь» 2 (Ьл)'2а ! и э Из первого уравнения а"= — ~'хл=х. Подставляя — л2ы л=! зто значение во второе уравнение, найдем Ьа =- ~~' (х„— х)'. л=! Оценка а' рассматривалась в примере !.
Можно показать (см. задача (7 гл. 5), что МЬ'=":Ь. Оценка ! Ь* является несмещенной и состоятельной (см. задачу 2 атой главы). П р и м е р 4 Найдем оценку наибольшего правдопо добия для вероятности р успеха в схеме Бернулли. По 1ао алименты мьтемлтйческон стАтистики (гл. <з формуле (4.4.10)(.=Е(х,, ...,х„,р)=Ц р*ь(1 — р)' "ь, А ! ха=0, 1, (х„=1, если в испытании А был успех, и хз 0 в противном случае) и 1пЕ= ~~„', '(х„1п р+(1 — хз)!п(1-р)).
Отсюда д!пт. хь ~ — хь «а и пх Е '1р' ~ — р") р. ~ — р~ ~ — и» дс1 и р*=х. Так как для числа успехов р„имеем равенство р,=х,+х,+... +х„то р*=и — „", Оценка р' является несмещенной. Состоятельность р* следует из теоремы 2.4 гл. 6.
Из теоремы Муавра — Лапласа следует аснмятотнческая нормальность р'. Другим методом, который иногда используется для оценки параметров, является метод моментов. Пусть х„х„..., х„— случайная выборка. Случайные величины в л1, = — „~~~' (х„— х)' называют выборочными или вм~иричгсхини иомеитаяа. В примере 1 было показано, что х является состоятельной оценкой Мхи Можно показать, что ~п, является состоятельной оценкой б, =М (х„ — Мх,)".
Если функция распределения Р(х„< х) зависит от з неизвестных параметров 0„, О„..., О„то б, =. =б„(0„..., 0,). Неизвесткые йараметрй В, можно выразить в виде функций от теоретических моментов б,. Если в зтих функциях заменить б„на си„то получим оценки параметров О;, 0„ ..., О,. 2.3. Интервальные оценки. Предположим, что нам удалось найти две функции О О (х„.. „х„) я 6 0(хм ..„х„) такие, что 0<6 при всех х„ З т1 оценкх неизвестных пхелмат ов !8! Тогда величина х — а о1Р ь распределена нормально с параметрами (О, 1), н, следовательно, ее распределение не зависит от а. Определяя и„как решение уравнения х* 1 = «е 'с(х=а, р'К 3 (2.б) получим или р о о х — и„= <а<х+и =~=1 — 2сс, (2.7) а Таким образом, мы нашли доверительный интервал о — о и« вЂ”., х+и =~ для параметра а.
)со ' уй~ ..., х, н при любых значениях О Р (О (х„..., х„) < О < О (х, ..., х„)) = 1 — 2сс, е, вероятность того, что случайный интервал (О, О) накроет неизвестный параметр О, не зависит от параметра О. В этом случае интервал (О, О) ноаывспот дсверишехьнам иншервалом для неизвестноео параметра О, соо~пве~пстврюи(им доееригпельной вероятности 1 — 2а. В ряде случаев функнни О и О, обладающие указанными свойствами, можно найти. Пусть имеется выборка х„..., х„, величины х„ нормально распределены с параметрамй (а, о), параметр о известен. Найдем доверительный интервал для а. Случайная величина х=(х,+... +х„)/н имеет нормальное распределение н ов Мх= — а, Ох= —. гаа эламзнты мхтзмхтичвскоп статистики ггл. го Более естественной является снтуапня, когда оба параметра а и о неизвестны.