Г.И. Ивченко, Ю.И. Медведев, А.В. Чистяков - Сборник задач по математической статистике (1115272), страница 8
Текст из файла (страница 8)
При отыскании явного вида оптимальных оценок важную роль играет свойство полноты достаточной статистики. Статистика Т называется (ограниченно) полной, если для всякой (ограниченной) функции р(Т), из того, что Еьу(Т) = Очтй, следует, что ~р(1) — О на множестве значений Т. Для полной достаточной статистики всякая функция от нее является оптимальной оценкой своего среднего.
Следовательно, если оценивается заданная параметрическая функция т(8), то оптимальная несмещенная оценка т* — такая функция т* = Н(Т) от полной достаточной статистики Т, которая удовлетворяет уравнению несмещенности Еь Н(Т) = т (О). Это уравнение либо имеет единственное решение, либо решений нет.
В последнем случае класс Т, несмещенных оценок т (0) пуст. Многие модели математической статистики укладываются в схему г-параметрического экспоненциального семейства, т. е. когда функция ~(х; 0), 0 = (Оп ..., 0,)еп ен В с йи представима в виде ~ (х; 8) = ехр( ~; О,В,(х) + С(8) + 0 (х)~ 1=! (или приводится к такому аиду заменой параметров).
В этом случае Т =(Тн ..., Т,), Т; = Т;(Х) = Х ВИ') ! = 1=! = 1, ..., г, — минимальная достаточная статистика, и оиа полная, если дип 9 = г. 4. Одним из наиболее универсальных методов оценивания неизвестных параметров распределений являет- ся метод максимального правдоподобия. По этому методу оценкой максимального правдоподобия (о.м.п.) 0„ параметра О по выборке Х = (Хь ..., Х.) является такая точка параметрического множества 6, в которой функция правдоподобия 1.(х; О) при каждом Х = х достигает максимума, т.
е. Е (х; 6,) ) 7. (х; О)-9 6, или 7. (х; 0„) = = зир Е (х; О). Если для каждого х ~ Х максимум 7. (х; О) Омь достигается во внутренней точке 9 и А (х; 0) дифференцируема по О, то о.м.п. О„ удовлетворяет уравнению правдоподобия ' = О (или ' = О, 1 д)п Ь(х; О) д)п Ь(к; О) дз ' дз, = 1, ..., т, если 0 = (Оь ..., О,)). Если оценивается некоторая параметрическая функция .г(О), то ее о.м,п. т, = т (О„) — это так называемое свойство инвариантности оценок максимального правдоподобия. В тех случаях, когда уравнение правдоподобия не удается решить точно, прибегают к различным приближенным методам решения.
Одним из них является рекуррентный метод накопления Фишера, согласно которому (й + !)-е приближение для о.м.п. вычисляется по формуле 0»+ ~ = О» + () (х; О»)/п1(0»), й = О, 1, 2, ...; прн этом в качестве начального приближения Оь берут значение какой-нибудь легко вычисляемой состоятельной оценки О. Для регулярных моделей оценки максимального правдоподобия обладают рядом важных асимптотических свойств. Именно (1, с. 73 — 75), если О, существует, единственна и лежит внутри 9, то она является состоятельной оценкой О, причем ее распределение являетсп асимптотически нормальным: если дополнительно предположить, что функция 1(х; О) трижды диффереицируема по 0 и при этом ~ ' ~ ( )О, К); П)л ~ М (х), где функция М (х) пс зависит от О н интегрируема: ЕОМ(О) ( оо.
Если элементы матрицы 7(6) непрерывны по О, то также Более того, если т(О) — непрерывно дифференцируемая функция и т„= т (О,) — ее о.м.п., то при и -ь оо .!ь (~/п (т„— т(0))) -+ У (О, а,'(О)), а также т.ь( !(и -'-":-'''"1-) -» Ж(0, 1), где о,'(О) = Ь'(О) Т '(О)Ь(0), Ь(О) = ~ в, ..., — '~. Величина а,'(0)/п называется асимптотической дисперсией статистики т„и совпадает с границей Рао — Крамера для дисперсий несмешенных оценок функции т(0). Такое свойство оценок максимального правдоподобия называется асимптотической эффективностью. Если имеется некоторая другая состоятельная и асимптотически иормальпая оценка Т„для функции т (О): ««Яп (Т, — т(О))) — !Ч(0, от(0)), то ее «качество» можно « измерять величиной еН (Т„; О) = — о,'(О)/атт(О), называемой асимптотической эффективностью оценки Т„: оценка тем асимптотически «лучше» (точнее), чем больше ее асимптотическая эффективность; для о.м.п.
же эта величина равна !. 5. Наряду с точечным оцениванием неизвестных параметров распределений в математической статистике используется оценивание с помощью доверительных интервалов или (в случае векторного параметра) доверительных множеств. Пусть Π— скаляр. При интервальном оценивании ищут две такие статистики Т; = = Т;(Х), ! = 1, 2, что Т~ < Тм для которых при заданном доверительном уровне у ~(0, 1) выполняется условие Ро (Т1(Х) < 0 < Тэ(Х)) > у«у 0 я 6. (*) Таков (случайный) интервал (Ть Тт) ~ О называют у-доверительным интервалом для О. Длина этого интервала Тт — Т~ характеризует точность локализации неизвестного параметра, а доверительный уровень у — его «надежность»: вероятность ошибиться, утверждая, что О~(Ть Т»), не превышает ! — у.
Поэтому на практике величину у выбирают обычно близкой к 1 (у = 0,95; 0,99 и т. д.), н при выбранном у стремятся построить кратчайший (в том или ином классе) интервал. Иногда рассматривают односторонние доверительные интервалы: верхний (вида 0 < Тэ(Х)) или нижний (вида Т1 (Х) < О), определяемые условиями, аналогич- 44 ными (ь(с)„в которых опускают соответствующую вторую границу. Аналогично определяют доверительный интервал для отдельной компоненты (например, О,) в случае векторного параметра: Ре(Т~ (Х) ~ О~ ( Те (Х)) ь у4/ О ~ 6, а также доверительный интервал для параметрической функции т (О): Ре(Т~ (Х) < т (0) < Те (Х)) ) ухе'О е= 6. Если оценивается векторный параметр 8 = (8ь ..., О,), то у-доверительная область для него есть такое случайное подмножество б„(Х) с: 6, которое удовлетворяет условию Ре (О ~ б,(Х)) ) у 4~ О еп 6.
Такое подмножество строят обычно с помощью некоторой статистики Т(Х), распределение которой известно. Если требуется оценить скалярный параметр 0 н сушествует такая случайная величина 6 (Х; О), зависящая от наблюдений Х = (Х„..., Х„) и оцениваемого параметра, что: 1) распределение 6(Х; 0) не зависит от 8 и 2) при каждом х еп Х функция 6 (х; О) непрерывна и строго монотонна по 0 (в атом случае 6 (Х; 0) называют центральной статистикой), то у-доверительный интервал для О строят следующим образом.
Определим числа д~ ( йе из условия Ре(й, б (Х; 0) ( йе) = у и решим уравнения 6 (Х; О) = дп йе относительно О. Обозначая через Т, = Т;(Х), ! = 1, 2, Т~ «с Тм эти решения, получаем искомый интервал вида (Ть Те). Методику, основанную на использовании центральных статистик, можно приме. нять н для оценнвания отдельных компонент параметрического вектора О = (Оь ..., О,), а также для оценивання скалярных параметрических функциИ т = т(0).
Если уже имеется некоторая точечная оценка Т = = Т(Х) параметра О и ее функция распределения г (й О) непрерывна и монотонна по О, то, определив из уравнений (относительно 0) Р (Т; О) = (! — у)!2, 1 — Р (Т вЂ” 0; 0) = (1 — У)/2 два случайных числа Т; = Т,(Х), ! = 1, 2, Т~ ( Тм получим центральный у-доверительный интервал (Тп Т,) для О. Для больших выборок в ряде случаев удается построить приближенные доверительные интервалы, осно- ванные на оценках максимального правдоподобия.
Так, если т(6), О = (Оь ...,6,), — непрерывно дифференцируемая функция и т. = т(6.) — ее оценка максимального правдоподобия, то в случае регулярной модели асимптотическим т-доверительным интервалом для т (0) является интервал (т„-+- с,а,(6„)/ /и ), где о,'(О) = Ь'(0)l '(9)Ь(9), асимптотическим у-доверительным интервалом для скалярного параметра О является интервал (О„-~- с,/-Чгшг(6„)). Подобные интервалы являются асимптотически панкрат. чайшими и они основаны на стандартной нормальной аппроксимации для о.м.пл С (т,) й/( (6), о,(6)/н).
$1. Оцвним и их общие свойства 2.!. Убедиться в несмещенности и состоятельности следующих статистик: а) Т„(Х) = г'.(х) как оценки теоретической функции распределения Т(х) в заданной точке х; б) Т,(Х) = Л,ь как оценки теоретического момента ах = Е6'; в) Т.(Х) = — 2, '(Х, — а~)' как оценки дисперсии рт = н,. ! 1 = РС в случае, когда среднее а~ = ЕС известно; г) Т„(Х) = — ", 5' = — 5' как оценки и2 вобщем случае. Является ли 5' состоятельной оценкой рт? У к а з а н и е. Воспользоваться задачей !.27 и неравенством Чебышева (предполагается, что соответствующие теоретические моменты существуют1. 2.2.
В каких случаях статистика Т„(Х) = ~/А.~/2 является состоятельной оценкой теоретического среднего а1? 2.3, По выборке Х = (Х,, ..., Х„) из распределения х. (с) построить несмещенную оценку его характеристической функции (х. ф.). ( У к а з а н и е. Рассмотреть эмпирическую х, ф. 2.4. Пусть Х = ((Хы, Хм), ..., (Хю, Х.т)) — выборка из распределения двумерной случайной величины $ =- = Дь $з). Доказать, что несмещенной оценкой для р„ = = сот Яь ~~) является статистика Т(Х) = — ", 5иь где 5м — выборочная ковариация (см.
решение задачи !.38). У к а з а н и е. Рассмотреть случайную величину ~~ + 8~ и воспользоваться решением задачи 2.! п, г). 2.5. Пусть Х = (Х,, ..., Х.) — выборка из распределения В1 (1, 0). Описать класс параметрических функций т (О), для которых существуют несмещенные оценки Т(Х). Убедиться, что в этот класс пе входят, в частности, функции т (О) = 1/О' при а ) О и т (О) = 0' при Ь ) и. 2.6*. По результатам и испытаний оценивается неизвестная вероятность «успехаъ 0 в схеме Бернулли В((1, О). Обозначая через г, число успехов в этих испытаниях и рассматривая класс оценок вида Т = " ,вы«. + а н+ р числить ср.днсквадратическую ошибку оценки Т и сравнить ее с ошибкой «обычной> оценки г„/и. 2.7.