Г.И. Ивченко, Ю.И. Медведев, А.В. Чистяков - Сборник задач по математической статистике (1115272), страница 7
Текст из файла (страница 7)
Пусть на отрезке [а, Ь] задана ограниченная плотность распределения 1(х), с= гпах 1(х). Определим случайную величину ч = гп(п (!» 1: с 0м < ! (о + (6 — а) Пь)), где ( Ы) те же, что и в предыдущей задаче. Доказать, что случайная величина 5 = а+ (б — а) Ц„ имеет плотность распределения 1(х). 3 а м е ч а н и е. Этот результат дает способ моделирования распределения с произвольной плотностью, удовлетворяющей указанным ограничениям, Гаааа 2 Оценивдние пАРАметРОВ РАСПРЕДЕЛЕНИЙ 1. Пусть задана статистическая модель Г= ( Т) для схемы повторных независимых наблюдений над некоторой случайной величиной ь и Х = (Хь ..., Х,) — выборка из Ь (Ц. Всякая случайная величина Т = Т(Х), являющаяся функцией лишь от выборки, называется статистикой.
Часто требуется по выборке Х оценить истинное значение некоторой неизвестной теоретической характеристики д = д(Е), т. е. построить такую статистику Т(Х), значение которой можно было бы считать разумным приближением для истинного значения характеристики й. В атом случае статистику Т (Х) называют ог1енкой д (для д). Для оценивания я можно использовать различные оценки, н нх качество сравнивают, исходя из той или иной меры точности оценок (меры близости оценки к истинному значению оцениваемой характеристики). Если определен некоторый класс оценок Т, и зт выбрана мера точности, то оценку, оптимизирующую эту меру, называют опт!!л!альной (в классе Т ).
Наиболее распространенной мерой точности является среднекеадратикескал ошибка Е (Т(Х) — Х)'. Эта мера порождает и соответствующий критерий оптимальности оценок — критерий минимума среднекеадротической ошибки. Часто ограничиваются рассмотрением лишь класса Те несмещенных оценок: Т = Т(Х) Е Т с~ ~> Е Т= их!7 ГГ- г". Для несмещенных оценок Е(Т вЂ” й) = = РТ, т.
е. мерой точности таких оценок является величина их дисперсии, а критерием оптимальности для несмещсиных оценок является критерий минимума дисперсии. Если модель Г параметрическая: Г = (Т(х; О), 0 ев е— : 6), то любая теоретическая характеристика является функцией от параметра О. Таким образом, в данном случае речь идет об оценивании параметрических функций, для которых будем использовать обозначение т(О).
Статистика Т = Т(Х) является несмещенной оценкой для т(О), если выполняется соотношение Е!Т = т (0)хг' О ев 6. Оптимальной в классе Т, несмещенных оценок функции т = т(0) является статистика Т*, для которой Р,Т* ( ( РТЦ Т ~ Т, и Х!!О е= 6. Для оптимальной оценки Т" иногда использу!от обозначение т*, чтобы подчеркнуть, что она относится к функции т (О). Оптимальная оценка Т* (в заданной модели Е и для заданной параметрической функции т (0)) существует не всегда, но в тех случаях, когда опа существует, она единственна (1, с. 42) .
Важным , вляется линейность свойства оптимальноти: сслн 7э— оптимальная оценка т; = т,(0), ! = 1, 2, ..., то оптимальной оценкой линейной комбинации 2", с!т, является ста! тистика 2, с!Т!~ (1, с. 44). ! Обязательным для любого правила оценивания является свойство состопгельносги, которое означает, что при неограниченном возрастании объема выборки и оценка должна сходиться по вероятности к оцениваемой характеристике каким бы нн было истинное распределение наблюдений. Таким образом, состоятельность — это асимптотическое свойство оценок (в отличие от свойств несмещеппости и оптимальности).
Когда хотят подчеркнуть зависимость рассматриваемых статистик от объема выборки, их отмечают индексом и. При установлении свойства состоятельности полезен следующий простой критерий (1, с. 72): если ЕОТ„= т(0) + е., Р~Т = б„ис„= зв = с„(0) — 0 (т. е. ҄— асимптотически несмещенная оценка т (О)), б„= б (О) — 0 при п — оо для всех О ~ 6, то Т вЂ” состоятельная оценка т(О). 2. Рассмотрим кратко общие критерии существования оптимальных оценок и способы их нахождения в рамках обшей параметрической модели г= (Р(х, О), О ен 6).
Пусть 1 (х; 0) — плотность распределения наблюдаемой случайной величины О (или вероятность события (О = к] в дискретном случае) и х = (хп ...,х„) — реализация выборки Х = (Хо ..., Х.). Функция Е(х; 0) = 1(хц 0)Х ...Х((х„; О), рассматриваемая при фиксированном ке=Х как функция параметра 0 е= 6, называется функцией правдоподобия.
В дальнейшем предполагается, что 1. (х; 0) > 0 при всех хен Х и 0 я 6 и дифференцируема по О. Более того, справедливо следующее правило перемены порядка дифференцирования и интегрирования (в случае скалярного параметра 0): для любой статистики Т (в частности, для Т = сопз() ~ $ Т( ) Е (х; О) х = 5 Т("ф1- (х; О) дх (дх = дх| ... дх„) (интегрирование ведется по всему выборочному пространству Х, указанные интегралы, по предположению, абсолютно сходятся при всех О ен 6, везде для дискретных моделей интегрирование заменяется соответствующим сум мированием).
Наконец, введем случайную величину е (1(Х. О) В'и с(Х: О) и В)О1(хл О) до,'~', до называему)о вкладом выборки, и будем предполагать, что 0 < Ео У'(Х; 0) < оо з,У О ~ 6. Модели, для которых выполняются все перечисленные условия, называют регулярными. Для регулярной модели Ег(т'(Х; 0) = 0 зч~ О ~ 6 и определена функция 1„(О) — = Рг (1(Х; О) = Ев(1'(Х; О), называемая функцией информации (функцией Фишера) . Величину Е ( д )и 1 (Х,, О) ) Е ( д )и 1 (Хп О) ) называют также количеством (фишеровской) информации, содержащейся в одном наблюдении (последнее выражение используется в тех случаях, когда функция 39 /(х; О) дважды дифференцируема по 0).
Для схемы по- вторных независимых наблюдений 1„(8) = п((8). Введенные понятия непосредственно обобщаются на случай векторного параметра 0 = (Оь ..., О,). В этом слу- чае под вкладом выборки понимается случайный вектор У = (У~(Х; О), ..., У,(Х; О)), где (/;(Х; О) = — (п/.(Х; 0), ] = 1, ..., т, а аналогом функции информации является информационная матрица выборки 1„= 1„(0) = — Ое(1/) = = Еэ(1/1/'). Информационную матрицу одного наблюде- ния 1~ = 1 = [[йн[]; можно вычислить по формулам Е/дь)(хпв) д(л((хпв)~ йн=йн() = .~ да, дар Е / д'(п)(хп а)) о~ дв, да, (последнее равенство справедливо для дважды дифференцируемых функций 1(х; 8). Для схемы повторных независимых наблюдений 1.(О) = п1(О).
В данном случае в определении регулярной модели предполагается, что матрица 1(0) невырождена при всех О~ 9. Для регулярных моделей можно установить нижнюю границу для дисперсий несмещенных оценок заданной дифференцируемой параметрической функции т(О). Именно (неравенство Рао — Крамера): для любой оценки Т = Т(Х) еи Т, и всех 0 я 6 имеет место неравенство ь)еТ ~ . в, если параметр 0 скалярный, и неравенство 1 (е)1' ы (е) О,Т ~ Ь(8)1„-'(О) Ь(О),Ь (О) =( — ';,"',...,— ';,"'), если 0 = (оь ..., 0,). Оценка Тв сн Т„, для которой достигается указанная нижняя граница, называется эффективной. Если такая оценка существует, то она является, следовательно, оптимальный (в классе Т,) и единственной. Критерием эффективности является следующее представление [1, с. 47, 52]: Т(Х) — т (0) = а(0) (/(Х; 8), если Π— сналяр, Т(Х) — т(0) = а'(8) У(Х; 8), если 0 — вектор, где а(0) (соответствеино а(0)) — некоторая функция (вектор-функция) О.
В заданной модели Г эффективная оценка может су- шествовать только для какой-то одной параметрической функции т(0) (с точностью до преобразования ат(0)+ Ь, где а и Ь вЂ” константы). В тех случаях, когда эффективной оценки не сушествует, для отыскания оптимальной оценки Т» = т* (в классе несмешенных оценок Т,) можно использовать следующий алгоритм (критерий Бхаттачария) (1, с. 50, 53]: учитывая старшие производные функции правдоподобия Б = Б (Х; О), подбирают такую их линейную комбинацию, чтобы получить представление вида " +, ~',ц-з аз»..ЗЭ„1 ' при этом последовательно полагают з = 2, 3,.... Если при некотором значении з 2 и коэффициентах а.
= а.(0) зто удается сделать, то статистика Т = Т(Х) является оптимальной оценкой функции т = т(0). 3. Наиболее эффективным способом построения оптимальных оценок является использование так называемых достаточных статистик, Статистика Т = Т (Х) (вообще говоря, векторная) называется достаточной для модели х"= (Р(х; 0), О ен 6) (нли достаточной для параметра О), если условная плотность (или вероятность — в дискретном случае) Б(х11; О) случайного вектора (выборки) Х = (Хь ..., Х.) при условии Т(Х) = г не зависит от параметра О. Эквивалентным определением достаточности является следующее: для любого события А с: Х условная вероятность Ро(Х ен А(Т(Х) = 1) не зависит от О.
Это свойство статистики Т означает, что она содержит всю информацию о параметре О, имеющуюся в выборке. Действительно, вероятность любого события, которое может произойти при фиксированном Т, не зависит от О, и, следовательно, оно не может нести дополнительной информации о О. Сама выборка Х, очевидно, является достаточной статистикой, но обычно стремятся найти достаточную статистику наименьшей размерности, представляющую исходные данные в наиболее сжатом виде, в этом смысле говорят о минимальной достаточной статистике. Минимальная достаточная статистика является функцией любых других достаточных статистик. Практически достаточные статистики обычно находят на основании следующего критерия факторизации (1, с.
55): статистика Т(Х) достаточна для параметра О тогда и только тогда, когда функция правдоподобия Б (х; 8) представима в виде Б (х; 8) = д (Т(х); 8) и (х), где й и и — неотрицательные функции и и не зависит от О. Если Т вЂ” достаточная статистика, то таковой же является и любая взаимно однозначная функция от Т. Роль достаточных статистик в теории оценивания определяется теоремой Рао — Блекузлла — Колмогорова [1, с. 58), согласно которой для любой несмещенной оценки Т~ заданной функции т(8) можно построить новую несмещенную оценку Т* = Ел(Т11Т), зависящую от достаточной статистики Т, для которой ВьТ' - О~То Следовательно, оптимальную оценку надо искать среди функций от достаточной статистики.