Г.И. Ивченко, Ю.И. Медведев, А.В. Чистяков - Сборник задач по математической статистике (1115272), страница 23
Текст из файла (страница 23)
Использовать рекуррентное соотношение а,+,(1) = (1+ а)а„(1) + ра, ~(1), л где а = — ~', 1,а,'(1;)/а~ р = — ~ 1,а,,(1,)а,(1;)/а,' 1=! (см, (4,0) ), 4.33. Смоделировать наблюдения Х~ = 1,'+ ел 1 = 1, л, если л = 100, 1, = 2+ 0,1(1 — !), е; — независимые 1ЗВ равномерна распределенные случайные величины на отрезке !О; 0,7). 1) Построить по зтнм данным интерполяционный многочлен Гра(О р) = ~:; р,и,(Г) для й = 2, 3, 4, ~=! где и;(Г), / = 1, ..., 4, — многочлены Чебышева. 2) Построить графики функций х = Гв, х = ~ра(Г; р), й = 2, 3, 4.
3) Как изменяется точность интерполяции с ростом йр 4.34. Решить предыдущую задачу прн е; нормально распределенных с Ее, = О, 0е; = 0,04. 4.35. Решить задачу 4.33 с Х, = е" + еи 4.33. Решить предыдущую задачу при е~ нормально распределенных с Ее~ = О, !Уе; = 0,04. 4.37. Пусть У,, ..., У. — независимые случайные величины с общей функцией распределения рв((х — (3~)/рв), где га(х) — известная непрерывная функция распределения, а параметры сдвига Р, и масштаба рв -» О неизвестны. Тогда У> = Д~ + бэУь где случайные величины Уо ..., У„независимы и имеют функцию распределения га(х).
Записав для соответствующих порядковых статистик представление Ую=(3~ + ифв+ бэеь где е; = Уш — аь а~ = ЕУиь ! = 1, ..., и, получить оценки параметров 3~, рв методом наименьших квадратов. У к а з а н и е. Здесь случайные величины У = = (Уоь ..., Уоо) удовлетворяют модели линейной регрессии с коррелированными наблюдениями: сот(еь е,) = сот((б;~, Ущ) — = дп известны, поэтому нада перейти к некаррелнраванным величинам Х = = 0 '~'У, где матрица б = ~!йн!!", является, по предположению, невырожденнай.
Глава 5 РЕШАЮЩИЕ ФУНКЦИИ 1. Пусть на выборочном пространстве Х = (х) значений наблюдаемой случайной величины Х задана функция б(х), значения которой принадлежат множеству Э = (й) возможных решений, которые могут быть приняты при наблюдении конкретного значения Х. В этом случае б(х) называют решающей функцией (правилом, процедурой). Пусть, далее, А(Х) а Р = (г(х; О), 0 а 0), н для каждой пары (О,й) ее ВХО задана числа ЦО, й) - О, интерпретируемое как убыток (ущерб, потеря) от принятия решения й, когда Х имеет распределения г(х; О).
В этом случае говорят, что задана функция потерь Е(0, д). Например, в задачах точечного оценнвання решениями являются значения оценки параметра О, поэтому множество решений Р совпадает обычно с параметрическим множеством В, решающая функция 6 называется оценкой, а ущерб Л(0, И) отражает расхождение между значением 0 и оценкой д. Поэтому в таких задачах обычно полагают ь(9, д) = ы(~0 — д1), где и — строго возрастающая функция ошибки 1д — 81. Величина Я(0,6) = Ген(9,6(Х)) называется функцией риска процедуры 6, т. е. это средние потери, которые имеют место при применении решающего правила 6, когда наблюдаемая случайная величина Х имеет распределение г(х; О).
Если для двух правил 6' и 6 выполняется условие (5.1) 11(8, 6') ~~ й(9, 6) 9 О е= В, причем имеет место строгое неравенство хотя бы для одного 8, то правило 6' предпочтительнее 6; в этом случае правило 6 называют недопустимым. Решающее правило, не являющееся недопустимым (т. е. для которого не существует предпочтительного правила), называется допустимам. В практических ситуациях ограничиваются рассмотрением класса допустимых решающих правил, никакие два из которых уже несравнимы в смысле (5.1). Для выбора наилучшего из допустимых правил в статистике применяют байесовский либо минимаксный подходы.
2. При байесовском подходе предполагается, что параметр 8 — это случайная величина с некоторым (априорным) распределением 1(0), задаваемым плотностью распределения (или вероятностью в дискретном случае) п(О). В этом случае можно вычислить полную среднюю потерю для процедуры 6: г(6) = )й(0, 6)п(0)дО (или ,'~ Я(0„6)н(0,) в дискретном случае), называемую байесовским риском, и упорядочить все решающие правила по величине этого риска. В данном случае оптимальным, или байесовским, решением является процедура 6*, минимизирующая байесовский риск г(6). Алгоритм нахождения байесовского решения при заданном априорном распределении параметра я(0) имеет следующий вид 11, с.
224 — 225): а) для Х = х находят апостериорное распределение я(01х) по формуле н(81х) = 1(х; 8)я(9)/1(х), где 1(х) = 122 =- Е)(х; О) = )Е(х; О)л(0)дО( плн ,'Р)(х; 0)л(0,) в дискретном случае); б) вычисляют среднюю потерю для решения сЕ относительно этого апостсрнорного распределения Е(Е(О, д)1х) = = )с(о,д) (01 )до ( 2;Е.(он д)л(0,1 )); в) в качестве искомого выбирают решение д* = 6"(х), для которого эта средняя потеря минимальна. 3. При отсутствии априорной информации о 0 для сравнения допустимых решающих правил используют максимальный риск ь~(6) = эорЕЕ(0, 6), и наилучшим счньвв тают правило 8, минимизирующее гп(6)„это правило называется минимаксным решаюи1им правилом. В ряде случаев такое правило удается построить, если можно найти априорное распределение параметра л(0) ) О, для которого функция риска соответствующего байесовского правила 6" постоянна: ЕЕ(0,6*) = — сопэ1 (такое распределение л называют наименее благоприятным априорным распределением), в этом случае 6 = 6* [1, с.
225]. 4. В важном частном случае 6 = (О, „, 0~), т. е. возможными распределениями наблюдаемой случайной величины Х являются лишь конечное число Ег распределений Р(х) = г(х; О,), Е = 1, ..., А, и требуется выбрать одно из ннх в качестве истинного по наблюдению над Х. Такие задачи называют задачами классификации. В данном случае множество возможных решений Еэ = (дь ..., дь), где решение д, означает, что в качестве истинного следует выбирать распределение Рь Е = 1, ..., й, и каждое решающее правило 6(х) порождает разбиение выборочного пространства Х = ОУ~() .() Жм ЖП Ж~ = = О, ЕФЕ, где Ж',=(х:6(х)=А), Е=!, ..., А. При этом байесовское решение 6* определяется разбиением Х = В'~ () ...
() %7, в котором От,"' = (х: Еь(х) = пнп Ег,(х)), /' с Ф Е = 1, ..., и, где функции 70(х) = ~ Е(11Е)л,),(х), Е(Е'1Е) = Е(Оь де), л; = л(Ог) г=! (если указанный минимум достигается при нескольких значениях Е, то в качестве значения индекса Е берут минимальное из них). Если потери Е(Е)Е) = 1, 1 ~1, нлн же они неизвестны, илн их трудно оценить числом, то байесовское правило заменяется принципом максимума апостериорной вероятности: относить обаект с наблюде- гзз нием х к тому классу, апостериорная вероятность п,(х) = 1,(х)п,у2', п,1,(х), ! = 1, ..., я, которого максималь- 5 на, т. е. в таких случаях [1, с. 230[: !Р,"' = !х: п,),(х) = гпах п,1,(х)), ! = 1, ..., и.
~к,<в Для построения минимаксного решения 6 ишут наименее благоприятное априорное распределение и = = (пь ..., пх) из условия равенства компонент вектора риска 1с(6*) = (й~(6*), ..., )с~(бь)) соответствуюшего байесовского решения, где К(б'*) = Р(Оь б ) = ~; 1(1!1)рь(Хе= Ю;), К = 1, ..., и. у=! 5.1. Пусть Е(Х) = В~(1, 0), 9 =[0~ = —, Ог= -2[ ! 21 множество решений В = (с!н А) и функция потерь А(О„с1,) задана таблицей 1) Определить все допустимые решаюгцие правила в данной ситуации и найти среди них минимаксное. 2) Найти байесовское решение 6* для произвольного априорного распределения п(0,) = а, а(0г) = 1 — а, а ен [О,! [, и построить график байесовского риска р(а) = г(6*) как функции а.
5.2. Найти все байесовские решения в следуюшей ситуации: Е(х) =В~(1,0), ГО =~0~ = —, От = — '~, В = (А, А, ~1з) и функция потерь ЦО„И,) задана таблицей. Построить график байесовского риска р(а) = т(б*) как функции а = п(0), а е= [О,! [. А А А о, ог 124 ! У к а з а н н е. Сравнить средние потери относительно апостериорного распределения, данного в решении 2 предыдущей задачи. 5.3. Пусть Е(Х) = В1(1,0), 6 = [Оь Ог), В = (А, А) и функция потерь Л(О„А) задана таблицей (а, Ь ) 0).
Рас- 2 ! 3 ! смотреть два случая: 0~ = -о-, Оз = -2- и 0~ = —, Ох =-и- 4' ъ Щ Убедиться в том, что в обоих случаях множества допустимых решающих правил совпадают, но во втором случае прн любом априорном распределении параметра байесовское решение предпочтительнее. [ Указание.
Воспользоваться решением задачи 5.1. 5.4. Пусть х.(Х) = В1(3,0), 6 = [О~ = !О ~, Оз = 10 '), множество решений 12= [А, А) и функция потерь Е(Оз А) задана таблицей а2 о, о о, ! о Рассмотрим следующие решающие правила бг = (6,(0), 6,(!), 6,(2), 6;(Э)): 6 ~ = (А, Ны1ь с(з) бг = (А, А, А, ~г), 63 = (А, А, А, В2) Убедиться в том, что эти правила между собой несравнимы и найти среди них миннмаксное. 5.5.
Пусть х,(Х) = В1(1, 0), 9 = [0,,0,), О= (А, Вг) и функция потерь задана таблицей Ш 125 Определить мннимаксную решающую функцию среди фун- кций (А прн х = О, 1, ...,с — 1, 1А при х =1,1+1, ..., 5.6. Убедиться в том, что если в условии предыдущей задачи заменить Е(Х) на пуассоновский закон П(О), то 6 = 6~ при а(! — е "')е Ье ', а соответствующий вектор риска есть (а(1 — е "), Ье "). 5.7. Пусть Х вЂ” случайная величина, имеющая распределение Ь~(х) = Г(х; 9~) либо гг(х) = г(х; Ое); множество решений 0= [А, А) и функция потерь задана таблицей И, 41г о, Щ Построить байесовское решение для заданного априорного распределения (лп пг) и вычислить соответствующий риск (ср. с задачей 3.51).