Тихонов В.И., Харисов В.Н. Статистический анализ и синтез радиотехнических устройств и систем (2004) (1151791), страница 59
Текст из файла (страница 59)
Ры .смотрим пока мс!олы оценки параметров 2., представляющих сл. в. Пусть в наблюдение (6.1.1) входит сипгал «(г, 2.), зависящий от одно?о случайного параме)ра. Получить оценку по существу означает организовать такую фупкгц»о рсгзульгытов наблюдения у(Ц), значение которой можно было бы припаси за Он«им??лы!ую оценку р.=у(~о) истинного зна )ения »араме?ра ).. Отлельный результат наблюлепия со есть времепиь?е о~счеты в 9-1 1 .!очках конкретной реализации случайного наблюдения "' (г)» г е (О, Т3. Разные наблюдения Ц, как и функция от них с (Цо), будут представ?!ять собой сл. в. Поэтому 1'яковов И. И., Фег)о?5)зв /з. И.
С) бвассовской с»сикс функции рвсиредслеиия всроятнс»с)с«)/,'Изв. вузов ССС Р. Радиофизика. -1985.— т. 28, ?»Ь 2..-С2 249-- 251. 308 нельзя найти оценку, которая принимала бы значения, близкие к р., лля всех возможных наблюдений. Следует ограничиться такой процедурой оценивания, которая дает хорошие резул!паты «в среднем» прн многократном ее повторении. В зависимости от критерия оптимальности оценки и других фак?оров возможны разные подходы к формированию функции у(го).
Байесовская методология. При байесовском подходе критерий оптимальности связывают с так называемой ф)!с!с?/ией ггопгеуь (стпоимоспги) с()., у(с'„')), харакгсризую?цей по~ери из-за отклонения оценки от истинно?о значения параметра ).. Вид се выбирают на основании практических соображений и простоты решения залачи; выбор не являешься особенно ограничительным. Посколысу конкретное значение е(р., у(ео)) зависит ог рсзульта~ов наблюдения и оказывается случайным, то качество измерителя характеризую) некоторыми средними значениями. В результате осреднсния с(2., у) с функцией правдополобия /) (~о'!) ) получаем так наз?»!ваемый условный риск г(Р У)= ) е(г У(го))Р(со!)с)с/со. (6.3.!) (с о) Здесь интеграл являешься (9-! !)-кра?.ным. Естественно, что более предпочти).ельными являются алгоритмы у(1;Ц, приводящие к меньшим значениям г(),, у).
Если некоторыи алгоритм у(со) мишсмизирует условныи риск при всех значениях )., то такое решение оптик,слыло. Однако в общем случае решение, минпмизируюп!ес услоы -?й риск, будет различным при разных р.. Тогда выбор оптимального решения производится на основании байесовского поихогьа — минимизации среднего /)иска (условного рис?сы, Осреш?сино?О с ап?зио!»?ой и.
в. параметра) Я(у)= ) г(х, у)/)р„() )с/2-= ) ) с(2, у(со))/)(). »ео)с/!с/(~о (6.3.2) сц !И)йв С учетом равенства (6.1.5) это выражение можно записать и!аче: /с(у)=- (/с(у!19»)/)с(Ц)с/г;о. (6.3-3) !С,) где Я (у ! Ц о ) = ) с ()., у) р (2. ! с о ) с/). (6.3.4) Сс) — апостсрпорное м. о. функции потерь, называемое апоггггергсо/гнььи риском.
Решение Х=-у(Ц), минимнзирун)щее средний риск (2), называется оппгимальаыз! Осгйееоеекгсм реп!с!с!гесс относительно сгп/)ио/)!!ого распределения рр„(Х), а качество оптимальной оценки определяется минимальным значением среднего (байесовско!'о) риска. Интеграл (3) мипимизируется, если минимизировать подьштегральное выражение при каждом значении переменной интс- 309 (63.8) грирования Ц.
Это можно сделать, так как оценка»с=у(Ц) определяется для каждого наблюдения г,)ь Таким образом, оценка должна минимизировать А(у!до)р (д "о). Поскольку р (г,'о)>0, то этот сомножитель можно опустить. В рсзультлате получаем. что минимум среднего риска Я(у) достигается ири том же значении у, что и минимум апостериорпого риска (4): (г(».„«.)р(«.! Ц)Ю.=пип. (6.3.5) !л! Г Это утверждение справедливо и для дискретного параметра «..
При этом интеграл в (5) заменяется суммой, а аиостериорная п. в. Р(«.!г„о)--вероятностями р(«.=«.,! «о), с=1, ). Задача (5) часто разрешима аналитически. Итак, байесовские правила оценки можно находить, оперируя апосгериорным риском, который определяется выбранной функцией потерь и апостериорным распределением параметра.
Для отыскания байесовской оценки нужно задать функцию потерь. Во многих практических случаях можно полагать, что потери зависят только от ошибки оценки с, = — ал (Ц) = ». — «„с («., «) = с (вл). (6.3.6) Три типичные функции потерь (квадратичная, простая и модульная) имеют соответственно вид с(ал)=-ал, г(ал)=1 — б(ал), Г(вл)=!е! !.
(6.3.7) Подставив эти выражения в (5) и найдя минимум апосгериорного риска, придем к следующим результатам. Байесовская оценка при квадратичной функции потерь является оптимальной по критерию минимума среднего квадрата ошибки и представляе~ собой м. о. апостериорной и. в. х„„=-) «.Р(«.! Ц)с(«.. л При этом минимальное значение агюстериорного риска (4) есть просто апостсриориая дисперсия Л(«„.! «;) =»«,л= ((« — «„„)'р(».! «;),у«.. (6.3.9) (!.) Байесовская оценка при простой функции потерь является ош.имальиой по крлггерию максимума апостериорной и. в., г.
е. совпадает с положением абсолютного максимума апостериорной п. в. Если абсолютный максимум дости!.ается внутри допустимой области изменения параметра «, и апостериорная п. в. Р(«.! «о) дифферешлируема по «., то оценку можно находить из решения уравнения др(«. ! го)/д». !,; = О. Поскольку логарифм есть монотонно возрастающая функцл!я аргумента, то обычно удобнее решать уравнение д)пр(«.!ьо)с'д«.! =г=О (6.3.10) 3!О Форму!ла (6.1.6) позволяет разделить в этом уравнении роли наблюдения и априорных сведений: В !ор(Ьо ! л) с» !о Р,(л) (6.3.1 1) вх л" дх Во многих случаях (в частности, при широком равномерном априорном распределении параметра) выполняется приближенное равенство д!ир,(«.)/д».жО и оценка по максимуму апостериорной и, в. совпадает с небайесовской оценкой по максимуму функции правдоподобия: д!прйо ! ХИ«! л=о (6З.!2) Оценки постоянных параметров методом максимально! о правдоподобия обладают хорошими свойствами — они асимптотически (при о- оо) состоятельны, эффективны и нормально распределены (5).
Поэтому этот метод нашел широкое практическое применение. Байесовская оценка по модулю ошибки есть медиана апостернорной п. в. Подставив г(ал)=!х — »с! в (5), имеем Ю а. л ) !Х вЂ” ».!Р(»л!Со)сС«-=-1(« — «.)Р(«!Го)с(»- — ) (».— «)Р(«!1о)с)«- Ю л О Приравняв производную по «.
нулю, получаем уравнение для оценки О л ~р(».!Ц)с(«,= 1 р(«.!РД)с(»л, (6.3.13) представляющее собой математическое определение медианы аиостериорного распределения. При рассмотрении практических задач наиболее часто используются оценки по минимуму среднего квадрата ошибок и по максимуму аиостериорной п. в, или максимуму функции правдоподобия. Хотя перечисленные оценки в общем случае различны, однако в асимптотике (при очень бо.пылом объеме выборки л оо или большом времени наблюдения с-+ос) априорные сведения утрачивают свою роль, и поэтому байесовские оценки и оценки максимального правдоподобия асимптотически эквивалентны. При этом функцию правдоподобия часто можно аппроксимировать нормальной п. в.
р (с о ! «) =Р (с; о ! «) ехр -(«. — Х)~ —,1и р (Ц ! л), где «.=у(Ц) — оценка максимума правдоподобия. Поясним это на примере. Пусть элементы выборки Ц=(г, „ независимы. Тогда 3!! распределения параметра. Если оно неизвестно, то байесовский метод в том виде, как он изложен выше, использовать нельзя, и следует применять небайесовские методы выбора наиболее предпочтительного решения, не предполагающие знания априорного распределения. Кроме упомянутого выше метода максимального правдоподобия (12) к таким методам относится минил>аксный, при котором минимизируют условный риск для самого неблагоприятного случая, а именно находят минимаксное решение у„, из условия п>1ппзахг(Х, у)=гпахг(>,, у ).
(6.3.22) т Величина шах> ()., Т„,) нязь>вается минимаксным риском. Мнпимаксный критерий дает оптимальное решение лишь для наихудшей (относительно Х) ситуации. Этот критерий в прикладных исследованиях используют реже, чем байесовский (5), еще и по~ому, что отыскание минимаксного решения сопряжено с большими трудностями. Несколько облегчает положение резульга.> Вальда. устанавливающий соответствие между минимаксными и байесовскими решениями.
Оказывается, что минимаксное решение у,„при некоторых слабых ограничениях является байесовским опюсительно наименее благоприятного априорного распределения ре„(Х), максимпзнрующего байесовский риск. При этом минимакснйй риск равняется байесовскому риску для р „(Х), а функция риска > (Х, у„,) минимакспого решения у„нс зависит от значений параметра Х.
Отсюда, в частности, следует, что если байесовский риск для некоторого априорного распределения р „(Х) оказывается пе зависящим от Х, то это распределение наименее благоприятно, а байесовское решение у — минимаксное. Этот факт помогает при отысканил наименее благоприятного априорного распределения (часто оно оказывается равномерным) и минимаксных решений. Минимаксный критерий часто используется в робастных (устойчивых) методах оценивания, которые малочувствительны к отклонениям априорных данных и другим возможным отклонениям от принятой исходной модели (см. й 13.3).
Метод моментов. Иногда для оценки неизвестных неслучайных параметров задмп>ого распределения р(«; Х„..., Х„) применяют пебайесовский метод, известный как метод момен~он. Допустим, гго по результатам наблюдения «ь тем или иным способом найдены оценки >и моментов т„(Х„..., Х ) распределения р(«; 1.„..., Х„,). Обычно находя~ первые т моментов (> =1, т).
Тогда неизвестные параметры Х„..., Х определяю~ из т алгебраических уравнений, получаемых при ран ниванием статистических оценок моме»гов теоретическим значениям соответствующих моментов: п>„(Х>,...,Х„,)=-(«"р(«; Х„...,Х„,)с(«, г=1, т. (6.3.23) 314 Об интервальном оценивании. До сих пор говорилось о получении оценки параметра Х в виде единственного числового значения 1.„=у(«ь), принимаемого за приближенное значение параметра. Такие оценки называются >почечны.ип.
Поскольку при каждом конкретном ис»ыгании значение оценки будет отличаться от значения параметра, то более полный и надежный (но вместе с тем и более сложный) способ оценивания постояшюго параметра заключается в определении интервала (а не единственного точечного значения), в котором с заданной степенью достоверности будет заключено значение оцениваемого параметра. В этом случае говорят об интервальном или доверительном оценивании. При интервальном оценивании ищут две такие статистики: Х'=у'(«ь) и ) "=у"(«ь), Х'<Х", внутри когорых заключено истинное значение параметра Х с заданной вероятностью ес Р(Х'<г.<Х") =а. (6.3.24) Интервал (Х', Х") называется и-доверительнь>м интервалом для )., число а — -довсрпнгельной вероятностью илп доверительным уровне.и, Х' и )." — нижней и верхней доверительнымп границами соответственно.