Учебник_Бочаров_Печинкин (846435), страница 42
Текст из файла (страница 42)
Дифференцируя (!) по д, получаем р(х; д) с(х = ] , р(х; д) г(х = О. дд ] доз Поэтому М[ 1пр(Х; д) ] =- ] [, р(х;д)] р(х;д) г9х =- О, М[ —,!пр(Х;д) ] = дз 1 д з [ — —,р(х;д) — ( — — — р(х1д)) ] р(х,д)дх = р(х,д) Из ' р(х,д) дд ' в.:М = — М[( — 1пр(х1д)) ] = — 1 = — 1(д), МН(Х) = ] Н(х) р(х;д) с(х < ЛУ. Вернемся к уравнению (!4) и воспользуемся сначала тем фактом, что прн и -э сю в силу закона больших чисел бо — О, б9 -ч — ! и бз — МН(х), причем, согласно условиям теоремы, 1 > О. Тогда можно показать, что уравнение (14) будет в некоторой окрестности д иметь асимптотически единственное решение д", которое к тому же определяется приближенной формулой д д-1- —.
бо у Величина со, по центральной предельной теореме, прн и — со имеет аснмптотическн нормальное распределение с нулевым средним н дисперсией 1уп. 197 4. Меглод максимального правдоподобия Поэтому оценка д" также асимптотически распределена по нормальному закону с параметрами д и 17'Са7). П 3 а м е ч а н и е к теореме 7 Доказанная теорема гарантирует, что среди всех решений уравнения правдоподобия существует по крайней мере одно д*, обладающее свойством асимптотической эффективности в указанном смысле.
Более того, такое решение асимптотически единственно в некоторой окрестности точки д !т.е вероятность того, что в этой окрестности имеется другое решение уравнения правдоподобия, с ростом п,стремится к нулю) и именно оно доставляет локальный максимум функции правдоподобия в этой окрестности. Но с самого начала мы назвали оценкой максимального правдоподобия оценку, доставляющую глобальный максимум функции правдоподобия. Такая оценка, вообще говоря, может не совпадать с д* и даже быть неединственной.
Однако если семейство распределений с'!х; д) удовлетворяет естественному свойству разделимости, смысл которого сводится к тому, что для достаточно удаленных друг от друга д и д распределения Е(х; д) и Г!х; д) также достаточно хорошо отличаются друг от друга, то любая оценка максимального правдоподобия будет состоятельной, т.е.
стремиться к оцениваемому параметру. Вкупе с доказанной теоремой это означает асимптотическую единственность оценки максимального правдоподобия и совпадение ее с д", что позволяет при асимптотическом анализе свойств оценки максимального правдоподобия говорить не об одном из решений уравнения правдоподобия или даже не об одной из оценок максимального правдоподобия, а просто об оценке максимального правдоподобия д*. Детальный разбор этого явления можно найти в 111) Там же показано, что для оценки близости распределений удобно использовать расстояние Кульбака-Лейблера р(Г(х,д).Г(х;д)) = ] [!ц" ' ' ] р(акд) г1х, р!',д) поскольку в силу закона больших чисел именно к расстоянию КульбакаЛейблера прн п — со сходится с точностью до знака, постоянной ) 1п !р(х, д)) р(х; д) дх и множителя ! 7а логарифм функции правдоподобия 1ггЛ(Хн..., Х„; д) = !пр(ХВ д) + ., + 1ггр(Х„; д); здесь д — аргумент функции правдоподобия, а д — истинное значение неизвестного параметра.
В случае, когда семейство Г1х;д1,...,дь) зависит от нескольких неизвестных параметров ды ...,дь, при использовании метода максимального правдоподобия нужно искать максимум функции правдоподобия или ее логарифма по й аргументам д!,..., дя, Уравнение правдоподобия превращается в систему уравнений — 1пг(Х!,...,Х„;ды..., дг) =-О, д дд~ 1п ЦХ!,..., Ха; д!,..., дя) = О. д 198 Гл.
2. Оценки неизвестных парамегпров П р и м е р 25. Выборка Хн..., Х, произведена из нормальной генеральной совокупности с неизвестными параметрами д~ (среднее) и да (дисперсия). Найдем их оценки д*, и д.; методом максимального правдоподобия Логарифм функции правдоподобия задается формулой 1пЦХь, Хрл дпдз) = — — 1гг(2пд~) — — ((Х вЂ” д~)з+ .. + (Մ— д~)з1. 2 2де 1 Система уравнений правдоподобия имеет вид (1тг7,(Хп,Х„; дп д.))' = (Х1 + .. + Х вЂ” пд|) = О, дг (1пй(Хь...,Х„,дпдз))', = — — ' Э вЂ”, '((Х~ — д~)з р ...
-1-(Х вЂ” д~)з] = О 2дз 2д, или Х1+... ЭՄ— пд~ = О, (Х~ — д~) Э ...-1-(Х~ — д~) — пда = О. Таким образом, д,* = — (Х1э...эХ„) =т*, 1 и 1 з 21 дз = — ~(Х1 — т ) +..~-(Մ— т') ~ =о*. и Читателю предлагается самостоятельно показать, что д*, и д; доставляют максимум фуикпии правдоподобия Б(Хп...,Х,;дпдз). Опенки д; и д; параметгюв д~ и дз совпадают с выборочным средним т* н выборочной дисперсией о ". Отметим, что оценка д*, неизвестного матема- тического ожидания д~ является эффективной (см. пример 1!), чего нельзя сказать об оценке д~ неизвестной дисперсии дз, которая, как мы знаем, является даже смещенной. Оказывается, однако, что если мы в качестве оценки параметра дз рас- смотрим выборочную дисперсию в-*, то эта оценка будет уже не только несме- щенной, но и иметь минимальную дисперсию среди всех несме1ценных оценок параметра дэ Последний факт вытекает из неравенства Бхаттачария (7), обобщающего неравенство Рао-Крамера, а также может быть установлен нз свойств многомерных достаточных оценок (11) П 5.
Метод минимального расстояния Суть этого метода заключается в следующем. Предположим, что любым двум функциям распределения Г1(х) и Гз(х) поставлено в соответствие число р = р (Г! (х), Гз(х)) ) О, называемое расстоянием, причем р(Г(х),Г(х)) .= О. Пусть теперь, как обычно, задана выборка Х1,...,Х„ из генеральной совокупности с теоретической функцией распределения Г(х), принадлежащей параметрическому семейству Г(х;д). Вычислим расстояние между эмпирической функцией распределения Г*(:с) и функциями распределения Г(х; д) из данного семейства.
Оценкой, полученной методом минимального расстояния, называется такое значение д; для которого р (Г (т), Г(х; д*)) = пцп р(Г'(т), Г(х; д)), 199 6. Метод номограмм т.е. такое значение д*, которое определяет ближайшую к Г*(х) в смысле расстояния р функцию распределения из семейства Р(тад). Приведем примеры некоторых наиболее часто встречающихся в математической статистике расстояний. Равномерное расстояние (расстояние Колмогорова) определяется формулой ри (Е1 (х), Гг(х) ) = вп1> ~Г1 (х) — Гз(х) ~. х Расстояние и>а имеет вид р,„; (е1(х),Ра(х)) ~ 71(х) Ых)1 г(рз(х).
Расстояние Хз употребляется для функций распределения Г1 (х) и Рз(х) дискретных случайных величин ~1 и бш принимающих одинаковые значения Ьы..., 6ш и задается выражением (Р1(т) Рз(. И (Р1 (6~) — !> (6~))~ 1=1 где вероятности Р~(6|) = РД~ = 6|) и Рз(6|) = РДа = 6|) определяются рядами распределения случайных величин ~~ и ~а. Использование приведенных выше расстояний для получения оценок весьма сложно в вычислительном плане, и поэтому они употребляются крайне редко.
Здесь мы упомянули об этих расстояниях только потому, что применение оценок, полученных с их помощью, позволяет упростить вычисление уровней значимости критериев при проверке сложных непараметрических статистических гипотез, поскольку такие оценки естественным образом связаны с соответствующими критериями (см. параграф 5 гл. 3). 6. Метод номограмм Еще одним методом, позволяющим, пользуясь только номограммами (специальным образом разлинованными листами бумаги, которые в математической статистике носят название вероятностной бумаги), весьма просто и быстро оценить неизвестные параметры, является метод номограмм.
Его сущность состоит в следующем. Пусть мы имеем выборку Хы...,Х„из генеральной совокупности с неизвестной теоретической функцией распределения, принадлежащей двухпараметрическому семейству Г(х;дн дз). Предположим теперь, что каким-то чрезвычайно простым способом удалось построить функцию распределения Г(х; д*,,д*) из семейства Р(х; дпдз), достаточно хорошо приближающую эмпирическую функцию распределения Г'(х). Тогда д~ н д; будут являться оценками неизвестных параметров д| и дш при- Гж 2. Оценки неизвееганмх парамегпров чем в силу теоремы Гливенко — Кантеллн состоятельными при весьма слабых условиях, накладываемых на семейство Г(х; дпдз). Казалось бы, мы пришли к не менее сложной задаче: найти «чрезвычайно простой» способ приближения эмпирической функции распределения функцией распределения из семейства Е(х; ды дз).
Оказывается, однако, что графики функций распределения тех семейств с'(х; дн дз), в которых д| и дз, по сути дела, связаны с параметрами «сдвига» н «масштаба» (к таким семействам относятся, например, нормальное, логнормальное н т.д.), можно с помощью некоторых нелинейных преобразований координат превратить в семейство прямых линий. Тогда, построив в этих новых координатах график эмпирической функции распределения с'(х), нетрудно визуально провести прямую, которая достаточно хорошо приближает Г*(х), а затем уже по коэффициентам проведенной прямой найти оценки д*, и д; неизвестных параметров д1 н дш Практическая реализация метода номограмм происходит следующим образом.
Сначала выборку Хы...,Ха преобразуют в вариационный ряд Х;, .,Х„* и на номограмме для соответствующего семейства Г(ах дпдз) откладывают точки Л, (1 =- 1,...,п) с координатами (Х,*,(21 — 1)/(2п)), абсциссы которых Х,* представляют собой точки скачков эмпирической функции распределения Е (х), а ординаты (2«', — 1)г'(2г») — середины этих скачков. Затем «на глаз» проводят прямую линию, проходящую как можно ближе ко всем точкам А,.
Наконец, с помощью пояснений к номограмме по коэффициентам прямой находят оценки д", и д,* неизвестных параметров д1 и дз. Пример 26. Предполагая в примере 1 из гл 1, что проекция вектора скорости молекул водорода распределена по нормальному закону, оценим с помощью метода номограмм неизвестное математическое ожидание д| и дисперсию д«. Воспользовавшись вариационным рядом выборки, найдем координаты точек Л, (табл.3). Отложим точки Л, на номограмме для нормального распределения (на нормальной о ггз) ' вероятностной бумаге) и прове- О,О ) дем «на глаз» прямую Л, зада- О.'Зз 1 ваемую уравнением П =- их+ а ОО 1 (рнс.















