Л.Н. Фадеева, А.В. Лебедев - Теория вероятностей и математическая статистика (1115296), страница 38
Текст из файла (страница 38)
Далее приведена таблица наблюдаемых отклонений от номинала, подвергнутых группировке, для л = 200 изделий. В первой строке указаны середины интервалов отклонений хи мм; во второй строке приведена частота и,. — число наблюдений, попадающих в данный интервал. х, 0,3 2,3 2,2 1,7 1,9 1,5 1,3 0,9 1,1 0,7 0,5 26 25 30 26 24 20 21 и, Найти методом моментов точечные оценки неизвестных параметров а и а нормального распределения.
Оценить долю изделий с отклонением менее 1,5 мм в генеральной совокупности, используя нормальное приближение. Решение. Для нахождения двух неизвестных параметров необходимо два уравнения. Первое получаем, приравняв начальный теоретический момент первого порядка к начальному эмпирическому моменту первого порядка, а второе — приравняв центральный теоретический момент второго порядка к центральному эмпирическому моменту второго порядка: а =х, (ст )'ма', або Глава вз ф Найдем величины х и о' по данным выборки: х = — ~ пх,. =(О Зхб+О 5х9+О 7х 26+0 9х 25+ 11х30+1Зх26+ и 200;, '' + 1,5 х 21+ 1,7 х 24+ 1,9 х 20+ 2,2 х 8+ 2,3 х 5) /200 = 1,266.
Для нахождения выборочной дисперсии перейдем к услов- ным вариантам и,. = 10х,.: и / 1 и а (и)= — л и,'ц -~ — ~~ цц =(бх9+9х25+2бх49+25х81+ = гоо,, ' ' ~гоо,, ' ' +30 х121+ 26х169+ 21х 225+ 24х 289+ 20х 361+ 8 х 484+ 5х 529)/200- -1„266' х100 = 24,72; 2 200" о (х) = а'(и)/100 = 0,2472; а = — о' = 0,2484 (при больших 199 и исправленная и неисправленная выборочные дисперсии мало различаются); з = 0,498. Таким образом, получаем: а ~ 1,27 (мм); о' 0,5 (мм). Оценим долю изделий с отклонением менее 1,5 мм как вероятность для нормальной 9: р=Р(~<1,5)=Ф ' ' = 0,68. 0,5 Заиечание.
Эту долю можно оценить также непосредственно по таблице: поскольку значение 1,5 мм делит соответствующий интервал пополам, получается, что 122 из 200 изделий имеет отклонение меньше заданного, что дает близкую оценку 0,61. Задача 3. Предполагается, что выполнение некоторой работы занимает случайное время с распределением Симпсона на отрезке [а, Ь1. Хронометраж 20 испытаний дал среднее время работы 30 мин и исправленную выборочную дисперсию 24 мин'.
Определить параметры а и Ь методом моментов. Оценить, за какое время работа будет выполняться с вероятностью 98%. Решение. Для распределения Симпсона (плотносп которого имеет вид равнобедренного треугольника с основанием на заданном отрезке) имеем а+Ь (Ь-а)' Мг,= —; Р~= 2 ' 24 аба ЧАСТЬ ! Ь Математическая статистика Параметры распределения можно выразить через математи- ческое ожидание и дисперсию: а=М"с,—,~ЫК; ЬмМс,+,/БР~.
Подставляя вместо теоретических моментов выборочные, получаем оценки амх-я/ба'; Ь=х+т/ба', откуда а =18 (мин), Ь = 42 (мин). Функция распределения Симпсона имеет вид О, х<а; 2(х-а)'/(Ь-а)', аяхь(а+Ь)/2; 1-2(Ь-х)'/(Ь-а)', (а+Ь)/2ьхьЬ; 1, х>Ь. Г(х) = Решая уравнение )с(х) = 0,98, находим искомое время Т = Ь вЂ” 0,1(Ь-а). Подставляя полученные оценки в формулу вместо теоретических параметров, получаем Т = 42 — 0,1(42 — 18) = = 39,6 (мин).
5 зЗ.з. Метод максимального правдоподобия лба Одним из основных методов получения оценок параметров генеральной совокупности по данным выборки является метод максимального правдоподобия, предложенный Р. Фишером. Основу метода составляет функция правдоподобия, выражающая плотность вероятности (либо вероятность) совместного появления результатов выборки х,, х„..., х„. Результаты выборки рассматривают как одну из возможных реализаций л-мерной случайной величины (~„Г„..., Р„), компоненты которой независимы и имеют одну и ту же функцию распределения.
Совместное распределение этих величин задается в виде произведения частных распределений (поскольку предполагается, что наблюдения независимы) и, следовательно, функция правдоподобия имеет вид Е(х„х„..., хии О) = Ц,Р(х„О) Глава 1з в случае дискретного распределением, заданного вероятностя- ми Р(х, О), и л'.(х„х„..., х„, 0) = Пр(х„О) !! в случае непрерывного распределения с плотностью р(х,О). Из определения функции правдоподобия следует, что чем вероятнее (правдоподобнее) набор значений (х„х„..., х) случайной величины г, при фиксированном О, тем больше значение функции правдоподобия. Поэтому в качестве оценки неизвестного параметра 0 принимается такое значение О„, которое максимизирует функцию правдоподобия. Если параметр О е й, где й — замкнутая область допустимых значений параметра, то получаем задачу математического программирования: найти такое О„, чтобы Е(х„...,х„, 0„) = тахЦх„...,х„,О). ва Поиск оценки упрощается, если максимизировать не саму функцию правдоподобия, а ее логарифм, потому что максимумы А(Х О) и 1п2,(Х, О) достигаются при одном и том же значении параметра О.
Функцию 1„(х„..., х„, О) = 1пА(Х О) называют логарифмической функцией правдоподобия. Если максимум функции 1(х„..., х„, О) достигается внутри допустимой области й, то в точке максимума О„выполняются необходимые условия экстремума: = О для любого 1 = 1, 2, ..., 1Г.
Полученная система уравнений называется уравнениями правдоподобия. Решения этой системы могут соответствовать максимуму, минимуму функции С(хо ..., х„, О), а также являться точками перегиба. Необходимо проверить, что полученное решение есть точка максимума функции правдоподобия. Отсюда следующий алгоритм для отыскания оценки параметра О: решают уравнение или систему уравнений правдоподобия, получаемых приравниванием производной (частных д1пС производных) по параметру (параметрам) 0 к нулю: =О. дО Затем отбирают то решение, которое соответствует именно максимуму. функции 1пЬ, т.е. вторая производная в данной абз ЧАСТЫ Ь Матаиатическак статистика д' 1пС точке должна быть отрицательной: — <О.
Иногда функция дО' правдоподобия имеет несколько максимумов, и приходится искать наибольший из них. Бывают также случаи, когда этот алгоритм не действует, поскольку функция правдоподобия достигает максимума не во внутренней точке, а на границе некоторой области, либо когда она просто недифференцируема в точке максимума. Такие случаи называют нерегулярными. Достаточные условия регулярности (в одномерном случае) следующие. 1. Область 6„= (х: р(х,О) >0) возможных значений случайной величины не зависит от параметра О. 2.
Тождество ~р(х, 0)с(х - =1 можно дважды дифференцироГ" вать под знаком интеграла, а соотношение МО = 10„(х)р(х 0)с(х П можно один раз дифференцировать под знаком интеграла по параметру О. (а(п,((г, 0))' 3. Математическое ожидание 1(0) = 1т(~ ' ) конечно и положительно. Интегралы в условии 2 могут быть многомерными. Теорема 2. Если для выборки (х„хв ..., х,) обьема и выполнены условия регулярности 1 — 3, то: 1) решение О„уравнения правдоподобия единственно; 2) ΄— состоятельная оценка параметра 0; 3) распределение оценки О„асимптотически нормально и предельное распределение имеет математическое ожидание 0 и дис- 1 персию п2(0) ' 4) оценка максимального правдоподобия асимптотически эффективна.
Если для оценок максимального правдоподобия выполнены условия теоремы Рао — Фреше — Крамера (см. О 11.4), то справедлива следующая а64 ! Глава 1З ® ~ Теорема 3. Если эффективная (по Рао — Фреше — Крамеру) оценка существует, то она является оценкой максимального правдоподобия. Однако это не означает, что любая оценка максимального правдоподобия эффективна. Но если эта оценка оказывается неэффективна, это значит, что эффективных оценок вообще нет, хотя при этом могут существовать оценки с дисперсией, сколь угодно близкой к д„. Следует также отметить, что метод максимального правдоподобия иногда дает те же оценки, что и метод моментов, а иногда — другие.
Бывает, что ни один из этих методов не дает хороших оценок, и приходится использовать другие методы. А. Дискретные распределения Задача 4. Найти методом максимального правдоподобия оценку вероятности «успеха» 0 в схеме испытаний Бернулли. Решение. Рассмотрим случайную величину /1, в случае «успеха», '(О, в случае «неудвчи», тогда функция вероятностей случайной величины С запишется в виде Логарифмическая функция правдоподобия для одного испытания будет иметь внд 11пО, х= 1; 1,(0) = 1и Р(х, О) = ~ ~1п(1-0), х=О. Для и испытаний и т «успехов» в и испытаниях получаем 1„(О) = т 1пО + (и — т) 1п(1 — О). т п-т т Отсюда Г„(0) = — — = 0 и 0„= —.
Проверим знак О 1-9 и т п-т второй производной: 1"„(0) = —,—, <О. О' (1 - 0)' Таким образом, относительная частота появления события является оценкой вероятности «успеха» в одном испытании г65 (В1 ЧАСТЬ 11. Математическая патистика Бернулли, найденной методом максимального правдоподобия. Поскольку МО„=О, то оценка О„является несмещенной оценкой вероятности. Задачи 5. Случайная величина Ч (число поврежденных стеклянных изделий в одном контейнере) распределена по закону Пуассона с неизвестным параметром Л. В таблице приведено эмпирическое распределение числа поврежденных изделий в 500 контейнерах (в первой строке указано число х,. поврежденных изделий в одном контейнере, во второй строке указана частота л, — число контейнеров, содержащих х,. поврежденных изделий).
Найти методом максимального правдоподобия точечную оценку неизвестного параметра Л распределения Пуассона. Решение. Выпишем функцию правдоподобия Е = Р(х,; Л) Р(х;, Л) ... Р(х„; Л) = Ли""'"'"""е "'. 1 Найдем точку максимума логарифмической функции правдоподобия, лля чего приравняем к нулю ее первую производную по Л: ч д!п2, 1 " Ы, = (~х ) 1пЛ вЂ” лЛ вЂ” 1п(х! х! ...
х!), = — ~х. -и = О. 1 г х - сзЛ Л Имеем Л' = х. Убедимся, что полученное значение Л является точкой максимума. Для этого найдем вторую производную и д'1пс', 1 проверим ее знак в точке Л'1, = —,') х, Если в послед- дЛ2 Лт, 1 и нее уравнение подставить Л' = х, то вторая производная будет отрицательна, значит, х является точкой максимума. Найдем значение Л* для рассматриваемого примера: в Л' = — ч ~пх, =(169+2 87+3.31+4 9+5 3+б+7)/500=1. и,„, абб Глава )з ф Б. Непрерывные распределения Задача 6.
Найти методом максимального правдоподобия по выборке х„х„..., х„точечные оценки параметров а и а нормального распределения, плотность которого о-а) 1 Р(Х) = е 2в~ а /2и Решение. Выпишем функцию правдоподобия: Цх)х„...,х„а,а)= ехр~ —,2;(х,.-а) ~. (ал/2л)" ), 2а~)-) Логарифмическая функция правдоподобия имеет внд Ю 1пА=-п!пс)-и1п )2п — —,~(х,.-а)'. 2а'; ) Найдем точку максимума, решив систему из двух уравнений, получающихся приравниванием первых двух частных производных по неизвестным параметрам к нулю: 2 (х,.-а)=0, )=1 д)пС 1 = —, ) (х,.-а)=О, да с)',, д)пс п — = — + —,~(х) -а)' =0 да а а';.) Ф ~(х) -а)' а а' в а=- )'х„ п,=) Ю а =-~(х,.-х) . и) ) д'Ый и да' д)г, и 3 —,= —,—,~(; —.)', д 2 а2 ал,, г'ыь г " — = — — 2 (х)-а).