Афанасьев В.И., Зимина О.В. и др. Решебник. Высшая математика. Специальные разделы. Под ред. А.И. Кириллова (2-е изд., 2003) (1095465), страница 48
Текст из файла (страница 48)
Гл. 7. Математическая статистика 362 ПЛАН РЕШЕНИЯ. 1. Находим вероятности р(к: ам.,.,а ) значений ~, если ~ дискретная случайная величина, или плотность вероятностей р(х; ам ...,а ) значений С, если С вЂ” непрерывная случайная величина. Часто р(й:, ам..., аз) или р(х; ам..., аа) бывают заданы изначально. 2. Определяем функцию правдоподобия Ь(ам...,а ) =Р(хПам...,а ),...Р(х„,:ам.,.,а ), (1) где хм.,,,х„-- выборка значений исследуемой случайной величины С. 3.
Находим неизвестные параметры ам, .., а из условия Ь(ам..., а ) — э шах, т.е. как координаты точки, в которой функция правдоподобия Цап..., а.) принимает наибольшее значение. Замечания. 1. Если с дискретная случайная величина, то функция правдоподобия (1) есть вероятность того, что выборка с объема п есть хн,,.,х„, Поэтому 0 < Ь(ам..., а.) < 1. 2. Иногда удобней вместо Цап...,а ) использовать функцию 1пЬ(ам...,а ). Она принимает наибольшее значение при тех же ам...,а, что и 5(ам..., а ). 3. Если функция правдоподобия 1(ае....., а,) дифференцируема по ам..., а, то точку, в которой она принимает наибольшее значение, можно найти так, как это объяснено в задачах 5.2 и 6.7 книги РЕШЕБНИК „Высшая математика", или численными методами, например,методом градиентного спуска.
4. Если функция правдоподобия Цап ...,а~)недиффсренцируема по некоторым аь, например, если эти параметры аь могут принимать только дискретные значения, то значения параметров ае,..., а, при которых функция Ь(ам..., а.) принимает наибольшее значение, находятся перебором. ПРимеР 1.
Случайная величина С распределена по нормальному закону с неизвестными параметрами а и аз. Определить эти параметры по выборке хм,,,, х„значений с методом наибольшего правдоподобия. 7.12. Метод наибольшего правдоподобия 363 Решениь. 1. Плотность распределения вероятностей случайной величины ~ имеет вид р(х; а.,о ) = е тт2яог 2. Определяем функцию правдоподобия 7 ( г) — бн — ардгов1 — 1л — в1вдгов1 ст 2птпг где хы,,.,х„— выборка значений исследуемой случайной величины С. 3. Находим неизвестные параметры а и а~ из условия 1(а,о ) — т шах, т.е.
как координаты точки, в которой функция правдоподобия принимает наибольшее значение. Для этого удобней использовать функцию 1пХ(а,ст ) = — — 1п т — [(хт — а) +... + (х„— а) ] — — 1п2я. г и г 1 г г и 2 2стг 2 Она принимает наибольшее значение при тех же а, о~, что и Г(а, ог). Поскольку а б ( — со, со) и ог б (О, оо), область изменения параметров а и стг не имеет границы. Следовательно, функция 1пА(а, а~) принимает наибольшее значение в одной из ее точек максимума. Ищем точки максимума.
Необходимое условие экстремума имеет вид д г — 1пЦа,о. ) = — — (хт +... + х„— па) = О, до, ' стг 1тс т(а,о ) = — + [(хт — а) +... + (хп — а) ] = О. дог ' 2ог 2(стг)г Отсюда следует, что х~ +... + хп (тт — а)г +... + (х„— а)г а= и сс и и Итак, функция правдоподобия Ь(а, о г) имеет единственную точку экстремума. В ней 1 (а, о ) принимает наиболыпее значение. х~ +... +х„г (хт — а) +... +(х„— а) Ответ. а = о 'и и 364 Гл. 7.
Математическая статистика Замечание. Известно, что оценка 02 = (х — х), которую мы получили для дисперсии методом наибольшего правдоподобия, является смещенной. Этот пример показывает, что метод наибольшего правдоподобия дает, вообще говоря, смещенные оценки, которые еще нужно исправлять. Пгимкг 2. Как узнать сколько рыб в пруду? Поймаем и, = 20 рыб, пометим их и выпустим в пруд. Спустя некоторое время, достаточное для того, чтобы меченые рыбы расплылись по всему пруду, выловим т = 50 рыб. Допустим, что среди них оказалось а2 = 7 меченых.
Определить число рыб в пруду Х методом наибольшего правдоподобия. Ргшгииг, 1. Случайная величина С количество меченых рыб среди т выловленных определяется вероятностями С„" С™ „Сзьес Р(с ") Р(к! Х) 00 (к 0111' ' ' 50)' 2. Определяем функцию правдоподобия Сг С~з 20 Ю-20 С50 В данном случае выборка состоит из одного числа?е, = 7. 3. Находим неизвестный параметр Х (число рыб в пруду) из условия 1(Х) — 2 шах, т.е.
как такое значение Х, при котором функция правдоподобия Д(Х) имеет наибольшее значение. Функция Л(Х) недифференцируема, так как ее аргумент Х принимает только дискретные значения 63,64,... Позтому значение Х, при котором Ь(Х) достигает наибольшей величины, ищем перебором. Имеем (Х вЂ” 20)! 50! (Х вЂ” 50)! (Х вЂ” 50)..... (Х вЂ” 62) 43! (Х вЂ” 63)! Х! Х(Х вЂ” 1) .... (Х вЂ” 10) 50! где А = — С вЂ” несущественный множитель. Простая программа 4~! 20 дает таблицу значений ЦХ) при Х = 63 —: 1000. В таблице находим, что Л(Х) достигает наибольшего значения при Х = 142.
Ответ. Х = 142. 7.12. Метод наибольшего правдоподобия 365 Условия задач. ХХспольздя метод наибольшего правдоподобия, найти параметры распределения па выборке. 1. Биномиальное распределение р(й;п,р) = Сьр"йп ь, и = 10, выборка: 6,5,9,5,8,7,9,6,6,7. р(й; а) = е 'а~ььй!, выборка; 2. Распределение Пуассона 5, 3, 3, 3, 5, 5, 1, 2, 3, О. р(й; 9) = (1 — д)д~, выборка: 3. Геометрическое распределение 1, 2, О, 4, 1, 4, 4, 1, 2, 2.
Сь С™-" п пь 4. Гипергеометрическое распределение р(й; пл, пв, т) = — " С.„„м ' т=10, выборка: 6,3,7,6,4,4,5,5,6,8. 5. Распределение кратности звезд р(й:, д) = (1-9)'йдь ', выборка: 1, 2, 1, 3, 2, 1, 1, 2, 1, 2. 1 6. Равномерное распределение р(хда,Ь) = — — при а < х < Ь, Ь вЂ” а р(х; а, Ь) = 0 при х < а или х ) Ь, выборка: 0.35, 1.83, 0.14, 0.64, 2.08, — 0.46, 2.0, — 0.31, — 0.30, 1.87. 7. Показательное распределение р(х; Л) = Ле ~ при х > О, р(х; Л) = 0 при х < О, выборка: 0.61, 0.71, 1.27, 0.10, 1.49, 1.14, 2.15, 0.06, 0.74, 0.28. х е Ь вЂ” 1 — л 8.
Гамма-распределение р(х; 1) = Г(1) при х > О, р(х;1) = 0 при х < О, выборка: 1.12, 4.34, 1.54, З.П, 0.64, 0.62, 2.01, 2.13, 0.87, 0.79. 9. Распределение Лапласа р(х; Л) = а Ле т~'~, выборка: 0.17, -0.22, -0.017, -0.16, 1.20, 0.057, -0.19, 0.19, 0.25, †.0.32. о 7ан 10. Распределение Парето р(х; а, о) = — ( — ) при х ) а, а х р(х; а, о) = 0 при х < а, выборка: 1.63ь 1.35, 1.80, 1.51, 1.56, 2.10, 1.36, 1.48, 1.24, 1.39. Ответы. 1, р = 0.68.
2. а = 3.235. 3. ь1 = 0.677. 4. п, = 17, пь = 25. 5. 9 = 0.23. 6, а = — 0.46, Ь = 2.08. 7. Л = 1.17. 8, 1 = 1.8. 9. Л = 3.60. 10. а = 1.24, о = 2.88. Гл. 7. Математическая статистика 366 7.13. Метод наименьших квадратов ПОЕтАНОНКА ЗАЛАЧИ. Для определения параметров аз,.,., аз в формуле у = 7"(х: а,,...,ай) бь ли измерены значения у при различных значениях х. Получена выборка (х~.,у~),...,(х„,у„). Используя эьпи данные, определить паральетры в,....., а.
методом наименьших квадратов. Ошибками измерения хы..., х„и погрешностями вьсчислений можно пренебречь. ПлАн РешениЯ. Величины ~ь = уь — )'(хь; аы...,а ) отличны от нуля из-за ошибок измерения ую поскольку ошибками измерения хь и вычисления 7(хь, аы.,,, а ) можно пренебречь. Принято предполагать, что ошибки измерения распределены по нормальному закону с математическим ожиданием О (нет систематических ошибок) и некоторой дисперсией оз, определяемой точностью прибора.
Следовательно, функция правдоподобия имеет вид 1( ) — с~дзс~) — Е~дгсь1 ч72 оРг ач72 ' ' 1 ехР— г л~ (Уь — з (хь~ 01 ... вй)) я=1 Эта функция достигает наибольшего значения при тех аы..., а, при которых д(аы..., ад) = — 1и Цам..., ай) = ~~~ (уь —,((хкб ам..., ай)) (1) я=1 достигает наименьшего значения. 1. находим частные производные дд — (й = 1,...,у). дав 2. Определяем параметры аы ..,, в. как решение системы уравнедд О, дд О, „дд О, (2) даь ' доз ' '''' да.
Замечания. 1. После того, как параметры аы .,,, а определены, следует проверить, что величины Сь = уя — 7" (хь, вм ..,, а,) образуют выборку значений нормальной случайной величины с нулевым математическим 7.13. Метод наименьших квадратов 367 ожиданием и некоторой дисперсией о~. Такая проверка выполняется с помощью одного из критериев согласия (см. задачи 7.18 и 7.19).
2. Система уравнений (2) имеет простое решение, только если ~(х;аы,.,,а ) — многочлен. В остальных случаях для решения системы (2) могут потребоваться численные методы. Тогда лучше искать точку минимума функции (1) непосредственно, используя один из методов спуска. В пакете РЕШЕБНИК.ВМ метод наименьших квадратов можно реализовать и через решение системы (2) и непосредственно, отыскав точку минимума функции (1) одним из методов спуска. 3. Иногда ошибки измерения величин ум..., д„имеют нормальные распределения с разными дисперсиями а.~~„(й = 1,..., и).
Тогда параметры ам, ..,а определяются из условия Я(ам...,а ) — ~ ппп, г е д о 1 г Я(ам...,а ) = ~ (уь — ~(хь,ам...,а )) . ь=г оа 4. Если ошибками измерения величин хы..., хн нельзя пренебречь, причем известно, что зти ошибки имеют дисперсии о г, (а = 1,..., и), то параметры а,,..., а. определяются из условий уь — хзуь = Дхь — гахь; а„...., а.), Й = 1,..., и.
ПРимеР 1. Для определения параметров ам аг и аз в формуле у = азх + агх + аз были измерены значения у при различных значег виях х. Получена выборка хь -1 -0.75 —.0.5 -0.25 0 0.25 0.5 0.75 1 уь 6.01 5.07 4.30 3.56 3.07 2.87 2.18 2.00 2.14 Используя эти данные, определить параметры аы аг и аз методом наименьших квадратов. Ошибками измерения хм..., хг и погрешностями вычислений можно пренебречь. Ркшкник. Функция (1) имеет вид 9 Я(аы аг, аз) = ~ ~(уь — агх~ — агхь — аз) .
Гл. 7. Математическая статпистика 368 1. Находим частные производные дЯ = — 2 ~ (уй — агхгй— да1 дд = — 2 7 (уй — агхй г— даг й-1 дд = — 2 ~~~ (уй — агхгй— даз агхй — аз)хй, ,2 агхй — аз)хй, агхй — аз) 2. ОпРеДелЯем паРаметРы а1, аг и аз дд дд да1 даг как решение системы урав- дЯ даз Имеем й=1 9 хй (3) По известным хй, уй вычисляем хй = О, й хгй — — 3.750, ~~~ хзй — — О, ~~~ х~й — — 2.7656, 9 9 9 уй = 31.2, ~~ уйхй = -7.4, ~ ~уйхг = 14.15.
й=1 й=1 й=1 Подставляя зти значения в систему (3),приводим ее к виду 2.7656а1 + 3.750аз = 14.15, 3.750аг = -7.4, 3.750а1 + 9аз = 31.2. Решая эту систему, получаем а1 = 0.95586., аг = -1.9733, аз = 3.0684. Ответ. у = 0.96хг — 1.97х + 3.07. а1 ~~~ й=1 а1 ~~~ й=1 а1 ~~ 9 хй + аг ~ хй + аз й=1 9 хй+аггг ей+аз 3 ч 2 й.=1 хй+аг~ хй+аз 2 й=1 уйхй, й=1 ~. Уйхй, 9 ~у 7.И.
Метод наименьших квадратов 369 хй -1 -075 --05 -025 0 025 05 075 1 уй 7.14 4.46 2.81 1.68 0.99 0.50 0.36 0.33 ОАО Используя зти данные, определить паравлетры а1 и аз методом наименьших квадратов. С!Шибками измерения х1,...,хв и погрешностями вычислений можно пренебречь. РЕШЕНИЕ. ПОСКОЛЬКУ фуНКцня у = а1Е'*н НЕ яВЛяЕтСя МНОГОЧЛЕ- ном, точку, в которой функция (1) приниыает наименьшее значение, можно найти только численным методом. Но в данном случае 1п У = азх + 1п а1 = азх+ Ь.