4 часть (1081361), страница 41
Текст из файла (страница 41)
= б, оз = 1, о2 = 2, рхг =. 0,8. Найти выборочные средние, дисперсии и коэффициент корреляции. Вычислить коэффициенты линейной регрессии Х на У и У на Х. 92. Статистическое опенивание характеристик распределении генеральной совокупности по выборке 1. Точечные оценки и их свойства. Метод подстановки.
Основная задача математической статистики состоит в нахождении распределения наблюдаемой случайной величины Х по данным выборки. Во многих случаях вид распределения Х можно считать известным, и задача сводится к получению приближенных значений неизвестных параметров этого распределения. Пусть Г,1х, 6) — функция распределения Р 4У, 'еи Я„ 7,50 110,0 41,27 55,01 7,50 7,50 7,50 110,0 110,0 110,0 41,27 41,23 41,23 55,00 54,97 54,99 З 2. Статистическое оценяванне аспределенил по выборке 219 случайной величины Х, содержащая один неизвестный параметр В, а хы хг,..., х„ — выборка наблюдений этой случайной величины. Точечной оценкой В неизвестного параметра В называется приближенное значение этого параметра, полученное по выборке.
Очевидно, что оценка В есть значение некоторой функции элементов выборки, т.е. В = В [хы хг,..., х„). Любую функцию элементов выборки называют статистикой. Чтобы выяснить, какие свойства должна иметь статистика В[хм хэ, ..., х„) для того, чтобьч ее значения могли бы считаться хорошей в некотором смысле оценкой параметра В, ее рассматривают как функцию случайного вектора (Хм Хг, ..., Х„), одной из реализаций которого является данн я выборка х1, хг, ..., х„. Так как закон распределенин каждой из случайных величин Х„1 = 1, 2, ..., и, есть Гл(х, В), являющаяся функцией параметра В, то н распределение статистики В[хм хг, ...,х„) также зависит от неизвестного параметра В. Качество оценок характеризуется следующими основными свойствами: 1.
Состоятельность. Оценка В = В„= В(хы ..., х„) называется состоятельной оценкой параметра В, если В„сходится по вероятности к В при и -+ со. Последнее означает, что Че ) 0 Р [[„— В/ < е[-+ 1 при и -+ оо. Состоятельность оценки В„во многих случаях может быть установлена с помощью следующей теоремы. Теорема 1. Если М [В„[ -+ В и 0 [В„] -+ 0 при и -+ оо, то „— состоятельная оценка параметра В. 2. Несмещенность.
Оценка В называется несмещенной оценкой параметра В, если ее математическое ожидание равно оцениваемому параметру, т.е. М[В[ = В. Разность М [В[ — В называется смещением. Для несмешенных оценок систематическая ошибка оценивания равна нулю. Простейший метод статистического оценивания — метод подстановки или аналогии — состоит в том, что в качестве оценки той или иной числовой характеристики [среднего, дисперсии и др.) генеральной совокупности берут соответствующую характеристику распределения выборки — выборочную характеристику. Пример 1. Пусть хы хг, ..., х„— выборка нз генеральной сово- Р пности с конечными математическим ожиданием т и лисперсией о~. спользуя метод подстановки, найти оценку т.
Проверить несмешенНость и состоятельность полученной оценки. 0 По методу подстановки в качестве оценки т математического ожидания надо взять математическое ожидание распределения выборки— Гл.19. Математическая статистика 220 выборочное среднее. Таким образом, получаем 1 т=х= — д~ х,. я 1=1 М[Х;] = — ит = т, 1 я а=1 П 1 э О [Х;] = — поо =— я' я ~=1 М[Х] = М О[Х] = 0 Отсюда по определению получаем, что Х вЂ” несмещенная оценка т, и так как 0 [Х] -+ 0 при я — ~ оо, то в силу теоремы 1 Х является состоятельной оценкой математического ожидания тл генеральной совокупности. > 19,96.
Пусть хы хэ, ..., х„— выборка наблюдений случайной величины Х. Используя метод подстановки, найти оценки следующих числовых характеристик случайной величины Х: дисперсии, медианы, асимметрии, эксцесса. 19.9Т*, Пусть хы хэ, ..., х„— выборка из генеральной совокупности с конечным начальным моментом ггть Используя метод подстановки, найти оценку начального момента ггь Показать, что полученная оценка является несмещенной и состоятельной.
19.98*. Предположим, что выборка хы хэ, ..., х„получена из генеральной совокупности с конечными математическим ожиданием т и дисперсией оэ. Показать, что выборочная дисперсия Р„' = — ~~> (х, — х) 1 является смещенной оценкой дисперсии генеральной совокупности, и найти ее смещение. 19.99 (продолжение). В условиях предыдущей задачи показать., что несмещенная оценка дисперсии генеральной совокупности задается статистикой з = ~~> (х, — х)~.
1 19.100**. Показать, что оценки Р„ *и з~, полученные в задачах 19.98 и 19.99 соответственно, являются состоятельными оценками дисперсии генеральной совокупности. Чтобы проверить несмещенность и состоятельность выборочного среднего как оценки т, рассмотрим эту статистику как функцию выборочного вектора (Хы ..., Х„). По определению выборочного вектора имеем: М[Х;] = т и Р[Х,] = пт, 1 = 1, 2,..., и, причем Х, — независимые в совокупности случайные величины.
Следовательно, э 2. Статистическое оцеиивание распределения но выборке 221 19.101. Пусть хм ..., х„— выборка из генеральной совокупности с известным средним т и неизвестной дисперсией о2. Показать, что несмещенной оценкой о2 будет статистика во = ~~~~~(х' гп) . 2 1 2 п 19.102. В качестве оценки математического ожидания гп генеральной совокупности по выборке хм ..., х„предлагается взять статистику т1 = хы Проверить несмещенность и состоятельность этой оценки. 19.103.
Рассмотрим лве выборки объемов п1 и п2 из одной генеральной совокупности со средним т и дисперсией о2. Пусть Хм Х2, 512 и 522 — — несмещенные оценки средних и дисперсий, определенные по этим выборкам. Показать, что объединенные оценки, вычисляемые по формулам — п1Х1 + п2Х2 Х= П1+ П2 о2 (п1 — 1) о1 + (п2 1) о2 п1+п2 — 2 будут несмещенными и состоятельными оценками т и о2. 19.104*. Случайная величина Х имеет распределение с плотностью ук(х), равной е' * при х > а и О при х ( о.
Для оценки неизвестного параметра а по выборке хм х2, ..., х„наблюдений случайной величины Х предлагается выбрать статистику б=хОО= ппп х;. 1(1<и Проверить несмещенность и состоятельность этой оценки. 19.105*. Пусть хм х2, ..., х„— выборка из генеральной совокупности, имеющей равномерное распределение г1 (О, 1).
Показать что статистика т = '(хОО + хрй), 2 тле х(П и тйй — соответственно наименьший и наибольший элементы выборки, являетсн несмещенной и состоятельной оценкой математического ожидания гп. 19,106Я. Пусть (хы у1), (х2, у2), ..., (х„, р„) — выборка из двумерной генеральной совокупности. Методом подстановки найти оценку ковариации. Показать, что полученная оценка является смещенной и состоятельной, Найти несмещенную оценку. Гл.19.
Математическая статистика 222 19.107а. Пусть Π— несмещенная оценка параметра О, О [0] < < ао. Показать, что 0 является смещенной оценкой 0~, и вычислить смешение. 19.108. Показать, что выборочное среднее, вычисленное по выбарке из генеральной совокупности, имеющей распределение Пуассана с параметром Л, будет несмещенной и состоятельной оценкой этого параметра. 19.109. В результате проведения и независимых экспериментов в одних и тех же условиях случайное событие А произошло х раз, х а) Показать, что относительная частота 6 = — появления со- и бытия А будет несмещенной и состоятельной оценкой вероятности события А: Р [А) = р в одном эксперименте.
б) Определить такое значение р, при катаром дисперсия сг~ будет максимальна. 19,110. Пусть 0 — состоятельная оценка параметра О, а ф [В)— непрерывная функция в области изменения О. Доказать, что 10[0) — состоятельная оценка ф [В). 19.111*.
Пусть х1, хо, ..., х„ — выборка из генеральной совокупности с конечным математическим ожиданием ги и дисперсией сг~. Показать, что является смещенной и состоятельной оценкой параметра о. 19.112*. Доказать теорему 1 о состоятельности оценки. Для оценки параметра 0 может быть предложено несколько несмещенных оценок. Мерой точности несмещенной оценки В считают ее дисперсию 11 [В]. Пусть Ве и Вз — две различные несмещенные оценки параметра О.
Если 11 [01] < 1э [Вз], то говорят, что оценка 01 более эффективна, чем оценка Оз. В предположении, что распределение случайной величины Х к статистика 0 удовлетворяют некоторым условиям регулярности (А*) 4), для дисперсии несмещенной оценки 0 параметра 0 выполняется яеровеяспаво Крамера-Рво: 1 0[0] ) ) См,, яапрямер: Чоссяаков В. И. Курс теории вероятностей,— Мо Наука, 1982. С.
180. а 2. Статистическое оценивание аспределеяия по выборке 223 1„(0) = нМ [ — !и ~я(Х, 0)) (г) Если же Х вЂ” дискретная случайная величина, то 1„(0) = пМ ~ — 1пр(Х, 0)] (3) где р (х, О) = Р [Х = х]. Условия регулярности (А*) выполняются для обычно используемых статистик нормального, биномнального и пуассоновского распределений. Несмещенная оценка Оо параметра О, дисперсия которой достигает 1 своего наименьшего возможного значения —, называется эффектив- 1„(0)' ной: 0[0,] = —.
1 1„(0) ' (4) Несмещенная оценка О = О„называется асимятотически эффективной оценкой параметра О, если 1 !пп = 1. 1„(0) 0 [О„] (5) Если условия регулярности (А*) не выполняются, то может существовать несмещенная оценка параметра О, дисперсия которой меньше, ,'чем нижняя граница в неравенстве (1). Такая оценка называется сверх- аффективной. Пример 2. Пусть хы хэ, ..., х„— выборка из нормально распределенной генеральной совокупности Л(т, а). Показать, что выборочное среднее х является эффективной оценкой параметра т. з В примере 1 было показано, что х — несмещенная оценка параметра гп, причем Р [Х] = —. Используя (2), найдем информацию Фишера и 1,(т). Имеем (, — т)'! ух(х, т) = — ехр]— ~/2~г и 1 2вэ !П~х(х, т) = — — !П(1Г27Г о).
(х — т) э где 1„(0) — информация Фишера, содержащаяся в выборке объема и относительно неизвестного параметра О. Для непрерывной случайной величины Х с плотностью распределения 1х(х, О) Гл. 19. Математическал статистика 224 Следовательно, д 1п 2 4 (х, т) х — т дт Х вЂ” т 2 Математическое ожидание случайной величины ) равно: п2 м~ ~ = — м](х-т)']= — '= —. (Х вЂ” т) 1 2 1 2 1 и4 ~ 4 пз пт ' Таким образом, ~(Х вЂ” т) ) и у„(т) = им ~ и4 ~ п2 ' г Так как условие (4) выполнено, т.е.
11 [Л] = — = —, то лля кори 4„(т) малько распределенной генеральной совокупности х является эффективной оценкой математического ожидания т. ~> 19.113. Пусть 0 = В(хм ..., х„) является оценкой неизвестного параметра В по выборке объема и. В качестве меры близости оценки 0 к истинному значению В выберем величину средней квадратической ошибки М ((Π— 0)2]. Показать, что М](0 — 0) ] = В]0]+ (М [0] — 0) .