1193507387 (547421), страница 26
Текст из файла (страница 26)
Для непрерывно распределенного признака формулы для выборочных средних будут такими же, но за значения хыхз, ..,,хь надо брать не концы промежутков [хс,х1),(тых2),..., а их середины то +т1 х1+тз 2 ' 2 В качестве описательных характеристик вариационного ряда тд, хр),...,хйй (или полученного из него статистического распределения выборки (6.3)) используется медиана, мода, размах вариации (выборки) и т.д. Размахом вариации называется число гк = хбй — х~ц, где х~ц —— п11п х/„хйй = 1пах хь или .Й = хп1ах хгпы, Где хл1кх наибольший, 1(й(в 1(й(п х,в,„наименьший вариант ряда. Модой М,*, вариационного ряда называется вариант, имеющий наибольшую частоту.
Медианой М,* вариационного ряда называется значение признака (с. в. Х), приходящееся на середину ряда. Если и = 2й (т е. ряд х~0, т(з),..., х(ь), т(в+И,..., т(зь> имеет четное х(ь) + хо,+1) ~~~~~ членов), то М,* = ; если и = 2й + 1, то М,* = т1ь+, Пример 6.7. По условию примера 6.2 из п.
6.3 найти характеристики Д выборки — результаты тестирования 10 абитуриентов. Используя формулы (6.4) — (6.12) и определения из п. 6.5, находим: т,= —.(О 1+1 2+...+5 3)=3, Р, = — ((Π— З)~ 1 + (1 — 3)з . 2 + ... + (5 — 3)~ . 3) = 3,2, а, = х/3,2 - 1,79, Яз О 32 356 9 Я = ~/3,56 = 1,87, В=5 — 0=5, М,* = 5, М* 3+4 е 190 ' Раздел второй. Основы математической статистики Упражнения 1. Найти и построить эмпирическую функцию распределения для вы- борки, представленной статистическим рядом.
2. На телефонной станции производились наблюдения за числом неправильных соединений в минуту. Результаты наблюдений в течение часа представлены в виде статистического распределения. Найти выборочные среднее и дисперсию. Сравнить распределение частостей с распределением Пуассона р„,„= т! 3. Изучается с. в. Х вЂ” число выпавших очков при бросании игральной кости. Кость подбросили 60 раз.
Получены следующие результаты; 3, 2, 5, 6, 6, 1, 4, 6, 4, 6, 3, 6, 4, 2, 1, 5, 3, 1, 6, 4, 1. Что в данном опыте-наблюдении представляет генеральную совокупность? 2. Перечислите элементы этой совокупности. 3. Что представляет собой выборка? 4. Приведите 1 — 2 реализации выборки. 5. Оформите ее в виде: а) вариационного ряда; б) статистического ряда. 6. Найдите эмпирическую функцию распределения выборки. 7.
Постройте интервальный статистический ряд. 8. Постройте полигон частот и гистограмму частостей. 9. Найдите: а) выборочную среднюю; б) выборочную дисперсию; в) исправленную выборочную дисперсию и исправленное среднее квадратическое откло- че; г) размах вариации, моду и медиану. Элементы теории оценок и проверки гипотез 7.1. Оценка неизвестных параметров Понятие оценки параметров Пусть изучается случайная величина Х с законом распределения, зависящим от одного или нескольких параметров. Например, это параметр а в распределении Пуассона Р(Х = т) = ~ или парат! метры а и а для нормального закона распределения. Требуется по выборке Х1,Хг,...,Х„, полученной в результате п наблюдений (опытов), оценить неизвестный параметр О. Напомним, что Хы Хг,..., Х„случайные величины: Х1 — результат первого наблюдения, Хг — второго и т.д., причем с.в.
Х„ г = 1,2,..., п, имеют такое же распределение, что и с. в. Х; конкретная выборка я1, яг,..., я„— это значения (реализация) независимых с. в. Х1,Хг,...,Ха. Сгаагаисгаической оценкой 0„(далее просто — оценкой 0) параметра О теоретического распределения называют его приближенное значение, зависящее от данных выбора. Очевидно, что оценка О есть значение некоторой функции результатов наблюдений над случайной величиной, т. е.
(7.1) О = 0(ХмХг,...,Х„). Функцию результатов наблюдений (т.е. функцию выборки) называют егаатистикой. Можно сказать, что оценка О параметра О есть статистика, которая в определенном смысле близка к истинному значению О. Так, Р'(я) есть оценка Рх(я), гистограмма — плотности 1 (я).
192 ' Раздел второй. Основы математической статистики Оценка О является случайной величиной, так как является функцией независимых с. в. Хы Хз,..., Х„; если произвести другую выборку, то функция примет, вообще говоря, другое значение. Если число опытов (наблюдений) невелико, то замена неизвестного параметра О его оценкой О, например математического ожидания средним арифметическим, приводит к ошибке.
Это ошибка в среднем тем больше, чем меньше число опытов. К оценке любого параметра предъявляется ряд требований, которым она должна удовлетворять, чтобы быть «близкой» к истинному значению параметра, т. е. быть в каком-то смысле «доброкачественной» оценкой. Свойства статистических оценок Качество оценки определяют, проверяя, обладает ли она свойствами несмещенности, состоятельности, эффективности, Оценка О параметра О называется несмещенной, если МО = О. Если МО ф О, то оценка О называется смещенной. Чтобы оценка О не давала систематической ошибки (ошибки одного знака) в сторону завышения (МО > О) или занижения (МО < О), надо потребовать, чтобы «математическое ожидание оценки было равно оцениваемому параметру».
Если МОл — + О, то оценка О„называется ас мпглотически несмещенной. Требование несмещенности особенно важно при малом числе наблюдений (опытов) . Оценка О„параметра О называется состоятиельной, если она сходится по вероятности к оцениваемому параметру: т. е. для любого е > О выполнено 1пп р ()д„— О! < е~ = 1.
Это означает, что с увеличением объема выборки мы все ближе приближаемся к истинному значению параметра О, т.е, практически достоверно О„= О. Свойство состоятельности обязательно для любого правила оценивания (несостоятельные оценки не используются). Глава 7. Элементы теории оценок и проверки гипотез ° 193 Состоятельность оценки В„часто может быть установлена с помощью следующей теоремы. Теорема 7.1. Если оценка В„параметра 0 является несмещенной и РВ„-+ О при п — + оо, то В„состоятельная оценка.
Д Запишем неравенство Чебышева для с. в. В„для любого е > О: РВ„ Р(~„— 0) < е) )~ 2 ез Так как по условию 1пп РВ„= О, то 1пп Р~~„— 0( < е) > 1. Но вероятность любого события не превышает 1 и, следовательно, РЦ„— 0~ < е) = 1, т. е.
0„— состоятельная оценка параметра О. Несмещенная оценка В„параметра В называется эффективной, если она имеет наименьшую дисперсию среди всех возможных несмещенных оценок параметра О, т.е. оценка В„эффективна, если ее дисперсия минимальна. Эффективную оценку в ряде случаев можно найти, используя неравеиетпво Рао — Крамера: РВ„> и 1' где 1 = 1(В) — информация Фишера, определяемая в дискретном случае формулой 1 = М [ — 1пр(Х,В)] = ~~~ [ ~ " ] .р(х„В), р(х,, О) где р(х> В) = р(Х = х), а в непрерывном — формулой где 1 (х, О) — плотность распределения н. с. в, Х. Эффективность оценки определяется отношением РВз еЯ 0„= — ", РВ„ 194 ' Раздел второй.
Основы математической статистики где д'„' — эффективная оценка. Чем ближе ей'д„к 1, тем эффективнее оценка О„. Если ей'д„— > 1 при п — > оо, то оценка называется асимптотически эффективной. Отметим, что на практике не всегда удается удовлетворить всем перечисленным выше требованиям (несмещенность, состоятельность, эффективность), и поэтому приходится довольствоваться оценками, не обладающими сразу всеми тремя свойствами. Все же три свойства, как правило, выделяют оценку однозначно. Точечные оценки математического ожидания и дисперсии Пусть изучается с.
в. Х с математическим ожиданием а = МХ и дисперсией РХ; оба параметра неизвестны. Статистика, используемая в качестве приближенного значения неизвестного параметра генеральной совокупности, называется ее точечной оценкой. То есть точечная оценка характеристики генеральной совокупности — это число, определяемое по выборке. Пусть х1,хз,...,х„ — выборка, полученная в результате проведения и независимых наблюдений за с. в. Х. Чтобы подчеркнуть случайный характер величин хмхз,...,х„, перепишем их в виде Х1,Хг,...
...,Х„, т.е. под Х, будем понимать значение с.в. Х в г-м опыте. Случайные величины Х1,Хг,...,Х„можно рассматривать как и независимых «экземпляров» величины Х. Поэтому МХ1 = МХз = ... ... = МХ„= МХ = а, РХ1 = РХ1 = ° = РХ1 = РХ. Д Найдем м. о. оценки Х»: мх.= м(-„'т'х) =-„'мд х) =-„'т мх; =-„' 1=1 1=1 Отсюда по определению получаем, что Х, — несмещенная оценка МХ. Далее, согласно теореме Чебышева (п. 5.2), для любого с ) О имеет 196 ' Раздал второй. Основы математической статистики п „1(МХ2 — (МХ)г) п — 1 Из равенства (7.2) следует, что МР„ф РХ, т.е. выборочная дисперсия является смещенной сценкой дисперсии РХ.
Поэтому выборочную дисперсию исправляют, умножив ее на, получая формулу и и — 1' Яг = ~~ Р, (см. (5.11)). Д Примем без доказательства состоятельность оценки ог. Докажем ее несмещенность. Имеем т. е, МЯ2 = РХ. Отсюда по определению получаем, что Яг — несмещенная оценка РХ. Отметим, что при больших значениях п разница между Р, и о 2 очень мала и они практически равны, поэтому оценку 5 используют для оценки дисперсии при малых выборках, обычно при п < 30. Имеют место следующие теоремы.
Теорема 7.4. Относительная частота — появления события А в п не- иА зависимых испытаниях является несмещенной состоятельной и эффективной оценкой неизвестной вероятности р = Р(А) этого события (р— вероятность наступления события А в каждом испытании). пА Отметим, что состоятельность оценки д = д непосредственно вы- текает из теоремы Бернулли (см. и. 5.3). Глава 7. Элементы теории оценок и проверки гипотез ° 197 Пример 7.1.
Монету подбрасывают и раз. Вероятность выпадения герба при каждом подбрасывания равна р. В ходе опыта монета выпала пА гербом пд раз. Показать несмещенность оценки В = — вероятности и В = р выпадения герба в каждом опыте. („) Число успехов (пл) имеет распределение Бернулли. Тогда М(пл) = = пр, Р(пл) = прц = пр(1 — р). Следовательно, МВ = М ( — ) 1 1 = и М(пА) = —, и р = р = В, т.е, оценка 0= и — несмещенная. ° пА 7.2.