Теория вероятности. Вентцель Е.С (4-е издание) (1082431), страница 54
Текст из файла (страница 54)
Любая из таких оценок случайна; при пользовании ею неизбежны ошибки. Желательно выбрать такую оценку, чтобы эти ошибки были пз возможности минимальными. рассмотрим следующую общую задачу. Имеется случайная величина Х, закон распределения которой содержит неизвестныц параметр а. Требуется найти подходящую оценку для параметра а по результат ч п независимых опытов, в кзждом из которых величина Х приняла определенное значение. Обознзчнм наблюденные значения случайной величины Хох,...,Х„. (1 4.1.1) Их можно рассматривать как п «экземпляроз» случайной величины Х.
то есть о независимых случайных величин, каждая из которых распределема по тому же закону, что и случайная величина Х. Обозначим а оценку для параметра а. Любая оценка, вычисляемая на основе материала (14.!.1), должна представлять собой функцию величин Х,, Хз, ..., Х„: а = а (Х,, Хм ..., Х ) (! 4.1.2) и, следовательно, сама является величиной случапной. Закон распределения а зависит, во-первых, от закона распределения величины Х (и, в частности, от самого неизвестного параметра а); во-вторых, от «,ш опыт.в л. В пр:щш,пг этот закон рзспредсльчшя может быть найден известными методами теории вероятностей.
Предъявим к оценке а ряд требовании, которым она должна удовлетворять, чтобы быть в каком-то смысле «доброкачественнопз оценкой. Естественно потребовать от оценки а, чтобы прн увеличении числа опытов л она приближзлась (сходилась по вероятности) к параметру а. Опенка, обладающая таким свойством, называется сосгломгиельной. Кроме того, желательно, чтобы, пользуясь величиной а вместо а, мы по крайней мере не делали систематической ошибки в сторону ОБРАБОТНА ОПЫТОВ [гл. ы завышения или занижения, т. е.
чтобы выполнялось условие М [а]=а. (14.! .3) Оценка, удовлетворяющая такому условию, называется несл1ещенмол. Наконец, желательно, чтобы выбранная несмещенная оценка обладала по сравнению с другими наименьшей дисперсией, т. е. 0 [а] = ш!п. (1 4.1.4) Оценка, обладающая таким свойством, называется эффективной. На практике не всегда удается удовлетворить всем этим требованиям.
Например, может оказаться, что, даже если эффективная оценка существует, формулы для ее вычисления оказываются слишком сложными, и приходится удовлетворяться другой оценкой, дисперсия которой несколько больше. Иногда применяются — в интересах простоты расчетов — незначительно смещенные оценки. Однако выбору оценки всегда дол1кно предшествовать ее критическое рассмотрение со всех перечисленных выше точек зрения. 14.2. Оценки для математического ожидания н дисперсии Пусть имеется случайная величина Х с математическим о1кидапием т и дисперсией О; обз параметра неизвестны. Над величиной Х произведено и независимых опытов, давших результаты Хп Хт,..., Х„.
Требуется найти состоятельные и несмещенные оценки для параметроз ш и О. В качестве оценки для мзтематического ожидания естественно предложить среднее арифметическое наблюденных значений (ранее мы его обозначали ш')! '~ Х1 (1 4.2.!) Нетрудно убедиться, что эта оценка является состоятельноп; гогтзгно ззконт больших чисел. прп узелнче 1:1В и Веаш1ннз 1н гхо. дится по вероятности к ш. Оценка и является также и несмещенноя, так как (14.2.2) М [т] = ==т. л дисперсия этои оценки равна: Е> [е] = — О. (1 4.2.3) ысй оценки для млтзмлтнчзского ожидания н днспвпснн 315 Эффективность или неэффективность оценки зависит от вида закона распределения величины Х.
Можно доказать, что если величина Х распределена по нормальному закону, дисперсия (14.2.3) будет минимально возможной, т. е. оценка т является эффективной. Для других законов распределения это может быть и не так. Перейдем к оценке для дисперсии Е>. На первый взгляд наиболее естественной оценкой представляется стзтистическая дисперсия; ~„(Хс — т)' 0*= ' (14.2.4) где с=! лс= л (1 4.2.5) л ч', х' с рг с=! л (14.2.6) Первый член в прзвой части есть среднее арифметическое л наблюденных значений случайной величины Хз; он сходится по вероятности к М[Хт[=ат[Х[.
Второй член сходится по вероятности к лсз; вся величина (!4.2.6) сходится по вероятности к величине а, [Х[ — тз = с). Это означает, что оценка (14.2.4) состоятельна. Проверим, является ли оценка О* также и несмецсенной. Полставим в формулу (!4.2.6) вместо лс его выражение (14.2.5) и произведем указзнные действия: 2', Хс )' 2; Хс в =--'=-' — — ~ '=' л и ~Х', ~Х' с=! с=! ХсХ с(с 2 л л2 л' л ~и~ ~Х;Х. л — 1 ч~ 2 лс(/ — — ~~ Хс — 2 л' й л' (14.2.7) Проверим, является ли эта оценка состоятельной. Выразим ее через второй начальный момент (по формуле (7.4.6) гл.
7): 316 ' 1гл. и ОБРАБОТКА ОПЫТОВ Найдем математическое ожидание величины (14.2.7)! М [О*[ = — — "„, 1 ~) М ~Х1а] — — „', ~ М [ХгХ,[. (14.2.8) а М [Х~а]=М[Х~а]=О; ~~", М [Ха]=лО, (14.2.9) а=! М[ХаХ)[=М[ХгХТ[=К!)=0 (14 210) Последнее равенство следует из того, что опыты независимы. Подставляя (14.2.9) и (14.2.10) в (14.2.8). получим: М [О*[ = — О. (14.2.11) Отсюда вилно, что величина О' не является несмещенной оценкой для О: ее математическое ожидание не равно О.
а несколько меньше. Пользуясь оценкой О* вместо дисперсии О, мы будем совершать некоторую систематическую ошибку в меньшую сторону. Чтобы ликвидировать это смещение, лостаточно ввести поправку, умножив величину О* на — . Получим: ~ (Х! — т)а Оэ л — 1 л ч~[ (х! т)а л а=! л — 1 Такую «исправленную» статистическую дисперсию мы и выберем в качестве оценки для О! л (Х! — т)' О а=! (14.2.12) Так как множитель — стремится к единице при л -ь ОО, л — 1 а оценка О' состоятельна. то оценка О также будет состоятельной ').
На практике часто вместо формулы (1 4.2.12) бывает удобнее применять другую, равносильную ей, в которой статистическая l ') Оценка В лля дисперсии не является аффективной. Однако в случае нормального распределения она является «асннптотическн аффективной», то есть прн увеличении л отношение ее дисперсии к минимально возможной неограниченно приближается к единице. а=! г(/ Так как дисперсия О* не аависнт от того, в какой точке выбрать начало коорлинат, выберем его в точке т.
Тогда ы.н довигнтильнып ннтиввлл. довввитильнля вввоятность 317 дисперсия выражена через второй начальный момент: (! 4.2. 13) При больших значениях и, естественно, обе оценки — смещенная 0' и несмещенная 0 — будут различаться очень мало и введение поправочного множителя теряет смысл. Таким обрззом, мы пришли к слелующим правилам обработки ограниченного по обьему статистического материала. Если даны значения хн х..., х„принятые в в независимых опытах случайной величиной Х с неизвестными математическим ожиданием ш н дисперсией О, то для определения этих параметров следует пользоваться приближенными значениями (оценками): (1 4.2.
14) л — 1 или 14.3. Доверятельный интервал. Довернтельннн вероятность В предыдущих и'и' мы рассмотрели вопрос об оценке неизвестного параметра а одним числом. Такая оценка называется «точечной». В ряде задач требуется не только найти лля параметра а подходящее численное значение, но и оценить его точность и надежность. Требуется знать — к каким ошибкам может привести замена параметра а его точечной оценкой а и с какой степенью уверенности можно ожилать, что эти ошибки не выйдут за известные пределы? Такого рода задачи особенно актуальны при малом числе наблюдений, когда точечная оценка а в значительной мере случайна и приближенная замена а на а может привести к серьезным ошибкам.
Чтобы дать представление о точности и надежности оценки а, в математической статистике польауются так называемыми д о в ерительными кнтерваламн и доверительными вероятностями. 318 овглвоткл опытов 1гл. ~а Пусть для параметра а получена из опыта несмещенная оценка а. Мы хотим оценить возможную при этом ошибку, Назначим некоторую достаточно большую вероятность р (например, р = 0,9, 0,95 или 0,99) такую, что событие с вероятностью р можно считать практически достоверныи„и найдем такое значение е, для которого Р(~ а — а ! < в) = р.' (14.3.1) Тогда диапазон практически возможных значений ошибки, возникающей при замене а на а, булет +е; ббльшие по абсолютной величине ошибки будут появляться только с малой вероятностью а=1 — р.
Перепишем (14.3.1) в виде: Р (а — в < а < а+. е) = 11. (1 4.3.2) Равенство (14.3.2) означает, что с вероятностью р неизвестное значение параметра а попадает в интервал те=(а — в; а.+е). (1 4.3.3) При этом необходимо отметить одно обстоятельство. Ранее мы неоднократно рассматривали вероятность попадания случайной величины в заданный неслучайный интервал. Здесь дело обстоит иначе: величина а не случайна, зато случаен интервал УЭ.
Случайно его положение на оси абсцисс, определяемое его центром а; случайна вообще и длина интервала 2в, так как величина е вычисляется, как правило, по опытным данным, Поэтому в данном случае лучше будет толковать величину р не как вероятность «попадания» точки а в интервал гв, а как вероятность того, что случайный интервал г' накроет точку а (рис.
14.3.1). е Рнс. 14.3.!. Вероятность р принято называть доверительной веронпгностьт, а интервал) — доверительным интервалом '). Границы интервала): а, = а — е и аз= а + е называются доверительными границами, Дадим еще одно истолкование понятию доверительного интервала: его можно рассматривать как интервал значений параметра а, с о в м естииых с опытными данными и не противоречащих им, Действительно, если услозчтьси счнтзть событие с вероятностью ') Нэ ряс. 14.3.1 рвссмэтриввегсн доверительный ииьервал, сииистрнчиый относительно е.
Вообще, как мы увидим дальше, это не обязательно. ~4.п доввяитвльнып интвгвлл, повзгитвльная ввяоятность 319 а=1 — р практически невозможным, то те значения параметра а, длв которых ~ а — а ~ ) е, нужно признать противоречащими опытным данным, з те, для которых ( а — а( ( е, — совместимыми с ними. Перейдем к вопросу о нахождении доверительных границ а, и ам Пусть для параметрз а имеется несмещенная оценка а. Если бы нам был известен закон распределении величины а, задача нахождения доверительного интервала была бы весьма проста: достаточно было бы найти такое значение з, для которого Р ( ! а — а ! ( е) = р. Затруднение состоит в том, что закон распределения оценки а зависит от ззкона распределения величины Х и, следовательно.
от его неизвестных параметров (в частности, и от самого параметра а). Чтобы обойти это затруднение, можно применить следующий грубо приближенный прием: заменить в выражении для в неизвестные параметры их точечными оценками. При сравнительно большом числе опытов в (порядка 20 . 30) зтот прием обычно дает удовлетворительные по точности результаты. В качестве примера рассмотрим задачу о доверительном интервале для математического ожидания.