Вентцель Е.С., Овчаров Л.А. Теория вероятностей и ее инженерные приложения (2-е изд., 2000) (1186207), страница 68
Текст из файла (страница 68)
по результатам опытов. Для того, чтобы такая задача имела смысл, нужно располагать достаточно обширным статистическим материалом, порядка нескольких сотен опытов (наблюдений). Однако на практике нередко приходится иметь дело со статистическим материалом весьма ограниченно~о обьема — с двумя-тремя десятками наблюдений, часто даже меньше. Это обычно связано с дороговизной и слоятостью каждого отдельного опыта. Такого ограниченного материала явно недостаточно для того, чтобы найти заранее неизвестный закон распределепил случайной величины, но все же он может быть использован для получения некоторых сведений о яей; например, па основе ограниченного статистического материала можно определить — хотя бы орпентировочио,— важпейшие числовые характеристики с.
вл математическое ожидание, дисперсию, иногда — высшие моменты. 11а практике нередко бывает, что вид закона распределения известен ааранее, а требуется найти только п арам етр ы, от которых оп зависит (например, пг и о для нормального закона). Наконоц, в некоторых задачах закон распределения с. в. вообще несуществен, а требуется знать только ее числовые характеристики. Рассмотрим вопрос об определении числовых характеристик с. в. Х по результатам п независимых опытов. Допустим, что опыты еще не произведены, их результаты нам неизвестны, случайны.
Обозначим Х< значение, которое примет с. в. Х в 1-м опыте; результаты опыта — п независимых случайных величин: Х,Хз, ° ° .,Хь ° ° .,Х ° (11.6 1) Будем рассматривать их как и «зкземпляров» случайной величины Х, каждый нз которых имеет тот же закоп распределения, что и сама с.
в. Х. Иредполои'нм, что мы хотим определить (пусть приближенно) по результатам п опытов (11.6.1) пекоторый параметр а, связанный с закопом распределения с.в. Х. Будем пазывать прпблаженпое значение параметра а его и' 452 ГЛ. М. ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ оценкой. Любая оценка, вычисляемая на основе экспериментальных данных (11.6.1), есть ф у н к ц и я этих случайных величин и, значит, тоже случайная вел и ч и н а. Обозначим а оценку параметра ш а «р (Х„Х„..., Х„) .
Например, естественной оценкой для математического ожидания И. с.в. Х является среднее а рифм етическое ее наблюденных аначений: е 1 'ь1 л«« = л»„= — ~~ Х» '(в других случаях выбор оценки может быть не столь очевидным, как мы убедимся ниже). Итак, любая оценка а параметра а — случайная величина — функция п случайпых величин Хн Х«, ..., Х„ (и «экаемпляров» случайной величины Х). Закон распределения этой с. в. а зависит от закова распределения с. в. Х и от вида функции 1р, выражающей а через Х„Х„..., Х, а значит и от числа опытов п.
Этот закон распределения может быть найден методами теории вероятностеи; иногда он, на наше счастье, оказывается довольно простым. Предъявим к оценке а ряд требований, которым она должна удовлетворять, чтобы быть в каком-то смысле «доброкачественной» оценкой. Естественно потребовать от оценки а, чтобы при увеличении числа опытов п она приближалась (сходилась / П С~ по вероятности) к искомому параметру а ~а — а).
Оценка, обладающая таким свойством, называется состоятельной. Кроме того, желательно, чтобы, пользуясь величиной а вместо а, мы по крайней мере пе делали систематической ошибки в сторону завышения или занижения, т. е. чтобы выполнялось условие: М(а] = а. (11.6.4) Оценка, обладающая таким свойством, называется несмещенной. Наконец, желательно, чтобы выбранная несмещенная оценка была как можпо менее случайной, т. е. обладала по сравнению с другими минимальной дисперсией: 0(а~ = ш«п, (11,6.5) 113. ОЦЕНКА ЧИСЛОВЬТХ ХАРАКТЕРИСТИК 453 Оценка, облада1ощая таким свойством, называется эффективной. На практике не всегда удается удовлетворить всем этим требованиям. Например, иногда формулы для вычисления эффективной оценки слишком сложны, и приходится удовлетворяться другой оценкой, дисперсия которой несколько больше.
Иногда применяются — в интересах простоты расчетов — незначительно смещенные оценки. Так или иначе, при выборе оценки л1обого параметра желательно ее критическое рассмотрение со всех вышеупомянутых точек зрения. Здесь мы ограничимся нахоя1депием — по результатам опытов (11.6 1) оценок для математического ожидания т и дисперсии Р случайной величины Х: М [Х) =т; 0[Х) = Р. Мы уя1е упоминали, что естественной оценкой для математического оя<идания т случайной величины Х является среднее арифметическое ее наблгоденных значений (или статистическое среднее): (11.6.6) Нетрудно убедиться.
что эта оценка состоятельна: согласно закону больших чисел (и. 10.1) при увеличении числа опытов и опа сходится по вероятности к математическому ожидани1о т случайной величины Х. Посмотрим, является ли эта оценка несмещенной? Для этого найдем ее математическое ожидание: и ] и и М [т]=М [т*]= — „' М ~,'~', Х,~- — „','У' М [Х1]= — ','~ т=т, 1=1 " 1=-1 Е=1 (11.6.7) то есть оценка т для т является несмещенной. Найдем дисперсию этой оценки: и и 0 [т~ = 0[т"] = — ~' 0 [Х1] —, ~' Р = —. (11.6.8) 1-1 1=1 Эффективность или неэффективность оценки вависит от вида закона распределения с.
в. Х. Мояено доказать (мы этого делать не будем1, что если с. в, Х распреде- 454 Гл, ы. элементы мАтемати'!Искои стАтистики лена нормальпо, то оценка т = т* для математического ожидания т является и эффективной. Перейдем к оценке для дисперсии Р.
На первый взгляд наиболее естественной представляется статистическая дисперсия Ра, то есть среднее арифметическое квадратов отклонений значений Х, от среднего: Ра = — ~' (Х1 — т))', (1 1.6.9) Проверим, состоятельна лн эта оценка? Выразим ее через статистический второй начальный момент, т. е. через среднее арифметическое квадратов наблюденных значении: (11.6.10) и меЮ Первый члеп в правой части — средне арифметическое наблюденных значений случайной величины Х' сходится по вероятности к ее м.о.: М(Х'] =аз(Х].
'Второй член сходится по вероятности к и', зся величина (11.6.10) сходится по вероятности к а1 — т'=Р. Значит, оценка (1169) состоятельна. Проверим, является лп она также и несме1ценпой? Подставим в (11.6.9) вместо т его выражение (11.6.6) и произведем указанные действия; Так как статистическая дисперсия Ре пе зависит от того, где выбрать начало координат, выберем его в точке т, то есть отцептрируем все случайные величины Х„Х...,., Х„. Тогда я Р " 1 )~~ Х, 2 «~Х,.Х,.
(11 611) 1-1 1~3 Найдем м. о. величины Р": и мз1)- м(лХ, — —,м Ххх~,(!111ч $!.6. ОценкА числовых хАРАктеРистик 455 Г» т Г» о Но М[Х';) = Р, М[Х1Х;~ = О, и формула (11.6.12) дает: » М [0*) = — 1,~ Р— —, ~'„М [Х!Х;~ = ":„Р. (11.6.13) 1=1 " 1~! Отсюда видно, что величина Р» не является несз1ещенной оценкой для дисперсии 0; ее и.о.
не равно Р, а несколько меньше. Пользуясь оценкой О» вместо Р, мы будем совершать некоторую снстематнческу1о о ш и б к у в меньшую сторону. Чтобы ее ликвидировать, » достаточно ввести поправку, умноншв 0» на „вЂ”; тогда мы получим несмещенную оценку для дисперсии: 0=0* —" » в ! равную статистической дисперсии, умноженной на и и деленной на п — 1: '0 к ! ~з~в (Х! т) (11 6 14) '1=1 пли, выражаа Р через статистический второй начальный момент, а-'~-Ах,— ь'] —.
(11.6.») 1=1 При больших аначениях и поправочный множитель пl(п — 1) становится близким к единице, и его применение теряет смысл. А теперь, произведя уже все необходимые выкладки, мы можем забыть о том, что результаты и опытов случайны, и записать их в виде последовательности известных чисел: х„х„..., х!... „х„ и сформулировать правило приближенного нахождения математического оигидания т и дисперсии 0 случайной величины Х по опытным данным. В качестве приближенных аначепий (оценок) этих характеристик нужно взять: т т» —,«~ хб Р = — ~~ (х! — т)1, (11,6.16) " г-1 'г-1 455 ГЛ.
!1. ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ Вместо второй из формул (И.6Л6) часто бывает удобнее пользоваться выражением я З вЂ” ~ — А 4 — '] — ". (11ЛЛ7) 1=1 Можно доказать (мы этого делать яе будем)', что та- А кой же поправочяый множитель „— нужно вводить и при вычислении несмещенной оценки для ковариации двух с.в. Х и У: О 0 К, = М (ХУ)1 а именно, если в результате я опытов получено и пар аиачеиий случайных величин Х и У: (х„у,); (х„у,); ...; (хь у1); ...; (х„, у„), то несмещеняая оцеика для их ковариации будет: К з — — —,~' (х1 — т„) (у1 — тз)1 (И,6.18) '1=1 где (И,6,20) Оценку коэффициента корреляции с.в.