Гмурман - Теория вероятностей и математическая статистика (969547), страница 35
Текст из файла (страница 35)
Ясно, что в этом случае и математическое ожидание (среднее значение) случайной величины 6' больше, чем 6, т. е. М(6') ) 6. Очевидно, что если 6'дает оценку с недостатком, то М(6') < 6. Таким образом, использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, привело бы к систематическим" (одного знака) ошибкам. По этой причине естественно потребовать, чтобы математическое ожидание оценки 6' было равно оцениваемому параметру. Хотя соблюдение этого требования не устранит ошибок (один значения 6' больше, а другие меньше 6), однако ошибки разных знаков будут встречат ься одинаково часто.
Иными словамн, соблюдение требований М (6') = 6 гарантирует от получения систематических ошибок. Несмещенной называют статистическую оценку 6', математическое ожидание которой равно оцениваемому параметру 6 при любом объеме выборки, т. е. М(6') =6. ю В теории ошибок измерений систематическими ошибками назынают неслучайные ошибки, искажающие результаты измерений и одну определенную сторону Например, измерение длины растянутой рулеткой систематически дает заниженные результаты.
Смещенной называют оценку, математическое ожидание которой не равно оцениваемому параметру. Однако было бы ошибочным считать, что несмещенная оценка всегда дает хорошее приближение оцениваемого параметра. Действительно, возможные значения 9' могут быть сильно рассеяны вокруг своего среднего значения, т е.
дисперсия О(6') может быть значительной. В этом случае найденная по данным одной выборки оценка, например Гз;, может оказаться весьма удаленной от среднего значения б', а значит, и от самого оцениваемого параметра 9; приняв еэ," и качестве приближенного значения 9, мы допустили бы большую ошибку. Если же потребовать, чтобы дисперсия 9' была малой, то возможность допустить большую ошибку будет исключена. По этой причине к статистической оценке предъявляется требование эффекти вн ости. Эф4мктиакой называют статистическую оценку, которая (при заданном объеме выборки и) имеет наименьшую возможную дисперсию. При рассмотрении выборок большого объема (и велико!) к статистическим оценкам предъявляется требование состоятельности.
Состоятельной называют статистическую оценку, которая при и ьь стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при и ьь стремится к нулю, то такая оценка оказывается и состоятельной. % 3. Генеральная средняя Пусть изучается дискретная генеральная совокупность относительно количественного признака Х.
Генеральной средней х, называют среднее арифметическое значений признака генеральной совокупности. Если все значения х„ х„ ..., хя признака генеральной совокупности объема И р а з л н ч н ы, то х, =(х, + х, +... +хя)/У Если же значения признака х„х„..., х„имеют соответственно частоты Ф„Л~„..., Ф», причем Ф, + ФУ+ ° ° ° +У =У х„= — (х,у,+х,й,+... +хлЫлуХ, т. е. генеральная средняя есть средняя взвешенная значений признака с весами, равными соответствуюш,им частотам. 3 а м е ч а н н е. Пусть генеральная совокупность обьема /У содержит объекты с различными значеннямн признака Х, равными хы хэ, ..., ху. Представнм себе, что нз этой совокупности наудачу извлекается один объект.
Вероятность того, что будет извлечен объект со эначеннем признака, например х,, очевидно, равна 1//т'. С этой же вероятностью может быть извлечен н любой другой объект. Таяны образом, величину пркзнака Х можно рассматрввать как случайную велнчнну, возможные значення которой хм хэ, ..., х„ нмеют одинаковые вероятностн, равные 1//у. Найдем матеыаткческое ожидание М(Х): М(Х) =х, 1/й/+хэ 1/д/+... +х/Ч 1//У=(х,+ха+... 4- х/Ч)/й/=хг. Итак, еслн рассматрнвать обследуемый признак Х генеральной совокупности как случайную велнчнну, то математическое ожидание признака равно генеральной средней этого признака: М (Х)=х„.
Этот выяод мы получнлн, считая, что все объекты генеральной совокупностн имеют разлкчные значения прнзнака. Такой же нтог будет получен, еслн допустить, что генеральная совокупность содержнт по нескольку объектов с одинаковым значенвем признака.
Обобщая полученный результат на генеральную совокупность с непрерывным распределенкем признака Х, н в этом случае определим генеральную среднюю как математическое ожнданне признака: х =М (Х). $4. Выборочная средняя Пусть для изучения генеральной совокупности относительно количественного признака Х извлечена выборка объема п. Выборочной средней х, называют среднее арифметическое значение признака выборочной совокупности. Если все значения х„х„..., х„признака выборки объема и различны, то х, = (х, + х, +... + х„)/и. Если же значения признака х„х„..., х» имеют соответственно частоты п„п„..., п», причем и,+и,+... ...+п»=л, то х, = (п,х, + л,х, +... + п»х „)/и, или / » =( -//' г=ь т.
е. выборочная средняя есть средняя взвешенная значений признака с весами, равными соответствующим частотам. 3 ам е ч а н не. Выборочная средняя, найденная по данным одной выборки, есть, очевидно, определенное число. Если же извлекать другие выборки того же объема из тсй же генеральной совокупности, то выборочная средняя будет изменяться от выборки к выборке. Таким образом, выборочную среднюю можно рассматривать как случайную величину, а следовательно, можно говорить о распределениях (теоретическом и эмпирическом) выборочной средней и о числовых характеристиках этого распределения (его называют выборочным), в частности о математическом ожидании и дисперсии выборочного распределения.
Заметим, что в теоретических рассуждениях выборочные значения х„х„..., х„признака Х, полученные в итоге независимых наблюденйй, также рассматривают как случайные величины Х„Х„..., Х„, имеющие то же распределение и, следовательно, те же числовые характеристики, которые имеют Х.
й 5. Оценка генеральной средней по выборочной средней. Устойчивость выборочных средних Пусть из генеральной совокупности (в результате независимых наблюдений над количественным признаком Х) извлечена повторная выборка объема и со значениями признака х„, х„..., х„. Не уменьшая общности рассуждений, будем считать эти значения признака различными. Пусть генеральная средняя х„неизвестна и требуется оценить ее по данным выборки. В качестве оценки генеральной средней принимают выборочную среднюю х, = (х, + х, +...
+ х„)/и, Убедимся, что х,— несмещенная оценка, т. е. покажем, что математическое ожидание этой оценки равно х,. Будем рассматривать х, как случайную величину и х„х„..., х„ как независимые, одинаково распределенные случайные величины Х„Х„..., Х„. Поскольку эти величины одинаково распределены, то они имеют одинаковые числовые характеристики, в частности одинаковое математическое ожидание, которое обозначим через а. Так как математическое ожидание среднего арифметического одинаково распределенных случайных величин равно математичес- 20! кому ожиданию каждой из величин (см. гл. Ч111, й 9), то М(Хв).= М 1(Х1+Ха+ ° .. +Хи)lп1=и (и) Приняв во внимание, что каждая из величин Х„Х„... ..., Х„имеет то же распределение, что и генеральная совокупность (которую мы также рассматриваем как случайную величину), заключаем, что и числовые характеристики этих величин и генеральной совокупности одинаковы.
В частности, математическое ожидание а каждой из величин равно математическому ожиданию признака Х генеральной совокупности, т. е. М(Х) =х„а. Заменив в формуле («) математическое ожидание а на х„, окончательно получим М (Х,) = х,. Тем самым доказано, что выборочная средняя есть несмещенная оценка генеральной средней. Легко показать, что выборочная средняя является и состоятельной оценкой генеральной средней. Действительно, допуская, что случайные величины Х„Х„..., Х„ имеют ограниченные дисперсии, мы вправе применить к этим величинам теорему Чебышева (частный случай), в силу которой при увеличении и среднее арифметическое рассматриваемых величин, т.
е. Х„стремится по вероятности к математическому ожиданию а каждой из величин, или, что то же, к генеральной средней х„(так как х„= а). Итак, при увеличении объема выборки п выборочная средняя стремится по вероятности к генеральной средней, а это и означает, что выборочная средняя есть состоятельная оценка генеральной средней.
Из сказанного следует также, что если по нескольким выборкам достаточно большого объема из одной и той же генеральной совокупности будут найдены выборочные средние, то они будут приближенно равны между собой. В этом и состоит свойство устойчивости выборочных срвдник. Заметим, что если дисперсии двух одинаково распределенных совокупностей равны между собой, то близость выборочных средних к генеральным не зависит от отношения объема выборки к объему генеральной совокупности.
Она зависит от объема выборки: чем объем выборки 202 больше, тем меньше выборочная средняя отличается от генеральной. Например, если из одной совокупности отобран )тв объектов, а из другой совокупности отобрано 4% объектов, причем объем первой выборки оказался большим, чем второй, то первая выборочная средняя будет меньше отличаться от соответствующей генеральной средней, чем вторая.