Гмурман - Теория вероятностей и математическая статистика (969547), страница 38
Текст из файла (страница 38)
Примем без доказательства, что если случайная величина Х распределена нормально, то выборочная средняя У, найденная по.независнмым наблюдениям, также распределена нормально, Параметры распределения Х таковы (см. гл. Ч111, ф 9): М (Х) = а, а (Х) = о 5l и . 214 Потребуем, чтобы выполнялось соотношение Р(~ Х вЂ” а~ < б)=у, где у †заданн надежность. Пользуясь формулой (см. гл. ХП, 9 6) Р (~ Х вЂ” а ( < б) = 2Ф (б(а), заменив Х на Х и а на о(Х)=о(~/а, получим Р (~ Х вЂ” а ! < б) = 2Ф (б 3l л/а ) = 2Ф ((), где Г бр'а /о. Найдя из последнего равенства б=Ы()' а, можем написать Р((Х вЂ” а ! < (ад/и ) =2Ф((). Приняв во внимание, что вероятность Р задана и равна у, окончательно имеем (чтобы получить рабочую формулу, выборочную среднюю вновь обозначим через х) Р(х — (оДlа <а <х+(а,( л)=2Ф(()='р.
Смысл полученного соотношения таков: с надежностью у можно утверждать, что доверительный интервал (х — га(Уп, х+(аД~а ) покрывает неизвестный параметр а; точность оценки б=(о( л. Итак, поставленная выше задача полностью решена. Укажем е1це, что число ( определяется из равенства 2Ф(()=у, или Ф(() =у/2; по таблице функции Лапласа (см.
приложение 2) находят аргумент г, которому соответствует значение функции Лапласа, равное у(2. Замечание 1. Оценку )х — а( < го/)~а называют классической. Из формулы В=со/ 3~ а, определяющей точность классической оценки, можно сделать следующие выводы: 1) при возрастании объема выборки а число б убывает н, следовательно, точность оценки увеличивается; 2) увеличение надежности оценки у=2Ф(г) приводит к увеличению г'(Ф(!) — возрастающая функция), следовательно, и к возрастанию б; другнмн словамн, увеличение надежности классической оценки влечет за собой уменьшение ее точности. Пример. Саучайная величина Х имеет нормальное распределение с известным средним квадратическим отклонением о=3.
Найти доверительные интервалы для оценки неизвестного математического ожидания а по выборочным средним х, если объем выборки а=36 н задана надежность оценки у=0,95. 21й Решен не. Найдем 1. Из соотношения 2Ф(1)=095 получим Ф(1)=0,475. По таблице приложения 2 находим 1=1,96.
Найдем точность оценки: 6=то) $~ а =(1,96-3)/р 366=0,98. Доверительный интервал таков: (х — 0,98; «+0,98). Например, если х=4,1, то доверительный интервал имеет следующие доверительные границы: х — 0,98 = 4,1 — 0,98 = 3,12; х+ 0 98 = 4, 1+ 0 98 = 5 08. Таким образом, значения неизвестного параметра а, согласующиеся сданными выборки, удонлетьоряют неравенству 3,12 < а < 5,08. Подчеркнеи, что было бы ошибочным написать Р (3,12 < а < 5,08) = 0,95.
Действительно, так как а — постоянная величина, то либо она заключена в найденном интервале (тогда событие 3,12 < а < 5,08 достоверно и его вероятнос1ь равна единице), либо в нем не заключена (в атом случае событие 3,12 < а < 5,08 невозможно и его вероятность равна нулю). Другими словами, доверительную вероятность ие следует связывать с оцениваемым параметром; она связана лишь с границами доверительного интервала, которые, как уже было указано, изменяются от выборки к выборке.
Поясним смысл, который имеет заданная надежность. Надежность 7=0,95 указывает, что если произведено достаточно большое число выборок, то 95е4 нз них определяет такие доверительные интервалы, в которых параметр действительно заключен; лишь в 5е4 случаев он может выйтн зв границы доверительного интервала. 3 а и е ч а н н е 2. Если требуется оценить математическое ожидание с наперед заданной точностью 6 н надежностью т, то минимальный объем выборки, который обеспечит зту точность, находят по формуле п (зоз(бз (следствие равенства 6=1о/ у н ). $ (6. Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном о Пусть количественный признак Х генеральной совокупности распределен нормально, причем среднее квадратическое отклонение о неизвестно.
Требуется оценить неизвестное математическое ожидание а с помощью доверительных интервалов. Разумеется, невозможно воспользоваться результатами предыдущего параграфа, в котором а предполагалось известным. Оказывается, что по данным выборки можно построить случайную величину (ее возможные значения будем обо- 216 значать через 1): т Х вЂ” о 3/р~ и которая имеет распределение Стьюдента с й =л — 1 степенями свободы (см. пояснение в конце параграфа); здесь Х вЂ” выборочная средняя, 3 — «исправленное» среднее квадратическое отклонение, а — объем выборки. Плотность распределения Стьюдента 3(1, а) =8.
[1+ — „'*,1 "", где В,= Уп (и — 1) Г((п — 1)/2) Мы видим, что распределение Стьюдента определяется параметром и — объемом выборки (или, что то же, числом степеней свободы й =' а в 1) и не зависит от неизвестных параметров а и а; зта особенность является его большим достоинством. Поскольку 3((, а) — четная функ- ция от 1, вероятность осуществления неравенства ! Х вЂ” а — ( у определяется так (см. гл.
2 Х1, 2, замечание): 31' )г в ~ г(~ х-,,'.~ <Ь) =з ) зо,.~о=» Заменив неравенство в круглых скобках равносильным ему двойным неравенством, получим Р(Х вЂ” 1»3/)~а < а < Х+(ДМй) =у. Итак, пользуясь распределением Стьюдента, мы нашли доверительный интервал (х — (тз/рга, х+(тз/)~л ), покрывающий неизвестный параметр и с надежностью у. Здесь случайные величины Х и 3 заменены неслучайными величинами х и з, найденными по выборке.
По таблице приложения 3 по заданным и и у можно найти (т. Пример. Количественный признак Х генеральной совокупности распределен нормально. По выборке объема о=16 найдены выборочная средина 7 20,2 и «ясправлениоеэ среднее квадратическое отклонение «=0,8. Оценить неизвестное математическое ожкдание при помощи доверительного интервала с надежностью 0,95. Ре жение. Найдем гт. Пользуясь таблицей приложения 3, по у=0,96 н и !6 находим Фу=2,13.
2!7 Найдем доверительные гранины: х — 1тз/ и' и =-20,2 — 2,13 0,8/ У16 19,774. х+ /чз / р" и = 20,2+ 2, 13 О, 8/ и' Гб = 20 626. Итак. с надежностью 0,05 неизвестный параметр а заключен в доверительном интервале 10,774 < а < 20,626. 3 а меча н ие. Из предельных соотношений 1 /е д д Йа Вл == 1нп ~1+ — ~ =е ьвз, в-+ж У2м ' и» е и — ! следует, что при неограниченном возрастании объема выборки и распределение Стьшдеита стремится к нормальному. Позтому практически прн я > 30 можно вместо распределенив Сгьюдеита пользоваться нормальным распределением. Однако важно подчеркнуть, что для малых выбор о к (и < 30), в особенности для малых значений и, замена распределения нормальным приводит к грубым ошибкам, а именно к неоправданному сужению доверительного интервала, т, е. к повышению точности оценки. Например, если л=5 и у 0,99, то, пользуясь распределением Стьюдента, найдем 1„=4,6, а используя функцию Лапласа, найдем 1.,=2,50, т.
е. доверительный интервал в последнем случае окажется более узким, чем найденный по распределению Стьюдента. То обстоятельство, что распределение Стьюдента при малой выборке дает не вполне определенные результаты (широкий доверительный интервал), вовсе не свидетельствует о слабости метода Стьюдента, а объясняегся теле, что малая выборка, разумеется, содержит малую информацию об интересующем нас признаке.
Пояснение. Ранее было указано (см. гл. Х11, 2 14), что если х — нормальная величина, причем М (Я) = О, о(л) =1, а Ч вЂ” независимая от Я величина, распределенная по закону х' с й степенями свободы, то величина Т=— г (») у"р/й распределена по закону Стьюдента с й степенями свободы. Пусть количественный признак Х генеральной совокупности распределен нормально, причем М (Х) =а, п(Х) =о. Если из втой совокупности извлекать выборки объема и и по ним находить выборочные средние, то можно доказать, что выборочная средняя распределена нормально, причем (см. гл. Ч111, 9 9) М (Х,) = а, о (Х,) = вфла . 218 Тогда случайная величина Х,— н о! г' н (»») Т = ((х,— а) р а )13, которая распределена по закону Стьюдента с й = а — 1 степенями свободы. й 17.
Оценка истинного значения измеряемой величины Пусть производится а независимых равноточных измерений некоторой физической величины, истинное значение а которой неизвестно. Будем рассматривать результаты отдельных измерений как случайные величины Х„Х„..., Х„. Эти величины независимы (измерения незавйсимы), имеют одно и то же математическое ожидание а (истинное значение измеряемой величины), одинаковые дисперсии а' (измереиия равноточны) и распределены нормально (такое допущение подтверждается опытом). Таким образом, все предположения, которые были сделаны при выводе доверительных интервалов в двух предыдущих параграфах, выполняются, и, следовательно, мы вправе использовать полученные в них формулы. Другими словами, истинное значение измеряемой величины можно оценивать по среднему арифметическому результатов отдельных измерений при помощи доверительных интервалов.
Поскольку обычно о неизвестно, следует пользоваться формулами, приведенными в 9 16. Пример. По данным девяти независимых равноточиых намерений физической величины найдены среднее арифметической результатов 2!9 также имеет нормальное распределение как линейная функция нормального аргумента Х, (см. гл.
Х11, 9 10, замечание), причем М(Я) =О, а(Е)=1. Доказано, что случайные величины д. и У = ((и — 1) Яз)~аз (»»») независимы (Яз — исправленная выборочная дисперсия) и что величина Ф' распределена по закону )(з с А=а — 1 степенями свободы. Следовательно, подставив (»») и (»»») в (»), получим величину отдельных измерений х=42,319 н «исправленное» среднее квадратическое отклонение з = 5,0.