ТЕОРИЯ ВЕРОЯТНОСТЕЙ, МАТЕМАТИЧЕСКАЯ СТАТИСТИКА, (1269688), страница 33
Текст из файла (страница 33)
Из крупной партии изделий было наугад проверено nизделий. Бракованных изделий среди проверенных не оказалось. Снадежностью γ оценить нижнюю доверительную границу для доли годныхизделий в этой партии. (См. пример 3.5 и исходные данные к задаче 3.5.1.)Пример 3.6. При штамповке 70% деталей выходит первым сортом,20% –– вторым и 10% –– третьим. Определить, сколько нужно взятьдеталей, чтобы с вероятностью равной 0,997 можно было утверждать, чтодоля первосортных среди них будет отличаться от вероятностиизготовления первосортной детали не более чем на 0,05 в ту или другуюсторону? Ответить на тот же вопрос, если процент первосортных деталейнеизвестен.Решение. Изготовление каждой детали можно считать независимымиспытанием с вероятностью «успеха» р = 0,7. Нужно выбрать такое числоиспытаний n, чтобы по формуле (3.2.1):æöç 0,05 ÷÷ = 0,997.Р (| k / n – 0,7 |< 0,05) 2F ç =ç 0,7 × 0,3 ÷ç÷nèøПо таблице функции Лапласа (см.
прил., табл. П2) находим, что0,052F(2,97) = 0,997. Тогда 2,97 =, откуда n = 741. Если процент0,7 × 0,3n0,05 n.первосортных деталей неизвестен, то 2,97 =pqУчитывая, что pq £ 1 / 4, и замену pq на 1/4 придется компенсироватьнекоторым увеличением n, получим 2,75 = 0,05 n / 0,5 или n = 882 .Ответ. 741; 882.Задача 3.6.1. Вероятность события равна P ( A) = p.
Скольконеобходимо сделать независимых опытов, чтобы с вероятностью g можнобыло утверждать, что частота события в этой серии опытов будетотличаться от вероятности события не более чем на a в ту или другуюсторону? Ответить на тот же вопрос, если вероятность события p189неизвестна. (Иначе говоря, сколько нужно проделать независимых опытов,чтобы по их результатам можно было построить для неизвестнойвероятности события доверительный интервал шириной 2a с надежностьюg?) (См.
пример 3.6 и исходные данные.)Исходные данные к задаче 3.6.1.ppp№№№aaaggg0,55 0,02 0,95 11 0,69 0,02 0,99 21 0,41 0,02 0,9710,56 0,03 0,96 12 0,71 0,03 0,90 22 0,40 0,03 0,9820,58 0,04 0,97 13 0,72 0,04 0,95 23 0,39 0,04 0,9930,59 0,05 0,98 14 0,73 0,05 0,96 24 0,38 0,05 0,9040,60 0,06 0,99 15 0,74 0,06 0,97 25 0,37 0,06 0,9550,62 0,07 0,9616 0,75 0,07 0,98 26 0,36 0,07 0,960,64 0,08 0,95 17 0,45 0,08 0,99 27 0,35 0,08 0,9770,65 0,09 0,96 18 0,44 0,09 0,9828 0,34 0,09 0,980,66 0,10 0,97 19 0,43 0,10 0,95 29 0,33 0,10 0,99910 0,68 0,01 0,98 20 0,42 0,01 0,96 30 0,32 0,01 0,95Задача 3.6.2. Вероятность события равна b/100.сделать независимых опытов, чтобы с надежностьюгарантировать, что частота события в этих опытахвероятности события не более, чем на a? (См. примерданные к задаче 3.6.1, b –– номер варианта.)Сколько нужноg можно былоотличается от3.6 и исходные3.3.
Проверка гипотезы о равенстве вероятностейПусть некоторое событие А в серии из n1 независимых опытовпроизошло k1 раз, а в серии из n2 независимых опытов это событиепоявилось k2 раза. Пусть каждая серия состоит из достаточно большогочисла опытов (хотя бы несколько десятков опытов в каждой серии).Требуется проверить гипотезу о том, что вероятность появления события вкаждой серии одинакова и равна р.kkЕсли частоты появления события 1 и 2 в этих серия не принимаютn1 n2значений близких к 0 или 1, то по центральной предельной теоремечастоты имеют близкие к нормальному законы распределения:æ p (1 - p ) öæ p (1 - p ) öN ç p;иN÷ç p;÷ соответственно. Поэтому в силуn1 øn2 øèè190устойчивости нормального закона распределения разность частотk1 k2n1 n2ææ 1 1 ööимеет закон распределения N ç 0; p (1 - p ) ç + ÷ ÷ .è n1 n2 ø øèЗаметим, что большие различия в частотах появления событиясвидетельствуют против гипотезы.
Поэтому к критическим следует отнестиk kте серии наблюдений, для которых 1 - 2 > C , где С –– некотораяn1 n2положительная постоянная. Если уровень значимости выбрать равным a,то постоянная С определяется из равенстваæöç÷æ k1 k2öCç÷>C= ÷ 1 - 2F ç=Pç ÷ a.æö11è n1 n2øç p (1 - p )÷ç + ÷÷çè n1 n2 ø øèЕсли по таблице функции Лапласа (см. прил., табл. П2) найти taæ1 1öтакое, чтобы 1 – 2F (=ta ) a, то следует выбрать C = ta р (1 - р ) ç + ÷ .
Кè n1 n2 øкритическим следует отнести те серии наблюдений, в которых модульæ1 1öразности частот больше величины ta р (1 - р ) ç + ÷ . В последнемè n1 n2 øравенстве в качестве оценки неизвестной вероятности р можно взятьk +kвеличину р% = 1 2 .n1 + n2Пример 3.7. В 225 независимых опытах событие A появилось 78 раз.В контрольной серии из 64 независимых опытов было зарегистрировано 12появлений события.
Можно ли считать, что вероятность события Aодинакова в обеих сериях опытов при уровне значимости b = 0,04 ?Решение. Предположим, что вероятности события в этих опытаходинаковы. По таблице функции Лапласа (см. прил., табл. П2) находим,что 1 - 2F (2,06) = 0,04. Оценкой неизвестной вероятности в предположении,что гипотеза о равенстве вероятностей верна, может служить величина78 + 12р% == 0,31. Поэтому критическую область составят те серии225 + 64опытов, в которых модуль разности частот превысит величину1911 öæ 12,06 × 0,31 × 0,69 ç+ ÷ = 0,135.è 225 64 ø78 12=0,09 < 0,135.Реальная разность частот равна225 64Предположение о равенстве вероятностей не противоречит опытнымданным.Ответ. Предположение о равенстве вероятностей правдоподобно.Задача 3.7.
В серии из n1 независимых опытов событие A появилосьk1 раз, а в серии из n2 независимых опытов это событие появилось k2 раз.При уровне значимости b можно ли считать, что вероятность появлениясобытия A в этих сериях одинакова? (См. пример 3.71 и исходные данные.)Исходные данные к задаче 3.7.№n1k1n2k2b№n1k1n2k2b1751418150 0,05 1676813221 0,05265265031 0,05 1761912014 0,02380223570,02 186889621 0,054120194012 0,05 1992273690,055100296022 0,02 20 112840064 0,02672189013 0,05 2145730025 0,05795197090,05 223028012 0,05880113020,02 23 40035 60076 0,029400 112 16050 0,05 24 196296440,0510140215040,05 25 175253830,0511561412041 0,02 26 16057 400 111 0,02126413256760,027 110245040,0513522014081 0,05 28 140815220 0,0214130714833 0,02 296022 10027 0,051582145640,05 30 140235040,053.4.
Доверительный интервал для математического ожидания3.4.1. Случай большой выборкиПусть закон распределения случайной величины Х неизвестен.Неизвестны так же М ( X ) и D ( X ), причем D ( X ) < ¥. Над случайнойвеличиной проделано n независимых наблюдений и получена выборказначенийХ 1 , Х 2 ,K, Х n . Построим доверительный интервал дляматематического ожидания на основе точечной оценки X .Если число наблюдений n достаточно велико (хотя бы несколькодесятков), то192Х1 + Х 2 + K + Х n X1 X 2X=++K + nnnnnпредставляет из себя сумму большого числа одинаково распределенныхнезависимых слагаемых с ограниченной дисперсией. На основаниицентральной предельной теоремы можно утверждать, что X имеетблизкий к нормальному закон распределения.
Параметры этогонормального закона определяются тем, что М ( X )= М ( X ) иD ( X ) = D ( X ) / n . Поэтому окончательно можно утверждать, чтоD( X ) öæ(3.4.1)X : N ç М ( Х ),÷.n øèЗапись формулы (2.9.3) для этого закона распределения имеет видæöç e ÷÷.(3.4.2)P (| Х - М ( Х ) |< e) = 2F çç D ( x) ÷ç÷n øèЗададим вероятность g и по таблице функции Лапласа (см. прил. 1,D( x ), откудатабл. П2) выберем такое tg, чтобы 2F(=tg ) g. Тогда tg = e /nD( x). Если такое e подставить в (3.4.2), то получимe = tgnæD( X )D( X ) ö< M ( X ) < X + t=gР ç X – tg(3.4.3)÷ g,nnèøЕсли дисперсия случайной величины известна, то формула (3.4.3)решает задачу.Если вместе с М ( X ) неизвестна и D ( X ), то из тех же опытныхданных можно получить несмещенную и состоятельную оценку длядисперсии по формуле:X=nD( X ) » s 2å(Хi =1- X )2= ×n -1i(3.4.4)Тогда (3.4.3) имеет видss öæР ç X – tg< M ( X ) < X + t=g(3.4.5)÷ g.nnèøВ выводе формул (3.4.3) и (3.4.5) ключевую роль играет тот факт, чтопри большом числе независимых наблюдений среднее арифметическое ихрезультатов имеет близкий к нормальному закон распределения.
Этуформулу можно использовать для любой случайной величины с193ограниченной дисперсией, лишь бы число наблюдений было достаточновелико (хотя бы несколько десятков).Пример 3.8. По результатам 100 наблюдений случайной величины Xнайдены оценки математического ожидания и дисперсии, равные Х = 20,4и s 2 = 3,62 . Требуется построить доверительный интервал дляматематического ожидания последовательно для уровней надежностиg = 0,9 , g = 0,99 и g = 0,999.Решение.
По таблице функции Лапласа (см. прил., табл. П2) находим,что 2F(1,65) = 0,9 , откуда tg =1,65. Для уровня надежности g = 0,99соответствующее значение tg =2,58 , а для g = 0,999имеем tg =3,28 .Подставляя полученные значения в (3.4.5) можем утверждать, что20,09 < M ( X ) < 20,71 при уровне надежности g = 0,9 ; 19,91 < M ( X ) < 20,89при уровне надежности g = 0,99 ; 19,78 < M ( X ) < 21,02 при уровненадежности g = 0,999 .Ответ. 19,78 < M ( X ) < 21,02 при g = 0,999 .Задача 3.8. По результатам n независимых наблюдений полученыоценки математического ожидания ( X ) и дисперсии (s2) случайнойвеличины X.
Постройте доверительные интервалы для математическогоожидания этой случайной величины при уровнях надежности g = 0,95 иg = 0,98. (См. пример 3.8 и исходные данные.)Исходные данные к задаче 3.8.№ n Xs2 № n Xs2 № n Xs2 № n Xs21 64 1,2 4,5 9 100 2,5 1,4 17 75 3,2 1,44 25 64 5,3 4,82 81 –1 2,25 10 70 1,4 1,96 18 60 –2 1,96 26 70 –1 2,253 90 4,8 3,2 11 64 1,3 4,2 19 55 3,4 4,8 27 64 4,8 3,24 85 –2 4 12 81 2,1 2,25 20 64 4,8 4 28 81 –2 45 60 3,5 1,96 13 100 2,4 1,6 21 81 –2 1,96 29 100 3,5 1,966 55 4,2 3,6 14 64 4,2 1,44 22 90 3,5 3,6 30 64 2,5 1,47 68 2,8 2,25 15 90 3,5 4 23 85 4,2 2,25 31 90 1,4 1,968 56 1,6 2,56 16 81 4,2 2,56 24 60 2,8 2,56 32 81 1,3 4,2Пример 3.9.
По сгруппированным данным наблюдений случайнойвеличины построить доверительный интервал для ее математическогоожидания, соответствующий уровню надежности g = 0,98.Интервалы(0;4)(4;8)(8;12)(12;16)(16;20)Число наблюдений1229422116194Решение.
Представителем каждого интервала можно считать егосередину. В данной серии из 120 наблюдений2 × 12 + 6 × 29 + 10 × 42 + 14 × 21 +18 × 1690Х== 10.120По формуле (3.1.3) оценим дисперсию случайной величины:s2 » s 2 =(2 -10)2 ×12 + (6 -10) 2 × 29 + (10 - 10) 2 × 42 + (14 - 10) 2 21 + (18 -10) 2 ×16== 21,78,119s » 4,67.Общее число наблюдений велико. Поэтому, безотносительно кзакону распределения случайной величины, можно воспользоватьсяформулой (3.4.3). Из таблицы функции Лапласа (см. прил., табл. П2)находим, что 2F(2,33) = 0,98 , т.е. tg = 2,33. Поэтому10 – 2,334,674,67< M ( X ) < 10 + 2,33,120120или 9,01 < M ( X ) < 10,99 .Ответ.