ТЕОРИЯ ВЕРОЯТНОСТЕЙ, МАТЕМАТИЧЕСКАЯ СТАТИСТИКА, (1269688), страница 39
Текст из файла (страница 39)
Так как l1 / l 0 < 1 , тоln(l1 / l 0 ) < 0 и k £ (ln C + l1 – l 0 ) / ln(l1 / l 0 ) = k1.Итак, в критическую область следует включить значения{0,1, 2,K, k1}, где значение k1 зависит от ошибки первого рода. При l 0 = 9по формуле Пуассона получаем вероятности:Р(0) = 0,000129,Р(1) = 0,001111,Р(2) = 0,004998,Р(3) = 0,014996,Р(4) = 0,033735.Отсюда следует, что если включить в критическую область значениядля числа изюмин k = 0,1,2,3, то вероятность ошибки первого рода будетравна 0,000129 + 0,001111 + 0,004998 + 0,014996 = 0,021228.
Итак, еслиизюмин в булке окажется три или меньше гипотезу следует отвергнуть впользу ее альтернативы.Заметим, что при добавлении в критическую область значения k = 4вероятность ошибки первого рода останется достаточно малой » 0,05.Ответ. W0 = {0,1, 2,3}.Задача 3.18. Пусть p –– вероятность того, что взятый наугад человекобладает некоторой особенностью (например, дальтоник, или имеетредкую группу крови). Построить критерий уровня значимости » a дляпроверки гипотезы Н 0 : p = p0 против альтернативы Н1 : p = p1 > p0 порезультатам обследования n наугад взятых людей.У к а з а н и е .
Обследование каждого человека можно считатьнезависимым опытом. Так как в условиях задачи вероятность появлениясобытия в каждом опыте p мала, а опытов много, то можно считать, чточисло людей с особенностью распределено приблизительно по законуПуассона с параметром l = np.(См. пример 3.18, исходные данные и прил., табл. П5.)Исходные данные к задаче 3.18.nnn№р0№р0№р0aaa223123456789100,0150,010,010,010,010,010,020,0250,0350,04203040506070202020150,030,030,050,020,010,010,020,030,050,01111213141516171819200,04 200,045 200,05 1000,05 200,05 400,02 300,02 400,02 500,025 400,025 320,050,020,020,020,020,020,020,030,030,05212223242526272829300,01 800,01 900,015 400,01 1000,015 200,03 200,04 250,015 400,03 1000,04 500,020,030,050,020,050,050,020,050,040,05Пример 3.19.
Изготовитель утверждает, что в данной большойпартии изделий только 10% изделий низкого сорта. Было отобрано наугадпять изделий и среди них оказалось три изделия низкого сорта. С помощьюлеммы Неймана––Пирсона построить критерий и проверить гипотезу отом, что процент изделий низкого сорта действительно равен 10( H 0 : p = р0 = 0,1) против альтернативы, что процент низкосортныхизделий больше 10 ( H1 : p = р1 > р0 ). Вероятность ошибки первого родавыбрать 0,01.
Какова вероятность ошибки второго рода, если р1 = 0,6 ?Решение. Согласно проверяемой гипотезе р0 = 0,1 при альтернативномзначении р1 > р0 . По лемме Неймана––Пирсона в критическую областьследует включить те значения k, для которыхР5 (k / р1 ) C5k ( р1 )k (1 – р1 )5- k=³ C,Р5 (k / р0 ) C5k ( р0 )k (1 – р0 )5- kгде С –– некоторая постоянная.После сокращения на C5k неравенство приводится к виду( р1 / р0 )k [ (1 – р1 ) / (1 – р0 )] ³ C.Прологарифмируем обе части неравенстваk ln( р1 / р0 ) + (5 – k )ln [(1 – р1 ) / (1 – р0 ) ] ³ ln Cилиk ëéln( р1 / р0 ) – ln [ (1 – р1 ) / (1 – р0 ) ]ùû ³ ln C - 5ln [(1 – р1 ) / (1 – р0 ) ].5- kТак как р1 / р0 > 1 , а (1 – р1 ) / (1 – р0 ) < 1, то выражение в скобкенеотрицательно.
Поэтомуln C – 5ln [(1 – p1 ) / (1 – р0 ) ]k³= k1ln( р1 / р0 ) – ln [(1 – p1 ) / (1 – р0 ) ]Значит, в критическую область следует включить те из значений{0,1,2,3,4,5}, которые больше некоторого k1, зависящего от уровня224значимости (от вероятности ошибки первого рода). Для определения k1, впредположении, что гипотеза верна, вычисляем вероятности:Р5 (5) = C55 (0,1)5 (0,9)0 = 0,00001,Р5 (4)=C54 (0,1) 4 (0,9)= 1 0,00045,Р5 (3) = C53 (0,1) 3 (0,9)2 = 0,0081,Р5=(2) C52 (0,1) 2 (0,9)= 3 0,0729.Если к критической области отнести значения {3, 4,5} , то= + 0,00045 +вероятность ошибки первого рода будет равна a 0,00001+0,0081 0,00856=< 0,01.В условиях задачи оказалось, что среди пяти проверенных триизделия бракованных. Значение k = 3 входит в критическую область.Гипотезу р0 = 0,1 отвергаем в пользу альтернативы.
Вероятность того, чтомы это делаем ошибочно, меньше 0,01.Вероятностью ошибки второго рода называется вероятность принятьложную гипотезу. Гипотеза р0 = 0,1 будет принята при k = 0,1,2. Есливероятность изготовления бракованного изделия на самом деле равнар1 = 0,6 , то вероятность принять ложную гипотезу р0 = 0,1 равнаC50 (0,6)0 (0,4) + C51 (0,6)(0,4) 4 + C52 (0,6) 2=(0,4)3 0,31744 » 1 / 3.Вероятность ошибки второго рода велика потому, что критерийпостроен на скудном статистическом материале (всего пять наблюдений!).Ответ.
При уровне значимости 0,01 нулевую гипотезу отвергаем.Задача 3.19.1. Изготовитель утверждает, что в крупной партии доляизделий высшего сорта равна р0. Контракт предусматривает проверку взятыхнаугад n изделий. В зависимости от их качества решается вопрос о приемкепартии, или отказе от нее. Построить критерий для проверки гипотезыH 0 : p = р0 против альтернативы H1 : p = р1 < р0 . Вероятность ошибкипервого рода взять равной 0,05. (См. пример 3.19 и исходные данные.)Исходные данные к задаче 3.19.1.n № р0nn № р0n № р0n№ р0№ р01 0,9 67 0,85 9 13 0,9 9 19 0,85 6 25 0,9 142 0,8 78 0,95 10 14 0,8 10 20 0,95 7 26 0,95 123 0,85 89 0,9 8 15 0,85 7 21 0,9 12 27 0,8 144 0,95 9 10 0,8 9 16 0,95 8 22 0,95 14 28 0,85 125 0,9 7 11 0,85 10 17 0,9 10 23 0,8 12 29 0,9 116 0,8 8 12 0,95 6 18 0,8 6 24 0,85 14 30 0,95 11Задача 3.19.2. Устроители лотереи утверждают, что в среднемкаждый k-й билет выигрышный.
Вы приобрели n билетов. Из нихвыигрышными оказались m билетов. При уровне значимости β, есть ли225основания Вам сетовать на свою особую невезучесть («Мне всегда невезет»), или стоит усомниться в правдивости устроителей лотереи?У к а з а н и е . Пусть p –– вероятность купить выигрышный билет.Проверить гипотезу H 0 : p = p0 = 1 / k против альтернативы H1 : p = р1 < р0 .(См. пример 3.19 и исходные данные.)Исходные данные к задаче 3.19.2.nmnmnm№ kβ № kβ № kβ3 101 0,05 11 4 121 0,05 21 3 122 0,031280 0,05 12 5 101 0,03 22 2 101 0,052490 0,03 13 3 121 0,03 23 4 121 0,0535 101 0,04 14 281 0,05 24 591 0,0243 120 0,02 15 4 101 0,02 25 3 101 0,0252 101 0,05 16 5 121 0,05 26 291 0,0564 121 0,02 17 3 100 0,02 27 4 121 0,047591 0,03 18 2 122 0,05 28 5 100 0,0383 100 0,05 19 491 0,03 29 3 121 0,05992 0,04 20 5 100 0,02 30 4 101 0,0510 2Пример 3.20.
Количество первосортных изделий в крупной партиине должно быть менее 90%. Для проверки выбрали наугад 100 изделий.Среди них оказалось только 87 изделий первого сорта. Можно ли считатьпри вероятности ошибки первого рода, равной 0,05, что в данной партиименее 90 % первосортных изделий?Решение. Построим критическую область для проверки гипотезыН 0 : р = р0 = 0,9 против альтернативы Н1 : р = р1 < 0,9 и посмотрим,попадает ли значение 87 в критическую область. Из леммы Неймана––Пирсона следует (см. рассуждения в примере 3.19 только с учетомнеравенства р1 < р0 ), что существует такое k0, что меньшее или равное k0число первосортных изделий следует отнести к критической области.
Таккак независимых опытов проделано много ( n= 100 ), то можновоспользоваться интегральной теоремой Муавра––Лапласа, согласнокоторойæ k - 100 × 0,9 öæ 0 - 100 × 0,9 ö=Р100 (0 £ k £ k 0 ) F ç 0÷ - Fç÷ = 0,05.××××1000,90,11000,90,1èøèøæ k - 90 öОткуда, с учетом нечетности функции Лапласа, имеем F ç 0÷ + 0,5 = 0,05è 3 øæ 90 - k0 öили F ç÷ = 0,45. Из таблицы функции Лапласа (см. прил., табл. П2)è 3 ø22690 - k0= 1,65 и k0 = 90 – 3 × 1,65.
Так3как k0 –– целое число, то k0 = 85. Итак, критическую область для проверкинулевой гипотезы составляют значения k Î [0;85]. Число 87 в критическуюобласть не попадает. Нет оснований сомневаться в том, что в даннойпартии не менее 90% первосортных изделий.Ответ. Наличие в выборке менее 90% первосортных изделий можнообъяснить случайностями выборки.находим, что F(1,65) = 0, 45. ПоэтомуЗадача 3.20. В нечетных вариантах: изготовитель крупной партииизделий утверждает, что в партии не более m% изделий со скрытымдефектом (брак).
Для проверки выбрано наугад 100 изделий. Из нихоказалось k изделий бракованных.В четных вариантах: изготовитель крупной партии изделийутверждает, что в партии не менее m% изделий высшего качества. Дляпроверки выбрано наугад 80 изделий. Из них оказалось k изделий высшегокачества.При вероятности ошибки первого рода a можно ли согласиться сутверждением поставщика?(См. пример 3.20 и исходные данные, a = 0,02 в нечетных вариантах,a = 0,05 в четных вариантах.)Исходные данные к задаче 3.20.№ m k № m k № m k № m k № m k № m k1 10 15 6 60 53 11 6 11 16 40 31 21 7 13 26 40 312 50 41 7 9 15 12 50 42 17 9 14 22 70 63 27 8 153 8 14 8 70 62 13 5 9 18 55 48 23 5 10 28 45 384 40 32 9 10 16 14 45 36 19 10 17 24 50 43 29 5 115 7 12 10 55 46 15 8 13 20 60 52 25 9 13 30 70 64Пример 3.21.
Случайная величина Х имеет нормальный законраспределения N (m, s2 ), причем значение дисперсии s2 известно.Получены Х 1 , Х 2 ,¼, Х n –– результаты n независимых наблюденийслучайной величины. Построить критерий для проверки гипотезыН 0 : m = m0 против альтернативы Н1 : m = m1 < m0 , полагая вероятностьошибки первого рода a = 0,05.Решение. Так как наблюдения независимы, то n-мерная случайнаявеличина ( Х 1 , Х 2 ,¼, Х n ) имеет плотность вероятности, равнуюпроизведению плотностей вероятности своих компонент:227æ nö( xi - m) 2 ÷åçæ 1 öi =1÷.f ( x1 , x2 ,¼, xn ) ç÷= exp ç 2s 2ç÷è 2ps øç÷èøПоэтому по лемме Неймана––Пирсона к критической области должныбыть отнесены те выборки, для которыхnæ nö2( xi - m0 )( xi - m1 )2 ÷ååçf ( x1 , x2 ,K, xn , m1 )÷ ³ С.= exp ç i=1- i=12f ( x1 , x2 ,K, xn , m0 )2s2s 2ç÷ç÷èøПосле логарифмирования неравенства получаемnnnå(x - m ) - å(x - m )2i =1i0i =1i21³ 2s2 ln С = C1 ,откудаn2(m1 – m0 )å xi ³ С1 + n(m02 + m12 ) = C2 .i =1Так как по условию m1 < m0 , тоnС2å x £ 2(m - m ) = С .i =1i310Итак, в критическую область следует включать выборки, для которыхnå x £ С .
Свяжем значение С3 с величиной ошибки первого рода. Так какi =1i3nнормальный закон устойчив, то суммаåxi=12iимеет тоже нормальный законраспределения N (nm, ns ). Если гипотеза Н: m = m0 верна, то значение С3можно найти из условияnæ С - n т0 öæ -¥ - n m0 ö= 3) F ç 3Р (-¥ < å xi < С÷ - F ç=÷ a = 0,05.è s n øè s n øi =11æ С - nm öОтсюда F ç 3=÷ 0,05 – < 0 .
Это означает, что аргумент функции2è s n øЛапласа отрицателен. В силу нечетности функции Лапласа имеемæ n m0 - C3 ö 1Fç= ÷=– 0,050,45. По таблице функции Лапласа находим, что2nsèøn m0 - C3F(1,65) = 0, 45. Поэтому= 1,65. Значит, С3 = nm0 – 1,65s n . Итак,s n228nесли суммаåxi= 1iокажется меньше величины nm0 – 1,65s n , то гипотезуН0 следует отвергнуть в пользу альтернативной гипотезы Н1.ì nüОтвет. W0 = íå xi < nm0 – 1,65s n ý .î i =1þЗадача 3.21. Физическая величина a измеряется прибором, среднийквадрат ошибки которого равен s2. Получены результаты n независимыхизмерений X 1 , X 2 ,K, X n .
Здесь X i = a + Yi , где Yi –– ошибка прибора при iм измерении.Полагая, что ошибки измерений имеют нормальный законраспределения N (0; s2 ), постройте наиболее мощный критерий дляпроверки гипотезы H 0 : a = a0 против альтернативы: для нечетныхвариантов H1 : a = a1 < a0 ; для четных вариантов H1 : a = a1 > a0 .Вероятность ошибки первого рода возьмите равной 0,02.У к а з а н и е . Так как M ( X i ) = M (a + Yi =) M (a ) + M=(Yi ) a + 0 = a, аD( X i ) = D(a + Y=i ) D(a ) + =D (Yi ) 0 + s 2 , то X i ~ N (a; s2 ).(См. пример 3.21, a –– номер варианта, n равно номеру вариантаплюс 50).3.6.5. Проверка гипотезы о значении медианыПусть Х непрерывная случайная величина, а m –– значение ее медианы,т.е.