Вентцель Е.С., Овчаров Л.А. Теория вероятностей и ее инженерные приложения (2-е изд., 2000) (1186207), страница 70
Текст из файла (страница 70)
ы. влеыепты мАтемАтическОЙ стАтистики тов в 101 появилось событие А. Найти вероятность того, что приняв р = рз 101/400, мы пе сделаем ошибки больше, чем е =0,02. Решение. р"-0,253, 9*-0,747; р'д* ж 0,189. Р() р' — р) (е) ж 2Ф " = 0,642. (11.8.7) ~ )/0,233 0,747/ Итак, вероятность того, что ошибка приближенного равенства р = 0,253 не превзойдет 0,02, не очеяь велика и составляет около 64'/е.
~ П р и и е р 3. Сколько опытов и надо произвести в условиях предыдущего примера, чтобы ошибка приближенного равенства р = р* ие превысила 0,02 с вероятностью не меньше, чем 0,9? Ре ш е н и е. Будем исходить из того, что частота события А при увеличенном числе опытов останется приблизительно той н~е, как и при п =400 (все наши расчеты носят ориентировочиый характер). Нам нужно, чтобы 2Ф(0,02УЕ/0,4349) было ке меньше, чем 0,9, т. е.
Ф(0,02Уп/0,4349) > 0,45. Найдем, пользуясь таблицей приложения 2, то значение аргумента, при котором функция Лапласа становится равной 0,45; опо приближенно равно 1,64; отсюда 0,02 '$/в — 4,64. 0,4349 ' 4 4 ) 1,64; )/и ) , ж 35,66, 1 п)1271. > Рассмотренный пример поучителев тем, что показывает, какое грандиозпое число опытов требуется, чтобы добиться удовлетворительной точпости определения вероятности по частоте. Обычно мы определяем вероятности событий по значительно меньшему числу опытов; надо отдавать себе отчет в том, что точность приблин4епного равенства р = р~, как правило, невелика и, значит, нет смысла сохранять большое число зпачащих цифр в получеяиой таким образом вероятности.
К изложевиому вопросу об оцепке вероятности по частоте тесно примыкает другой, имеющий большое практическое значение вопрос о з н а ч и и о с т и расхождений между двумя частотами. Пусть произведепо две серии, состоящих соответственно из л, и я, опытов. В каждом из них регистрировалось появление или непоявлепие одного и того же события А. !1.З. ОЦЕЕ1КА ВВРОЯТЕ1ОСТИ ПО ЧЛСТОТЯ 465 В первой серии событие А появилось в й, опытах, во второй — в й, опытах, причем частота события А в первой серии получилась больше, чем во второй: рт=й1/Я1) ) р, = з.!я,.
Разность между двумя частота получилась равной г,: Ф Ф Р1 — Рз = го. (11.8.8) р — рз =(й, + )г,)!(и, + яд. '(И.8.9) При достаточно больших и, и и, каждая иэ случайе е ных величин р,; рз распределена практически нормально, с одним и тем н<е м. оя р = р~. Что касаетсн дисперсий Р, и Р, в первой и второй сериях, то они различны и равны соответственно: Р, — р1' (1 — р,*)/я;, Р, ж рз' (1 — р,')(пз. (11.8ЛО) Ф Ф Случайная величина Н = р1 — р, такл1е имеет приближенно нормальное распределение с математическим Спрашивается, значимо или не значимо это расхождение? Указывает лн оно на то, что в первой серии опытов событие А действительно вероятнее, чем во второй, или расхол1дение между частотами надо считать случайным? При решении этой задачи мы воспользуемся классическим в математической статистике приемом н у л ьгипотезы.
Нуль-гипотеза Н, состоит в том, что различия в вероятностях не существует, то есть обе серии опытов произведены в одинаковых условиях, а расхождение г, объясняется случайными причинами. Выдвинув нуль-гипотезу, подсчитывают вероятность того, что при этой гипотезе расхождение превзойдет наблюденное г,. Если эта вероятность очень мала (меньше той вероятности а, при которой мы уговорились считать событие практически невозможным), то нуль-гипотезу надо о т б р о с и т ь, как противоречащую опытным данным; если же вероятность не очень мала, гипотезу Н, отбрасывать не надо, а расхождение г, можно объяснить случайными причинами. В данном случае нуль-гипотеза Н, состоит в том, что обе серии опытов однородны и что вероятность р появления события А в них одна и та же, приближенно равная частоте, которая получится, если обе серии смешать в одну: 466 ГЛ 11.
ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ ожиданием л<,, равным пулю, и дисперсией Пе =,У<+ О ж р," (1 — р, 7 п<+ ро (1 — р,)7л», (11.8.11) откуда ал 'Т' А»в т ~lР, (1 — Р<)(и< + Р, (1 — Р',)/по (11.8 12) Вероятность того, что с. в. В примет значение, не меньшее, чем наблюденное в опыте г„равна Р (Л ) ~Д ~ Р (Л > г,) = 1 — Р«(~,), где Ео(х) — функция распределения с. в. Л. Из и. 6.3 мы знаем, что для пормального закона функция распределения равна: Р (х) = 0,5 + Ф ~* — ). В нашем случае Ре(1'о) = 0,5+ Ф 0 ое 7' откуда Р (Л )~ 1'о) = 1 — Рв (го) = 0.5 — Ф вЂ” 0 ) (11 8 13) О В 0» Ол Если вероятность (11.8.13) очень мала (не превосходит выбранного уровня значимости а), то гипотезу Н, следует отбросить, как противоречащую опытным данным; если же она не слишком мала, можно отнести расхои<дение между частотами за счет случайных причин.
Пример 4. Два стрелка, соревнуясь, дали по одинаковым мишеням из одинакового оружия первый — двадцать выстрелов, второй — шестнадцать (л, = 20; л, = 16). Первый попал в «десятку» й, =16 раз, второй й, 10 раз; о 1Е в 10 о о, р<.= ЕŠ— — 0,8; р» = 1Š— — 0,625; р, ~ р,.< г, = 0,800— — 0,625 = 0,175. Второй стрелок утверждает, что различие частот случайно, что вообще он стреляет так же хорошо, как первый. Проверить правдоподобие атой гипотеаы, считая за уровень значимости а= 0,02, 11.0. пРовеР1»А знАчимостп РАсхол»ленин 467 Решение. По формуле (11.812) находим: ж 0,1503. По формуле (11.813): Р(Н «го) ж0,5 — Ф вЂ” "~ ж0,5 — Ф( — '5'",з) жО»122, х оа / Эта вероятность заметно превосходит принятый уровень значимости с»=0,02; гипотеза Н, = (стрелки стреляют одинаково метко) н е противоречит опытным данным.
~ 11.9. Проверка значимости расхождений между двумя средними В данном пункте мы рассмотрим задачу, подобную той, которую мы решали в п. 11.8 (проверка значимости расхождений между двумя частотами). Пусть имеется две серии опытов; первая состоит пз Ло ВтОрая — ИЗ И, ОПЫТОВ. В 1»ап»де»» Сзрнн рЕГИСтрнрО- вались значения какоя-то с. в. Х.
Первая серия дала п Ч»»1))» о среднее значение и» вЂ” ~~ Х; д и,; вторая т о ~ ~'„Х» !»я„где индексами (1) и (2) вверху отмечены »о) »=1 значения, принятые с.в. Х в первой и второй сериях опытов. Оказалось, что пг, ) т,,а разность между ними равна о о го=т» — тз >О, Спрашивается, является ли значимым зто расхождение, или же его моя»но объяснить за счет случайных причин7 Уровень значимости принят равным а. Снова выдвинем нуль-гипотезу Н„состоящу»о в том, что в первой и второй сериях мы имеем дело с одной и той же с.в.
Ее м.о. прнбляженно равно статистическому среднему, взятому по материалам всех опытов (без 4ЕЕ гл. 11, элементы мАтематическоя стАтистики разделения на серии): / и в о о 1=1 (11.9 1) а дисперсия, вычисленная через второй начальный мо- мент (для простоты берем слегка смещенную оценку Ве, без поправки (и, + и,)/(и, + и, — 1); при больших и, и и, этот поправочный коэффициент близок к единице), равна: / ))1 оо Р (В )х,'НГо Е )х ~) ))')" )") — ) *)' ))192) 1=1 1=1 Теперь рассмотрим две случайные величины: У, и У, — средние аначеяия с.
в. Х в первой и второй сериях: о1 ))о У1 — ~' Х('~ - и,; У = — ~~Х1ю = т, (11.9.3) "1,=, и найдем их числовые характеристики: М (У1) = М (Уо) = .*; (11.9.4) разность двух средних аначеиий о Ф Л = У1 — У, = и, — и, имеет математическое ожидание т„=О и дисперсию, равную сумме дисперсий величин У, и У,: В„ /)о/и) + йо/по = (и, + и,) Ио/(и, ° и,), откуда ао = У (п) + по) Х>о/(п) по) (11 9 5); Вероятность того, что с. в. Н примет значение, ке меньшее, чем наблюденное в опыте г„равна Р(В =Его) 1 — Р(Л ()'о) =/гл(го) (11 9 6) где г',(л) — функция распределения с. в.
111 ы.е. провинил знлчимости рлсхождкнни 469 В п' 6.3 мы нашли выражение нормальной ф. рл Р (х) = 0,5 + Ф ( — *~), откуда Рл (г,) ж 0,5 + Ф ( — о~. 1ов2 Подставляя в (11.9.6), получим Р(Л)го) = 05 — Ф вЂ” ' ° (1197) Если зта вероятность очень мала (меньше принятого уровня значимости се), то расхождение между двумя средними У, — У, =Н надо признать значимым, а нуль- гипотезу Н, отбросить, как противоречащую опытным данным; если она недостаточно мала — признать гипотезу Н, правомочной и отнести расхождение за счет случайных причин.
Пример. Испытано два образца ЭВМ одной и той же марки; для каждой проводились опыты по измерению времени безотказной работы Т (суток). Для первого образца проведено и, = 20 опытов, для второго и, =16 опытов*). Результаты обеих серий опытов (время безотказной работы в часах) сведены в таблицу: Таблица 11.9.1 1а обра- аец Ьа обра- аец 2-а обра- аец 2-В обра- аец 24 опыта 1 24 опыта Е тЯ 242> т;10 т1121 14,4 15,2 6,1 0,5 2,8 4,6 Среднее: иа, = 10,65; ла," = 8,13.
") В целях простоты вычислений мы ваяли такое умеренное число опытов, 1 2 3 4 5 6 7 8 9 10 10,1 9,2 7,8 14,5 16,1 3,2 4,9 8,8 11,4 20,2 8,6 10,2 3,8 4,9 19,0 10,0 4,3 12,2 8,6 11 12 13 14 15 16 17 18 19 20 6,1 12,3 14,4 10,5 2,2 18,3 22,4 6,6 3,4 Ю,5 470 Гл 11 элементы мАтемАтическОЙ стАтистики Большее среднее время безотказной работы первого образца как будто говорит в пользу его большей надежности: 10,65 ) 8,13. Спрашивается, является ли зто расхождение значимым (при уровне значимости а= 0,05), нли его можно объяснить случайными причинами? Р е ш е н и е. Среднее по обеим сериям: в в 342,9 гяв= ' ж952= +— 20+16 ' и +и и +и' Средний квадрат по обеим сериям: а, ж — ' 101,39; Пв м 101,39 — 9,52' ж 10,76, По формуле (11.9.5) (Л = ги, — т, = 2,52): пя ж 1/ — ° 10,76 = У1,2105 ж 1,10; и 320 Р(Л=»гв) =05 Ф(252/110) 0021.
Полученная вероятность заметно меньше принятого уровня значимости а = 0,05, поэтому гипотезу Н, следует отбросить как противоречащую опытным данным: первый образец действительно дает в среднем большее время бевотказной работы, чем второй. Заметим, что сравнительно небольшого изменения опытных данных было бы достаточно, чтобы прийти к протнвоиоложному выводу, Например, если бы разность г, имела значение не 2,52, а, например, г,= 1,8, мы получили бы Р()т'= гз) = Ов5 — Ф(1.636) 0*051~ а зто уже превзошло бы уровень значимости сг = 0,05, и нам не пришлось бы отбрасывать гипотезу Н,.