Теория вероятности. Вентцель Е.С (4-е издание) (1082431), страница 57
Текст из файла (страница 57)
Расчеты показывают, что этим допущением можно пользоваться да«ке при не очень больших значениях л: достаточно, чтобы обе величины ир и лд были больше четырех. Будем исходить из того, что эти условия выполнены и частоту р' можно считать распределенной по нормальному закону. Параметрами этого закона будут! 888 ОБРАБОТКА ОПЫТОВ [Гл. м преобразуем зто неравенство к виду 1', (р' — р)' ( — „р (1 — р) (14.5.8) 1 Га,/ р"(1 — р*) 1 1'„ Р 2 и и 4 иа Рг— 1+ — ' и 1 11 »,Г Л'(1 —.Р) 1 Р~+ — +г, ~/ 2 и 1 $ и 4 иа (14 5.9) а 1+ — ~ и и дадим ему геометрическую интерпретацию.
Будем откладывать по осн абсцисс частоту р', а по оси ординат — вероятность р (рис, 14.5.1), Геометрическим местом точек. координаты которых р' и р удовлетворяют неравенству (14.5.8). будет внутренняя часть эллипса, про- ходящего через точки (О, О) Ф и (1, 1) и имеюпгего в атих точках касательные, параллельные оси Ор'. Так как велил ау чина р' не может быть ни у Р отрицательной. ни большей Ю единицы, то область )У, со- ответствующую неравенству 8 (14.5.8), нужно еще ограничить слева и справа прямыми р'= О и р'= 1.
Теперь можно для любого значения р', полую ченного из опыта. построить доверительный интервал 1Б, коРяс. 14«а1, торый с вероятностью р накроет неизвестное значение р. Для етого проведем через точку р' прямую, параллельную оси ординат; на этой прямой границы области Р отсекут доверительный интервал ' 1а — †(Рм РР). Дейетвительно, тОчка М со случайной абсциссой р' и неслучайной (но неизвестной) ординатой р с вероятностью р' попадет внутрь эллипса. т.
е. интервал г с вероятностью р накроет точку р. Размеры и конфигурация «доверительного эллипса» зависят от числа опытов и. Чем больше и, тем больше вытянут эллипс и тем уже доверительный интервал. Доверительные границы р, и ра можно найти из соотношения (14.5.8), ваменив з нем знак неравенства равенством. Решая полученное квадратное уравнение относительно р, получвм два корня: опенка вероятности по чдстотп Доверительный интервал для вероятности р будет уз=(р~ рт) Пример 1.
Частота события А в серии из 100 опытов оказалась р'=078. Определить 90%-й доверительный интервал для вероятности р события А. Р е ш е н и е. Прежде всего проверяем применимость нормального закона; для етого оценим величины лр и лф Полагая ориентировочно р - р', получим лр ю яр*= 78! лд - л(1 — р ) Ю. Обе величины значительно больше четырех; нормальный закон применим.
Из таблицы 14.3.1 для 5 =0,9 находим г' =1,643. По формулам (145.9) имеем Р, = 0,705; Рз = 0,840; Уа —— (0,705; 0,840). р=р" — у „/р" Рт=р з ~ь' .+у ~/ р'(! — р") (14.5.10) Эти формулы могут быть получены и непосредственно, если воспользоваться приближенным способом построения доверительного интервала для математического ожидания. данным в и'14.3. Форму« лами (14.5.10) можно пользоваться при больших а (порядка сотен), если только вероятность р не слишком велика и не слишком мала (например, когда обе величины лр и пп порядка 10 иля более). Пример 2, Произведено 200 опытов; частота события А оказалась р' =034, Посгроигь 35%-й доверительный интервал для вероятности созытия приближенно (по формулам (14.5.10)). Сравнить результат с точным, соответствующим формулам (14.5 9).
Ре шеи не. Р =0,85; по таблице 14.зл находим га 1А39. Умножая ~/ Р ('„7' ' = о,оззб, получим гз~/ "( „Р)»0,048. откуда находим приблиягенно доверительный интервал Уа ш (0,292; 0,388). По формулам (т4.5.9) наидем более точные значения р, =0,294; рз = О,о89, которые почти не отличаются от приблнженных. гт ! гз Заметкм, что при увеличении а величины — и — — в формулак л 4 л (14.5.9) стремится к нулю; в пределе формулы принимают вид 334 ОЗРАЗОТКА ОПЫТОВ [Гл. ы Выше мы рассмотрели вопрос о построении доверительного интервала для случая достаточно большого числа опытов, когда частоту можно считать распределенной нормально.
При малом числе опытов (а также если вероятность р очень велика или очень мала) таким допущением пользоваться нельзя. В этом случае доверительный интервал строят, исходя не из приближенного, а из точного закона распределения частоты. Нетрудно убедиться, что это есть биномиальное распределение, рассмотренное в главах 3 и 4. Действительно, число появлений события А в и опытах распределено по биномиальному закону: вероятность того, что событие А появится ровно т раз, равна Рт, л=Слр Ч (1 4.5.1 !) а частота р' есть не что иное, как число появлений события, деленное на число опытов. Исходя из этого распределения, можно построить доверительный интервал ! аналогично тому, как мы строили его, исходя из нормального закона для больших л (стр.
331). Предположим сначала, что вероятность р нам известна, и найдем интервал частот рп р', в который с вероятностью р = 1 — а попадег частота события р'. Для случая большого в мы пользовались нормальным законом распределения и брали интервал симметричным относительно математического ожидании. Биномиальное распределение (14.5.11) не обладает симметрией. К тому же (в связи с тем, что частота — прерывная случайная величина) интервала, вероятность попадания в который в точности равна р, может и не существовать.
Поэтому выберем в качестве интервала рп р самый малый интервал, вероятность попадания левее а которого и правее которого будет больше —. 2' Аналогично тому, как мы строили область В для нормального аакона (рис. 14.5.1), можно будет для каждого л и заданного р построить область, внутри которой значение вероятности р совместимо с наблюденным в опыте значением частоты р'. На рис, 14.5.2 изображены кривые. Ограничичл ли такие области для различных и при доверительной вероятности р=0,9. По оси абсцисс откладывается частота р', по оси ординат — вероятность р.
Кагкдая пара кривых, соответствующая данному а, определяет доверительный интервал вероятностей, отвечающий данному значению частоты, Строго говоря, гоаницы областей должны быть ступенчатыми (ввиду прерывности частоты), но для удобства они изображены в виде плавных кривых. Для того чтобы, пользуясь такими кривыми, найти доверительный интервал У, нужно пронзвсстн след)тощее построение (си. рис. 14.5.2): по оси абсцисс отложить наблюденное в опыте значение частоты р', 335 ОНЕНКА ВЕРОЯТНОСТИ ПО ЧАСТОТЕ провести через эту точку прямую, параллельную оси ординат, и отметить точки пересечения прямой с парой кривых.
соответствующих данному числу опытов и; проекпии этих точек на ось ординат и дадут гранины ри рт доверительного интервала У . Р РУР ОРР ОЗО 34Р 4РО ООО ОЕО ЦРО ООО (00р" Рнс. 14.5та (14.5.13) При заданном и кривые, ограничивающие «доверительную область», определяются уравнениями; и ~; С.-р" (1 — „)м- м=.=', чья где Й вЂ” число появлений события: й=пр', Разрешая уравнение (14.5.12) относительно р, можно найти нижнюю Гранину р, «доверительной области»; аналогично из (14.5.13) можно найти ря.
Чтобы не решать эти уравнения каждый раз заново, удобно заранее Ватабулировать (или представить графически) решения для нескольких 336 ОБРАБОТКА ОПЫТОВ !Гл; ы типичных вначений доверительной вероятности р. Например, в книге И. В. Дунина-Барковского и Н. В. Смирнова «Теория вероятностей и математическая статистика в технике» имеются таблицы р, и рт для 9=0,95 и р=0,99. Из той же книги заимствован график рис. 14.5.2.
Пример 3. Найти доверительные границм р, и ре для вероятности события, если в 50 опытах частота его оказалась р'=0,4. Доверительная вероятность Р = 0,9. Решение. Построением (см. пунктир иа рис. 14.5.2) для р'=0,4 н в=50 находим: р, и 0,28; р, ш 0,52. Пользуясь методом доверительных интервалов, можно приближенно решить и другой важный для практики вопрос: каково должно быть число опытов а для того, чтобы с доверительной вероятностью р ожидать, что ошибка от замены вероятности частотой ие превзойдет заданного значения? Прн решении подобных задач удобнее не пользоваться непосредственно графиками типа рис. 14.5.2, а перестроить их, представив доверительные границы как функции от числа опытов и.
Пример 4. Проведено 25 опытов, в которых событие А произошло 12 раз. Найти ориентировочно число опытов л, которое понадобится для ию! Р РР Рис. !453. того, чтобы с вероятностью Р =0,9 ошибка от замены вероятности частотой не превзошла 20% Р е ш е н и е. Определяем предельно допустимую ошибку: 5=02-0,48=0,096. 0,1. Пользуясь кривыми рис.
14.5.2, построим новый график: цо оси абсцисс отложим число опытов л, по оси ординат — доверительные границы для вероятности (рнс. 14,5,3). Средняя пряная, параллельная оси абсцисс, соответствует 337 ОПЕНКА ВЕРОЯТНОСТИ ПО ЧАСТОТЕ наблюденной частоте события р'= — = 0,48. Выше и ниже прямой р= р'= 12 25 =-0,48 проведены кривые р, (л) и рз(в), изображающие нижнюю и верхнюю доверительные границы в зависимости от л. Ооласть между кривыми, оаределяющая доверительный интервал, заштрихована.
В непосредственной близости от прямой р = 048 двойной штриховкой показана более узная область 2044-8 допустимой ошибки. Из рис. 145.3 видно, что ошибка падает до допустимой величины при числе опмтов л порядка 100. Заметим, что после выполнения потребного числа опытов может понадобиться новая проверка точности определения вероятности по частоте, так как будет получено в общем случае уже другое значение частоты р', отличное от наблюденного в ранее проведенных опытах. При этом может оказаться, что число опытов все еще недостаточно для обеспечения необходимой точности, и его придется несколько увеличить.
Однако первое приближение, полученное описанным выше методом, может служить для ориентировочного предварительного планирования серии опытов с точки зрения требуемого на них времени, денежных затрат и т. д. На практике иногда приходится встрсчаться со своеобразной задачей определения доверительного интервала для вероятности события, когда полученная из опыта частота равна нулю. Такая задача обычно связана с опытами.
в которых вероятность интересующего нас события очень мала (или, наоборот, очень велика †тог мала вероятность противоположного события). Пусть, например, проводятся испытания какого-то изделия на безотказность работы. В результате испытаний иаделие не отказало нн разу. Требуется найти максимальную практически возможную вероятность отказа. Поставим эту задачу в общем виде. Произведено л независимых опытов, ни в одном из которых событие А не произошло. Задана доверительная вероятность р; требуется построить доверительный интервал для вероятности р события А, точнее — найти его верхнюю границу рз, так как нижняя р,.