В.Ю. Королев - Теория вероятностей и математическая статистика (1115266), страница 12
Текст из файла (страница 12)
1.6.1. Бнномиальнее распределение Рассмотрим спиоютнческую снтуацню, заюпочающуюся в осуществленнн л испытаний Бернуллн (л э 1). Построим соответствующую вероятностную модель. С этой целью заметим, что каждый элементарный исход ь 6. »гслмваиая Бернулли 62 лосаедовательности л испытаний Бернулли представляет собой цеиочку вида ю = (соь..., ш„), где ю» равно либо 1 либо О в зависимости от того, каюе значение случайной величины Х» наблюдается в»-и испытании, то есть в зависимости от того, закончилось лн А-е испытание успехом нли неудачей.
Несложно убедиться, что всего имеется Ф = 2" разных цепочек вида ю = (э~,..., в„), в которых ю» равно либо 1 либо О. Отсюда мы соответственно заключаем, что совокупность всех злементарных исходов рассматрнваемой стохастнческой ситуации состоит нз Ф = 2" злементов указанного выше вида. Так как испытания независимы, то вероятность каждой злементарной цепочки гс = (эь..., в„) оказывается равной произведению вероятностей соответствующих исходов днхотомнческнх испытаний, составляющих зту цепочку: Х(ю) = Х;ю» (6.1.3) Пусть е — целое число, О < е < л. В разделе 1.1.2 мы установили, что существует С„'" разных цепочек гс = (сч,..., ю„), удовлетворяющих условию а в» =т.
(6.1.4) »ая С учетом соотношения (6.1.2) мы замечаем, что каждая нз цепочек гс = (ел,...,гс„), удовлетворяющих условию (6.1.4),имеет вероятность (чнсло единиц в цепочке в = (сп,..., в„) равно ~,» з м» и, соответсвенно, число нулей в тююй цепочке равно и — 2», в»). Пусть Х вЂ” случайная величина, равная количеству успехов в л испытаниях Бернулли. Найдем ее распределение. Очевидно, что возможнымн значениями случайной величины Х являются числа О, 1,..., и. Несложно . видеть, что для каждого злемевтарного исхода ю = (сл,..., в„) случайная величина Х равна 1.б.З. Геометрическое реепредееенее 63 Р((ю)) = р"'(1- р)" .
Событие (го: Х(ю) = и) состоит из всех цепочек, удовлетворяющих условию (6.1.4), Поэтому р =Р(Х=я) = ~~> Р((ео)) = Сир'"(1-р)™, т =О,...,п. — ( ь...,еъ): Ф1+...+Од--3В Используя формулу бинома Ньютона, несложно убедиться, что рс+р1+" +р =1.
Набор пар (Оп, р„), и = О,..., п) называется биномиальньии распределением вероятностей. Мы можем замеппь, что случайную величиву Х, равную числу успехов в л испытаниях Бернулли, можно представить в виде Х =Х1+ ° ° ° +Хм (6.1.5) где Хп..., Մ— введенные в самом начале раздела 1.6 независимые случайные величины. На основании (6.1.1) мы заюпочаем, что ЕХь = 1 р+ О (1 — р) = р, 0Хь = (1 — р)~ .
р + (Π— р)~ ° (1 — р) = р(1 — р) й = 1,..., л. Поэтому в силу справедливости представлейия (6.1.5) мы заюпочаем, что если случайная величина Х имеет биномиальное распределение, то ЕХ=ЕХг+...+ЕХе =» ЕХ1 =лр, 0Х = 0Х1+... +ОХ„= и 0Хг = лр(1 — р). р, = Р((о)) = р" '(1 — р). (6.1.6) 1.6.2. Геометрическое рнспределеиие Рассмотрим стохастнческую ситуацию, соспмщую в проведении испытаний Бернулли до первой неудачи. В такой ситуации совокупносп эле-. ментарных исходов состоит из цепочек ю = (в1,..., гое), в которых го1 = ... = го„1 = 1, а го„= О, и = 1, 2,... Таких цепочек бесконечно много. Так как испытания независимы, то цепочка го = (го1„..., в„) указанного вида имеет вероятность 1.7. Р1енмтанил Бернулли: нреоельнме теоремы ' По формуле суммы членов бесконечно убывающей геомегрнческой про- гресснн можно убеднться, что ~ рн = (1 — р) ~ р"-' = 1. Набор пар ((л, рн), л = 1, 2,...), где р„вмеет внд (6.1.б), называется геометрическим распределением вероятностей.
С рассматриваемой стохастнческой ситуацией свяжем случайную величину Х, определнв ее для каждого элементарного исхода ЕО = (ЕОП..., О7н) уКаЗаННОГО ВЬППЕ Влда'КаК Х(ЕО) = Л. СпуЧайлая ВЕЛИ- чина Х прнннмает значення 1, 2,... н нмеет смысл колнчества нспьпаннй Бернулли, осуществленных до первой неудачи. В таком случае говорят, что случайная величина Х имеет геометрнческое распределение. Можно показать, что если случайная величина Х имеет геометрнчесюе распределение, то 1 ,)з.
1 ЕХ = 1 — р' 1.7. Предельные теоремы, связанные с иснытаниями Бернулли Вычисление бнномналъных веролгностей Сйре(1 — р)" " прн болъппзх л представляет собой очень сложную задачу. Однако оказывается возможным нспольювать приближенные формулы, которые являются следствнямн предельных теорем, о юторых пойдет речь ниже. Р(Х = й) = ССр~(1 — р)н ~, й = О, 1,..., л. 1.7.1. Теорема Пуассона.
Распределение Пуассона Напомним, что в разделе 1.4 мы упомянулн число е = 2,718281829..., равное так называемому второму замечательному пределу. Мы договори лись использовать обозначение ехр(х) для числа е*. Пусп. Х вЂ” случайная велнчнна, нмеющая бнномналъное распределенне с параметрами л н р, то есть 1.7.1. Теорема Пуассона Распределение Пуассона 65 Можно показать, что если /с — 1 < «/4 и р ( 1/4, то Р(Х = 1с) = — ехр( — ир+ гн(Л)), (пр)" к! (7.1.1) где /с(1 — А) + бЬвр — 4(пр)з й(1 — А) + Мпр бл ( гн(А) ( 2 Из соотношения (7.1.1) вытекает возможность использования для указанных вьппе значений параметров приближенной формулы Р(Х нс) -нР Ы (7.1.2) которая имеет хорошую точность даже при умеренно болыпих л. Из это- го же соотношения вытекает, что ббльшую точность дает приближенная формула (пр)~ $ к(1 — к) Р(Х = й) ехр1-лр+ + йр И ~ 2« (7.1.3) Однаю соотношение (7.1.1) показывает, что если л -и оо, но при этом значение р остается постоянным, то точность приведенных валле ашроксимаций становится неудовлепюрительной.
Для того, чтобы при л -+ оо формулы (7.1.2) и (7.1.3) давали приемлемую точность, нужно, чтобы одновременно с неограниченным увеличением л параметр р стремился к нулю. При этом из соотношения (7.1.1) вытекает следующее утверждение. Пусть п ~ со и одновременно р -+ О так, что лр ~ Л для неюторого Л ~ О. Тоща для каждого к = О, 1, 2,... Л~ Р(Х = Л) = С р~(1 — р)"~ — + е ~ —.
(7.1.4) Это утверждение называется теоремой Пуассона, теоремой о редких собыппасс, или законом малых чисел. Условия теоремы Пуассона можно интерпретировать следующим образом. Если число испытаний Бернулли велвю, а вероятность успеха в одном отдельном испытании мала и при этом ожидаемое число успехов 1.7.
Ислытекил Бериулли; лреоельные теоремы умеренно (напомним, что лр — зто математическое ожидание числа успехов в л испытаниях Бернулли с вероятносп ю успеха в одном отдельном испьпании, равной р), то бнномиальные вероятности можно вычислять по приближенной формуле (7.1.2): Ср(1 — р) е Р— Ь ль л(р) л И Если мы просуммируем числа в правой части соотношения (7.1.4) по всем я, то получим ,л' ~~) е ~ — =1, е=с то есть набор пар (()1, е "Л~/И), я = О, 1,...) представляет собой распределение вероятностей.
Это распределение называется распределением Пуассона. Если случайная величина Х имеет распределение Пуассона, то ЕХ = ОХ =Л. Распределение Пуассона часто используется, скажем, в страховании для описания распределения числа страховых случаев в течение некоторого промежутка времени. Пример применения теоремы Пуассона содержится в следующей задаче.
ЗядАЧА 7.1.1. В двух городах, скажем, А и В, Примерно одинаковое и довольно большое число жителей и, соответственно, примерно одинаковый уровень системы здравоохранения. В течение года в городе А зарегистрировано ля заболеваний лейкемией, а в городе В зарегистрировано лв заболеваний, причем ля > лв. Свидетельствует ли зто обстоятельство о наличии в городе А неюторого систематического фактора, увеличивающего риск заболевания по сравнению с городом В? Ясно, что конкретный ответ на поставленный вопрос можно дать, толью имея конкретные числовые значения лл и лв.
Однако с помощью теоремы Пуассона можно построить довольно осмысленный мелюд получения подобных выводов. Интуитивно ясно, что если л л намного больше, чем лл, то дополнительный фактор риска в городе А присутствует. Однако, в то же время, лл может оказаться ббльшим лв чисто случайно.
1.7 1. Георена Пуассона Раслределеиее Пуассона 67 Поэтому задача сводится к оценке того, случайно ли наблюдаемое отклонение нх от нв нли оно имеет систематическую причину. Однако и в такой постаыовке, кажется, не хватает информации для осмысленного решения. Действительно, в условиях ничего не говорится о том, каковы распределения случайных величин, наблюдаемыми 'значениями которых являются нь и лв.
К тому же в процедуре сравнения случайных величин довольно много сложностей. Намного проще сравнимть юнкретные неслучайные числа. Прнведеынм выше постановка задачи типична для практики. Она существенно отличается от типичных формулировок проблем в многочисленных учебниках и задачниках. Дело в том, что приведеннм выше задача не сформулирована математически, то есть, строго говоря, решить ее нельзя. Однаю жизнь устроена так, что, как правило, приходится решать не те задачи, юторые можно репппь, а те, юторые нужно реппггь. Руюводсгауясь уже цитированным выше высказыванием П.
Л. Чебышева о том, что правильно поставить задачу математически — это значит наполовину ее решить, мы сейчас попробуем использовать имеющийся у нас багаж сведений и попытаемся найти подходюцую математическую формулировку приведенной вылив задали. Пусть М вЂ” юличество жителей в городе А. Пусть Хь — случайнм величина, разная 1, если у к-го жителя города А обнаружена лейкемия, и О, если у этого жителя нет данного заболемния.