Б.Л. ван дер Варден Математическая статистика (1960) (1186203), страница 10
Текст из файла (страница 10)
Сравнение двух вереятниппеа ва пшное обстоятельство справедливо и для Ьи Следовательно, разность Ь, — Ь, нмеег среднее значение р, — рв н дисперсию о =ав-ра (2) В ~ 4 ( пример 5) мы видели, что разность двух независимых нормальных случайных величин снова подчиняется нормальному распределению. Если же Л, и Ь, распределены лишь приближенно нормально, то Ь, — Лв будет также иметь приближенно нормальное распределение.
Это приближение будет еще лучше, чем соответствующие приближения для распределений Ь, или Ь„так как функция распределения разности Л1 — Ь, имеет меньшие скачки и меньшую асимметрию, чем функции распределения Ь, пли Л,. Таким образом, мы, без сомнений, можем принять, что Ь, — Ь, имеет нормальное распределение со средним значением )21 — р,. н квадратичным отклонением о.. Но тогда следует, что значения ~(Л, — Ь,) — (р1 — рв)~, превышающие д-кратное квадратичное отклонение, будут очень редки, причем д связано известным соот11ошеннсм с заданным доверительным ур<>вием 2)д (например, д = 2.58 при 26 = 0,0)). Следовательно, если Ь, — Ь, больше, чем дк, то могкно считать, что разность р, — рв положительна.
Но здесь опять возникает трудность, связанная с тем, что то шов значение а. неизвестно. Имеются два пути для преодоления этой трудности. Идя по первому менее предпочтительному пути, в формуле (2) неизвестные величины т"', н т,' заменяют их приблнжсннымн значениями 2 Ь1(1 — Ь1) 8 112() Ьв) — — ва = — —— 1= Ня — 1 2 Нв — 1 и образуют сумму 8 =81 ., 81, .2 среднее значение которой равно и.-", однако в отдельных случаях 82 может заметно отклоняться от ее'-', Вместо условия Л, — Ь. > да' яеперь требуют, чтобы разность Ь, — Ьв была больше, чем да.
Если п1 и пв велики, а частоты Ь, и Ьв не слишком близки к нулю или к единице, то при применении этого правила с д = 2,58 наши выводы будут ошибочными в среднем лишь в одном случае из ста. Б. КРИТЕРНГ1 х' Второй путь связан с более простыми вычислениями, кроме того, он предпочтительнее и теоретически. Основной гипотезой, которую, может быть, следует отвергнуть н которая поэтому нуждается в проверке, является предположение, что различие Ь, и Л, чисто случайное и что в действительности р, = ре Посту- е"е.
11. Вероятности и частота пая так, как поступал Сократ, когда он хотел диалектически опровергнуть утверждение своего собеседника, сначаладопускают, что гипотеза р, = р, верна, и затем делают вывод: если эта гипотеза находится в противоречии с фактами, то ее следует отвергнуть.
В предположении, что р, = р, = р, имеем сгз = —, о.з = р— 1= е 3= пт ' па оа = сг = сгт + стад = птпа пгееа ЕЧ пд па ~ где Л' = и, + па. Теперь снова заменим неизвестную вероятность р соответствующей частотой. Для этой цели теперь имеется значительно больше материала, чем имелось раньше для отдельных р, и р„так как мы теперь можем объединить вместе результаты всех Ьт = и, + па опытов, из которых Ь, + Ь, = Х дали положительный исход, а Ег+ Ез = 1 — отрицательный. Поэтому р и д заменяют частотами Н к и 1 Н ь (4) и получают приближенное значение сгз (в силу указанных в Я б Б соображений знаменатель Ь' заменяют на Ьт — 1): КЕ 1 вя = Еч — 1 пыла Эта формула более надежна, чем выведенная ранее формула (3)'.
Если окажется, что (Ьт — Ь (> дв, илн, что то же самое, (Ь вЂ” Ьа)з > дева нли (Ьт — Ьа)' и, п (Етг — 1) кь то гипотезу р, = рз следует отвергнуто. Положим (й — ар (к — ц х = и назовем только что сформулированный критерий критерием ь Это верно, если верна основная гипотеза. В противном случае более надежной может оказаться формула (3), так как формула (5) будет в этом случае давать приближенные значения ае со значительной систематической отибкой.
— Прим. нерее. д О Сравнение деде еепелтнестеа 57 уе для сравнения двух вероятностей. Если Ь, и Ае заменить их зна- чениями, то вместо (6) можно написать е ()еепе ))еп1 )е (Д 1 ) К дп,п, (7) в. овосновлннв Для обоснования эзого критерия нужно доказать, что если гипотеза р, = ре верна, то вероятность неравенства (8) приближенно равна т, 1 — 2р= — )в а й) ) 2п./ о При этом будет предполагаться, ч~о и, н и, являются большими числами и р, = р, = р пс слишком близки к нулю нли к единице, так что математические озкидания рл,, рн, дп, и дп, также являются большими числами, Тогда с большон вероятностью будут велики Й„7е,, 1, = и, — )е, н 1е = и, — Й,.
Случаи, когда одно из этих четырех чисел мало, хотя и возможны, однако онн нс играют сколько-нибудь заметной роли нри вычислении вероятпгсзи нсравенства (8). Пусть Р(К) — вероятность того, что (е, + еее примет определенное целочисленное значение К, и нусгь Р(те- де)К) — условная вероятность неравенства ее~ де в предположении, что ее, + еее = К. Тогда но формуле полной вероятности (2 1, формула (7) ) Р(Х' — де) = ~~ Р(К) Р(Хе — де)К).
(10) Следовазельпо, если мы сможем доказать, что все условные вероятности Р(те= де(К) приближенно равны 1 — 28, то применение критерия ее будет оправдано. Действительно, если каждый отдельный множитель в правой части (10) заключен в пределах 1 — 2)3 — е и ! — 2р" -1- е, то левая часть (1О) лежит в тех же пределах. ВЕрОятНОСтЬ, СООтВЕтСтауЮщая Паре ЗиаЧСНИй ()Еп еЕе) С )Е, -) + 1; = К, равна Г*. 11. Вероятности и чосыопш Вероятность р(К) совпадает с вероятностью того, что из Х независимых вспытаний ровно Х испытаний буду~ иметь положительньш исход, следовательно, Р(К) — ~ ) рк дь Условная вероятность, соответствующая паре значений (Ьи Ь,) при условии, что Ь, + Ь, = К, по определению условной вероятности (Э 1, формула (5) ) равна отношеншо (и,)!п ! !К) Если теперь для упрощения обозначений положим то получим и! (Зà — и)! К! ?Л Ь)К) = ыд(к' — ь))(В 1)')к) (1!) При делении множители р и д сократилнсь, и найденный результат совпадает с формулой (1) Э 8.
Это означает, что уеловнал вероятнотнь р(Ь, К вЂ” Ь)К) в точности равна вероятности появления Ь белых сс 1 черных шаров ари п-кратном извлечет1и из урны, Годержшцей К белых и с черных шаров. Далее, если в (7) положить Ь, =- К вЂ” Ь н и, = ?д — п, то по- лучим (ЬЗ? — пК)- "(М вЂ” 1) Х Кдп(Х вЂ” и) (12) Г. ПРИМЕНЕНИЕ ОДНОСГОРОННЕГО И ДВУСТОРОННЕГО КРИТЕРИЕВ к' На практике критерий у'-' применяют не только для проверки гипотезы р, == р„но также и для выявления, какая из двух вероятнссче!) болыпе: р, или р,у Невольно напрашивается следу1ощее правило (мы скоро убедимся в его справедливости). Если уе) де н при этом Ь, ) Ь,, то следует считать, что р, ) р, С другой стороны, если у' ) де и Ь, < Ь .
тс следует считать, что р, ( р,. Следовательно, неравенство уе- де в точности совпадает с неравенством (?) ч 8. Но, согласно Я 8, вероятность этого неравенства приближенно равна 1 — 28, что н зребовалось доказать. Идея э1огс доказательства принадлежит М, Гипперту. Формула (7) с ?д — 1 в числителе впервые была указана Х. П!сллннгом; ранее вместо )г — 1 всегда писали Х 59 Д 9. Сравнение двдт вероятностей Если в действительности р, = р,, то, как мы видели, вероятность ошибочного заключе1шя р,.-„ь р, близка к 28. А именно, в силу обоснования критерия мз, вероятности неравенств Л,) Л, и Ь, < Ь, приближенно равны, поэтому с вероятностью, примерно равной 15, может быть сдслвн ошибочный вывод р,. ре и почти с такой же вероятностью может возникнуть другой ошибочный вывод р, < р,. 11о если р, < р.„то вероятность одновременного осуществления двух событии )аз) де и Ь, > Л, будет меньше р.
Следовательно, в этом случае вероятность ошибочного заключения р, = р, будет также меньше 15. Аналогично если р, ) р,, то вероятность ошибочного вывода Р, < Ра, полУчешюго на основе кРитеРиЯ Уз, бУдет меньше, чем 11. Во всех трех случаях этого критерия вероятности ошибочных выводов нс превышают 20. Если применяется односторонний вариант критерия хз, то это означает, что заключение р, ) р, (или соответственно р, < р,) делается лишь в том случае, когда величина тз достаточно велика и Ь,) Ь, (или, соответственно, Л, < Л,); во всех ос~альных случаях от выводов воздерживаются.
Практически очень часто, например, бывает интересно выяснить, действительно ли новое лекарство лучше старогоз При этом не требуется ответа на вопрос, не будет ли действие нового лекарства одинаковым илн худшим, чем действие старогоз доверительный уровень одностороннего критерия составляет лишь половину соответствуюгцего уровня значимости двустороннего критерия. д. надежность при неволъшкх ч Критерий Ьз можно уверенно применять и при небольших значениях Х На рис. 8, заимствованном из работы Гильдемайстера и автора этой книги, графически изображена зависимость истиц1юео уровня критерия от р для некоторых типа шых случаев (приближенный уровень значимости выбран равным 215 == = 0,01).
Сплошные линии соответствуют случаю, когда в числителе (7) стоит Лг, а штриховые — случаю, когда хтг заменено величиной Лг — !. Лишь в отдельных местах штриховые линии превышают 1",',-ную границу, причем величина э~ого превышения мала и большинство кривых расположено яиже указанной границы. Пример 9. С 1946 по 1951 г. в медицинской клинике Цюрихского унивсрситеш для лечения последствий тромбоза — образования сгустков крови в кровеносных сосудак — 252 раза применялись антикоагулянтыч Из 252 пациентов умерли 7, слеловатсльио, смсрпюсть равнялись 2,8еьк ' Р и я а ь в с Ь 1., йпх Апвйхоаяо1ап11спЬеьапд1опи г1сг успепВЬгоотЬовсп ш дог пшевеп Медеаш, ??та.
ЕбпсЬ, 1954. Гл. 77. Вероятности и частота 60 С 1937 по 1942 г. за тикоагуляиты вообще пе применялись. При подсчетах из всех стучаев «коисервативного» лечения тромбоза этих лет были исключевы тс, в которых лечеиив зитикоагу.чангами противопоказоио. Оказалось, что из 205 оставшихся пациентов, подвергнутых консервативному лсчеипю, умерли 37, т. е. 18,бой.