Дж. Тейлор - Введение в теорию ошибок (1108329), страница 42
Текст из файла (страница 42)
Таким же образом, если полученное нами число выигрышей т заметно меньше, чем пр, мы можем сделать аналогичное заключение, только нам пришлось бы рассчитать вероятность получения т илп менее выигрышей з). Как и следовало ожидать, описанная процедура не дает простого ответа, что наша гипотеза безусловно верна нлн безусловно неверна. В действительности она дает количественную меру достоверности наших результатов в рамках гипотезьь Таким образом, мы можем выбрать объективный, хотя и неоднозначный, критерий, по которому мы отвергаем гипотезу. Когда экспериментатор делает вывод, основанный на подобных рассуждениях, то важно, чтобы он четко указал, какой критерий использовался и чему была равна вычисленная вероятность, чтобы читатель сам мог судить о достоверности выводов.
Опрос избирателей В качестве второго примера рассмотрим выборы, когда баллотируются два кандидата А н Б. Пусть кандидат А за- ') Как обычно, 9= нр есть среднее число успехов, ожидаемое в том случае, если бы мы были в состоянии повторить всю систему п испытаний много раз.
Я) Как мы увидим ниже, в некоторых экспериментах соответствуюпзая вероятность — сумма двух «хвостов», т.е. вероятность получения значений в. которые отличаются в любую сторону от ар так же, как фактически полученное значение, или более, Биномиальное распределение 209 явил, что, согласно гщательному обследованию, в его пользу высказываются 60')е избирателей, и предположим, что кандидат Б попросил нас проверить это заявление (в надежде, конечно, показать, что число избирателей, поддерживающих А, значительно меньше 60 "йг), В данном случае наша статистическая гипотеза состоит в том, что 60огв избирателей поддерживают А, так что вероятность того, что случайно выбранный избиратель будет поддерживать А, равна Р =0,6.
Сознавая, что мы не можем опросить всех избирателей, мы тщательно подбираем случайную выборку из 600 человек и спрашиваем об их симпатиях. Если действительно 60 с(г поддерживают Л, то ожидаемое число людей, поддерживающих Л, в нашей выборке равно пр = = 600 0,6 = 360 Если фактически только 330 предпочтут А, то можем лн мы заявить, что гипотеза о 60$,-ной поддержке А на значимом уровне сомнительна? Чтобы ответить на этот вопрос, заметим, что (в соответствии с гипотезой) вероятность того, что т избирателей выскажутся в поддержку Л, определяется биномиальным распределением Р(т избирателей за Л)=(г„, (т), (10,2!) где а = 600 и Р = 0,6. Так как п очень велико, то замена биномиальной функции распределением Гаусса с центром ар= 360 и стандартным отклонением о = ~'пр(1 — р)=12 будет отличным приближением: Р(т изоирателей за А) = )зевгз(т).
(1!!.22) Среднее ожидаемое число избирателей, отдающих предпочтение Л, равно 360. Таким образом, число тех, кто действительно поддергкивает Л по нашей выборке (а именно 330), на 30 меньше ожидаемого. Так как стандартное отклонение равно 12, то полученный результат на 2,5 стандартных отклонений меньше предполагаемого среднего. Вероятность такого 'нли меньшсго значения (согласно таблице приложения Б) равна 0,6гао '). Таким образом, наш результат «высокозначим» н на 1о),-ном уровне значимости мы можем отвергнуть гипотезу, согласно которой 60'уо избирателей поддерживают А. Этот пример иллюстрирует две общие особенности испытаний такого рода.
Во-первых, обнаружив, что 330 избирателей поддерживают Л (на 30 меньше, чем ожидалось), мы гя™ ."""" к ддР > С„„н т «~ ЗЗ0,0, так ьак в случае распределения Гаусса в — нспрермвная переменная. Это значение на 2дбо меньше среднего, поэтому правильное зна"ение вероятности равно в действительности 0,7 %; но столь малое отли"ве никак не влияет на наш вывод.
Глава !О Рис. !0.0. а — «однохвостовая» вероятность получения результата, ноторый более чем на 30 меньше среднего. б — «двухвостовая» вероятность получения результата, который отличался бы иа 30 н более в любую сто. рону. (Не в масштабе.) А, будет 330 или меньше. На первый взгляд можно было бы рассматривать вероятность того, что число лиц, поддерживающих А, равно ч = 330.
Однако эта вероятность чрезвычайно мала (в действительности 0,15%), и даже наиболее вероятный результат (ч = 360) имеет невысокую вероятность (З,З $). Чтобы получить надлежащую меру того, насколько неожиданным является результат ч = 330, мы должны рассмотреть ч = 330 и любой результат, который еще меньше среднего. Наш результат ч = 330 на 30 меньше, чем ожидаемый 360. Вероятность результата, который на 30 или более меньше среднего, иногда называют «однохвостовой вероятностью», поскольку она определяется площадью под одним хвостом кривой распределения, как показано на рис.
10.6,а. В некоторых испытаниях соответствующая вероятность есть «двухвостовая вероятность» получения результата, который отличается от ожидаемого среднего на 30 нли более в любую сторону, т. е. вероятность получения ч < 330 и ч ~ 390, как показано на рис. 10.6,б. Вопрос о том, использовать ли в статистическом тесте однохвостовую или двухвостоную вероятность, зависит от того, что считается альтернативой исходной гипотезе.
В данном случае мы были заинтересованы в том, чтобы показать, что кандидат А пользуется поддержкой л«еньшей, чем объявленные 60е>о, так что однохвостовая вероятность соответствовала сути дела. Если бы мы были заинтересованы в том, чтобы показать, что число лиц, поддерживающих А, отличается от 60с>з (в любую сторону), то двухвостовая вероятность соответствовала бы сути дела. На практике обычно довольно ясно, какую вероятность надо использовать. В любом случае экспериментатор всегда должен четко указать, какая вероятность и какой уровень значимости были выбраны и чему равна вычисленная вероятность. Располагая этой информацией, читатель может судить о значимости результатов самостоятельно. Задачи Напомннаниегзвездочка у номера задачи означает, что задача решается или ее ответ приводится в разделе «Ответы» в конце книги. Бнномиальное расппеделеиие 21! 10.! (равд. 10.2), Рассмотрите эксперимент из равд.
10.2, в котором бросаются трн игральные кости. Получите вероятности для выпадения случаи, когда нет ин одной единички, и для выпадения одной едвничкн. Проверьте все четыре вероятности, приведенные на рис. !0.1. *10.2 (разя. 10.2). а, Рассчитайте вероятности Р (ч единичек в двух бросаниях) для всех возможных ч при бросании двух костей.
Нанесите нх на гистограмме. б. Сделайте то же самое для случая бросания четырех костей. 10.3 (равд. !0.3). а, Вычислите 51, 6!, 25!/231 б. Используйте соотношение л! = (л+ 1)!/(л+ 1), чтобы показат!ь что О! должен быть определен как 1, в. Докажите, что бнномиалыгые коэффициенты, определяемые формулой (1О.З), равны () «! ч»' ч1(л — ч)! *10.4 (равд. !О 3).
Рассчитайте биномиальные коэффициенты !х ) для гЗх ч »4» ч = О, 1, 2, 3 и 1х ) для ч = О, ..., 4. Потом запишите бииомиальное разложение (105) выражения (Р+ 4)" для л = 3 и 4. !0.5 (равд. !0.3). а. Рассчитайте и начертите гистограмму биномнальной функции распределения Ь,,(ч) для л = 4, р = '/з и всех возможных ч. б. Повторите задание «а» для л = 4 и р = '/ь "10.6 (равд. 10.3).
Больница принимает четырех пациентов, страдающих от болезни, смертность от которой составляет 80 Зе. Используйте результаты задачи !0.5,6 и определите вероятности следующих исходов: а) ни один из пациентов не выживет; б) выживет только один; в) выжявут двое вли более. «10.7 (равд. 10.3). Определите вероятности получения ч едииичек прн бросании пяти костей для ч = О, 1, ..., 5. !0.8 (равд.
!04). Докажите, что среднее число выигрышей « ч= ~' чЬ«,р(ч) ч-О для биномиального распределения равно лр. Существует много способов доказать это, и один из лучших состоит в следующем: запишите биаомиальное разложение (10.5) для (Р+ д)», Поскольку оно верно для любых Р и д, вы можете проднфференцировать его по Р. Если вы затем положите р+ д = ! и умножите почленно на р, то получите требуемый результат. *10 9 (равд.
!0.4). Стандартное отклонение для любого распределении /(ч) определяется как а = (ч — О)'. Докажите, что это то же самое, что и ч' — (ч)з. *1О.!О (разя. 10.4]. Используйте результаты задачи 10.9 и докажите, что для биномиального распределения Ь, »(ч) ох = л Р (! — Р). (Используйте тот же прием, что и в задаче 10.8, но проднфференцвруйтв по Р дважды.) 212 Глава 10 10.11 (разд. 104). Докажите, что в случае р = '/з для биномиалыгого распределения верно соотношение Ьк 0 (ч) = Ь„ о (л — ч), т. е. что распределение симметрично оыюсительно ч = л/2. 10.12 (рвзд. !04).
Гауссова аппроксимация (10.12) биномиального распределения превосходна для больших и н, что уливительна, хороша для малых и (особенно если р близко к '/»/. Чтобы показать это, вычислите Ь,,/ (ч) (для ч = О, 1, ..., 4) по точным формулам и с использованием гауссовой аппроксимации. Сравните ваши результаты. *10.13 (равд. 104).