Дж. Тейлор - Введение в теорию ошибок (1108329), страница 41
Текст из файла (страница 41)
д.). Чтобы упростить наше доказательство, предположим еще, что все эти источники характеризуются случайными ошибками одной н той же 204 Глава 1О ЛаЯ -УХ Х-б Х Хеб а «-гб Х Х гс Х-угуб' б Х Х "/сто Ф фиксированной величины е, т. е. каждый источник ошибок увеличивает или уменьшает результат на н с равной вероятностью р = г,гя. Например, если истинное значение есть Х и имеется только один источник ошибок, то с равной вероятностью возможны результаты х = Х вЂ” е и х = Х+ е. Если имеются два источника ошибок, то результат измерения мог бы быть х = К вЂ” 2е (если окажется, что обе ошибки отрицательны), или х = К (если одна ошибка отрицательна, а другая положительна), или х = Х+ 2е (если окажется, что обе ошибки положительны).
Эти возможности проиллюстрированы на рис. 10.5, и и б. В общем случае если имеется и источников ошибок, наш результат мог бы изменяться от х = Х вЂ” пе до х = Х+ пи. Для данного измерения, если окажется, что тг источников дают положительные ошибки, а (и — ы) — отрицательные, результат будет равен х=Х+ее — (и — ч)е= = Х + (2т — и) в. (10.16) Вероятность того, что это случится, равна биномиальной вероятности Р(т положительных ошибок)=Ь, и(ч). (10.17) Таким образом, возможные результаты наших измерений будут распределены симметрично около истинного значения Х с вероятностями, даваемыми биномнальной функцией (10.17). Все сказанное проиллюстрировано на рис. 10.5 для п = 1, 2 и 32. Теперь мы утверждаем, что если число источников ошибок и велико и если индивидуальные ошибки е малы, то результаты измерений будут распределены нормально.
Если быть более точным, го заметим, что стандартное отклонение биномиального распределения есть ое =.~~яр(! — р) = — дол~4. Следовательно, в соответствии с (10.16) стандартное отклонение Рис. !05. Распределения результатов измерений, пеннер>пенных влияннш ч случайных ошибок величиной е для л = 1, 2 и 32. Иеарерывные «ривыс на графикак б и а — гауссавы функции с теми ые центрами м ширннай. (Вертикальный масштаб различен лля трех графиков.) 205 Бииоииальиое распрелелеине результатов измерений х будет равно а, = 2ео, = е Ч~л. Устремим и- с и е- О таким образом, чтобы величина о„=е ~/п оставалась постоянной.
Тогда произойдет следующее. Во-первых, как уже обсуждалось в предыдущем разделе, биномнальное распределение будет стремиться к распределению Гаусса с центром Х и с шириной о, Это отчетливо заметно на рис. 10.5,6 н в, где приведены соответствующие функции Гаусса. Во-вторых, если е — «О, то возможные результаты измерений становятся ближе друг к другу 1что также ясно видно на рнс. 10.5), ~ак что распределение дискретной величины переходит в непрерывное распределение, которое представляет собой ожидаемое распределение Гаусса.
10.6. Применения. Испытание гипотез Поскольку нам известно, как должны быть распределены результаты измерений, мы можем спросить: а действительно ли результаты эксперимента расиределеньс так, как ожидалось? Такой внд проверки распределений — важный элемент в физических науках, но, возможно, он еще более важен в биологической и социальных науках.
Один важный и общий тест — критерий у' — обсуждается в гл. 12. Сейчас мы рассмотрим два примера более простого критерия, который можно использовать при решении некоторых задач, связанных с биномиальным распределением. Испытание новой лыжной мази Предположим, что производитель лыжных мазсй заявил, что он изобрел новую мазь, которая существенно уменьшает трение между лыоьамп и снегом. Чтобы проверить это заявление, мы могли бы взять десять пар лыж и смазать одну лыжу из каждой нары этой мазью.
Затем мы могли бы спускать по подходящему снежному склону каждую пару лыж н смотРеть, какая из них в каждой паре, смазанная или несмазанная, скатится быстрее. Если бы смазанная лыжа скатывалась быстрее во всех десяти случаях, то у иас было бы, очевидно, убедительное доказательство того, что мазь эффективна.
К сожалению, такие однозначные результаты весьма редки, но даже и в этом случае мы бы предпочли иметь количественную меру убедительности доказательства. Таким образом, мы должны рассмотреть два вопроса. Во-первых, как можно определить количественно меру эффективности мази (илн неэффективности)? Вов~орых, где должна быть границас Если бы смазанные лыжи Глава 1О скатились быстрее в девяти случаях, было бы это убедительно? А что было бы, если бы в восьми? Или в семи? Точно такие же вопросы возникают во многих подобных статистических испытаниях. Если бы мы захотели проверить эффективность какого-то удобрения, мы могли бы сравнить какие-то параметры растений, под которые вносились и не вносились удобрения.
Чтобы предсказать, кто из кандидатов может победить на выборах, мы могли бы взять случайную выборку избирателей и проверить шансы кандидатов на примере этой выборки. Чтобы отве~ить на поставленные вопросы, нам необходимо решить более точно, что же мы должны ожидать от наших испытаний. Или, употребляя принятую терминологию„мы должны сформулировать статистическую гипотезу. В примере с лыжной мазью простейшая гипотеза — это нулевая гипотеза, согласно которой новая мазь в действительности ие оказывает никакого эффекта. В рамках этой гипотезы мы можем вычислить вероятности различных возможных исходов нашего испытания и затем судить о правдоподобности какого-то частного результата.
Предположим, что мы приняли гипотезу, согласно которой лыжная мазь нс оказывает никакого эффекта. Тогда в любом испытании смазанная и несмазанная лыжи с равной вероятностью могут скатиться одна быстрее другой, т. е. вероятность того, что смазанная лыжа скатится быстрее, равна р = '/а. Вероятность того, что смазанные лыжи скатятся быстрее в ч испытаниях из десяти, определяется биномиальным распределением Р(ч выигрышей в 10 испытаниях)=у~в, ь(ч)= 101 /! '~!в ч1(10 — ч)1 ~ 2 / (10.18) В соответствии с (!0.18) вероятность того, что смазанные лыжи скатятся быстрее во всех десяти случаях, равна т1»м Р(10 выигрышей в 1О испытаниях) = ~ — ) = 0,1%, (10.19) ~23 т. е.
если наша нулевая гипотеза верна, то очень невероятно, чтобы смазанные лыжи скатились быстрее во всех десяти случаях. И наоборот, если смазанные лыжи действительно скати'лись быстрее во всех десяти испытаниях, то очень невероятно, чтобы нулевая гипотеза была верна. Действительно, вероятность (10.19) так мала, что мы могли бы сказать, что доказательство эффективности мази «высокозначимо», как мы вскоре будем говорить. 207 Биномивльное рвспределспие С другой стороны, предположим, что смазанные лыжи скатились быстрее в восьми случаях из десяти испытаний. Тогда мы могли бы вычислить вероятность восьми или более выигрышей: р(8 или более выигрышей в 10 испытаниях) = = Р(8 выигрышей) + Р (9 выигрышей) + -1-Р(10 выигрышей) = 5,5 еле. (10.20) То, что смазанные лыжи скатятся быстрее в восьми или более испытаниях, все еще невероятно, но не до такой степени невероятно„как в случае всех десяти выигрышей.
Чтобы решить, какой вывод можно сделать из случая восьми выигрышей, мы должны осознать, что в действительности имеются только дне альтернативы: либо а) нулевая гипотеза верна (мазь не оказывает никакого эффекта), но по воле случая произошло редкое событие (смазанные лыжи скатились быстрее в восьми испытаниях); б) нулевая гипотеза неверна, и мазь эффективна. В статистических испытаниях обычно выбирают некоторую определенную вероятность (например, 5 о/о) и рассматривают ее как определяющую границу, ниже которой вероятность события считается неприемлемо низкой.
Если вероятность реального исхода (в нашем случае восемь или более выигрышей) ниже этой границы, то мы выбираем альтернативу «б», отвергаем гипотезу и говорим, что результаты эксперимента значимы. Обычно говорят, что результат значим, если соответствующая вероятность не превышает 5е)о, и «высокозначим», если соответствующая вероятность не превышает 1$. Так как вероятность (10.20) равна 5,5 о)о, то восьми выигрышей в случае смазанных лыж недостаточно, чтобы обеспечить «значпмое» доказательство того, что мазь эффективна. С другой стороны, мы видели, что вероятность десяти выигрышей составляет 0,1зэ.
Поскольку это меньше 1г)о, то мы можем сказать, что десять выигрышей представляли бы «высокозначимое» доказательство эффективности мази '). ') Вероятно, следует подчеркнуть исключительную простоту оппсвнного выше испытания. Мы могли бы измерять рвзли~ные дополнительные пврвметры, такие, как время, зв которое скатывается каждая лыжа, мвксимвльнвя скорость каждой лыжи и т. д. Вместо этого мы просто определяли, какая выжв скатывалась рзвьше.
Испытания, которые не вкдю~еют такие дополнительные параметры, извиваются непаралегрическими испытзннямн. Такие испытания обладают большими преимуществами простоты и широкой применимости. 208 Глава 1О Общая процедура Методы рассмотренного выше примера можно применить к любой системе и подобных и независимых испытаний, каждое из которых может иметь два возможных исхода: «выигрыш» или «проигрыш». Сначала формулируется гипотеза, которая в данном случае состоит просто в том, что выбирается вероятность р выигрыша в любом отдельном испытании.
Это принятое значение р определяет среднее ожидаемое число выигрышей т = пр в п испытаниях '). Если действительное число выигрышей м в п испытаниях близко к лр, то против гипотезы нет возражений. (Если смазанные лыжи выигрывают пять из десяти испытаний, то нет свидетельства того, что мазь оказывает какой-то эффект.) Если т заметно больше, чем пр, то мы рассчитываем вероятность (в рамках данной гипотезы) получения т нли более выигры)ней. Если эта вероятность меньше, чем наш выбранный «уровень значимости» (т. е. 5 или 1$), то мы заключаем, что наблюденное нами число неприемлемо невероятно (еслн наша гипотеза верна) н, следовательно, что нашу гипотезу следует отвергнуть.