Дж. Тейлор - Введение в теорию ошибок (1108329), страница 30
Текст из файла (страница 30)
Если бы мы очень тщательно следили за каждым измерением, то иногда могли бы обнаружить какую-то определенную причину аномального результата. Например, наши записи результатов могли бы показать, что в случае последнего измерения в (6.1) использовался другой секундомер, а последующая проверка могла бы показать, что он отстает. В этом случае результат аномального измерения определенно следует отбросить. 149 Отбрасывание данных К сожалению, обычно не удается найти какую-то внешнюю причину аномального результата. В этом случае мы должны решить, отбросить этот результат или нет, опираясь только на сами результаты, и тогда наши знания распределения Гаусса оказываются полезными.
Отбрасывание данных — спорный вопрос, по которому у специалистов нет единого мнения. Но это также и важный вопрос. В нашем примере наилучшая оценка периода колебаний маятника существенно зависит от того, отбросим ли мы подозреваемое значение 1,8 с. Среднее всех шести измерений равно 3,4 с, в то время как среднее пяти измерений равно 3,7 с, т. е. существенно отличается. Кроме того, решение отбросить какие-то данные в конечном счете всегда субъективно, и ученого, ко~орый принял такое решение, его коллеги могут осудить за такую «подгонку» данных. Однако ситуация осложняется, если учесть вероятность того, что аномальный результат может отражать некоторые важные эффекты.
В самом деле, многие важные научные открытия сначала выглядели как аномальные результаты измерений, которые походили скорее на ошибки. Отбрасывая значение времени 1,8 с в примере (б.1), мы, возможно, выбрасываем наиболее интересную часть данных. Действительно, единственно честная реакция при встрече с данными, подобными (б.1)„ — повторять измерения много раз. Если аномалия повторится снова, мы, вероятно, будем в состоянии выяснить ее причину, будь то ошибка илн реальный физический эффект; если же она не повторится, то к тому времени мы сделаем, скажем, 100 измерений, так что не будет существенной разницы для нашего конечного результата, включим мы в расчет аномалию или нет. Тем не менее в большинстве случаев непрактично (особенно в учебной лаборатории) повторять измерение 100 раз, если только результат покажется подозрительным.
Следовательно, нам необходим крптерий, согласно которому отвергается подозрительный результат. Имеется несколько таких критериев, причем некоторые из них довольно сложные. Критерий, который мы опишем, называется критерием Шовене; это простой и поучительный случай применения распределения Гаусса. 6.2. Критерий Шовеие Вернемся к шести измерениям примера (6.1): 3,8; 3,5; 3,9; 3,9; 3,4; 1,8. Если мы предположим на время, что все эти значения †законные результаты измерений величины х, то можно вычис- 150 Глава 6 лить среднее х и стандартное отклонение и„: 2=3,4 с о„=0,8 с.
;. 2) ,6.3) Теперь мы можем установить количественный предел, указывающий, до какой степени подозрительный результат 1,8 аномален. Он отличается от среднего значения 3,4 на 1,6, или на два стандартных отклонения. Если мы предположим, что результаты измерений подчиняются распределению Гаусса с центром и шириной, определяемыми выражениями (6.2) н (6.3), то мы можем вычислить вероятность получения результатов, которые по крайней мере так же сильно отличаются от среднего. В соответствии с данными, приведенными на рис. 5.13, эта вероятность равна Р (вне 2о») = 1 — Р (в пределах 2а,) = 1 — 0,95 = 0,05. 0,05 6 = 0,3, т. е.
для имеющихся шести результатов измерений вероят. ность того, что хотя бы одно из этих значений будет настолько плохим, как 1,8 с, составляет '/а. Это число дает нам искомую количественную меру «разумности» подозрительного результата. Если считать, что число '/а «до смешного невероятно», то мы придем к выводу, что значение 1,8 с — ненормальный результат, который должен быть отброшен. Выбор границы, начиная с которой результат становится «до смешного невероятным», принадлежит экспериментатору.
Критерий Шовене в его обычном понимании утверждает, что если ожидаемое число измерений, столь же плохих, как и подозрительный результат, меньше чем '/а, то подозритель- Другими словами, предполагая, что значения (6,2) и (6,3)' для х и оа справедливы, мы ожидали бы, что только один результат из 20 отличается от среднего по крайней мере так же сильно, как отличается подозрительное число 1,8 с. Проделав 20 или более измерений, мы действительно должны были бы ожидать появления одного или двух результатов настолько плохих, как 1,8 с, и тогда не было бы оснований отбрасывать их.
Но мы произвели только шесть измерений, поэтому ожидаемое число результатов, которые были бы так плохи, как 1,8 с, в действительности равно Отбрасывание данных ный результат следует исключить. Очевидно, выбор величины '/и произволен; но он также разумен, и его можно оправдать. Теперь легко описать применение критерия Шовене к общей задаче. Предположцм, мы делаем /и' измерений хы ...,х„ одной и той же величины х.
учитывая все /у измерений, мы вычисляем х и а . Если один из результатов измерений отли- чается от х настолько, что представляется подозрительным (обозначим его х„,), то мы сначала вычисляем хдвд — х /дод ад (6.4) число стандартных отклонений, на которое х„„отличается от х. Затем мы находим (из рис. 6.13 или из более полной таблицы в приложении А) вероятность Р (вне /„,да„) того, что нормальное измерение будет отличаться от х на /„,д или более стандартных отклонений.
Наконец, мы умножаем на л1, полное число измерений, чтобы получить п(хуже, чем х„„,,) =Л/Р(вне 1„ьда„). Полученное значение и†число ожидаемых измерений, которые дают столь же плохие результаты, как х„д. Если и меньше '/в, то х„„ ве удовлетворяет критерию Шовене и отвергается.
После отбрасывания результата, не удовлетворяющего критерию Шовене, естественно, надо пересчитать х и а„по оставшимся данным. В этом случае получается значение о., которое будет меньше первоначального, и может случиться так, что с новым значением а, некоторые другие результаты измерений не будут удовлетворять критерию Шовене. Однако большинство авторитетных специалистов считает, что критерий Шовене не должен применяться второй раз с использованием пересчитанных значений х и од. Многие ученые полагают, что отбрасывание данных никогда не может быть оправдано, пока не найдется внешнее свидетельство того, что подозреваемые данные неверны. Может быть, более умеренная позиция состоит в том, что критерий Шовене следует использовать для обнаружения данных, которые могли бы по крайней мере рассматриваться как кандидаты на отбрасывание.
Добросовестный студент может сделать вычисления дважды: первый раз с учетом данных, которые находятся под вопросом, и второй раз без них, чтобы посмотреть, насколько в действительности подозреваемое значение влияет на окончательное заключение. 152 Глава 6 6.3. Пример Студент делает десять измерений одной длины х и получает результаты (все в миллиметрах) 46, 48, 44, 38, 45, 47, 58, 44, 45, 43.
Заметив, что значение 58 кажется аномально большим, он проверяет свои записи, но не находит указаний на то, что этот результат получился по ошибке. Тогда он применяет критерий Шопене. Какой вывод он сделает? Учитывая временно все десять измерений, он рассчитывает х =458 и ст„=5,!. Разность между подозрительным значением х„„= 58 и средним х = 45,8 равна 12,2, или 2,4 стандартных отклонений, т.
е. хпсз — х 58 — 45,8 = 2,4. Из таблицы приложения А он находит: вероятность того, что результат будет отличаться от х на 2,4о, или более, равна Р(вне 2,4ст) =1 — Р(в пределах 2,4п) = 1 — 0,984 = 0,016. Для десяти измерений он мог бы, следовательно, получить только 0,16 случаев такого плохого измерения, как подозрительный результат. Так как это число меньше г/т, числа, устанавливаемого критерием Шовене, то студент должен по крайней мере рассмотреть возможность отбрасывания этого результата. Следующий подозрительный результат — это 38, который на 1,5 стандартных отклонений отличается от среднего х = 45,8.
Аналогичные вычисления показывают, что среди десяти результатов он мог бы ожидать 1,3 случаев таких же плохих результатов, как и этот, так что этот результат вполне приемлем. Если же он решит выбросить подозрительный результат 58, то он должен пересчитать х и гт„и получить х = 44,4 и гт„= 2,9. Как можно было ожидать, среднее изменилось немного, а стандартное отклонение заметно уменьшилось. Задачи Напоминание: звездочка у номсра задачи означает, что задача решается плн ее ответ приводится в разделе <Ответы» в конце книги.