Дж. Тейлор - Введение в теорию ошибок (1108329), страница 48
Текст из файла (страница 48)
12.1 мы использовали данные для расчетов положения центра Х и ширины о ожидаемого распределения !х,е(х). Естественно„ поскольку Х и о были выбраны таким образом, чтобы аппроксимировать данные, то нам следует ожидать несколько лучшего согласия между наблюдаемым и ожидаемым распределениями, т. е. следует ожидать, что эти две лишние связи уменьшат значение Х'. А это как раз то, что предполагает (!2.15). Из формулы (12.14) следует, что существует несколько более удобный способ понимания критерия х'. Мы введем понятие приведенного значения Х' (или у' иа одну степень свободы), которое мы обозначим через Х и определим как (! 2.16) Поскольку ожидаемое значение х' равно д, то мы получаем (12.
17р Таким образом, каким бы ни было число степеней свободы, наш критерий можно сформулировать следующим образом: если мы получаем значение х' порядка 1 илн меньше, то у нас пет оснований сомневаться в нашем ожидаемом распределении; если мы получаем значение х' много большее, чем единица, то невероятно, чтобы наше ожидаемое распределение было верным. 12.4. Вероятности для х' Наш критерий проверки согласия между полученными данными и их ожидаемым распределением все еще остается только качественным. Нам хотелось бы иметь количественную меру согласия.
В частности, нам нужно некоторое указание па то, где проводить границу между согласием и несогласием Например, в случае эксперимента из равд. 12.! мы сделали 40 измерений некоторых расстояний х, распределение которых, как мы полагаем, должно быть гауссовым. Мы распределили наши данные по четырем бинам и нашли, что х' = = 1,80. При трех связях оставалась только одна степень свободы (д = 1), поэтому приведенное значение Хе, Х'=Х'!д, также равно 1,80: х'= 1,80. 236 Глава !2 Теперь возникает вопрос: достаточно ли велико значение Ха = 1,80 по сравнению с единицей, чтобы отвергнуть ожидаемое распределение Гаусса? Чтобы ответить па этот вопрос, будем исходить из предположения, что результаты наших измерений действительно распределены в соответствии с ожидаемым распределением (например, гауссовым).
В рамках этого предположения можно вычислить вероятность получения значения Ха, которое будет не меньше, чем наше значение 1,80. В данном слу. чае оказывается, что эта вероятность равна Р(Ха) 1,80) 18 Ж, как мы вскоре увидим. Следовательно, если бы наши результаты подчинялись ожидаемому распределению, то существо.
вала бы 18«4-пая вероятность получения значения Х', большего или равного 1,80, которое мы фактически получили. Другими словами, в этом эксперил!енте значение Ха, равное 1,80, вовсе не является неразумным, поэтому у нас нет причин (основанных на этих данных) отвергнуть наше ожидаемое распределение.
В общем случае наша процедура должна быть теперь довольно ясна. После завершения любой серии измерений мы вычисляем приведенное значение Х', которое теперь мы будем обозначать через Х' !где нижний индекс «о» означает «полученное» (оЫа!пеп), так как Х,' есть значение, которое действительно получено], Затем, предполагая, что результаты наших измерений распределены в соответствии с ожидаемым распределением, мы вычисляем вероятность Р(Х > Х,') (12.!8) получения значения Х', большего или равного значению фактически полученному. Если эта вероятность велика, то наше значение Х', вполне приемлемо и нет оснований отвергать наше ожидаемое распределение.
Если эта вероятность неразумно мала, то значение Х', столь же большое, как наше полученное Х'„ очень невероятно (если результаты наших измерений были распределены, как ожидалось), и соответственно невероятно, чтобы наше ожидаемое распределение было правильным. Как всегда бывает со статистическими критериями, мы должны решить, где проходит граница между тем, что «разумно вероятно», и тем, что нет, Два обычных выбора уже упоминались в связи с корреляциями.
Выбрав границу в 5$>, мы бы сказали, что наше полученное значение Х", обнаружи'- вает «значнмов разногласие», если Р(ха>Х2) < 5 Ж, Критерий Х' для распределений 2ЗТ Таблица 72л. Выраженная в процентах вероятность Рл! Хт) Хт) получения знвчения Хт, большего или рвиного любому честному 2 значению Х, в предпалажеяии, что результаты рвссмвтриввеммх измерений распределены в соответствии с ожндэемым распределением.
Прочерки соответствуют вероятностям, меньшим 0,05074 » хо ф 0 0,25 0,5 0,75 1,0 1,25 1,5 1,75 2 3 4 5 »' 8 5 3 1 5 2 0,7 0,2 3 0,7 0,2 1 0,1 О,! 100 62 48 39 100 78 61 47 100 86 68 52 100 94 78 59 100 99 89 68 100 100 94 73 32 26 22 19 37 29 22 17 39 29 21 15 42 28 19 12 44 25 13 6 45 23 10 4 16 14 11 8 3 1 2 3 5 10 15 и мы отвергли бы наше ожидаемое распределение на «5070-ном уровне значимостиш Если бы мы установили границу в 1ою то могли бы сказать, что расхождение «высокозначимо», если Р(ут- Х',) < 1%, и отвергнуть ожидаемое распределение на «10710-нем уровне значимости>.
Какой бы уровень мы ни выбрали в качестве границы, когда мы отвергаем гипотезу, выбранный уровень следует указать. Может быть, даже более важно привести и вероятность Р(Х2)Х',), так чтобы читатель смог самостоятельно судить о ее разумности, Расчеты вероятностей Р(Х2) Х',) слишком сложны, чтобы их описывать в этой книге. Однако их результаты можно легко свести в таблицы, как, например, табл. !2.6 или более полная таблица в приложении Г.
Оказывается, что вероятность получения любого частного значения уз зависит от числа степеней свободы. Позтому мы будем записывать интересующую нас вероятность как Р„(Х2'=вХ',), чтобы подчерк. путь ее зависимость от 5!. В обычных расчетах вероятностей Р„!'Хт) Х',) полученные числа 0» рассматриваются как непрерывные переменные, которые распределены относительно их ожидаемых значений Е, в соответствии с распределением Гаусса. В задачах, которые мы здесь рассматриваем, О, — дискретная переменная, распределенная в соответствии с законом Пуассона '). При усло- 1) Мы покэзелн, что определение чисел О» происходит п счетном эксперименте и что, следоветельио, О, должны быть распределены по ззяоиу Пуассона.
Если размер бина А слишком велик, то зта аргументация. Глава !2 вии что все рассматриваемые числа достаточно велики, дискретный характер Оа не важен и распределение Пуассона хорошо аппроксимируется функцией Гаусса. При этих условиях можно использовать табулированные значения вероятностей Р„(хт) Х',) на достаточно законных основаниях. Именно по этой причине мы говорили, что бины должны выбираться таким образом, чтобы ожидаемые отсчеты Е» в каждом бине были достаточно велики (по крайней мере порядка 5).
По той же причине число бинов не должно быть слишком малым. С этими предупреждениями мы приводим значения рассчитанных вероятностей Р„(11т.=ну.",) для небольшого числа выбранных значений с( и ут, в табл. 12.6. Числа в левом столбце предоставляют выбор нз шести значений с(, числа степеней свободы (г(= 1, 2, 3, 5, !О, 15).
Числа сверху над другими столбцами — возможные значения полученных Каждое число в таблице — выраженная в процентах вероятность Р„(хэ) Х',) как функция г( и Х',. Например, для десяти степеней свободы (с( = 10) мы находим, что вероятность получения х' ~ 2 равна 3~~о. Р го Яэ ) 2) = 3 % ° Таким образом, если бы мы получили приведенное значение 1бт, равное 2, в эксперименте с десятью степенями свободы, мы могли бы заключить, что наши наблюдения «значимо» отличаются от ожидаемого распределения, и отвергнуть ожидаемое распределение на 5%-ном уровне значимости (но не на !его-нем уровне). Все вероятности во втором столбце табл. 12.6 равны 100оге, так как получение уз 0 всегда достоверно.
С ростом вероятность получения Хт)хз уменьшается, но характер этого уменьшения зависит от г!. Например, для двух степеней свободы (с( = 2) вероятность Ре(уа ) 1) составляет 37о4, в то время как для г(=15 Рк(ут= 1) составляет 45ого, Заметьте, что Рп(уэ ) 1) всегда велика (по крайней мере не менее 32е~е), поэтому значение у",-, равное 1 или менее, вполне разумно и никогда не приводит к требованию отвергнуть ожидаемое распределение, Минимальная величина атем которая ставит под вопрос ожидаемое распределение, зависит от г(. Для одной степени свободы мы видим, что т,- 'может быть и большим, напри- не совсем верна, так как вероитность для такого бина не мала по сравнению с 1 (что является одним из условна справедливости распределения Пуассона, как упомянуто в раэд.
11.Ц; поэтому мы должны иметь разумное число бинов. Критерий Ха для распределений 239 мер 4, прежде чем расхождение станет «значимым» (на бо/б-ном уровне). В случае двух степеней свободы соответствующая граница равна уа, =3; для а2 = 5 она близка к 2 (фактическн х', = 2,2) и так далее. Используя вероятности из табл. 12.6 (или из приложения Г), мы теперь можем приписывать количественный критерий значимости для значения та„полученного в любом конкретном эксперименте.
В равд. 12.5 приведено несколько примеров. 12.5. Примеры Мы уже довольно подробно проанализировали пример нз равд. 12.1. В этом разделе мы рассмотрим еще три примера, чтобы проиллюстрировать применение критерия уа. Другой пример распределения Гаусса Пример из разд. 12.1 относился к измерениям, результаты которых, как ожидалось, были распределены нормально.