AOP_Tom2 (1021737), страница 10
Текст из файла (страница 10)
хэ-критерий был предложен Карлом Пнрсоном (Реагэоп) в 1900 году (РЫозор51са) Маяахте, Беаеэ 5, 50, 157 — 175). Его замечательная работа рассматривается как фундамент современной математической статистики. Предшественники Пирсона просто строили графики экспериментальных результатов и утверждали, что они правильны. В своей статье Пирсон привел несколько интересных примеров злоупотреблений статистикой. Он также доказал, что некоторые результаты наблюдений за рулеткой (на которой он проводил эксперименты в течение двух недель в Монте-Карла в 1392 гаду) были так далеки от ожидаемых частот, что шансы получить их снова при предположении, что рулетка устроена добросовестно, равны одному из 10ээ! Общее обсуждение Сэ-критерия и обширную библиографию можно найти в обзорной работе Вильяма Дж.
Кокрена (%11ИапЪ С. Сосйгап, Аппа1э Магб. ЯСаб 23 (1952), 315-345). Рассмотрим вкратце теорию, лежашую в основе 1~э-критерия. Легка увидеть, что точные вероятности того, что 1'г — — уы..., У» = уто равны и.' у! >Уг уг( . Ы ' (17) Если предположить, что 1; принимает значение у, с вероятностью Пуассона е шь(ир,)"' и что 1;. независимы, то (1'м..., 1ь) будет равен (ум..., уь) с вероятностью е ня (ир,)"' П и 1~ + + 1'ь будет равно и с вероятностью П е ня (ир,)" е "и" Е у,! и! г!+" +юг=в э=1 ю...г~>е которое, в свою очередь, равно (17). Поэтому можно рассматривать 1„в = 1, ..., )г — 1 квк независимые случайные величины, имеющие распределенне Пуассона н и таяне, что 2.' 1; = и. г=г Теперь удобно сделать замену переменных, У, — ир, (18) поэтому Г = лгг + + г,ьг.
Условие Р~ + . + 1г = и эквивалентно требованию ,гр-, г, + " +, р, гь = о. (19) Рассмотрим теперь (й — 1)-мерное пространство 5 векторов (Я„...,Яь), таких, что выполняется (19). Для больших значений и каждое г, имеет приближенно нормальное распределение (см. упр. 1.2.10-15). Поэтому вероятность попасть в дифференциальный объем дгг... Нгг области Я ириблимсенно пропорциональна величине ехр ( — (гг+ + г~)/2). (Именно из-за этого 1Сг-критерий можно использо- Если предположить, что они независимы, кроме шого, что выполняется условие уг + +Уь = и (т. е, 1;,..., 1'ь г независимы, а 1'ь выражается через 1'м..., 1'ь с помощью этого равенства. — Прим.
ред.), вероятность, что (1ы..., 1'ь) = (ум, уг): равна отношению вать только при больших и.) Вероятность, что Ъ" < с, равна ,)~„,.„) я .»+„,»хи<, ехр( — (»,'+". +г»)/2) Их»...~Ь» (20) ехр ( — (э( + + з»)(2) Их»... Нг» Так как гиперплоскость (19) проходит через начало координат я-мерного простран- ства, в числителе (20) интегрируем по (к — 1)-мерной гиперсфере с центром в начале координат. Перейдя к обобщенным полярным координатам с радиусом г и углами ым..., ы» г, преобразуем (20) в 3, . е 'з'Х» '1(ы„...,ы»-,)йк~)»".4»- ) е х'~эх» »У(им...,ы» э) НХ»(ьл ...
Йо»-э где г' — некоторая известная функция (см. упр. 15). Интегрирование по переменным ым ..., ы» з дает постоянный множитель в числителе и знаменателе, который сокра- щается. Окончательно для приближенной вероятности того, что К < е, получаем формулу д'"е-х'I»Х»-элХ (21) В (21) для переменной интегрирования используем символ "Х'* так же, как Пирсон в своей основополагающей работе. Вот откуда происходит название Х~-критерия.
Если заменить переменную в интеграле 1 = Хэ/2, то интегралы можно выразить в терминах неполной гамма-функции, сведения о которой содержатся в разделе 1.2.11.3. Наконец, приведем определение Хэ-распределения с к — 1 степенью свободы 1пп Рг(Ъ" < с) = у(, -) /Г( — ') . (22) Сейчас вернемся к КС-критерию. В 1933 году А. Н. Колмогоров предложил критерий, основанный на статистике К„= »/й шах ~г„(х) — Г(х)~ = шах(Х~+,К„), (23) Н.
В. Смирнов рассмотрел несколько модификаций этого критерия в 1939 году, предлагая, кстати, проверять отдельно статистики К„+ и К„, как мы это делали выше. Существует большая группа модификаций критерия Колмогорова, но статистики К+ и К„, кажется, лучше всего подходят для использования на компьютере. Обширный обзор литературы, посвященной КС-крнтериям н их обобщениям, можно найти в монографии Дж. Дурбина (Л. Ппгбш, Нея1опа! СопГ. Яег1еа оп Аррйеб Ма»й. 9 (91АМ, 1973)). Для того чтобы изучить распределения К„' и К„, начнем со следующего основного факта. Если Х вЂ” случайная величина с непрерывной функцией распрелеленяя г (х), то Р(Х) — это случайная величина, равномерно распределенная между 0 я 1. Чтобы доказать это, достаточно проверить, что если 0 < у < 1, то Г(Х)< у с вероятностью у.
Так как Г непрерывна, существует такое хе, что Е(хе) = д. Поэтому вероятность, что г'(Х) < у, равна вероятности, что Х < хе. По определению хе последняя вероятность равна Р(хе), а это число, в свою очередь, равно у. Пусть 11 = иЕ(Ху) для 1 < у' < и, где Х„должны быть рассортированы, как на шаге 2 перед формулой (13). Поэтому случайные величины 1' независимы и имеют одно и та же распределение, а именно — равномерное распределение между 0 и и. Они рассортированы в порядке неубывания у'~ < Ут < < У„, и первое равенство в (13) мажет быть преобразовано следующим образом: 1 К;,' = — шах(1 — Уз, 2 — Ую ..., и — 1и).
и Если 0 < ! < и, вероятность, чта К+ < !/,/й, равна, следовательно, вероитности того, чта 1; > у — ! для всех 1 < у < и. Это легко выразить в терминах и-мерных интегралов: .[ „с[у,)"„", Ф.— " ~,",' Ф где а = шах(,у — 1, 0). (24) Л' (у 3."" !у — ".(е"' "у Знаменатель здесь вычисляется моментально; он равен и"/и!. Это выражение имеет смысл, так как гиперкуб всех векторов (уы ую..., у„), таких, что О < у! < и, имеет объем и" и мажет быть разделен на и! равных частей, каждая из которых соответствует одному из возможных способов упорядочения у,.
Найти интеграл, стоящий в числителе, немного труднее. Но его можно вычислить методом, предложенным в упр. 17, и получить общую формулу: (25) (26) Распределение К„точно такое же. Равенство (26) впервые получено Н. В. Смирновым [Успехи мат наук 10 (1944), 176-206) (см. также работу 3. В. Бирнбаума и Фреда Х. Тинги (Е, Ж, В!гпЬашп апб Егер Н. Т!пяеу, Аппа)в Маса. осас. 22 (1951), 592-596)). Смирнов вывел также асимптотическую формулу Рг(К+ < в) = 1 — е ы (1 — -в/ъ/и+ 0(1/и)) (27) для всех фиксированных в > О, что привело к получению приближенных значений для больших и, которые приведены.в табл.
2. Биномиальная теорема Абеля, равенство 1,2.6 — (16), показывает, что равенства (25) н (26) эквивалентны. Можно расширить табл. 2, используя ту либо другую формулу. Существует интересный компромисс: хотя сумма в (25) имеет лишь около вЗ/й членов, когда в = 1/~ и, она должна вычисляться с помощью арифметики с многократной точностью, поскольку члены большие и их главные цифры сокращаются. На такая проблема не возникает в (26), так как члены этой формулы положительны, но (26) имеет и — в,/й членов. УПРАЖНЕНИЯ 1.
[00) Какую строку Х~-таблицы следовала бы использовать, чтобы проверить, будет лн величина Ъ' = 74~- формулы (5) невероятна большой? 2. ]80] Пусть две игральные кости "устроены" так, что на одной из них 1 будет выпадать вдвое чаще., чем любое другое значение, а на другой 6 будет выпадать вдвое чаще, чем любое другое значение. Найдите вероятность р, того, что сумма показаний иа двух игральных костях равна точно е, 2 ( в < 12. ° 3. (83] Игральные кости устроены так, квк описано в предыдущем упражнении. Они были брошены 144 раза, и получились следующие значения. Значениеэ= 2 3 4 5 6 ? 8 9 10 11 12 Число наблюдений 1, = 2 6 10 16 18 32 20 13 16 9 2 Примените ?Г~-критерий к этим значениям, используя вероятности из (1) и считая, что игральные кости на самом деле не поддельные.
Определит ли х~-критерий, что кости плохие? Если нет, объясните., почему. 4. ]83] На самом деле автор получил данные эксперимента 1 из (9), моделируя игральные кости, одна из которых была нормальна, а другая всегда давала только значения 1 или 6. (Причем обозначения появлялись с равными вероятностями.) Подсчитайте вероятности, которыми можно заменить (1) в этом случае, и, используя у -критерий, решите, соответз ствуют ли результаты эксперимента такому устройству игральных костей. 5.
]88] Пусть Г(х) — равномерное распределение (см. риг. 3, (Ь)). Найдите КД, и Кзе для следующих 20 наблюдений: 0.414, 0.732, 0.236, 0.162, 0.259, 0.442, 0.189, 0.693, 0.098, 0.302, 0.442, 0.434, 0.141, 0.017, 0.318, 0.869, 0.772, 0.678, 0.354, 0,718. Проверьте, будут ли наблюдения значимо отличаться от ожидаемого поведения по отношению к каждой из двух проверок. 6. ]М80] Пусть Е~ (х) задано формулой (10) для фиксированного х. Чему равна вероятность, что Р„(х) = е/и, для заданного целого э? Чему равно среднее значение Е„(к)? Чему равно стандартное отклонение? 7. [М?5] Покажите, что К,+, и К„никогда не могут быть отрицательными.
Какое наиболее возможное значение может иметь К„+? 8. ]00] В разделе описывается эксперимент, в котором 20 значений статистики К,+„были получены при изучении случайной последовательности. Эти значения были нанесены на график, чтобы получить рис. 4. КС-статистнка была подсчитана с помощью этого графика. Почему для изучения полученной статистики вместо таблицы при и = 10 использовались табличные значения для и = 20? 9. (80] Описанный в разделе эксперимент состоит в том, что 20 значений К,+р, вычисленных с помощью критерия "максимум-5", который применялся к различным частям случайиой последовательности, наносятся на график.