AOP_Tom2 (1021737), страница 11
Текст из файла (страница 11)
Мы подсчитали также соответствующие 20 значений Кнл поскатьку К, так же распределены, как и К,"„. Теперь можно объединить 40 значений, полученных таким образом (т. е. 20 значений К еи 20 значений К,е), опять применить КС-крнтерий и получить новые значения Кээе и Кэе. Обсудите ценность этой идеи. ь 10, (80] Предположим, что ~з-статистика подсчитана по результатам и наблюдений, т, е. получено значение %'. Повторим подсчет статистики, используя те же и наблкщений (конечно, получится такой же результат).
Затем суммируем данные обоих испытаний, рассматривая их как единственный х'-критерий с 2п наблюдениями. (Эта процедура нарушает требование независимости всех наблюдений, которое было выдвинуто в разделе; все наблюдения должны быть независимыми.) Каково соотношение между этими двумя значениями 1'? 11. [10) Выполните упр. 1Р, заменив Хз-критерий КС-критерием.
12. [М28) Пусть подсчет Хз-критерия основан на множестве, состоящем из и наблюдений, в предположении, что р, — вероятность тога, что каждое наблюдение соответствует категории з. Предположим, что на самом деле вероятность отнесения наблюдения к категории з Раина ас Ф Р, (см. УпР. 3). Хотелось бы, конечно, чтобы Х~-кРитеРий обнаРУжил тат факт, что предположения р. неверны, Покажите, что это ироизобдеас, если и достаточно велика.
Докажите аналогичный результат и для КС-критерия. 13. [М24) Докажите, что равенства (13) эквивалентны равенствам (11). ь 14. [НМ26) Пусть Яс задана равенствам (18). Покажите, непосредственно используя формулу Стирлинга, что полиномиальные вероятности »„" .,"гго.. гг».-"*1,7г..) — „..„оса-'"1, если Я1,22,...;Ял ограничены при и -+ оа (Эта идея ведет к обоснованию ! "-критерня; она ближе к "основным принципам» и требует меньше усилий, чем доказательство, приведенное в разделе.) 18. [НМ24) Полярные координаты в двумерном пространстве определяются равенствами х = г сов В и у = гяп В. При интегрировании справедливо равенство Ых с(у = г с(го(В. Для более общего и-мерного пространства можно положить 1<1<и, и х„=гяпбс...япВ хл = гзспбс...вспбл 1савбл, Покажите, что в этом случае с(хсс(хз...с)х» = [г» сз!и» 2 В!...япВ 2 с1гс1В1...88 -1[.
ь 16. [НМ85) Обобщите теорему 1.2.11.3А, чтобы найти значение у(я+ 1, х+зл/йхх+ у)/Г(х+ 1) для больших х и фиксированных у, х, Опустите члены ответа, илзеющие порядок 0(1/х). Используйте этот результат, чтобы найти приближенное решение 4 уравнения 7(-, -) /Г(-) = Р для больших сг и фиксированных р, таким образом получив асимптотическне формулы, приведенные в табл. 1. [Указание. См. упр. 1.2.11.3-8 ) 1Т.
[НМ28) Пусть 4 — фиксированное число. Для 0 < й < и положим Г Г*" Г*л+2 С'2»э г с *2 Ргс,(*) = ~ с1х„о/ б~„ъ, ... / с/ ~ с4х ... / с( г -С .-1-С Л+1-С а о по определению пусть Род(х) = 1. Докажите следующие соотношения. Г*+' Г " С' с л+ 2 Г л»с Г*' а) Р»л(х) = / Ых» /[ с(х„с ... /[ 24хлс.г / бхл ... / 24х!. »-1 2+! Ь) Р»а(х) = (х+1)»/и! — (х+1)" '/(и — 1)!.
(й — 1)л с) Р„л(х) — Р»сл ю (х) = , Рс„ „!2(х — сс), если 1 < к < и. б) Кролсе того, получите общую формулу для Р„л(х) и примените ее к вычислению (24). 18. [М20) Найдите "простое" объяснение, почему К,, имеет та же распределение, что и К+. 19. [НМ40] Предложите критерий, аналогичный критерию Колмогорова-Смирнова, для применения к многомерным распределениям Г(хм..., х,) = Рг(Х~ < хм...,Хг < х ).
(Мажете использовать такие процедуры, как, например, "критерий серий" (см. следующий раздел).) 20, [НМ41] Получите следующие члены асимптотического разложения для КС-распределения, продолжив (27). 21. [М40] Хата в разделе говорится, что КС-критерий может применяться только тогда, когда 2(х) — непрерывная функция распределения, конечно, можно попытаться вычис- лить К„+ и К„, когда распределение имеет скачки. Проанализируйте возможное поведение К~ и К,, для различных разрывных распределений г (х). Сравните эффективность по- лученных статистических критериев с 1~-критерием на нескольких выборках случайных чисел.
22. [НМ40] Исследуйте "подправленный" КС-критерий, предложенный в ответе к упр. 6. 23. [М22] (Т. Гонсалес (Т. Сапза1ег), С. Сахни (Б. БаЬп1) и В. Р. Франта (%'. В. Егапса).) (а) Предположим, что максималыюе значение в формуле (13) для КС-статистики К„+ при- нимается для данного индекса 1', когда [пЕ(Х )] = /с.
Докажите, что Н(Х;) шах (2 (Х,) [ [пЕ(Х;)] = к). (Ь) Напишите алгоритм для вычисления К+ и К„за 0(п) 1<се шагов (без сортировки). ь 24. [40] Проведите опыты с различными вероятностными распределениями (р, д, т) трех категорий, .где р+д+г = 1, вычисляя точное распределение Хз-статистики у для различных и и тем самым определяя, насколько точным является приближение Х~-распределения с двумя степенями свободы. 26.
[НМ2б] Предположим, чта У, = 2 „". ацХ + Р, для 1 < 1 < т, где Хм ..., Մ— независимые случайные величины со средним, равным нулю, и единичной дисперсией. Матрица А = (аа ) имеет ранг и. а) Выразите ковариационнуюматрицу С = (с„), где с; = Е(1; — рч٠— Р,), в терминах матрицы А. Ь) Докажите следующее: если С = (са) — любая матрица, такая, что ССС = С, то статистика И' — ~~ (1; — Р,)(у) — Р,)с, им 1 1 равна Х~ + . + Х~. [Следовательно, если Х; имеют нормальное распределение, Иг имеет кз-распределение с п степенями свободы.) Устойчивость среднего при бросании монеты определяется законом, ...
который гарантирует, что вы не разоритесь сами, слишком много теряя, и не Разорите своик оппонентов, глишком много выигоывая. — ТОМ СТОППАРД (ТОМ БТОРРАПО), Розенкранц и гилденстеон мертвы (1966) 3.3.2. Эмпирические критерии В атом разделе рассматриваются одиннадцать специфических критериев, которые традиционно применяются для проверки, будет ли последовательность случайной. Обсуждение каждого критерия разбивается на две части: (а) "краткое" описание способов примеиения; (Ь) теоретическое обоснование.
(Читатель, ие привыкший к математическим рассуждениям, может пропустить теоретические выкладки, С другой стороны, математически подготовлеиный читатель может найти приведенную теорию весьма интересной, даже если он никогда ие собирается проверять генераторы случайных чисел, так как здесь вводятся некоторые понятия комбинаторики. Действительно, в этом разделе вводится несколько важных понятий, представляющих для нас интерес в связи с совершеино иными вопросами.) Каждый критерий примеияется к последовательности (~ л) По~ Пм П2~ действительных чисел, которые, как предполагается, независимы и равномерно распределены между 0 и 1. Некоторые из этих критериев предназначены непосредственно для целочислеииых последовательностей, а не для последовательностей действительных чисел (1).
В таком случае вместо иее используется вспомогательная последовательность (2) (1 л) — 1 01 1 21 1 2 ~ определеииая правилом У„= (гК7„). (3) Это последовательность целых чисел, которые, как предполагается, независимы и одинаково распределены между 0 и о' — 1. (Иначе говоря, вероятность, что случайная величина примет значение к, к = О,..., и' — 1, равна 1/Н. — Прим.
ред.) Число д выбирается таким, чтобы его было удобно использовать в том либо ином смысле. Например, можно выбрать и' = 64 = 22 на бинарном компьютере так, что 1;, представляет шесть старших двоичных разрядов двоичного представления числа У„, Значение 4 должно быть достаточно большим, чтобы критерий был значимым, но не настолько большим, чтобы критерий стал практически неприменимым.
Введенные выше обозначения Ул, у~л и Н будут использоваться в этом разделе, хотя значение Н будет, вероятно, изменяться в различных критериях. А. Критерий равномерности (критерий частот). Первое требование, предьявляемое к последовательности (1), состоит в том, что ее члеиы — это числа, равномерно распределенные между 0 и 1. Существует два способа проверить это.
(а) Использовать критерий Колмогорова-Смириова с г'(х) = х для 0 < х < 1. (Ь) Использовать последовательность (2) вместо (1), где Ы вЂ” подходящее число, например 100 на десятичном либо 64 или 128 — на бинарном компьютере. Для каждого г, 0 < г < о, подсчитаем число случаев, когда 11 = т для О < у < и, а затем применим тт-критерий, принимая я = И и вероятности р, = 1/д для каждой категории. Описаний и обосновэлие этих критериев приведено в разделе 3.3.1. В. Критерий серий. Более общее требование к последовательности состоит в том, чтобы пары последовательных чисел были равномерно распределены независимым образом.
В конечном счете Солнце восходит так же часто, как и заходит, но это не делает его движение случайным. В критерии серий просто подсчитываем число случаев, когда пара (1'2,, У22 ы ) = (д,г) дня О < 2 < л. такая операция осуществляется для каждой пары целых чисел (д,г), таких, что О < е, г < Н. Затем применяем аз-критерий к этим к = Иэ категориям, где 1/И~ — вероятность отнесения пары чисел к каждой из категорий. Как и для критерия равномерности, Н вЂ” подходящее число, но оно должно быть немного меньшим, чем значения, предложенные выше, так как значимый у~-критерий должен иметь и сравнительна большим по сравнению с к (скажем, по крайней мере и > 5Н~), Ясно, что можно обобщить этот критерий для троек, четверок и т. д. вместо пар (см.
упр. 2). Тогда значение и' необходимо существенно уменьшить для того, чтобы число категорий не получилось слишком большим. Поэтому при рассмотрении четверок и больп:нх серий чисел используются менее точные критерии, такие как покер-критерий и максимум-критерий, описанные ниже. Заметим, что 2п чисел последовательности (2) использовались в этом критерии для того, чтобы сделать и наблюдений. Было бы ошибкой применять критерий серий к парам (1'е,У~), (1'ы1е), ..., (1'„ы1'„). Может ли читатель сказать, почему? Но можно применить критерий серий еще и к парам (уз ~~,1эз,т), ожидая, что наша последовательность удовлетворит этим двум проверкам.
Однако нужно помнить, что эти проверки на самом деле взаимозависимы. С другой стороны, Джордж Марсалья (Сеогйе Магэай!1а) доказал, что если использовать пары (1о,1ь), (ум1э), ..., (1н м 1'„) и применить обычный Кз-критерий для вычисления обеих статистик Я для критерия серий и $'~ — для критерия частот по 1'е,..., 1'„~) с тем же значением Н, то случайная величина Ъв — 1~~ будет иметь Хэ-распределение с И(И вЂ” 1) степенями свободы, когда и достаточно большое (см. упр.