Диссертация (1137428), страница 7
Текст из файла (страница 7)
стр.62)следует, что если ввестинормированные статистикиdC A~jCA =, j = 1,, d ,jln n(1.1)то они будут асимптотически независимы и нормальны: d j ~L (C A (n)) ~ N j ,, j = 1,, d .j ln n (1.2)Более того, на основании теорем сходимости для функций отслучайных величин [13,c.335] можно заключить, что для любыхдифференциируемых функций j ( )имеет место аналогичное~утверждение для статистик j (C A (n)) :jd j ~L ( j (C A (n))) ~ N j ( j ), ( 'j ( j ))2, j = 1,, d .jln n Наоснованиисоотношений(1.2)и(1.3)(1.3)можносформулировать следующее утверждение.70~Теорема 8. Если n , то статистика C A (статистикаj~ j (C A (n)) )jявляетсяасимптотическинесмещённойиасимптотически эффективной оценкой для параметра j (длядифференциируемой параметрической функции j ( j ) ), и параметры1 ,…, d оцениваются независимо друг от друга.Соотношение(1.2)позволяеттакжерассчитатьиасимтотический доверительный интервал для параметра j .
Для этогопрежде всего заметим, что (на основании теорем сходимости[13])соотношение (1.2) останется справедливым, если в его правой частизаменить параметр j , входящий в выражение дисперсии, оценкой~C A (n) . Таким образом, при n справедливо также соотношениеj~C A j ( n) jL~ dC A j (n)ln n ~ N (0,1).(1.4)Пусть теперь задан доверительный уровень , 0 < < 1.Определим число z уравнением ( z ) =1 , где (z ) - стандартная2нормальная функция распределения. Тогда из (1.4) следует, что~CA j ( n) jP z <ln n < z =~dC A (n)j~~dC(n)dCAA j ( n) ~~j= P C A (n) z< j < C A ( n ) z~jjlnnlnn~ ( z ) ( z ) = 2 ( z ) 1 = .Это означает, что справедлива71Теорема 9.
Асимптотический доверительный интервалдля параметра j имеет вид~~C A j (n) z dC A j /ln n .Аналогично, на основании соотношения (1.3), строитсяасимптотический доверительный интервал для функции j ( j ) .Однако, чтобы получить в этом случае аналог соотношения (1.4)(с~подстановкой в выражение диспресии статистики C A (n) вместоjнеизвестного параметра j ), необходимо дополнительно потребовать,чтобы производная 'j ( j ) была непрерывна [13]. При выполненииэтого условия искомый -доверительный интервал асимтотическиимеет вид~~~ (C j A j (n)) z j (C A j (n)) dC A j (n)/ln n .В частности, для функции j ( j ) = jсоответствующийинтервал особенно прост:z ~ C A (n) j2d .ln n 72§2.
Многовыборочный случайПустьврассматриваемоймоделинаблюдаетсяN 2независимых подстановок при одном и том же (но неизвестном)значении = (1 , d ) ,параметра(i)(i)(i)C A(i ) (n) = (C A (n), C A (n),C A (n)) есть реализация12dиA -структурыC(n) = (C A (n),, C A (n)) для i -й подстановки, i = 1,, N .1dВведём статистикуT ( N , n) =1 N (i )C A (n) = (T1 ( N , n),, Td ( N , n)).N j =1В условиях теоремы 7 компоненты этого вектора будутасимптотическинезависимыиасимптотическиj jN ln n,ln n , j = 1, , d . Нормированные жеdNd~T j ( N , n) = dT j ( N , n)/ln nбудутасимптотическинормальныстатистикинормальныd j N j ,. Nln n ~Следовательно, T j ( N , n) -асимптотически несмещённая оценкадля j с асимптотической дисперсией, в N раз меньшей, чем у~оценки C A (n) в одновыборочном случае.
Таким образом, при такомjобъединении информации точность оценивания возрастает.73Такжеболееузкимиоказываютсяисоответствующиедоверительные интервалы(точность локализации для неизвестныхпараметров возрастает): асимптотический -доверительный интервал~для j , основанный на статистике T j ( N , n) , имеет вид~~(T j ( N , n) z dT j ( N , n)/(N ln n) ).74§3. Критерий согласияУтверждениетеоремы7позволяетпостроитьновыестатистические критерии для случайных подстановок.Будемобозначатьрассмотреннуюмодель,определяемуюпараметрами = (1 ,, d ) , через H и называть её статистическойгипотезой.
Статистическая задача ставится следующим образом. Мынаблюдаем случайную подстановку s S n и подсчитываем для неёреализацию вектора C (n) = (C A (n),, C A (n)) . Спрашивается, как по1dэтой информации построить и рассчитать статистический критерий,подтверждающий либо опровергающий гипотезу H ? Если гипотезаH справедлива, то вектор C (n) имеет распределение, указанное втеореме. Отсюда следует, что в качестве тестовой статистикиестественно в данном случае использовать статистикуdTd (n) = (C *A (n)) 2 ,jj =1где C *A (n) =jC A ( n) jjdjdln n, j = 1,, d ,ln nкоторая при справедливости гипотезы H имеет, как известно,предельноераспределениехи-квадрат 2 (d ) .Этопозволяетпредложить следующий стандартный критерий согласия хи-квадратдля гипотезы H : при заданной вероятности ошибки первого рода(уровня значимости) 75H отвергаетс я {Td (n) > 12 ,d }.(3.1)где 2p ,d обозначает p -квантиль распределения 2 (d ) .Для этого критерия при n P{Td (n) > 21 ,d | H } ,т.е.
он в пределе имеет требуемый уровень значимости.Дляприложенийособоезначениеимеетгипотезаоравновероятности подстановок H1 :1 = = d = 1. Соответствующаятестовая статистика принимает в этом случае вид:2d dln n Td (n) = C A j ( n) ,ln n j =1d (3.2)а для критерия (3.1) можно вычислить и асимптотическоезначение его мощности Wn = P{Td (n) > 12 ,d | H1n } при«близких»альтернативах видаH1n : j = 1 jln n, j = 1,, d ,(3.3)где j - произвольные фиксированные числа.Для этого заметим, что при таком выборе (3.3) параметров jдля величин C *A (n) можно записать представлениеj C (n) ln n Ajj*d1 o(1),C A ( n) =jlnn/dd76из которого следует, что при гипотезе H 1n случайные величины(C A (n) ln n/d )/ ln n/d , j = 1,, d , распределены асимптотически поjнормальному закону со средними соответственно j / d , j = 1, , d , иединичной дисперсионной матрицей.
Но тогда статистика (3.2) имеет,как известно (см.например, [10, c.144]), в качестве предельногораспределение 2 (d ; 2 ) - нецентральное 2 -распределение с числом1 d 2степеней свободы d и параметром нецентральности = j .d j =12Обозначив через Fd ( x; 2 ) функцию распределения этого закона, мы,следовательно, имеем, что мощность критерия (3.1) для гипотезыравновероятности H 1 удовлетворяет при альтернативах H 1n вида(3.3) следующему предельному соотношению:22lim Wn = 1 Fd ( 1 ,d ; ).(3.4)nВ литературе уже рассматривалась задача проверки гипотезы оравновероятности подстановок с учётом возможных альтернатив. Так,в работе [6] в рамках модели Эвенса предложен соответствующийстатистический критерий, основанный на общем числе циклов C (n)наблюдаемой подстановки (тестовая статистика), и определена егопредельная мощность при альтернативах вида = 1 ln n(аналог(3.3)).
Построенный нами критерий (3.1) "работает" против болееширокого класса альтернатив (3.3) и к тому же использует "болеебогатую" статистику (3.2), т.е. он является более предпочтительным.77§4. Критерий однородностиВ рамках нашей модели можно также ставить задачу проверкигипотезы однородностиH 0 :1 = = d = > 0,(4.1)где -некоторый неизвестный параметр.При гипотезеH0все данныеC A (n), j = 1,, d , можноjdобъединить, и статистика C (n) = C A (n) является асимптотическиj =1нормальнойN ( ln n, ln n),jпоэтому неизвестный параметр состоятельно оценивается величиной ̂ n = C (n)/ln n (см.[6]).
Этопозволяет заменить в статистике (3.2) (в случае справедливостигипотезы H 0 ) параметр его оценкой ̂ n , в результате чего мыполучаем следующую статистику:2d dC ( n) Tˆd (n) = C A j ( n) .C (n) j =1d (4.2)Из общих теорем сходимости для случайных величин(см.,например, [10,c.229]) следует, что при гипотезе H 0 эта статистикараспределена припредложитьn по законуследующий 2 (d 1) . Это позволяетасимптотическийварианткритерияоднородности: при заданном уровне значимости H 0 отвергаетс я {Tˆ d (n) > 12 ,d 1}.(4.3)78§5 . Статистические задачи для случайных подстановок сцензурированными данными5.1.
Случайные подстановки с цензурированными даннымиРанее в исследовании предполагалась известной вся цикловаяпоследовательностьc(n) = (c1 , c2 ,, cn ) ,т.е.имеетсяполнаяинформация о наблюдаемой подстановке, и соответсвующие выводыимеют асимптотический (при n ) характер. Но в этом случае невсегда является реалистичным предположение о том, что мы можемнаблюдать всю цикловую последовательность c(n) . Может быть итак, что наблюдению доступно лишь какое-то ограниченное число kеёпервыхчленовc1 , c2 ,, ck ,-вэтомслучаеговорятоцензурированных (неполных) данных. Статистические задачи дляслучайныхподстановокснеполнымиданнымиводнопараметрической модели Эвенса, когда подстановканаблюдаетсясвероятностью,рамкахs Snпропорциональной c (n ) ( c(n) = c1 c2 cn -общее число циклов подстановкиs ),рассматривались в работе [9].
В настоящей работе аналогичныйподход применяется к описанной выше d -параметрической модели сконгруэнтными циклами.Именно,мыбудемпредполагать,чтовнаблюдаемойподстановке s S n для каждого j = 1,, d доступно подсчёту лишь79число A j -циклов с длинами, не превосходящими заданного уровняK j . В таком случае, пусть j ( n) = ci I (i K j ), j = 1,, d ,(5.1)iA jесть наши исходные данные (количества наблюдаемых A j -циклов).Мы рассмотрим различные вопросы статистического вывода d параметрической модели с конгруэнтными циклами именно по такимнеполным данным (5.1).
При этом мы будем предполагать, чтопорядок подстановки n , а параметры цензурирования K j ,j = 1,, d , фиксированы.Основой для дальнейших выводов будет служить следующееутверждение обасимптотическом распределениинаблюдаемыхстатистик c1 , c2 ,, т.е. начальных членов цикловой структурыподстановки.Теорема10.Дляслучайнойподстановкиsвобщейпараметрической модели с конгруэнтными циклами при n числациклов ограниченной длины асимптотически независимы, и при этомчисло A j -циклов длины i имеет в пределе распределение Пуассона j i .Доказательство.В теории случайных n -подстановок хорошо известен фактасимптотической (при n ) независимости и асимптотическойпуассоновости начальных членов цикловой последовательности80c(n) = (c1 , c2 ,, cn ) случайной равновероятной подстановки, при этом1L (ci ) для любого конечного i .iАналогичное свойство имеет место и для модели Эвенса,причём в этом случае L (ci ) .iЭто свойство асимптотической независимости и пуассоновостичиселцикловпараметрическойконечноймодели,длинысохраняетсясогласноидлякоторойобщейпроизвольнаяподстановка s S n наблюдается с вероятностью, пропорциональной i i , где = (1 ,, n ) , 0 , - параметр меры.