Диссертация (1137428), страница 8
Текст из файла (страница 8)
В этом случае дляciпроизводящей функции цикловой структурыc(n)справедливопредставлениеnE ti i = H n (t )/H n ( ),гдеci =1nH n ( ) = n![ z n ]exp{a( z; )}, a( z; ) = ii =1zi.iОтсюда следует, что производящая функция для произвольногоконечного числа k начальных членов c1 , c2 ,, ck имеет видkE i =1cti ikzi = n![ z ]expa( z; ) i (t i 1) H n ( ) .i i =1nДалее, используя стандартную технику метода перевала,нетрудно получить, что при n и фиксированных 81kk cE t i i exp i (t i 1), i =1 ii =1что означает асимптотическую независимость величин c1 ,, ckи их пуассоновскую сходимость:L (ci ) i . i (5.2)Утверждение теоремы 8 является следствием этого результата,поскольку для всех A j - циклов параметры в рассматриваемоймодели одинаковы.Следствие.
Наблюдаемые статистики (5.1) асимптотическинезависимы, и при этомL ( j (n)) ( j j ),гдеj =1 i I (i K j ) =iA jl K j j 1.ldjd(5.3)Из этих результатов следует, во-первых, что статистическиевыводы о каждом из параметров j можно делать независимо понаблюдению лишь соответсвующей статистики j (n) , и, во-вторых,исходная проблема в асимптотике сводится к соответствующимстатистическим задачам для пуассоновской модели с неизвестнымпараметром, решение которых достаточно хорошо известно.5.2. Оценивание параметровПустьимеетсяNнезависимыхподстановокs1 ,, s N ,полученных при одном и том же значении неизвестного параметра82 = (1 ,, d ) , и, тем самым, выборка (набор наблюдаемых статистик(5.1))(1( k ) (n),, d ( k ) (n)), k = 1,, N .Какотмеченоасимптотическиво(прип.5.1,n компонентыи(5.4)этихвекторовфиксированныхуровняхцензурирования K j ) независимы и распределены в соответствии с(5.3), поэтому для суммарного числа наблюдаемых A j -цикловNT j = T j ( N , n) = j ( k ) (n)(5.5)k =1будет выполняться предельное соотношениеL (T j ( N , n)) ( N j j ).(5.6)Это соотношение сводит задачу оценивания параметров jнашеймоделикзадачеоцениваниянеизвестногопараметрапуассоновской модели.Известно (см., напр., [10, §3.4]), что оптимальной (т.е.несмещённой с минимальной дисперсией) оценкой сходящегося привсех > 0 степенного ряда ( ) = ai iпо наблюдению надi 0случайной величиной Xявляетсяс пуассоновским распределением ( )статистика * = ai ( X ) i ,гдеi 0( X ) i = X ( X 1)( X i 1), i 1, ( X ) 0 = 1.Учитываяэтоисоотношение (5.6), мы можем сформулировать следующее общееутверждение для нашей модели.83Теорема11.Асимптотическиоптимальнойоценкойсходящегося при всех j > 0 степенного ряда ( j ) = ai ij являетсяi 0статистика * = ai (T j ( N , n))i /( N j ) i ;i 0в частности, асимптотически оптимальная оценка параметра j имеет вид *j = T j ( N , n)/N j .Соотвествующийже -доверительный интервал для(5.7)jасимптотически имеет вид [10,с.287] 11, 12 , 12 2 N j,2T j 2 N,2T j 2 j22(5.8)где 2 p,r есть p -квантиль распределения хи-квадрат с rстепенями свободы.5.3.
Проверка гипотезЕсли требуется проверить какие-то гипотезы о частныхзначениях параметров j в обсуждаемой ситуации, то, на основаниисоотношения (5.6), надо воспользоваться общей теорией дляпуассоновской модели (учитывая при этом специфику тестовыхстатистик T j ( N , n) ) с тем лишь замечанием, что соответствующиеалгоритмы в нашем случае будут иметь характер асимптотическихутверждений.84Продемонстрируем это на конкретном примере проверкипростой гипотезы H 0 : j = j 0 против правосторонней альтернативыH1 : j > j 0 . Известно [10, § 5.3], что в задачах такого типасуществует равномерно наиболее мощный (РНМ) критерий, которыйстроитсяследующимобразом.Обозначим(внашемслучае) 0 = j 0 N j и при заданной вероятности ошибки первого рода определим целое число t условием m m00 e < 0 e 0 '.m =t m!m =t 1 m!'Если(5.9) = ',здесьнерандомизированнымитоискомыйзадаётсякритерийкритическойявляетсяобластью(асимптотически)X = {T j ( N , n) t }.(5.10)Если же в (5.9) имеет место строгое неравенство ( < ' ) , токритерий является рандомизированным и задаётся критическойфункциейпри T j > t ,1,' (T j ) = ', при T j = t ,'при T j < t .0,В любом случае мощность этого критерия при произвольнойальтернативе 1 = j N j > 0 вычисляется по формулеt m'W (1 ) ~ 1 e 1 ( ) 1 e0 1 . 0 m=t 1 m!(5.11)85Замечание 5.
В случае ( < ' ) вместо рандомизированногокритерия можно также использовать нерандомизированные РНМкритерииилиX = {T j t 1}суровнямизначимостисоответственно и (асимптотически).Аналогично анализируется задача ( H 0 , H1 ) с левостороннейальтернативой, а при двусторонней альтернативе критерий задаётсяобъединением двух односторонних критических областей, т.е. имеетвидX = {T j t } {T j t }, 1 2 = .12Замечание 6.
Случай j 0 = 1, j = 1,, d , соответствует наиболееважной для приложений гипотезе о равновероятности подстановок, иизложенная методика даёт новые критерии проверки этой гипотезы,учитывающие широкий класс специальных альтернатив, при которых j 1 для некоторых j .5.4. Большие выборкиЕсли число N наблюдаемых подстановок велико, то можноприменить теорию больших выборок ( N ) и получить болеесильные выводы. В этом случае из (5.5)-(5.6) следует, что длянормированной статистики~ ~T j = T j ( N , n) = T j ( N , n)/(N j )(5.12)справедлива нормальная аппроксимация86j~L (T j ) ~ N j ,N j,(5.13)и тем самым статистические выводы о параметрах j можнополучать, используя соответствующую теорию нормальной модели[9].
Аналогичная ситуация рассматривалась в работе [6], поэтому,следуя ей, можно сформулировать для нашего случая следующиеутверждения.Теорема12.Статистика~Tj(см.(5.12))являетсяасимптотически несмещённой и асимптотически эффективнойоценкой j;параметратакимижесвойствамиобладает~статистика (T j ) как оценка ( j ) для любой дифференциируемойфункции .Теорема 13. Асимптотическим - доверительным интерваломдля параметрической функции ( j ) с непрерывной производной ' ( j ) является интервал (T~ ) z (T~ )j'j1 ~T j /( N j ) , z = 1 , 2 (5.14)где 1 (t ) -обратная функция к стандартной нормальной функциираспределения (x) .Теорема 14. Критерий уровня значимости для проверкигипотезы H 0 : j = 1 при левосторонней альтернативе H1 : j < 1асимптотически задаётся критической областью~X ( N ) = {T j < 1 u / N j }, u = 1 (1 );(5.15)"пороговыми" здесь являются альтернативы вида87t, t > 0,N jH 1N : j = j ( N ) = 1 и мощность критерия (5.15) при таких близких альтернативахудовлетворяет при N соотношениюWN ( j ) = P( X ( N )) (t u ).Аналогично,взадаче( H 0 , H1 : j > 1)критерийуровнязначимости асимптотически имеет вид~X ( N ) = {T j > 1 uN j }(5.16)и его мощность при близких альтернативахH 1N : j = j ( N ) = 1 t, t > 0,N jасимптотически равна (t u ) .Наконец,взадачесдвустороннейальтернативой( H 0 , H1 = H1 H1 ) критерий асимптотически имеет видu~X ( N ) = | T j 1 |> /2 N j (5.17)и его мощность при близких альтернативахH 1N : j = j ( N ) = 1 t, t 0,N jасимптотически равна (t u/2 ) (t u/2 ) .Сформулированныевтеореме14критериипозволяютконтролировать значения отдельных координат параметрического88вектора = (1 ,, d ) .
Вместе с тем желательно уметь такжепроверять гипотезы и о полном этом векторе. Важнейшей такойгипотезой является утверждениеH 0 : 1 = 2 = = d = 1,означающее, что подстановки выбираются равновероятно из S n .Если эта гипотеза справедлива, то из (5.12)-(5.13) следует, чтостатистикиT j* ( N ) = (T j N j )/ N j , j = 1,, d ,асимптотическинормальны N (0,1) , и они асимптотически независимы.Следовательносуммаихквадратовасимптотическираспределена по закону 2 (d ) :d (T N ) 2 2jj 2 (d ).LT ( N ) N jj =1(5.18)Этот результат позволяет сформулировать следующий критерийсогласия для гипотезы равновероятности H 0 , учитывающий всюисходную информацию.Теорема 15. При заданном уровне значимости H 0 отвергаетс я {T 2 ( N ) > 21 ,d }.5.5.
Гипотеза однородностиВыше предполагалось, что в процессе наблюдения надподстановкамиs1 ,, s Nпараметр = (1 ,, d )нашей моделиостаётся неизменным, что на самом деле является гипотезой, котораясама должна быть подвергнута статистической проверке; такая89гипотеза и называется гипотезой однородности.
Здесь предлагаетсяасимптотический (для больших выборок) вариант соответствующегокритерия однородности (§4) .Итак, теперь мы считаем, что каждый из векторов (5.4) получен,вообще говоря, при своём (но неизвестном) значении параметра .Обозначим значение этого параметра для подстановки s k через ( k ) = (1( k ) ,, d( k ) ) . Тогда гипотеза однородности есть утверждениеH 0 : (1) = = ( N ) .В силу предположения о независимости подстановок исоотношения (5.3) можно считать, что при гипотезе H 0 данные( (j k ) (n), k = 1,, N ) = ( X 1 j ,, X Nj )представляютсобойнезависимуювыборку(5.19)израспределенияПуассона ( j j ) при некотором j > 0 (далее для краткостиполагаем j = j j ); при этом, в силу Следствия из п.