Цепи Маркова (1121219), страница 73
Текст из файла (страница 73)
Тогда при ε = 1 /n1/8 получим, что 1 1 1Cn2P nij (X) − i pij > 1/8 6 4 −1/2 = C 3/2 .nnn nnP −3 / 2Рядnсходится. Значит, по лемме Бореля—Кантелли (см. т. 1,nс. 163) с вероятностью 1 событиеn 1 nij (X) −ni pij >1n 1 /8oпроисходит лишь для конечного числа значений n. Иными словами, с вероятностью 1 неравенство11 nij (X) − i pij < 1/8n·,· — символ Кронекера. В силу стационарности цепи (X m) с.в. I1 , . .
. , Inодинаково распределены, хотя и не являются независимыми.Снова используем неравенство Маркова: для любой с.в. Y > 0 и любого ε > 0 вероятность P (Y > ε) 6 EY 4 /ε4 (обратите внимание напоказатель степени 4 вместо «традиционного» показателя 2 в неравенствеP (Y > ε) 6 EY 2 /ε2). Подстановка XY = (Im − i pij) 16m6n16k6nПредположим, что нам удалось доказать неравенство X 4EIk 6 Cn2 ,Более того, предполагая для простоты, что := min [p ij ] > 0, получим(n)геометрическую (экспоненциальную) скорость сходимости: элементы p ijматрицы Pn удовлетворяют соотношениямpij = X 1 Ik > ε 6i pij > ε = Pnnимеет место для всех достаточно больших n. Этот последний факт влечетза собой сходимость почти всюду в формуле (3.3.27).Чтобы доказать неравенство (3.3.32), представим четвертую степеньв квадратных скобках в правой части неравенства (3.3.31), сгруппировавотдельно слагаемые Ik4 , попарные произведения вида Ik1 Ik32 и попарные произведения вида Ik21 Ik22 .
Используя аддитивность математического ожидания,можно записать X 4XXEIk =E [Ik4 ] +1(k1 6= k2) E [Ik1 Ik32 ] +16k6n+X16k6n1(k1 6=16k1 ,k2 6nk2) E [Ik21 Ik22 ] +16k1 ,k2 6n+XX1(k1 6= k2 6= k3 6= k1) E [Ik1 Ik2 Ik23 ] +16k1 ,k2 ,k3 6n16k1 ,k2 ,k3 ,k4 6n1(k 6= k , ∀6= ) E [Ik1 Ik2 Ik3 Ik4 ]1 1P nij (X) −...n→∞465приводит к оценке1...§ 3.3. Состоятельность оценок. Различные виды сходимости464(3.3.33)Глава 3. Статистика цепей Маркова с дискретным временем∀ , ∈ {1, 2, 3, 4}. Предвосхищая результат последующих оценок, заметим, что первая и вторая суммы в правой части есть O(n), но третья,четвертая и пятая имеют порядок O(n2).
Неравенство (3.3.28) послужитинструментом для оценки сумм во второй, третьей и четвертой строкахравенства (3.3.33). В самом деле, первая сумма в правой части равенства(3.3.33) равна n E [I14 ] , так как с.в. Ik одинаково распределены. В следующих двух суммах слагаемые E [Ik1 Ik32 ] и E [Ik21 Ik22 ] зависят только от разностиk1 − k2 . Это наводит на мысль суммировать по k = k1 и l = |k1 − k2 |. Втораясумма приобретает видXX[E (Ik Ik3+l) + E (Ik3 Ik+l)]16k6n 0<l6n−kи по абсолютной величине не превосходитXn| E (I1 Il3 + I13 Il) |.а это выражение, как мы видим, неплохо оценивается через степень n.Здесь a ∨ b = max(a, b), а последняя оценка в формуле (3.3.35) следует изформулы≈E [I1 ] E [Il3 ]иE [I13 Il ]≈E [I13 ]x 0 p x 0 x 1 [ x l− 1x0 ,x1 ,xl−1 ,xl=Xx0 px0 x1 Jx0 ,x1x0 ,x1+Xx1 ,xl−1 (l− 1)] pxl−1 xl Jx0 ,x1 Jx3l−1 ,xl =3xl−1 pxl−1 xl Jxl−1 ,xl +xl−1 ,xl+Xx 0 px 0 x 1x1 ,xl−1 (lx0 ,x1 ,xl−1 ,xlСогласно соотношению (3.3.30) получаемXXx0 px0 x1 Jx0 ,x1 =x 0 px 0 x 1x0 ,x1− 1)pxl−1 xl Jx0 ,x1 Jx3l−1 ,xl .x0 ,i x1 ,jx0 ,x1−i pij(3.3.38)= 0.Следовательно, в правой части формулы (3.3.38) отличен от нуля только второй член, и в силу соотношения (3.3.28) его абсолютная величинаограничена выражениемX34l−1(1 − ) l−1.(3.3.39)x0 px0 x1 Jx0 x1 pxl−1 xl Jxl−1 ,xl 6 A s(1 − )x0 ,x1 ,xl−1 ,xluivj −i pij .(3.3.36)E [I1 ] .(3.3.37)A = [(1 −∨ ( i pij)] .(3.3.40)| E (I13 Il) | 6 A2 s(1 − ) l−1 .(3.3.41)Из этих оценок следует, что | E (I1 Il3) | не превосходит правой части(3.3.25), что подтверждает первое из соотношений (3.3.37).
Аналогично| E (I13 Il) | не превосходит правой части (3.3.39), что объясняет второе изсоотношений (3.3.37). В дальнейшем мы будем использовать тот факт, чтоаналогичные оценки, разумеется, имеют место и для | E (I 13 Il) |:Итак, для выражения (3.3.34) получена оценка сверху:Конечно, эти произведения математических ожиданий совпадают:E [I1 ] E [Il3 ] = E [I13 ] E [Il ] = E [I1 ] E [I13 ]i pij)nX1<l<∞| E (I1 Il3 + I13 Il) | 6A2 sгде Ju,v =Рассуждения и оценки для четвертой и пятой строк из правой частиформулы (3.3.33) уточняют соответствующие рассуждения, применяемыек ряду (3.3.34).
Поэтому изучим вначале этот ряд. Идея состоит в том,чтобы проверить, что для больших l математическое ожидание произведения приближенно равно произведению математических ожиданий:E [I1 Il3 ]XЗдесь и далее(l−1)22x0 px0 x1 px1 xl−1 pxl−1 xl Jx0 ,x1 Jxl−1 ,xl ,x0 ,x1 ,xl−1 ,xlи используя равенство (3.3.28), перепишем его в видеXx0 ,x1 ,xl−1 ,xlПоэтому для второй суммы из правой части равенства (3.3.33) нужно лишьпроверить, что ряд (3.3.34) сходится.Третья сумма в правой части равенства (3.3.33) неотрицательна, таккак состоит из неотрицательных слагаемых, и не превосходит2(3.3.35)2n(n − 1) max [E (I12 Il2); l > 1] 6 2n2 (1 − i pij) 2 ∨ ( i pij) 2 ,467и равны 0, поскольку множитель E [I1 ] нулевой; см.
равенство (3.3.30).Чтобы уточнить первое соотношение из (3.3.37), запишем общий членE [I1 Il3 ] ряда (3.3.34) в видеX(l−1)3x0 px0 x1 px1 xl−1 pxl−1 xl Jx0 ,x1 Jxl−1 ,xl(3.3.34)1<l<∞E (I12 Il2) =§ 3.3. Состоятельность оценок. Различные виды сходимости466n,16k<n+6>Используем тот факт, что при совпадениимаксимальногорасстоянияlQQс l1 или с l3 один из множителей EIk или EIk сводится к6>«единственному» математическому ожиданию EIk1 и поэтому равен нулю.Тогда, конечно, произведение в правой части соотношения (3.3.43) обращается в 0, а «наихудший» случай — это когда l = l2 (см. ниже).Более точно, предполагая, что max[l1 , l2 , l3 ] велик, получимE [Ik1 ] E [Ik2 Ik3 Ik4 ] = 0, если l1 > l2 , l3 ,E [Ik1 Ik2 Ik3 Ik4 ] ≈ E [Ik1 Ik2 ] E [Ik3 Ik4 ] ,если l2 > l1 , l3 ,если l3 > l1 , l2 .E [Ik1 Ik2 Ik3 ] E [I4 ] = 0,(3.3.44)2× plx2k−x1k −1 pxk3 −1 xk3 Jxk3 −1 ,xk3 plx3k−x1k −1 pxk4 −1 xk4 Jxk4 −1 ,xk4 .233(3.3.45)4Суммирование проводится по состояниям xk1 −1 , xk1 , xk2 −1 , xk2 , xk3 −1 , xk3 ,xk4 −1 , xk4 , и индексы пробегают значения от 1 до s.
Если максимальноерасстояние l достигается при = 1 или = 3, записываем px(lk −−1)=x1 k −1= xk + xk −1 ,xk −1 (l − 1) и разбиваем сумму (3.3.45) аналогично (3.3.38).Тогда для первой и третьей сумм в выражении (3.3.44) получаем оценку X XX X , 6 nA4 sB2 ,16k<n l1 >l2 , l3 >116k<n l3 >l1 , l2 >1где A было определено в формуле (3.3.40), аXB2 =(1 − ) l1 −1 (l1 − 1) 2 .l 1 >2Видим, что первая и третья суммы в выражении (3.3.44) имеют порядокO(n).(l −1)Для второй суммы преобразуем pxk11 xk2 −1 = xk1 + xk1 ,xk2 −1 (l1 − 1) и(l −1)pxk33 xk4 −1 = xk4 −1 + xk3 ,xk4 −1 (l3 − 1), что дает оценку: XX1(k + l1 + l2 + l3 6 n) E (Ik Ik+l1 Ik+l1 +l2 Ik+l1 +l2 +l3 ) 616k<n l1 >l2 , l3 >16 As2XX1(k + l1 + l2 + l3 6 n) (1 − ) l1 −1 (1 − ) l3 −1 6l 1 >l 2 , l 3 >1 s2 X s2 n(n − 1)6A 2(n − k) = A 2.16k<nРис.
3.3.Теперь идея состоит в том, чтобы записать представление, аналогичное(3.3.37): если l равно наибольшему расстоянию между l1 , l2 и l3 и еслиэто l велико, тоY Y E (Ik1 Ik2 Ik3 Ik4 ) ≈ EIk EIk .(3.3.43)l1 =l2 =l3 >1Суммы во второй строке имеют меньший порядок, поэтому будем рассматривать суммы в первой строке. Общий член каждой суммы в выражении(3.3.44) можно записать в видеXl 1 −1xk1 −1 pxk1 −1 xk1 Jxk−1 ,xk1 pxk xk −1 pxk2 −1 xk2 Jxk2 −1 ,xk2 ×1(3.3.42)l2 =l3 >l3 >11(k + l1 + l2 + l3 6 n) E (Ik Ik+l1 Ik+l1 +l2 Ik+l1 +l2 +l3 ).16k<n l1 ,l2 ,l3 >1l1 =l3 >l2 >1X+Xl1 =l2 >l3 >1X+X=X+= 4!E [Ik1 Ik2 Ik3 Ik4 ]16k<nl 3 >l 1 , l 2 >1X16k1 <k2 <k3 <k4 6nl 2 >l 1 , l 3 >1X Xl 1 >l 2 , l 3 >14!469Соответственно, сумма в правой части равенства (3.3.42) разбиваетсяна следующие 7 сумм:X XXX +++подтверждающая, что вторая сумма в правой части равенства (3.3.33)есть O(n).Как уже было сказано, четвертая и пятая строки в правой части равенства (3.3.33) оцениваются схожим образом.
Обсудим в деталях оценкудля последней суммы, так как она более техничная и трудоемкая. Слагаемое E [Ik1 Ik2 Ik3 Ik4 ] не меняется при перестановке индексов k . Далее, онозависит только от попарных разностей k − k , поэтому положим k1 = k,k2 = k1 + l1 , k3 = k2 + l2 , k4 = k3 + l3 и запишем пятую строку в виде§ 3.3. Состоятельность оценок. Различные виды сходимостиГлава 3. Статистика цепей Маркова с дискретным временем46816k<n2Глава 3. Статистика цепей Маркова с дискретным временемТем самым подтверждается гипотеза о том, что последняя строка в правой части соотношения (3.3.33) имеет порядок O(n 2). Четвертая строкав правой части соотношения (3.3.33) оценивается аналогичным образом.Отсюда следует неравенство (3.3.32), и тем самым завершается доказательство равенства (3.3.27).Из приведенных примеров заключаем, что ц.м.д.в. во многом подобны независимым одинаково распределенным наблюдениям; значительнаяразница состоит, конечно, в том, что функция правдоподобия становитсяпроизведением множителей, связывающих пары последовательных состояний:l (x, ) = P (X1 = x1 , .
. . , Xn = xn | X0 = x0) = x0= px0 x1 . . . pxn−1 xn , x = ... .(3.3.46)§ 3.3. Состоятельность оценок. Различные виды сходимостифункции g(i, j), (i, j) ∈ D. Определим с.в. Gk = g(Xk−1 , Xk). Тогда приn → ∞ для любого ∈ Θ и любого начального распределения суммаnPGk n сходится с P , -вероятностью 1:k=1nXп.н.1XGk −→ E eq [G1 ] =nk=1pij g(i, j).(3.3.48)−Xipij ln(pij)i,j∈Iназывается энтропией ц.м.д.в. (Xm) и играет важную роль во многихприложениях.