Цепи Маркова (1121219), страница 68
Текст из файла (страница 68)
для марковских выборок аналогично определениюо.м.п. для н.о.р. выборок: о.м.п. ∗ (x) параметра задается так:argmax L(x, ) (полное правдоподобие),∗(3.2.5)(x) =argmax l(x, ) (приведенное правдоподобие).Как и в случае н.о.р. выборок, чаще оказывается проще максимизировать логарифмы функций правдоподобия L (x, ) = ln L(x, ) и l(x, ) == ln l(x, ). Обычно будем полагать, что параметр — это вся матрицаперехода P, а вектор начальных вероятностей совпадает с инвариантнымраспределением . Таким образом, полная функция правдоподобия имеетвидnYL(x; P) = x0pxk−1 xk ,(3.2.6 а)k=1и соответствующий логарифм правдоподобияL (x, P) = lnx0+nXln pxk−1 xk ,(3.2.6 б)k=1Тогда имеет место критерий факторизации: T является достаточтогда и только тогда, когда функцияной статистикой дляправдоподобия fX (x, ) может быть записана в виде произведенияg(T (x), )h(x) для некоторых функций g и h, где h(x) не зависит от .Доказательство повторяет аргументы, приведенные для (дискретных) н.о.р.выборок (см.
том I, с. 261).Пример 3.2.1. Достаточная статистика (в данном случае векторная)для функций правдоподобия (3.1.2) задается парой (x 0 , {nij }) (и {nij }в случае функции (3.1.3)), где {nij } — набор из чисел переходов i → jв выборке x.Другое свойство, которое следует упомянуть, — это несмещенность.называется несмещенной, если для любогоОценка b (x) параметра∈ Θ математическое ожидание E b (X) относительно вероятностногораспределения P совпадает с . (Параметр может быть скалярным иливекторным.)=Пример 3.2.2. Рассмотрим функцию правдоподобия (3.2.2), где= — инвариантное распределение для матрицы P . Будем рассматриватьслучай, когда вся матрица P является параметром: = P, и будем опускатьi pij .k=11,P 1 (X = x | T (X) = t) = P 2 (X = x | T (X) = t) ∀В этой связи выглядит естественным следующее определение.
Назовем функцию T (x) (в общем случае векторнозначную) достаточнойстатистикой (для ), если для любой выборки x условная вероятностьP (X = x | T (X) = t) не зависит от ∈ Θ, где t обозначает значениестатистики T в x: t = T (x). Формально запишем=nТогда функции правдоподобия L (x) и l (x) из формул (3.1.2) и (3.1.3)записываются в видеYY(pij) nij (полная) и l(x, ) =(pij) nij (приведенная).L(x, ) = x0E(3.2.1)n1 XE1(Xk−1 = i, Xk = j) ==число таких пар (xm−1 , xm), что xm−1 = i, xm = j.h n (X) iijm=11(xm−1 = i, xm = j),nXверхние индексы в обозначениях P и E .
Тогда nij /n является несмещенной оценкой вероятности P (Xk−1 = i, Xk = j) = i pij . В самом деле,nij (x) =437переходов i → j в выборке x:§ 3.2. Функции правдоподобия, I. Оценки максимального правдоподобия436где = ( i , i ∈ I) представляет собой инвариантное распределение дляматрицы P. Приведенную функцию правдоподобия определяют следующимобразом:nYpxk−1 xk ,(3.2.7)l(x, P) =k=1438Глава 3.
Статистика цепей Маркова с дискретным временема ее логарифм§ 3.2. Функции правдоподобия, I. Оценки максимального правдоподобияТогда(3.2.8)Cov(Xj , Xj+1) = E (Xj Xj+1) − E (Xj) E (Xj+1) == P (Xj = Xj+1 = 1) − P (Xj = 1) P (Xj+1 = 1) =Например, в примере 3.1.3 матрица перехода имеет вид1(3.2.10)Компоненты вектора x равны xj = 0 или 1, 0 6 j 6 n.
Следовательно,соотношение (3.2.6 а) принимает вид 1 p+qpx0 +n01 (1 − p) n00 q1−x0 +n10 (1 − q) n11 ,(3.2.11)(3.2.13)как функции от q и p.В некоторых приложениях могут представлять интерес параметры p + qи = |p − q|; перепишите матрицу P в терминах параметров p + q и .б) Докажите, что Cov(Xj , Xj+k) = k ∀ k > 1.Решение. а) Легко проверить, что инвариантное распределение имеетвидqp,.0 =1 =p+qp+qpp2pq−=,p+q(p + q) 2(p + q) 21− −21− +21+ +21 + −2P==p−q и и=1 − −2(1 − ),1− +2(1 − ),2) если p < q, то= q − p и матрица P получается из предыдущейперестановкой строк, а — перестановкой компонент.б) Прямые вычисления оказываются слишком громоздкими, и зачастуютрудно избежать ошибок.
Чтобы их обойти, заметим, что характеристический многочлен det(I − κ P) матрицы P, заданной формулой (3.2.9), имеетвид(1 − p − κ) (1 − q − κ) − pq,а его корни κ = 1 и κ = 1 − p − q = являются собственными значениямиматрицы P. Кроме того, мы знаем, что = ( 0 , 1) является собственнойвектор-строкой матрицы P, соответствующей собственному значению 1.Иными словами, выражениеCov(Xj , Xj+1)p,Var Xj Var Xj+1== Corr(Xj , Xj+1) = 1 − p − q.Для краткости часто опускают аргумент x и/или параметр P в L(x, P)и l(x, P).Пример 3.2.3.
а) Пусть (Xm) — ц.м.д.в. с двумя состояниями, находящаяся в равновесии и имеющая стохастическую матрицу вероятностейперехода P (см. соотношение (3.2.9)), где 0 < q, p < 1. Вычислите ковариацию Cov(Xj , Xj+1) = E (Xj Xj+1) − E (Xj) E (Xj+1) и коэффициент корреляции= Corr(Xj , Xj+1) = pТогда 1) если p > q, то(3.2.12)21−иа соотношение (3.2.7) выглядит следующим образом:l = pn01 (1 − p) n00 qn10 (1 − q) n11 .1а это выражение равно Var Xj+1 , поскольку цепь находится в равновесии.Следовательно,qqVar Xj Var Xj+1 = pq (p + q) 2 = 1 − 21L==p=.p+qq=,p+qVar Xj = E (Xj2) − (E (Xj)) 2 = E (Xj) − (E (Xj)) 2 =таково:1)Далее,= ( 0,где 0 6 p, q 6 1, (3.2.9)pp2pq(1 − q) −=(1 − p − q).p+q(p + q) 2(p + q) 2i = 0,i = 1,=01 − p,1 − q,21Corr(Xj , Xj+1) =− 21= 1 − p − q,21 − 11 p11и инвариантное распределение(−1 p111−ppP=, т. е.
pii =q1−q=ln pxk−1 xk ,k=1nXl(x, P) =439440Глава 3. Статистика цепей Маркова с дискретным временем(k)1 p11− 21,21 − 1Cov(Xj , Xj+k)=Var XjCorr(Xj , Xj+k) =включающее в себя: 1) нижний правый элемент p11 матрицы P и 2) правуюкомпоненту 1 собственной вектор-строки с собственным значением 1,задает второе собственное значение матрицы P. Это верно для любойстохастической (2 × 2)-матрицы P.Теперь очевидно, что(k)где p11 нижний правый элемент стохастической матрицы P k , а векторснова является собственным с собственным значением 1. Таким образом,Corr(Xj , Xj+k) должна совпадать со вторым собственным значением матрицы Pk , которое есть не что иное, как k .Рассмотрим сначала вопрос о корректности определения о.м.п.
как решения уравнения максимального правдоподобия. Для определенностипредположим, что параметр — это матрица перехода P. Этот параметрпредставлен точкой множества P , заданного формулой (3.1.7). Напомним,что мы предполагаем, что матрица P неприводима и апериодична: P ∈ P IA .Мы уже видели, что о.м.п. p∗ij вероятности перехода pij для приведеннойфункции правдоподобия l(x, P) легко вычисляется:p∗00 =n00,n00 + n01p∗01 =n01,n00 + n01p∗10 =n10,n10 + n11p∗11 =n11.n10 + n11Однако анализ о.м.п.
для полной функции правдоподобия L(x, P) оказывается намного сложнее, и на данный момент он был формально выполнентолько для ц.м.д.в. с двумя состояниями. Соответствующие вычисленияпредставлены в примере 3.2.4.Пример 3.2.4. Рассмотрим ц.м.д.в. с двумя состояниями в равновесиис такой матрицей перехода P, как в (3.2.9), где q + p > 0. Это приводит к единственному инвариантному распределению, которое определяетсяформулой (3.2.10). Предположим, что n > 1, т. е. рассмотрим хотя бы тринаблюдения. В терминах числа появившихся переходов это означает, чтоn00 + n01 + n10 + n11 > 1.Чтобы найти о.м.п. параметра = P для функции правдоподобия L,заданной в формуле (3.2.11), нам необходимо найти точку максимума Pправой части этой формулы относительно p и q, 0 6 p, q 6 1, p + q > 0.Начнем с вырожденного случая, когда n00 (x0 + n01) (1 − x0 + n10)n11 = 0,т.
е. когда хотя бы один переход не появляется в выборке x.Вначале предположим, что x0 + n01 = 0. Ясно, что тогда xj = 0 ∀ j == 0, . . . , n, а следовательно, n00 = n, 1 − x0 + n10 = 1, n11 = 0 иL =q(1 − p) n .p+q§ 3.2. Функции правдоподобия, I. Оценки максимального правдоподобия441Очевидно, при p = 0 достигается максимум L = 1 для любого 0 < q < 1.Иными словами, о.м.п.
оказывается неединственной и имеет вид10P = q 1 − q , 0 < q < 1,(3.2.14)что определяет 0 как поглощающее состояние. Симметричный случай1 − x0 + n10 = 0 рассматривается аналогично.Если (x0 + n01) (1 − x0 + n10) > 0, но n00 = n11 = 0, то (единственной)о.м.п. является p = q = 1 и 0 1(3.2.15)P= 1 0(детерминированный скачок в другое состояние).Далее предположим, что (x0 + n01) (1 − x0 + n10) > 0, но n00 = 0 и n11 > 1.Тогда1px0 +n01 q1−x0 +n10 (1 − q) n11 .L =p+qЛегко видеть, что для достижения максимума L следует взять наибольшеевозможное значение p, т.
е. p = 1. Далее, максимум относительно q недостигается для граничных значений q = 0 или 1, где L обращаетсяв нуль, а достигается во внутренней точке q ∈ (0, 1). Чтобы найти этуточку, возьмем логарифм ln L , подставим p = 1 и продифференцируемпо q:∂∂11 − x0 + n10nL =ln L =−+− 11 .(3.2.16)∂qp=1∂qp=1Равенство ∂ ln L /∂ qp=11+qq1−q= 0 приводит к квадратному уравнению для q:− (n10 + n11 − x0)q2 − (1 + n11)q + 1 − x0 + n10 = 0с корнямиq± =− (n11 + 1) ±p(n11 + 1) 2 + 4(n10 + n11 − x0) (1 − x0 + n10),2(n10 + n11 − x0)(3.2.17)из которых мы выбираем q+ , со знаком плюс перед квадратным корнем.Таким образом, в рассматриваемом случае о.м.п. единственна:01.(3.2.18)P= ++q1−q442Глава 3.