Цепи Маркова (1121219), страница 76
Текст из файла (страница 76)
Иными словами, мы рассматриваем случай, когда= P изменяется внутри множества P , определенного в формуле (3.1.7),или даже только на множестве его внутренних точек P in из формулы(3.1.8). Как было отмечено в замечании 3.1.1, если P ∈ P in , то матрицаP неприводима и апериодична, значит, имеет единственное инвариантноераспределение .Подробный обзор распределений Лиувилля содержится в статье: Gupta R.
D. , Richards D. S. P. Multivariate Liouville distributions // Journ. Multivariate Anal. 1987. V. 23. P. 233–256.Пример 3.5.1. Напомним (ср. с примером3.1.3), что для цепи с двуk∈Ij∈Ik∈Ij∈IΓ (aij)P = (pij).(3.5.1 б)Здесь параметры bj и aij это неотрицательные числа, i, j ∈ I. Формулы(3.5.1 а, б) следует использоватьс оговоркой, поскольку j и pij удовлетвоPPpij = 1 ∀ i ∈ I, т. е. не являются линейноряют соотношениямj = 1иj4 Ср.с названиями фильмов «Basic Instinct 2», «Last of Mogicans».1−ppq1−qможно отождествитьс парой (p, q), а множество P можно считать замкнутым единичным квадратом [0, 1] × [0, 1] .
Тогда для плотности распределения (3.5.1 б) получимформулуpr(p, q) ==Γ (a11 + a12) Γ (a21 + a22)(1 − p) a11 −1 pa12 −1 qa21 −1 (1 − q) a22 −1 .Γ (a11) Γ (a12) Γ (a21) Γ (a22)(3.5.2)иВспомнив, что 1/B( , ) = Γ ( + ) /Γ ( ) Γ ( ), видим, что получили произведение двух бета-плотностейΓ (bj)Y X Y pijaij −1prΓaik,tr (P) =i∈Iмя состояниями {1, 2} матрицу P =При байесовском подходе неизвестный параметррассматриваетсякак случайный с заданным априорным распределением Πpr . В этом параграфе мы вновь сосредоточимся на случае, когда — это либо пара ( , P),которая меняется внутри множества R, заданного в формуле (3.1.5), либоматрица P, которая меняется внутри множества P , заданного в формуле(3.1.7).
Вопрос в том, что считать «естественным» вероятностным распределением Πpr параметра .Во многих приложениях предполагают, что Πpr это произведение распределений Дирихле (или, более общим образом, распределений Лиувилля). Формально в случае, когда = ( , P), Πpr определяется как плотностьраспределения pr ( , P) относительно меры Лебега d × dP на множествеR из формулы (3.1.5); см. первое уравнение из (3.1.13). Плотность расprпределения имеет в этом случае вид произведения: pr ( , P) = pr0 ( ) tr (P),prгде 0 ( ) совместная плотность распределения элементов j вектора наprчальных состояний , а tr (P) это совместная плотность распределенияэлементов pij матрицы перехода P.
Далее, X Y bj −1b j −1jprbk,= ( j),(3.5.1 а)j0 ( ) = Γ(Из серии «Фильмы, которые не вышли на большой экран».)Байесовские инстинкты 2Последний из БайесовцевСтатистик, начинавший как Частотник,но пришедший к Байесовству4§ 3.5. Байесовский анализ цепей Маркова:априорные и апостериорные распределения4841(1 − p) a11 −1 pa12 −1 ,B(a11 , a12)0<p<11qa21 −1 (1 − q) a22 −1 ,B(a21 , a22)0 < q < 1.Легко считаются все моменты элементов матрицы, например,E [p11 ] =Γ (a11 + a12) Γ (a21 + a22)a11B(a11 + 1, a12)B(a21 , a22) =,Γ (a11) Γ (a12) Γ (a21) Γ (a22)a11 + a12и т. д.
Подробности см. в примере 3.5.4.486Глава 3. Статистика цепей Маркова с дискретным временемУчитывая вышеизложенный факт, распределения Π pr с плотностью(P) типа (3.5.1 б) иногда называют произведениями многомерных бетараспределений.Важную роль играет так называемая интегральная формула Дирихле. В ней содержится известный факт из математического анализа:prZ...AnZxa1 1 −1. .
. xann −1an+1 −1nX1−xidx1 . . . dxn =i=1=Γ (a1) . . . Γ (an+1).Γ (a1 + . . . + an+1)(3.5.3)An =(x1 , . . . , xn) : x1 , . . . , xn > 0,xn+1 00 0 xn+1 0 0∂ (v1 , . . . , vn+1)0 xn+1= det .∂ (x1 , . . . , xn+1).... ....000nXxi 6 1nа a1 , . . . , an+1 положительные числа. Аналитическое доказательствоформулы (3.5.3) довольно громоздкое. Более прозрачное доказательствоможно получить с помощью вероятностных методов; см.
ниже.Доказательство формулы Дирихле (3.5.3) проводится следующим образом. Рассмотрим независимые с.в. Yk ∼ Gam(ak , 1). Совместная плотностьраспределения fY1 ,...,Yn+1 величин Y1 , . . . , Yn+1 — это произведение видаe− (y1 +...+yn+1)an+1 −1ya1 −1 . . . yn+,1Γ (a1) . .
. Γ (an+1) 1y1 , . . . , yn+1 > 0.(3.5.4)V1 = Y1 , V2 = Y2 , . . . , Vn = Yn , Vn+1 = Y1 + . . . + Yn+1Γ (a1) . . . Γ (an+1)V1Vn, . . . , Xn =, Xn+1 = Vn+1 .Vn+1Vn+1Тогда совместная плотность распределения fV1 ,...,Vn+1 с.в. V1 , . . . , Vn+1приобретает видfV1 ,...,Vn+1 (v1 , ..., vn+1) =an+1 −1 nna −1XXe−vn+1 v1 1 ...vnan −1=vn+1 −vi1 vn+1 >vi , v1 , ..., vn > 0.Γ (a1) ... Γ (an+1)i=1i=1an+1 −1nX1−xi.(3.5.5)i=1i=1Доказательство формулы (3.5.3) завершается тем наблюдением, что выражение (3.5.6) определяет плотность распределения (т.
е. неотрицательнуюфункцию, интеграл от которой равен 1).Определение 3.5.2. Для заданных a1 , . . . , an+1 > 0 плотность распределения)1n+1f(x1 , . . . , xn) =xa1 −1 . . . xann −1 ×Γ (a1) . . . Γ (an+1) 1an+1 −1 XnnX× 1−xi1xi < 1 , x1 , . .
. , xn > 0,i=1X1 =. . . 0 x1. . . 0 x2 . . . 0 x3 . .. . . .. .. ... 0 1Теперь, интегрируя по переменной xn+1 , получим совместную плотностьраспределения fX1 ,...,Xn (x1 , . . . , xn) с.в. X1 , . . . , Xn . Прямой подсчет дает дляfX1 ,...,Xn (x1 , . . . , xn) выражениеan+1 −1nXΓ (a1 + . . . + an+1) a1 −1x1. . . xann −1 1 −xi.(3.5.6)Γ (a + . . . + aУдобно использовать такую замену переменных:и−1 a −11n+1e−xn+1 xn+x1 1 . . . xnan −11=Γ (a1) .
. . Γ (an+1)⊂R ,000...0равен xnn+1 . Отсюда получаем следующую формулу для совместной плотности распределения fX1 ,...,Xn+1 с.в. X1 , . . . , Xn+1 :a +...+ai=1fY1 ,...,Yn+1 (y1 , . . . , yn+1) =ЯкобианfX1 ,...,Xn+1 (x1 , . . . , xn+1) =Здесь область интегрирования имеет вид§ 3.5. Байесовский анализ цепей Маркова: априорные и апостериорные распределения 487(3.5.6 а)i=1называется плотностью распределения Дирихле; обозначим ееfDir (x1 , . . . , xn). О векторе X, составленном из с.в. X1 , . .
. , Xn с совместной плотностью распределения f Dir (x1 , . . . , xn), говорят, что он имеетраспределение Дирихле с (векторным) параметром a, или, кратко, Dir(a),и при этом записываютa1 X1 .. . X = ... ∼ Dir(a), где a = a .Xnnan+1488Глава 3. Статистика цепей Маркова с дискретным временем§ 3.5. Байесовский анализ цепей Маркова: априорные и апостериорные распределения 489Возвращаясь к формуле (3.5.1 б), видим, что совместная плотностьраспределения pr (P) с параметрами aij , i, j ∈ I, является произведением поi ∈ I плотностей распределения Дирихле Dir(ai) с векторными параметрамиai = (aij , j ∈ I). Более того, множительесли положить h = 1 и g(s) = (1 − s) an+1 −1 . Здесь a = (a1 , .
. . , an , an+1).б) Выведите формулу Лиувилля (3.5.7) из формулы Дирихле (3.5.3).Решение. а) Уравнение (3.5.6 а) следует из (3.5.8), если выбрать h и g,как указано, непосредственной подстановкой. Значение соответствующейΓXaikk∈IYa −1pijijчислений.б) Интеграл (3.5.7) равенΓ (aij)j∈Iопределяет в этом произведении совместную плотность распределенияэлементов pij , j ∈ I, строки с номером i в переходной матрице P = (p ij).Из формулы Дирихле следует более общая формула Лиувилля:Z...ZZh0g(x1 + . .
. +{xi >0,x1 +...+xn <h}=xn)xa1 1 −1. . . xann −1Γ (a1) . . . Γ (an+1)Γ (a1 + . . . + an+1)dx1 . . . dxn =ZhZg(t)=g(t)ta1 +...+an −1 dt,f(x1 , . . . , xn) = Cg(x1 + . . . +xn)xa1 1 −1. . . xann −1 1(x1+ . . . + xn 6 h),x1 , . . . , xn > 0, a1 , . . . , an > 0. (3.5.8)Здесь g(s), s > 0, — заданная функция, h > 0 — параметр, а C > 0 —нормирующая постоянная, выбранная таким образом, чтоZfLiouv (x1 , .
. . , xn) dx1 . . . dxn = 1.RnУбедитесь, что плотность распределения (3.5.8) совпадает с распределением Дирихле, Dir(a), которое имеет плотностьfDir nP+1 Γajj=1(x1 , . . . , xn) = Qn+1j=1Γ (aj)xa1 1 −1 . . . xann −1an+1 −1 XnnX1−xi1xj 6 1 ,i=1j=1x1 , . . . , xn > 0,(3.5.9)Zh0(3.5.7)верная для любой функции g, для которой интеграл в правой части корректно определен.Пример 3.5.3.
а) Рассмотрите распределение Лиувилля, Liouv(g, h)с совместной плотностью распределенияxa1 1 −1 . . . xann −1 dx1 . . . dxn−1 dt ={x1 +...+xn =t}g(t)Zn n−1Pj= 10LiouvΓ (a1 + . . . + an+1), что вытекает из предыдущих выΓ (a1) . . . Γ (an+1)постоянной C равноx j 6toxa1 1 −1an−1 −1. .
. xn−1n−1 an −1Xt−xjdx1 . . . dxn−1 dt.j=1После замены переменныхy1 =x1x, . . . , yn−1 = n−1ttэтот интеграл приобретает видZh0g(t)ta1 +...+an −1Zn n−1Pj= 1yj 6 1an−1 −1ya1 1 −1 . . . yn−1on−1 an −1X1−yjdy1 . . . dyn−1 dt.j=1В силу соотношения (3.5.3) внутренний интеграл в квадратных скобкахравенΓ (a1) . . . Γ (an),Γ (a1 + .
. . + an)чем и завершается доказательство.Пример 3.5.4. Моменты распределения Дирихле определяются формулойE (X1 1 . . . Xn n ) =ZAnx1 1 . . . xn n fDir (x1 , . . . , xn) dx1 . . . dxn .Глава 3. Статистика цепей Маркова с дискретным временем> −a 1 , . . . ,Γ nP+1E (X1 1 . . . Xn n ) = n+1PΓj=1aj +j=1i=1где a = a1 + . . . + an+1 .Решение. Запишем...AnZxi > 0,Γak (a − ak)a2 (a + 1)(3.5.11)ak alE (Xk Xl) =,a(a + 1)nPi=1 nP+11 −1xa1 1 +ajj=1n −1. .
. xann +1−Xk =(3.5.12)an+1 −1nXxidx1 . . . dxn ,i=1oxi 6 1 , и применим интегральную формулуΓ (a1 +Γ (a1) . . . Γ (an+1)1) . . . Γ (a1 + n) Γ (an+1)= nP+1nPΓaj +jj=1Γ= n+1PΓajj=1aj +j=1nPj=1ji=1Γ (ai).Yk∼ Bet (ak , a − ak).Sn+1aaikijEij = P ,kaijVij = Pkkaikaik − aij2 Pkaik + 1(3.5.13)∼ Dirakala − a k − alXi ∼ Bet(a, na),. i = 1, . . .
, n.(3.5.16)Здесь Вet( , ) означает бета-распределение.Указание. При доказательстве утверждений п. а) и б) сделайте такуюзамену переменных:Yl,Sn+1l = 1, . . . , n,Xn+1 = Sn+1и проинтегрируйте по избыточным переменным. Например, совместнуюплотность распределения x1 и x2 можно записать в видеfX1 ,X2 (x1 , x2) = Cxa1 1 −1 xa2 2 −1 (1 − x1 − x2) an+1 −1 ××Zxa3 3 −1An−2где.(3.5.15)докажите, чтоПример 3.5.5. Проверьте, что среднее значение Eij и дисперсия Vijэлемента (i, j) переходной матрицы с совместной плотностью распределения, задаваемой равенством (3.5.1 б), имеют видP(3.5.14)aв) Для симметричного распределения Дирихле Dir(a), где a = ... ,aXl =nYΓ (ai + i)k.б) Докажите, что совместное распределение имеет вид! j=1 nP+1aik + 1Решение немедленно вытекает из соотношений (3.5.11) – (3.5.12).