Диссертация (1150940), страница 13
Текст из файла (страница 13)
Ar Ω ( Ω – достоверное событие), Ai Aj при i j .81Множество всех возможных векторов вероятностей p ( p1 ,..., pn ) есть(n 1) -мерныйсимплексS n1 { p ( p1 ,..., pn ) : p1 ... pn 1, pi 0, i 1,..., n} ,лежащий в n -мерном евклидовом пространстве R n . Таким образом, имеет местонеопределенность выбора вектора p ( p1 ,..., pn ) из множества S n1 R n , которая,согласноТ.Байесувероятностей,то[91],моделируетсяестьзаданиемрандомизациейслучайноговектораэтоговектора~p (~p1 ,..., ~pn ) ,принимающего значения из множества S n1 и определяемого некоторойплотностью распределения f ~p ( p) f ~p ( p1 ,..., pn ) , p S n1 .Подставляя случайные компоненты ~p1 ,..., ~pr рандомизированного векторавероятностей ~p в формулы, определяющие плотность распределения f ( x; p) ,функцию распределения F ( x; p) , математическое ожидание μ( p) и дисперсиюσ 2 ( p) случайной величиныp1 ,..., pr ,получаемхарактеристик~xкак соответствующие функции параметроврандомизированныеэтойслучайнойаналогивеличины:указанныхчетырех~f ( x) f ( x; ~p ) f ( x; ~p1 ,..., ~pn ) ,~~ ( ~F ( x) F ( x; ~p ) F ( x; ~p1 ,..., ~pn ) , p) 2 ( ~p1 ,..., ~pn ) .p) ( ~p1 ,..., ~pn ) , ~ 2 2 ( ~Введем следующие обозначения и запишем очевидные соотношения дляматематических ожиданий pi , начальных моментов второго порядка pi2 ,дисперсий δi2 , стандартных отклонений δi , смешанных начальных моментоввторого порядка pi p j и ковариаций δi j компонент ~p1 ,..., ~pn рандомизированноговектора вероятностей ~p :pi2 δi2 pi2 ,pi E ~pi , pi2 E ~δi2 D ~pi pi2 pi2 ,pi p j E ~pi ~p j δi j pi p j ,δi j cov( ~pi , ~p j ) pi p j pi p j .В качестве искомых оценок ожидаемых (усредненных) значений~~рандомизированных характеристик f ( x) , F ( x) , μ~ , σ~ 2 случайной величины X82~~естественно взять их математические ожидания f ( x) E f ( x) , F ( x) E F ( x) ,~ , σ 2 E σ~ 2 , которые можно найти по формулам:μEμn~f ( x) E f ( x) E f ( x; ~p ) pi f ( x; i ) ,i 1n~F ( x) E F ( x) E F ( x; ~p ) pi F ( x; i ) ,i 1n E ~ E ( ~p ) pii 1d i 1 d i,2nnd i21 d i 1 d i d i2(d i 1 d i ) 222 ~22~ E E ( p ) pi [ i pi )]34i 1i 1n(d i 1 d i ) (d j 1 d j ) 2 ( i j pi p j ).4i , j 12i jВ качестве оценки среднего значения рандомизированного стандартногоотклонения σ~ можно взять величину 2 .Рандомизация вероятностей p1 , p2 , , pn альтернатив A1 , A2 , , An можетпроизводиться посредством различных распределений способами.
К достаточнопростым формулам приводит распределение Дирихле, которым мы ивоспользуемся.Сначала рассмотрим простейшую систему альтернатив A1 , A2 , A1 A2 Ω ,A1 A2 , вероятности которых суть p1 P( A1 ) , p2 P( A2 ) , p1 p2 1 , 0 pi 1,i 1,2 . Предполагается, что неизвестный вектор вероятностейпринадлежит одномерному симплексуp ( p1 , p2 )S1 { p ( p1 , p2 ) : p1 p2 1, pi 0, i 1,2} ,расположенному в двумерном евклидовом пространстве R 2 . Неопределенностьвыбора вектора вероятностейp ( p1 , p2 )из множества S1 моделируетсярандомизацией этого вектора, то есть заданием случайного вектора ~p ( ~p1 , ~p2 ) ,принимающего значения из множестваS1и определяемого некоторойплотностью распределения f ~p ( p1 , p2 ) .В байесовской статистике задача [26] оценки параметра p1 (второйпараметрp2однозначноопределяется83первым:p2 1 p1 )плотностираспределения f ~p ( p1 , p2 ) обычно ставится как задача оценки параметра p1биномиального распределения [26]:~ m /~f m~1 (m1 / p1 ) P({m11 p1 p1}) m!p1m1 (1 p1 ) m2 ,m1!m2 !где m1 m2 m , p1 есть вероятность осуществления события A1 в одномиспытании, m~1 ( m1 ) – случайная частота (наблюдаемая частота) появлениясобытия A1 в m испытаниях.
Таким образом, величина f m~ (m1 / p1 ) есть условная1вероятность появления события A1 ровно m1 раз при условии, что вероятностьпоявления этого события в одном испытании равна p1 .Неопределенностьслучайнымвыборомвыбораэтогозначениязначения,параметрат.е.p1описываетсярандомизациейпараметрабиномиального распределения, дающей случайный параметр ~p1 , имеющий~бета-распределение с параметрами v1 0 , v 2 0 . Иными словами, ~p1 (v1 , v2 ) ,~где (v1 , v2 ) есть непрерывная случайная величина, описываемая плотностьюf ~p1 ( p1 ) f ~ ( p1 ; v1 , v 2 ) p1v1 1 (1 p1 ) v2 1,(v1 , v 2 )где (v1 , v 2 ) есть бета-функция (эйлеров интеграл первого рода), задаваемаяформулой1(v1 , v 2 ) x v1 1 (1 x) v2 1 dx 0(v1 )(v 2 ),(v1 v 2 )где, в свою очередь, v - гамма-функция:(v) x v 1 exp ( x) dx , v 0 .0Для натуральных значений аргумента v гамма-функция, как известно,принимает вид простого факториала (v 1)!.Тогда формулу плотности f ~p ( p1 ) можно переписать в виде:1f ~p1 ( p1 ) f ~ ( p1 ; v1 , v2 ) (v1 v2 ) v1 1p1 (1 p1 ) v2 1 , p1 (0,1) .(v1 ) (v2 )84В этом случае можно получить оценки математическое ожидание и~стандартное отклонение рандомизированной вероятности ~p1 (v1 , v2 ) :~p1 E ~p1 E (v1 , v2 ) v1,v1 v2v1 v 2.(v1 v 2 ) 2 (v1 v 2 1)~ 1 D ~p1 D (v1 , v2 ) Из этих формул нетрудно выразить параметры v1 , v2 :v2p1 p 2 1, 2221v1 p1v , v 2 p 2 v ,δ12 δ22 .С помощью формулы полной вероятности получаем формулу для~ m }) появления события A ровно mбезусловной вероятности f m~ (m1 ) P({m11111раз в серии из m независимых испытаний:1~ m }) f ~ (m / ~f m~1 (m1 ) P({m11 m1 1 p1 p1 ) f ~p1 ( p1 ) dp1 0m ! (v1 m1 , v 2 m2 ).m1! m2 !(v1 , v2 )Далее, из очевидного соотношения f m~ (m1 / ~p1 p1 ) f ~p ( p1 ) f ~p ( p1 / m1 ) f m~ (m1 )111получаем выражение для условной плотности распределениярандомизированного параметра1f ~p* ( p1 / m1 )1~p1* , полученной при условии, что вmнезависимых испытаниях событие A1 появилось ровно m1 раз:f ~p* ( p1 / m1 ) f m~1 (m1 / ~p1 p1 ) f ~p2 ( p2 )f m~1 (m1 )1.Данное соотношение обычно называется «формулой Байеса».
Подставляяв него выражения для условного распределения f m~ (m1 / p1 ) , для распределения1f m~1 (m1 ) и для плотности f ~p1 ( p1 ) , получаем:f ~p* ( p1 / m1 ) 1p1v1 m1 1 (1 p1 ) v2 m2 1(v1 v 2 m)p1( v1 m1 )1 (1 p1 ) ( v2 m2 ) 1 .B(v1 m1 , v 2 m2 )(v1 m1 )(v 2 m2 )85Отсюда следует, что условная случайная вероятность ~p1* , задаваемаяусловной плотностью распределения f ~p ( p1 / m1 ) , имеет бета-распределение с*1~параметрами v1* v1 m1 , v2* v2 m2 : ~p1* (v1 m1 , v2 m2 ) , m1 m2 m .Тогда математическое ожидание и дисперсию условной случайнойвероятности ~p1* :~p1* E ~p1* E (v1 m1 , v2 m2 ) ~[ 1* ]2 D ~p1* D (v1 m1 , v2 m2 ) v1 m1,v1 v2 m(v1 m1 ) (v2 m2 ).(v1 v2 m) 2 (v1 v2 1)За плотностью распределения f ~p ( p1 ) рандомизированного параметра ~p1 в1основной массе текстов по байесовской статистике закрепилось название«априорная плотность распределения», то есть известная исследователю допроведенияопыта.Условнаяжерандомизированной вероятности~p1*плотностьраспределенияf ~p* ( p1 / m1 )1обычно называется «апостериорнойплотностью распределения», то есть условная плотность f ~p ( p1 / m1 ) становится*1известной исследователю только после проведения опыта по реализации серииm испытаний, позволяющей реально наблюдать некоторое число m1 появленийсобытия A1 .Однако, само математическое выражение «формулы Байеса» вовсе непредопределяетоднозначноинтерпретацию,излагаемуювтерминах«априорных» и «апостериорных» распределений, и в контексте настоящейстатьи мы будем пользоваться несколько иной трактовкой.
А именно,предполагается, что на момент составления прогноза исследователь обладаетэмпирической информацией, состоящей в наблюдении числа m1 появленийсобытия A1 в серии из m испытаний, образующих схему Бернулли. Такжеисследователь выдвигает гипотезу, что в будущем поведение схемы Бернуллизадаетсярандомизированнымраспределениявеличиныпараметром~p1 ,имеющимплотностьf ~p1 ( p1 ) .
В частности, это может быть экспертная оценкаp1 . Соединяя при помощи «формулы Байеса» эмпирическую86информацию о частоте m1 появления события A1 в прошлом с информацией,описываемой «гипотетической» плотностью f ~p ( p1 ) , исследователь получает1условную плотность f ~p ( p1 / m1 ) , задающую условную случайную величину*1~~p1* β (ν1 m1 , ν2 m2 ) , которую можно использовать для получения прогнознойоценки~p1* E ~p1* E β (ν1 m1 , ν2 m2 )вероятности появления событияA1вотдельном испытании в будущем.Перенесем теперь рассмотренную байесовскую схему оценки параметрабиномиального распределения на более общий случай оценки параметровполиномиального распределения. А именно, поставим задачу оценки векторавероятностейp1 ,..., pr ,определяющегоплотностьраспределенияx , как задачу оценки параметровf m~ (m1,..., mr / p1 ,...., pr ) случайной величины ~p1 ,..., pr полиномиального распределения~ m ,..., m~ m /~~f m~ (m1 ,..., mn / p1 ,..., p n ) P({m11nn p1 p1 ,..., p n p n }) n!p1m1 ...
p nmn ,m1! ... mn !где pi (0,1) есть вероятность осуществления события Ai в последовательностиm независимых испытаний с n альтернативными исходами, имеющими~ ,..., m~ ) ( (m ,..., m ) ) –постоянные вероятности pi , i 1,..., n , соответственно; (m1n1nвектор случайных частот (наблюдаемых частот) появления событий A1 ,..., An вm испытаниях; m1 ... mn m . Таким образом, величина f m~ (m1 ,..., mn / p1 ,...., pn )есть условная вероятность появления событий A1 ,..., An в m испытаниях ровноm1 ,..., mn разпри условии, что вероятность появления каждого события Ai водном испытании равна pi .Знание совместного распределения f m~ (m1 ,..., mn / p1 ,...., pn ) случайных частот~ ,..., m~ позволяет найти математическое ожидание E m~ m p и дисперсиюm1rii~ m p (1 p ) случайной частоты m~ , а также ковариацию cov(m~ ,m~ ) m p pDmiji jiiii~ ,m~ :случайных частот mij~E f i pi ,87~ p (1 pi ),D fi imp p~ ~cov( f i , f j ) i j .mНеопределенность выбора значения векторного параметра p описываетсярандомизациейслучайныйпараметроввекторполиномиальногопараметров~p,распределения,дающейраспределениеДирихлеимеющий(обобщенное бета-распределение) с параметрами v1 ,..., vn , vi 0 , i 1,..., n .
Иными~словами, ~p ( ~p1 ,..., ~p n ) (v1 ,..., v n ) , где~~~ (v1 ,..., v n ) ( 1 ,..., n ) есть непрерывнаяслучайная величина, описываемая плотностью:f ~p ( p) f ~ ( p1 ,..., p r ; v1 ,..., v r ) p1v11 ... p rvr 1, (v1 ,..., v r )где (v1 ,..., vr ) есть интеграл Дирихле (обобщенная бета-функция), задаваемыйформулой:n 1(v1 ,..., v r ) ... ... (1 x1 ... x n 1 ) vr 1 xivi 1 dx1 ...dxn 1 ,i 1S n*1где интегрирование идет по единичному (n 1) -мерному симплексу S n*1 ,расположенномувевклидовомпространствеR n 1 :S n*1 {( x1 ,..., xn1 ) : x1 ... xn1 1, xi 1, i 1,..., n 1} .Обобщенную бета-функцию (v1 ,..., vn ) можно выразить через гаммафункции:(v1 ,..., vn ) (v1 ) ... (vn ).(v1 ...