korolev_matematicheskie_osnovy_teorii_ri ska (811435), страница 30
Текст из файла (страница 30)
, k, и в качестве специального случая приведенного выше определения дискретной смеси получимH(x) =kXpj F³x − a ´jσjj=1,x ∈ IR.(2.10.4)Если при этом aj = 0, j = 1, . . . , k, то мы получаем чисто масштабнуюконечную смесьk³x´XH(x) =, x ∈ IR.pj Fσjj=1Если функция распределения F абсолютно непрерывна и имеетплотность f = F 0 , то смеси (2.10.4) функций распределения соответствует смесь плотностейh(x) =kXpj ³ x − aj ´j=1σjfσj,x ∈ IR.Физический смысл понятия смеси вероятностных распределенийможет быть проиллюстрирован на примере дискретной смеси. Рассмотрим некоторую популяцию, которая не является однородной и в своюочередь состоит из некоторого числа, скажем, k суб-популяций. Предположим, что наблюдаемый признак или наблюдаемая характеристика внутри j-й суб-популяции распределен в соответствии с функцией распределения Fj (x) ≡ F (x, yj ), которую можно интерпретироватькак условную вероятность того, что значение наблюдаемого признака услучайно выбранного индивидуума будет меньше, чем x, при условии,что случайно выбранный индивидуум является представителем j-й субпопуляции.
Пусть вероятность того, что при случайном выборе индивидуума из всей (генеральной) популяции будет выбран представительименно j-й суб-популяции, равна pj (pj ≥ 0, p1 + . . . + pk = 1). Тогда поформуле полной вероятности безусловная вероятность того, что значение наблюдаемого признака у индивидуума, случайно выбранного извсей генеральной популяции, будет меньше, чем x, окажется равнойH(x) =kXpj Fj (x).j=1В определенном смысле операция смешивания вероятностных распределений обеспечивает возможность формально интерпретировать популяции, реально являющиеся неоднородными, как однородные.1822.
Свойства случайных суммОчень часто нельзя непосредственно определить тип суб-популяции, к которой принадлежит очередное наблюдение. Вследствие этого вся (генеральная) популяция вынужденно считается однородной, хотя на самом деле она таковой не является и содержит индивидуумов,принадлежащих к существенно различным типам. Именно такая ситуация типична для анализа многих хаотических стохастических процессов.
Поэтому чрезвычайно важно иметь возможность осуществить операцию, в некотором смысле обратную операции смешивания, а именно,операцию разделения (расщепления) смесей. Статистические процедуры, реализующие эту операцию, в значительной степени зависят отсвойства идентифицируемости смесей вероятностных распределений.2.10.2Идентифицируемость смесей вероятностныхраспределенийПонятие идентифицируемой смеси интенсивно используется в прикладных задачах, связанных с декомпозицией (разделением, разложением, расщеплением) совокупностей (популяций). В качестве примеровможно упомянуть задачи классификации, распознавания образов илиидентификации вероятностных распределений.
Библиография по этимвопросам обширна, см., например, обзоры (Исаенко и Урбах, 1976),(Круглов, 1991), или книги (Titterington, Smith and Makov, 1987), (Айвазян, Бухштабер, Енюков и Мешалкин, 1989) и списки литературы вуказанных источниках.Напомним определение идентифицируемых семейств смесей распределений вероятностей. Оно было предложено в работе (Teicher, 1961).Пусть функция F (x, y) определена на множестве IR × Y. Для простоты предположим, что Y ⊆ IRm при некотором m ≥ 1 и множествоY снабжено борелевской σ-алгеброй Σ. Как и ранее, мы предполагаем, что функция F (x, y) измерима по y при каждом фиксированномx и является функцией распределения как функция аргумента x прикаждом фиксированном y. Пусть Q – семейство случайных величин,принимающих значения во множестве Y.
ОбозначимH = {HQ (x) = EF (x, Q), x ∈ IR : Q ∈ Q}.(2.10.5)Семейство H, определяемое ядром F и множеством Q, называетсяидентифицируемым, если из равенстваEF (x, Q1 ) = EF (x, Q2 ),dс Q1 ∈ Q, Q2 ∈ Q вытекает, что Q1 = Q2 .x ∈ IR,2.10. Смеси вероятностных распределенийК примеру, идентифицируемыми являются конечные смеси нормальных распределений, показательных распределений, пуассоновскихраспределений и распределений Коши. Однако, легко привести оченьпростые примеры неидентифицируемых семейств.
В частности, в качестве ядра рассмотрим равномерное распределение и связанные с нимсмеси2 3111· 3 · 1[0, 1 ) (x) + · · 1[ 1 ,1) (x) = · 2 · 1[0, 1 ) (x) + · 2 · 1[ 1 ,1) (x).332233 222Здесь(1[a,b) (x) =1, если x ∈ [a, b),0, если x ∈/ [a, b)– индикаторная функция отрезка [a, b).В этой книге мы главным образом рассматриваем сдвиг/масштабные смеси, в которых y = (u, v), F (x, y) = F ((x − v)/u). Поэтому все, что на самом деле нам нужно, – это результаты об идентифицируемости семейств сдвиг/масштабных смесей одномерных распределений.Если X, U и V – случайные величины, определенные на одном итом же достаточно богатом вероятностном пространстве так, что случайная величина X стохастически независима от пары (U, V ) и длялюбых фиксированных значений u случайной величины U и v случайной величины V случайная величина X имеет функцию распределенияF ((x − v)/u), то приведенное выше определение идентифицируемостиприменительно к сдвиг/масштабным смесям сводится к следующему.сдвиг/масштабная смесь H(x) = EF ((x − V )/U ), порожденная ядромF (сдвиг/масштабная смесь функции распределения F ) идентифицируема, если из соотношенияdX1 · U1 + V1 = X2 · U2 + V2 ,где (Xi , Ui , Vi ), i = 1, 2, – тройки случайных величин, обладающих точно такими же свойствами, что присущи описанным выше случайнымвеличинам X, U, V , вытекает, чтоd(U1 , V1 ) = (U2 , V2 ).Сужение определения идентифицируемости на класс конечных сдвиг/масштабных смесей сводится к следующему.Семейство смесейH=½Xkj=1pj F³x − a ´jσj:1831842.
Свойства случайных сумм¾k ≥ 1; pj ≥ 0, p1 + . . . + pk = 1; aj ∈ IR, σj > 0, j = 1, kпорожденное ядром F , идентифицируемо, если из равенстваkXpj Fj=1³x − a ´jσj=mXqi F³x − b ´iδii=1вытекает, что(i) k = m;(ii) для каждого индекса j ∈ {1, . . . , k} существует индекс i ∈ {1, . . . , k}такой, чтоpj = qi , aj = bi , σj = δi .Теперь мы перейдем к рассмотрению условий идентифицируемости.Сначала рассмотрим условия идентифицируемости смесей, в которыхсмешивание производится либо по параметру сдвига, либо по параметру масштаба.
Другими словами, сначала мы рассмотрим семействаоднопараметрических смесей. Условия идентифицируемости таких семейств хорошо известны. Напомним некоторые из них.Семейство функций распределения {F (x, y) : y > 0} называетсяаддитивно замкнутым, если для любых y1 > 0, y2 > 0 справедливосоотношениеF (x, y1 ) ∗ F (x, y2 ) ≡ F (x, y1 + y2 ).(2.10.6)Здесь символ ∗ обозначает свертку распределений: если F1 и F2 –функции распределения, тоZ∞F1 (x) ∗ F2 (x) =Z∞F1 (x − y)dF2 (y) =−∞F2 (x − y)dF1 (y).−∞Иногда свойство (2.10.6) семейств распределений вероятностей называется воспроизводимостью по параметру y.Семейство нормальныхзаконов с нулевым математическим ожида√нием N0 = {Φ(x/ s), s > 0} является очевидным примером аддитивнозамкнутого семейства (относительно дисперсии s).Следующие результаты принадлежат Г.
Тейчеру (Teicher, 1961).Теорема 2.10.1. Семейство смесей (2.10.5) функций распределения F (x, ·) из аддитивно замкнутого семейства является идентифицируемым.Отсюда немедленно вытекает, что семейство N0 масштабных смесейнормальных законов с нулевым средним идентифицируемo.2.10. Смеси вероятностных распределений185Смеси, порождаемые ядрами из аддитивно замкнутых семейств, конечно же не исчерпывают все примеры идентифицируемых смесей. Рассмотрим масштабные смеси распределений, сосредоточенных на неотрицательной полупрямой.Теорема 2.10.2. Пусть F (x, y) = F (xy), y ≥ 0, F (0) = 0.
Предположим, что преобразование Фурье функции G ∗ (y) = F (ey ), y ≥ 0,нигде не обращается в нуль. Тогда семейство смесейH = {HQ (x) = EF (xQ), x ≥ 0 : P(Q > 0) = 1}идентифицируемо.Аналогичное свойство присуще некоторым семействам сдвиговыхсмесей распределений вероятностей.Теорема 2.10.3.
Пусть Q – множество всех случайных величин.Семейство сдвиговых смесейH = {HQ (x) = EF (x − Q), x ∈ IR : Q ∈ Q},идентифицируемо, если характеристическая функция, соответствующая функции распределения F (x), нигде не обращается в нуль.Теорема 2.10.1 гарантирует, что наряду со смесями нормальных законов с нулевым средним, идентифицируемыми являются семействамасштабных смесей любых строго устойчивых законов.Теорема 2.10.3 гарантирует идентифицируемость семейств сдвиговых смесей любых безгранично делимых (в том числе устойчивых) законов.Здесь мы упомянули только некоторые идентифицируемые семейства, которые так или иначе рассматриваются в данной книге. Многочисленные примеры других идентифицируемых семейств можно найтив работах (Medgyessy, 1961), (Teicher, 1961), (Teicher, 1963), (Yakowitzand Spragins, 1968).Некоторые критерии (то есть необходимые и достаточные условияидентифицируемости семейств смесей доказаны в работе (Tallis, 1969),также см. обзор (Kruglov, 1991).К сожалению, примеры ядер, порождающих идентифицируемые семейства сдвиг/масштабных смесей в общей ситуации (то есть без какихлибо дополнительных условий на смешивающие распределения) неизвестны.