Распределения хи-квадрат
5.3. Распределения хи-квадрат
Перед знакомством с нецентральным распределением хи-квадрат c2 вспомним рассмотренное в главе 1 центральное распределение c2. Простейший вектор zТ=[z1, z2, ..., zn] независимых случайных переменных имеет стандартное нормальное распределение Nn(0, I). Сумма квадратов этих переменных
=zTz (5.3.1)
по определению имеет распределение c2(n), то есть, сама сумма квадратов n независимых и распределённых по стандартному нормальному закону случайных переменных является случайной переменной, имеющей центральное распределение c2 с n степенями свободы.
Выражения для среднего, дисперсии и функции, производящей моменты случайной переменной, имеющей распределение c2, приведены в следующей теореме.
Теорема 5.3.1. Если случайная переменная u=zTz имеет распределение c2(n), то
Е(u)=n, (5.3.2)
D(u)=2n, (5.3.3)
Мu(t)=(1–2t)–n/2. (5.3.4)
Рекомендуемые материалы
Доказательство: Так как u - квадратичная форма zTIz, то Е(u), D(u) и Мu(t) могут быть получены путем применения соответственно теорем 5.2.1, 5.2.3 и 5.2.2 следующим образом:
E(zTIz)=след(I)+0ТI0=n,
D(zTIz)=2след(I)+40TI0=2n,
Mu(t)=[det(I–2tI)]–1/2exp{–0T[I–(I–2tI)–1]I–10/2}
={det[(1–2t)I]}–1/2=(1–2t)–n/2,
так как определитель det[(1–2t)I]=(1–2t)n, где п – ранг матрицы I.
□
Функция плотности вероятности распределения c2(n) имеет вид [Johnson c соавт. (1995) Vol.1, стр. 416]
рхи-кв.(u)=, при u ≥0,
где Г(п/2) - гамма-функция. Показанный на Рис. 5.3.1 синей кривой график функции плотности вероятности распределения c2(6) асимметричен, но с увеличением числа степеней свободы асимметрия становится меньше и при n >50 распределение c2 принимает форму приблизительно нормального.
Рис. 5.3.1. Графики функций плотности вероятности распределений хи-квадрат: синий - центрального c2(n) при п=6 и красный - нецентрального c2(n, g) при п=6 и g=4.
Из рисунка видно, что случайная переменная, имеющая центральное распределение c2, принимает только неотрицательные значения. Такие переменные используются для проверки гипотез о дисперсиях или стандартных отклонениях. Конкретное распределение c2 определяется единственным параметром – положительным числом степеней свободы.
Теперь допустим, что переменные у1, у2, ..., уn распределены независимо по нормальному закону N(yi, 1), так что составленный из них вектор у имеет распределение Nn(y, I), где yТ=[y1, y2,..., yn]. В этом случае сумма =yТy не имеет распределения c2. Однако, в силу (5.3.1), сумма квадратов разностей
=(у–y)Т(у–y) имеет распределение c2(n), так как переменная (уi–yi) имеет стандартное нормальное распределение N(0, 1).
Распределение случайной переменной v==yТy, в которой вектор у состоит из независимых и имеющих нормальное распределение N(yi, 1) случайных переменных у1, у2, ..., уn, называется нецентральным распределением c2 и обозначается c2(n, g). Параметр g не центральности может определяться в виде
g ==yТy/2. (5.3.5)
Заметим, что математическое ожидание переменной v= больше математического ожидания переменной u=
. Так, математическое ожидание переменной u
E[]=
=
=
=n,
а математическое ожидание переменной v
E[]=E(yТIy)=след(I)+yТIy [по теореме 5.2.1]
=n+yТy=n+2g,
где g дано выражением (5.3.5).
Функцию плотности вероятности нецентрального распределения c2(n, g) можно представить в виде суммы функций плотности вероятности для центрального распределения c2(n) [Gendron (2015)] в виде
рv(v)=exp[–(γ+v)/2].
График функции плотности вероятности нецентрального распределения c2(n, g) показан на Рис.5.3.1 красной кривой. При его расчёте с использованием программы Mathcad 13 в качестве бесконечности для суммы бралось число 145, так как при больших числах программа даёт ошибку, что получается число большее 10307, которое является бесконечно большим для этой программы.
Выражения для среднего, дисперсии и функции, производящей моменты случайной переменной, имеющей нецентральное распределение c2, приведены в следующей теореме.
Теорема 5.3.2. Если вектор у имеет нормальное распределение N(y, I) и случайная переменная v=yТy имеет нецентральное распределение c2(n, g), то
Е(v)=n+2g, (5.3.6)
D(v)=2n+8g, (5.3.7)
Mv(t)=(1–2t)–n/2exp{–g [1–(1–2t)–1]}. (5.3.8)
Доказательство: Для получения выражения (5.3.6) найдём среднее E(yТIy) по теореме 5.2.1 и считая А=S=I,
Е(v)=E(yТIy)=след(I)+yТIy
=n+yТy=n+2g, [так как след(I)=п]
где g определено выражением (5.3.5).
Для получения выражения (5.3.7) найдём дисперсию D(yТIy), используя теорему 5.2.3 и принимая А=S=I,
D(v)=D(yТIy)=2след(I)+4yTIy=2n+8g.
Для получения выражения (5.3.8) используем теорему 5.2.2
Mv(t)=[det(I–2tI)]–1/2exp{–yT[I–(I–2tI)–1]I–1y/2}
=(1–2t)–n/2exp{–yT[I–(I–2tI)–1]I–1y/2} [так как [det(I–2tI)]–1/2=(1–2t)–n/2]
=(1–2t)–n/2exp{–yT[1–(1–2t)–1]y/2} [так как I=I–1]
=(1–2t)–n/2exp{–g[1–(1–2t)–1]}.
□
Следствие 1. Если g=0 (что соответствует y=0), то Е(v), D(v) и Mv(t) теоремы 5.3.2 сводятся к Е(u), D(u) и Мu(t) центрального распределения c2 теоремы 5.3.1. Таким образом,
c2(n, 0)=c2(n). (5.3.9)
□
Распределение c2 обладает аддитивным свойством. Это показано в следующей теореме.
Теорема 5.3.3. Если случайные переменные v1, v2, ..., vk распределены независимо и каждая имеет распределение c2(ni, gi) (i=1, 2, ..., k), то их сумма
имеет распределение c2(
,
). (5.3.10)
Доказательство: Так как переменные v1, v2, ..., vk распределены независимо, то функция, производящая моменты суммарной переменной v= имеет вид
Мv(t)=E[exp(t)]=E[exp(tv1)exp(tv2)…exp(tvk)]
Если Вам понравилась эта лекция, то понравится и эта - Особенности культуры Древнего Египта.
=E[exp(tv1)]E[exp(tv2)]…E[exp(tvk)]
==
exp{–gi[1–(1–2t)–1]}
=(1–2t)Sini/2exp{–[1–(1–2t)–1] Sigi}.
Поэтому, в силу (5.3.8), сумма имеет распределение c2(
,
).
□
Следствие 1. Если случайные переменные u1, u2, ..., uп распределены независимо и каждая имеет распределение c2(ni), то сумма имеет распределение c2(
).