Распределения квадратичных форм
5.5. Распределения квадратичных форм
После доказательства теоремы 5.3.1 отмечено, что если вектор у имеет нормальное распределение Nn(y, I), то квадратичная форма (у–y)Т(у–y) имеет центральное распределение c2(n). Если же вектор у имеет нормальное распределение Nn(y, S), то имеющую также центральное распределение c2(n) квадратичную форму можно представить в виде
(у–y)ТS–1(у–y). (5.5.1)
Чтобы доказать это, запишем (у–y)ТS–1(у–y) следующим образом
(у–y)ТS–1(у–y)=(у–y)ТS–1/2S–1/2(у–y)
=[S–1/2(у–y)]Т[S–1/2(у–y)]
=zТz,
где z=S–1/2(у–y) и S–1/2=(S1/2)–1. Вектор z имеет математическое ожидание
Е[S–1/2(у–y)]=S–1/2[Е(у)–y]=0
Рекомендуемые материалы
и ковариационную матрицу
C[S–1/2(у–y)]=S–1/2C[у–y]S–1/2=S–1/2S1/2S1/2S–1/2=I.
Следовательно, по пункту 2 теоремы 4.5.2 вектор z=S–1/2(у–y) имеет нормальное распределение Nn(0, I). Поэтому, в силу (5.3.1), квадратичная форма zТz имеет центральное распределение c2(n). Обратим внимание на сходство между (у–y)ТS–1(у–y) и (у–y)(s2)–1(у–y) для одной случайной переменной у. Квадратичная форма (у–y)s–2(у–y) имеет распределение c2(1), если переменная у имеет нормальное распределение N(y, s2).
В следующей теореме рассматривается условие нецентрального распределения квадратичных форм в общем. При её доказательстве будем считать, что симметричная матрица А некоторых числовых значений имеет ранг r, а параметр не центральности g =yTAy/2 [Searle (1971) стр.57-58].
Теорема 5.5. Если вектор у имеет нормальное распределение Nп(y, S), то квадратичная форма уTAy имеет нецентральное распределение c2(r, g), если и только если произведение матриц AS даёт идемпотентную матрицу.
Доказательство: По теореме 5.2.2 функция, производящая моменты распределения переменной q=уTAy, имеет вид
Mq(t)=[det(I–2tAS)]–1/2exp{–yT[I–(I–2tAS)–1]S–1y/2}.
В силу (П.12.5), собственными значениями матрицы I–2tAS являются 1–2tli (i =1, 2,..., п), где li - собственные значения матрицы AS. Зная, что определитель квадратной матрицы равен произведению её собственных значений, в силу (П.12.14), получаем det(I–2tAS) =. При условии –1< 2tli<1 для всех i, в силу (П.12.9), имеем (I–2tAS)–1 =I+
. Таким образом, в показателе экспоненты функции Mq(t) получаем I–(I–2tAS)–1=–
и функция Mq(t) принимает вид
Mq(t)=exp{–yT[–
]S–1y/2}.
Допустим, что матрица AS идемпотентная ранга r (ранг матрицы А), тогда (AS)k=AS и r её собственных значений равны 1, а остальные равны 0. Поэтому получаем
Mq(t)=exp{–yT[–
]ASS–1y/2}
=(1–2t)–r/2exp{–yT[1–(1–2t)–1]Ay/2},
где 1–(1–2t)–1=–, при условии –1<2t <1, что согласуется также с требованием существования производящей моменты функции для значений t в окрестности 0. Таким образом
Mq(t)=(1–2t)–r/2exp{–[1–(1–2t)–1]yTAy/2}, (5.5.2)
что, в силу (5.3.8), является функцией, производящей моменты случайной переменной, распределённой по нецентральному закону c2 со степенями свободы r=ранг(А) и параметром не центральности g =yTAy/2.
Докажем обратное, а именно, если уTAy имеет распределение c2(r, g), то матрица AS идемпотентная и ранга r. В этом случае, зная распределение переменной уTAу, имеем функцию, производящую моменты этой переменной, данную выражениями (5.5.2) и (5.2.5). Правые части этих выражений должны быть равны для всех значений вектора y, в частности, и для y=0. Подставляя y=0 в (5.2.5) и (5.5.2) и приравнивая их правые части, получаем
(1–2t)–r/2=[det(I–2tAS)]–1/2.
Заменяя в полученном выражении 2t на и и преобразуя его, получаем
(1–и)r=det(I–иAS).
Пусть l1, l2, ..., ln - собственные значения матрицы АS, тогда
(1–и)r=.
Это выражение, будучи тождественным относительно и, в правой части не должно иметь превосходящих r степеней и. Следовательно, по крайней мере, одно li равно нулю. А повторение этого рассуждения показывает, что n–r собственных значений равны нулю, и поэтому получается
(1–и)r=.
Беря логарифм от этого выражения, и приравнивая выражения под логарифмом, получаем r уравнений для r неизвестных собственных значений li. Все они имеют решение li=1 при i=1, 2, ..., r. Таким образом, n–r собственных значений АS равны нулю, а r из них равны единице. Поэтому, по теореме П.6.8 матрица AS является идемпотентной и теорема доказана.
□
Другие доказательства этой теоремы даны в книге [Hocking (2003) стр.602-603] и статье [Driscoll (1999)]. В ней наиболее важно то, что, если произведение AS даёт идемпотентную матрицу, то квадратичная форма уTAy имеет нецентральное распределение c2. Однако, полезно также знать, что, если уTAy имеет распределение c2(r, g), то матрица результата произведения AS идемпотентная и ранга r.
Рассмотренная теорема имеет много следствий, зависящих от значений вектора y и матрицы S, а также выбора матрицы А. Некоторые из них, представляющие интерес, приведены ниже.
Следствие 1. Если вектор у ~ Nп(0, s2I), то квадратичная форма уTAy имеет распределение c2(r), если и только если матрица A идемпотентная и ранга r.
Доказательство: В этом случае S=s2I и A заменяется на A/s2. При этом имеем матрицу (A/s2)( s2I)=A, которая является идемпотентной.
□
Следствие 2. Если вектор у ~ Nп(y, s2I), то квадратичная форма уTAy/s2 имеет распределение c2[r, yTAy/(2s2)], если и только если матрица A идемпотентная и ранга r.
Доказательство: По теореме 5.5 квадратичная форма уT(A/s2)у имеет распределение c2(r, g), если (A/s2)S идемпотентная. В этом случае S=s2I поэтому (A/s2)S=(A/s2)(s2I)=A. Для g имеем g=yT(A/s2)y/2=yTAy/(2s2).
□
Следствие 3. Если вектор у ~ Nn(0, S), то квадратичная форма уTAy имеет распределение c2(r), если и только если AS идемпотентна и ранга r.
Доказательство: Параметр не центральности g =yTAy/2=0TA0/2=0.
□
Следствие 4. Если вектор у ~ Nп(y, s2I), то квадратичная форма уTy/s2 имеет распределение c2[п, yTy/(2s2)].
Доказательство: Матрица AS=(I/s2)(s2I)=I идемпотентная, ранг(I)=п и параметр не центральности g =yT(I/s2)y/2=yTy/(2s2).
□
Следствие 5. Если вектор у ~ Nп(y, s2S), то квадратичная форма уTAy имеет распределение c2[r, yTAy/(2s2)], если и только если А идемпотентная и ранга r.
Бесплатная лекция: "9 Электронная память" также доступна.
Доказательство: В этом случае имеем (А/s2)(s2S)=AS.
□
Для дополнительных следствий см. упражнение 5.7.
Пример 5.5. Применяя следствие 2 теоремы 5.5, рассмотрим распределение величины (n–1)s2/s2=, где вектор уT= [y1, y2,..., уn] имеет нормальное распределение Nn(y1, s2I), как в примерах 5.1 и 5.2.1. В примере 5.2.1 имеем
=yТ(I–E/n)y. В разделе 5.1 показано, что матрица I–E/n идемпотентная. Тогда по теореме П.13.4, ранг(I–E/n)=след(I–E/n)=n–1. Затем найдем значение параметра g следующим образом
g ==
=
=
=
=0.
Следовательно, yТ(I–E/n)y/s2 имеет распределение c2(n–1).