Матрица оценки переменных отклика
8.5. Матрица оценки переменных отклика
Ранее было отмечено, что матрица H=X(XТX)–1XТ симметричная и идемпотентная. Рассмотрим теперь некоторые дополнительные свойства этой матрицы. Эти свойства будут полезны при обсуждении резко выделяющихся значений переменных отклика и влиятельных наблюдений.
В силу (7.5.26), для модели у=b01+X1b1+e с нормированными факторами вектор оценки ожидаемых значений переменных отклика принимает вид
=1+X1, (8.5.1)
где X1= (I–Е/n)X1Ds–1. В силу (7.5.30) и (7.5.31), выражение (8.5.1) можно записать так
=1+X1(X1ТX1)–1X1Ту=11Ту/п+H1у
=(Е/п+H1)у, (8.5.2)
где матрица H1=X1(X1ТX1)–1X1Т. И на основе выражений (8.4.2) и (8.5.2) имеем
H=Е/п+H1
Рекомендуемые материалы
=Е/п+X1(X1ТX1)–1X1Т. (8.5.3)
Рассмотрим теперь некоторые свойства элементов hij матрицы Н [Hocking (2003) стр.196; Rencher, Schaalje (2008) стр.231; Chatterjee, Hadi (1988) стр.18].
Теорема 8.5. Если матрица Х нормированных значений факторов размеров nxр и ранга р<n с первым столбцом 1 из единиц, то элементы hij матрицы Н=X(XТX)–1XТ обладают следующими свойствами:
1. Элементы по диагонали матрицы H находятся по формуле hii=1/п+x1iс(X1ТX1)–1x1iсТ, где x1iс= [xi1, xi2,..., xi(р-1)] является i-й строкой матрицы X1.
2. Значения элементов по диагонали матрицы H находятся в интервале 1/п ≤hii ≤1, при i=1, 2, …, n.
3. Значения остальных элементов матрицы H находятся в интервале –0,5 ≤hij ≤0,5 для всех i≠j (j=1, 2, …, n).
4. след(H)==р.
Доказательство:
- Элементы по диагонали матрицы H находятся с использованием выражения (8.5.3). Каждый из них является суммой элемента по диагонали матрицы Е/п равного 1/п и соответствующего элемента по диагонали матрицы X1(X1ТX1)–1X1Т. Элементы по диагонали этой матрицы можно найти, разделив матрицу X1 по строкам. При этом квадратичная форма x1iс(X1ТX1)–1x1iсТ от i-й строки x1сi матрицы X1 даёт i-й диагональный элемент матрицы X1(X1ТX1)–1X1Т. Результат сложения квадратичной формы x1iс(X1ТX1)–1x1iсТ с 1/п даёт искомый диагональный элемент hii матрицы H.
- Наименьшее значение 1/п неравенства 1/п≤hii≤1 получается из выражения (8.5.3). Так как матрица X1ТX1 положительно определённая, то по теореме П.6.5 и её обратная матрица (X1ТX1)–1 тоже положительно определённая. Следовательно, являющиеся диагональными элементами матрицы X1(X1ТX1)–1X1Т квадратичные формы х1ic(X1ТX1)–1х1icТ все больше нуля. Отсюда 1/п≤hii при равенстве, если X1=О. Поскольку матрица H симметричная и идемпотентная H=HH, то на основе этого можно найти наибольшее значение элементов hii. Пусть hiс будет i-й строкой матрицы H. Тогда i-й диагональный элемент матрицы H является результатом произведения i-й строки hiс на i-й столбец hi матрицы H. При этом ввиду симметричности матрицы H, элементы её строк равны соответствующим элементам её столбцов. Поэтому получаем
hii=hiсhi=[hi1, hi2, ..., hiп]=.
В полученной сумме произведений элементов строк и столбцов можно выделить произведение элементов строки и столбца с одинаковыми значениями индексов и записать это в виде странного на первый взгляд выражения
hii=hiihii+. (8.5.4)
Так как hii≥1/п, то элементы hii имеют положительные значения. Поэтому можно разделить обе части выражения (8.5.4) на hii и получить
1=hii+/hii, (8.5.5)
что означает hii≤1, при равенстве, если все hij=0.
- Выражение (8.5.4) можно записать также в виде
hii=hii2+hrs2+(–hrs2), (8.5.6)
где hrs2 является некоторым взятым из суммы произведением соответствующих и расположенных не по её диагонали элементов строки hiс и столбца hi матрицы H. Выражение (8.5.6) преобразуется к виду
hii–hii2=hrs2+(–hrs2),
откуда hrs2≤hii–hii2, при равенстве, когда =hrs2. Максимум разности hii–hii2 равен 1/4. Это получается, если взять производную от hii–hii2 по hii и приравнять её нулю. При этом вторая производная получается отрицательной, что указывает на получаемый максимум. Следовательно, так как hrs2 взято из суммы , то при j≠i для любого hij имеем hij2≤1/4 или –0,5 ≤hij ≤0,5.
- След матрицы H находится так
"7 - Поисковые признаки" - тут тоже много полезного для Вас.
след(H)=след[X(XТX)–1XТ]
=след[XТX(XТX)–1]
=след(Ip)
=р.
□
По пункту 4 теоремы 8.5 видно, что с увеличением п значения hii будут уменьшаться.