Резко выделяющиеся значения остатков и переменных отклика
8.6. Резко выделяющиеся значения остатков и переменных отклика
В некоторых случаях, модель представляется правильной для большинства значений переменных отклика, но один остаток по абсолютной величине значительно больше остальных. Такое резко выделяющееся значение может быть из-за ошибки записи или взято из другой популяции, или может быть просто редким наблюдением из предполагаемого распределения. Например, если ошибки εi имеют нормальное распределение N(0, s2), то значения εi большие 3s или меньшие –3s будут всё-таки получаться с вероятностью 0,0027.
Если никакого объяснения для наблюдаемого в опыте эксперимента резко выделяющегося значения переменной отклика не найдено, то данные эксперимента могут быть проанализированы с этим значением или без него. Если в присутствии и отсутствии резко выделяющегося значения результаты анализа приводят к различным выводам, то для получения правильного вывода необходима постановка дополнительных опытов для получения новых данных. Возможно, также просто исключить из рассмотрения резко выделяющееся значение, хоть никаких объяснений его появления и не было обнаружено. Третья возможность заключается в использовании специальных методов, которые учитывают резко выделяющиеся значения наблюдений и рассматриваются в [Mosteller, Turkey (1977); Birch (1980)].
Один из методов выявления резко выделяющихся значений переменных отклика заключается в построении графика зависимости остатков от результатов оценки ожидаемых значений переменных отклика или от номера i наблюдения. При анализе остатков необходимо иметь в виду, что, в силу (8.4.7), остатки имеют различные дисперсии
D() =s2(1–hii).
По пункту 2 теоремы 8.5 значения диагональных элементов матрицы Н удовлетворяют неравенству hii≤1, поэтому дисперсия D() будет малой, если значение hii близко к 1.
Зависимость остатков от диагональных элементов матрицы Н
То, что большие значения диагональных элементов hii матрицы Н сопровождаются малыми значениями остатков, подтверждается следующим неравенством
1/п≤hii+≤1. (8.6.1)
Рекомендуемые материалы
Чтобы показать его справедливость, выполним следующие действия. Пусть матрица Н* образована из H=X(XТX)–1XТ путём заменены матрицы X на увеличенную матрицу [X, у]. При этом матрица Н* имеет вид
Н*=[X, у]{[X, у]T[X, у]}–1[X, у]T
=[X, у].
В силу (П.5.7) и используя обратную разделённой матрицы с A11=XTX, a12=XTy и а22=yTy, получаем
Н*=[X, у],
где b=yTy–yTХ(XTX)–1ХTy. Вектор остатков =(I–H)y, поэтому b=yT(I–Х(XTX)–1ХT)y =yT(I–H)y=T.
Выполнив умножения, получаем выражение для матрицы Н* в виде
Н*=Х(XTX)–1ХT+[Х(XTX)–1ХTyyTХ(XTX)–1ХT–yyTХ(XTX)–1ХT–Х(XTX)–1ХTyyT+yyT]/b
=Н+[HyyTH–yyTH–НyyT+yyT]/b.
Его можно преобразовать так
Н*=Н+[(HyyT–yyT)H+yyT–НyyT]/b
=Н+(yyT–HyyT)(I–Н)/b
=Н+(I–H)yyT(I–H)/b
=Н+(T)/(T).
В силу (П.2.13), , , ..., являются элементами, расположенными по диагонали матрицы T. Следовательно, элементы по диагонали матрицы Н* находятся по формуле hii*=hii+/(T). Матрица Н* симметричная и идемпотентная, поэтому по пункту 2 теоремы 8.5 имеем неравенство 1/n≤hii*≤1. Подстановка в него hii*=hii+/(T) даёт искомое неравенство (8.6.1). Для выполнения этого неравенства большое значение hii должно сопровождаться малым по абсолютной величине значением остатка.
Нормирование остатков
Нормированные остатки часто дают больше информации, чем обычные остатки [Myers с соавт. (2016) стр.38]. Кроме того, так как остатки имеют разные дисперсии, то желательно нормировать их таким образом, чтобы они имели одинаковую дисперсию. Существуют два общих и связанных между собой метода нормирования остатков. В первом методе используются дисперсии D() =s2(1–hii) остатков чтобы получить нормированные остатки /s, которые имеют среднее равное 0 и дисперсию равную 1.
Замена стандартного отклонения s результатом s его оценки позволяет получить стьюдентизированный нормированный остаток
ri=/s, (8.6.2)
где статистика s2=SE/(n–р) оценки дисперсии находится по формуле (7.3.8). Такие остатки при правильной модели имеют постоянную дисперсию D(ri)=1 и дают ту же информацию, что и обычные нормированные остатки. Однако так как значение переменной отклика с большим остатком и при большом hii сильно влияет на расчёты методом наименьших квадратов, то обычно рекомендуется проверка стьюдентизированных нормированных остатков [Myers с соавт. (2016) стр. 39].
Нормированные остатки полезны в обнаружении резко выделяющихся значений переменных отклика. Большинство их значений должно находиться в интервале от –3 до 3 и значение переменной отклика с нормированным остатком за пределами этого интервала является резко выделяющимся значением этой переменной. Это значение должно тщательно проверяться, так как оно может быть результатом неправильной записи или получено для области значений факторов, где модель неправильно описывает данные эксперимента.
При втором методе нормирования остатков используется результат оценки стандартного отклонения s, при которой не учитывается i-е наблюдение
ti=/s(i), (8.6.3)
где s(i) - результат оценки стандартного отклонения вычисляемым по n–1 значениям переменных отклика, оставшимся после удаления наблюдения (уi, xiс)= (yi1, xi1,..., xiр-1), где уi - i-й элемент вектора у значений переменных отклика и xiс - i-я строка матрицы X. Если i-е наблюдение переменной отклика имеет резко выделяющееся значение, то оно, скорее всего, будет выявлено как таковое при нормировании его остатка по формуле (8.6.3) и называемого стьюдентизированным остатком удалённого значения переменной отклика.
Остатки удаляемых значений переменных отклика
Другой подход заключается в изучении остатков удаляемых значений переменных отклика. Остаток для удалённого значения переменной отклика вычисляется при удалённом (уi, xiс) с использованием вектора оценки на основе оставшихся n–1 значений переменных отклика по формуле
=yi–=yi–xiс, (8.6.4)
где вектора находится методом наименьших квадратов по формуле
=(X(i)ТX(i))–1X(i)Тy(i) (8.6.5)
и матрица X(i) размеров (n–1)хр получается путём удаления i-й строки xiс=[1, xi1,..., xi(р-1)] из матрицы X, а вектор y(i) размеров (n–1)х1 значений переменных отклика получается после удаления из вектора y элемента yi, соответствующего строке xiс.
Вектор можно найти также по формуле
=–(XТX)–1xi. (8.6.6)
Она получается следующим образом. Разделяя матрицу Х по строкам и выделяя произведение i-й строки на саму себя и на yi, представим произведения XТX и ХTy в виде
XТX==[x1, x2, …, xn]
==+xixic
=X(i)TX(i)+xixic, (8.6.7)
где x1, x2, …, xn - столбцы матрицы XТ, являющиеся строками матрицы Х, и
ХTy=[x1, x2, …, xn]=
=+xiyi
=Х(i)Tу(i)+xiyi. (8.6.8)
При этом вектор оценки параметров можно записать в виде
=(XТX)–1XТy=(XТX)–1(Х(i)Tу(i)+xiyi)
=(XТX)–1Х(i)Tу(i)+(XТX)–1xiyi
откуда
(XТX)–1Х(i)Tу(i)=–(XТX)–1xiyi.
Из выражения H=X(XТX)–1XТ имеем hii=хic(XТX)–1хi, где хic - i-я строка матрицы Х, а хi - i-й столбец матрицы XТ. Используя полученные выше выражения (8.6.7) и (8.6.8) произведений XТX и ХTy, а также формулу (П.5.9), получаем
=(X(i)ТX(i))–1X(i)Tу(i)= (XТX–xixic)–1X(i)Tу(i)
=X(i)Tу(i)
=X(i)Tу(i).
Далее, раскрывая скобки, имеем
=(XТX)–1X(i)Tу(i)+(XТX)–1xixic(XТX)–1X(i)Tу(i)/(1–hii)
=–(XТX)–1xiyi+(XТX)–1xixic[–(XТX)–1xiyi]/(1–hii),
а при xic= и хci(XТX)–1хi=hii получаем
–=–(XТX)–1xiyi+[(XТX)–1xixic–(XТX)–1xixic(XТX)–1xiyi]/(1–hii)
=–(XТX)–1xiyi+[(XТX)–1xi–(XТX)–1xihiiyi]/(1–hii)
=[–(XТX)–1xiyi+(XТX)–1xi]/(1–hii)
=–(XТX)–1xi(yi–)/(1–hii)
=–(XТX)–1xi/(1–hii).
Отсюда и получается формула (8.6.6).
В силу (8.6.4) и (8.6.6), остаток удалённого значения yi переменной отклика можно выразить через обычный остаток и hii в виде
=yi–xiс=yi–xiс[–(X(i)ТX(i))–1xi]
=yi–xiс+xiс(X(i)ТX(i))–1xi]
=yi–+=+
= (8.6.9)
Таким образом, п остатков удаленных значений переменных отклика могут быть получены без вычисления п регрессий.
В силу (3.2.8) и (8.4.7), дисперсия остатка удалённого значения yi переменной отклика имеет вид
D()=D()=D()==s2/(1–hii).
Оценка этой дисперсии делается так =s(i)2/(1–hii). Следовательно, получаемые по формуле (8.6.3) нормированные остатки ti можно выразить через следующим образом
ti=/s(i)=.
Используемая в формуле (8.6.3) статистика s(i)2 оценки дисперсии, при удалённом резко выделяющемся значении переменной отклика, находится по формуле s(i)2=SE(i)/(n–р), где SE(i)= y(i)Тy(i)–ТX(i)Тy(i). Она может быть найдена без удаления этого i-го наблюдения по формуле
s(i)2=SE(i)/(n–р)
=[SE–]/(n–р). (8.6.10)
Так получается следующим образом. Сумму квадратов значений переменных отклика можно записать
уТу==+yi2=у(i)Ту(i)+yi2.
В силу Х(i)Tу(i)=ХTy–xiyi, выражение =–(X(i)ТX(i))–1xi можно представить в виде
y(i)TХ(i)=(yTХ–yixiс)[–(XTX)–1xi]
=yTХ–yixiс–yTХ(XTX)–1xi+yixiс(XTX)–1xi
=yTХ–yi–Txi+yihii
=yTХ–yi–+yihii
Подставляя в него =yi–, получаем
y(i)TХ(i)=yTХ–yi(yi–)–(yi–)+yihii
=yTХ–yi2+(yi–yihii–yi++yihii)/(1–hii)
=yTХ–yi2+/(1–hii).
Отсюда сумма квадратов остаточных ошибок SE(i) находится из выражения
SE(i)=y(i)Ty(i)–y(i)TХ(i)
=yTy–уi2–[yTХ–yi2+/(1–hii)]
=yTy–yTХ+/(1–hii)
=SE+/(1–hii).
Еще одним методом обнаружения резко выделяющихся значений переменных отклика является построение графика зависимости обычных остатков =yi–xiс от остатков удаляемых значений yi переменных отклика, рассчитываемых по формулам (8.6.4) или (8.6.9). Если при удалении i-го наблюдения в вычислении оценка ожидаемых значений переменных отклика существенно не меняется, то точки на графике должны следовать примерно по прямой линии с единичным наклоном. Любая сравнительно отдалённая от этой линии точка является потенциально резко выделяющимся значением.
Сумма квадратов остатков предсказаний
Вычисляемые по формуле (8.6.9) остатки могут быть использованы для проверки постулируемой модели или её улучшения. В формуле (8.6.4) величина =xiс является предсказанным значением удалённого известного значения переменной отклика. Остаток для него находится по формуле =уi–. Этот остаток называют остатком предсказания. Сумма квадратов остатков предсказания предложена в качестве критерия способности модели осуществлять предсказания [Allen (1974)]. Она определяется в виде
Sop==
=. (8.6.11)
В силу (8.6.9), остаток предсказания является просто взвешенным обычным остатком с весами, определяемыми диагональными элементами hii матрицы Н. Значения переменных отклика, для которых элементы hii имеют большие значения, будут иметь большие значения остатков предсказания. Таким образом, соответствующий большому значению hii остаток вносит большой вклад в Sop. В качестве критерия насколько хорошо модель прогнозирует будущие наблюдения для определённого набора данных, сумма Sop может быть лучше, чем SE. Когда целью разработки модели является применение её для выполнения предсказаний, то для сравнения разных моделей может использоваться сумма Sop и предпочтение должно быть отдано модели с малым её значением.
Сумму квадратов остатков предсказаний можно использовать для вычисления статистики Rp2 предсказания по формуле [Myers c соавт. (2016) стр. 40]
Rp2=1–Sop/STс, (8.6.12)
Лекция "11 Применение микропроцессоров в приводах" также может быть Вам полезна.
где STс=уТу–()2/n. Она численно выражает качество предсказания с использованием рассматриваемой модели.
Пример 8.6. Для данных примера 7.1 проведём анализ нормированных остатков. Рассчитанные по формуле (8.6.2) нормированные стьюдентизированные остатки ri представлены в таблице 8.3. График кумулятивных вероятностей распределения нормированных стьюдентизированных остатков показан на Рис.8.6.1.
Этот график представляет ту же информацию, что и график кумулятивных вероятностей распределения обычных остатков на Рис.8.4.2. Так получается потому, что, как видно из таблицы 8.3.3, большинство диагональных элементов hii матрицы Н похожи по величине и отсутствуют необычно большие по абсолютной величине остатки. Однако иногда значения элементов hii значительно отличаются один от другого, и в этих случаях наилучшим является построение графиков кумулятивных вероятностей распределения нормированных стьюдентизированных остатков.
Рассчитанные по формуле (8.6.9) остатки предсказаний представлены в таблице 8.3.3 и график зависимости обычных остатков от остатков показан на Рис.8.6.2. Точки на графике следуют приблизительно по прямой линии с единичным наклоном, и нет точек, находящихся далеко от этой линии и указывающих на резко выделяющиеся значения.
Найденная на основе остатков предсказаний по формуле (8.6.12) статистика Rp2=0,487. Следовательно, ожидается, что модель коэффициента усиления транзистора описывает 48,7% изменений в предсказании новых значений коэффициента усиления.