Популярные услуги

КМ-3 Важнейшие аспекты теории графов - любой вариант за 3 суток!
Любая задача по линалу
Решу любую задачу
Любая задача по математическому анализу и по интегралам и дифференциальным уравнениям
Любая задача по Линейной алгебре и аналитической геометрии
НОМОТЕХ
Повышение уникальности твоей работе
Предельные теоремы и математическая статистика
Контрольная работа по рядам (КМ-3) ИДДО 2022
Сдам любой тест по дискретке в течение суток на положительную оценку!
Главная » Лекции » Математика » Статистические методы экспериментальных исследований » Резко выделяющиеся значения остатков и переменных отклика

Резко выделяющиеся значения остатков и переменных отклика

2021-03-09СтудИзба

8.6. Резко выделяющиеся значения остатков и переменных отклика

В некоторых случаях, модель представляется правильной для большинства значений переменных отклика, но один остаток по абсолютной величине значительно больше остальных. Такое резко выделяющееся значение может быть из-за ошибки записи или взято из другой популяции, или может быть просто редким наблюдением из предполагаемого распределения. Например, если ошибки εi имеют нормальное распределение N(0, s2), то значения εi большие 3s или меньшие –3s будут всё-таки получаться с вероятностью 0,0027.

Если никакого объяснения для наблюдаемого в опыте эксперимента резко выделяющегося значения переменной отклика не найдено, то данные эксперимента могут быть проанализированы с этим значением или без него. Если в присутствии и отсутствии резко выделяющегося значения результаты анализа приводят к различным выводам, то для получения правильного вывода необходима постановка дополнительных опытов для получения новых данных. Возможно, также просто исключить из рассмотрения резко выделяющееся значение, хоть никаких объяснений его появления и не было обнаружено. Третья возможность заключается в использовании специальных методов, которые учитывают резко выделяющиеся значения наблюдений и рассматриваются в [Mosteller, Turkey (1977); Birch (1980)].

Один из методов выявления резко выделяющихся значений переменных отклика заключается в построении графика зависимости остатков  от результатов  оценки ожидаемых значений переменных отклика или от номера i наблюдения. При анализе остатков необходимо иметь в виду, что, в силу (8.4.7), остатки имеют различные дисперсии

D() =s2(1–hii).

По пункту 2 теоремы 8.5 значения диагональных элементов матрицы Н удовлетворяют неравенству hii≤1, поэтому дисперсия D() будет малой, если значение hii близко к 1.

Зависимость остатков от диагональных элементов матрицы Н

То, что большие значения диагональных элементов hii матрицы Н сопровождаются малыми значениями остатков, подтверждается следующим неравенством

1/пhii+≤1.                                             (8.6.1)

Рекомендуемые материалы

Чтобы показать его справедливость, выполним следующие действия. Пусть матрица Н* образована из H=X(XТX)–1XТ путём заменены матрицы X на увеличенную матрицу [X, у]. При этом матрица Н* имеет вид

Н*=[X, у]{[X, у]T[X, у]}–1[X, у]T

=[X, у].

В силу (П.5.7) и используя обратную разделённой матрицы с A11=XTX, a12=XTy и а22=yTy, получаем

Н*=[X, у],

где b=yTyyTХ(XTX)–1ХTy. Вектор остатков =(IH)y, поэтому b=yT(IХ(XTX)–1ХT)y =yT(IH)y=T.

Выполнив умножения, получаем выражение для матрицы Н* в виде

Н*=Х(XTX)–1ХT+[Х(XTX)–1ХTyyTХ(XTX)–1ХTyyTХ(XTX)–1ХTХ(XTX)–1ХTyyT+yyT]/b

=Н+[HyyTHyyTHНyyT+yyT]/b.

Его можно преобразовать так

Н*=Н+[(HyyTyyT)H+yyTНyyT]/b

=Н+(yyTHyyT)(IН)/b

=Н+(IH)yyT(IH)/b

=Н+(T)/(T).

В силу (П.2.13), , , ...,  являются элементами, расположенными по диагонали матрицы T. Следовательно, элементы по диагонали матрицы Н* находятся по формуле hii*=hii+/(T). Матрица Н* симметричная и идемпотентная, поэтому по пункту 2 теоремы 8.5 имеем неравенство 1/nhii*≤1. Подстановка в него hii*=hii+/(T) даёт искомое неравенство (8.6.1). Для выполнения этого неравенства большое значение hii должно сопровождаться малым по абсолютной величине значением  остатка.

Нормирование остатков

Нормированные остатки часто дают больше информации, чем обычные остатки [Myers с соавт. (2016) стр.38]. Кроме того, так как остатки имеют разные дисперсии, то желательно нормировать их таким образом, чтобы они имели одинаковую дисперсию. Существуют два общих и связанных между собой метода нормирования остатков. В первом методе используются дисперсии D() =s2(1–hii) остатков чтобы получить нормированные остатки /s, которые имеют среднее равное 0 и дисперсию равную 1.

Замена стандартного отклонения s результатом s его оценки позволяет получить стьюдентизированный нормированный остаток

ri=/s,                                              (8.6.2)

где статистика s2=SE/(nр) оценки дисперсии находится по формуле (7.3.8). Такие остатки при правильной модели имеют постоянную дисперсию D(ri)=1 и дают ту же информацию, что и обычные нормированные остатки. Однако так как значение переменной отклика с большим остатком и при большом hii сильно влияет на расчёты методом наименьших квадратов, то обычно рекомендуется проверка стьюдентизированных нормированных остатков [Myers с соавт. (2016) стр. 39].

Нормированные остатки полезны в обнаружении резко выделяющихся значений переменных отклика. Большинство их значений должно находиться в интервале от –3 до 3 и значение переменной отклика с нормированным остатком за пределами этого интервала является резко выделяющимся значением этой переменной. Это значение должно тщательно проверяться, так как оно может быть результатом неправильной записи или получено для области значений факторов, где модель неправильно описывает данные эксперимента.

При втором методе нормирования остатков используется результат оценки стандартного отклонения s, при которой не учитывается i-е наблюдение

ti=/s(i),                                            (8.6.3)

где s(i) - результат оценки стандартного отклонения вычисляемым по n–1 значениям переменных отклика, оставшимся после удаления наблюдения (уi, x)= (yi1, xi1,..., x-1), где уi - i-й элемент вектора у значений переменных отклика и x - i-я строка матрицы X. Если i-е наблюдение переменной отклика имеет резко выделяющееся значение, то оно, скорее всего, будет выявлено как таковое при нормировании его остатка по формуле (8.6.3) и называемого стьюдентизированным остатком удалённого значения переменной отклика.

Остатки удаляемых значений переменных отклика

Другой подход заключается в изучении остатков удаляемых значений переменных отклика. Остаток для удалённого значения переменной отклика вычисляется при удалённом (уi, x) с использованием вектора  оценки на основе оставшихся n–1 значений переменных отклика по формуле

=yi=yix,                                              (8.6.4)

где вектора  находится методом наименьших квадратов по формуле

=(X(i)ТX(i))–1X(i)Тy(i)                                              (8.6.5)

и матрица X(i) размеров (n–1)хр получается путём удаления i-й строки x=[1, xi1,..., xi(р-1)] из матрицы X, а вектор y(i) размеров (n–1)х1 значений переменных отклика получается после удаления из вектора y элемента yi, соответствующего строке x.

Вектор  можно найти также по формуле

=(XТX)–1xi.                                          (8.6.6)

Она получается следующим образом. Разделяя матрицу Х по строкам и выделяя произведение i-й строки на саму себя и на yi, представим произведения XТX и ХTy в виде

XТX==[x1, x2, …, xn]

==+xixic

=X(i)TX(i)+xixic,                                                        (8.6.7)

где x1, x2, …, xn - столбцы матрицы XТ, являющиеся строками матрицы Х, и

ХTy=[x1, x2, …, xn]=

=+xiyi

=Х(i)Tу(i)+xiyi.                                                        (8.6.8)

При этом вектор  оценки параметров можно записать в виде

=(XТX)–1XТy=(XТX)–1(Х(i)Tу(i)+xiyi)

=(XТX)–1Х(i)Tу(i)+(XТX)–1xiyi

откуда

(XТX)–1Х(i)Tу(i)=–(XТX)–1xiyi.

Из выражения H=X(XТX)–1XТ имеем hii=хic(XТX)–1хi, где хic - i-я строка матрицы Х, а хi - i-й столбец матрицы XТ. Используя полученные выше выражения (8.6.7) и (8.6.8) произведений XТX и ХTy, а также формулу (П.5.9), получаем

=(X(i)ТX(i))–1X(i)Tу(i)= (XТXxixic)–1X(i)Tу(i)

=X(i)Tу(i)

=X(i)Tу(i).

Далее, раскрывая скобки, имеем

=(XТX)–1X(i)Tу(i)+(XТX)–1xixic(XТX)–1X(i)Tу(i)/(1–hii)

=–(XТX)–1xiyi+(XТX)–1xixic[–(XТX)–1xiyi]/(1–hii),

а при xic= и хci(XТX)–1хi=hii получаем

=–(XТX)–1xiyi+[(XТX)–1xixic–(XТX)–1xixic(XТX)–1xiyi]/(1–hii)

=–(XТX)–1xiyi+[(XТX)–1xi–(XТX)–1xihiiyi]/(1–hii)

=[–(XТX)–1xiyi+(XТX)–1xi]/(1–hii)

=–(XТX)–1xi(yi)/(1–hii)

=–(XТX)–1xi/(1–hii).

Отсюда и получается формула (8.6.6).

В силу (8.6.4) и (8.6.6), остаток  удалённого значения yi переменной отклика можно выразить через обычный остаток  и hii в виде

=yixiс=yixiс[(X(i)ТX(i))–1xi]

=yixiс+xiс(X(i)ТX(i))–1xi]

=yi+=+

=                                                          (8.6.9)

Таким образом, п остатков удаленных значений переменных отклика могут быть получены без вычисления п регрессий.

В силу (3.2.8) и (8.4.7), дисперсия остатка  удалённого значения yi переменной отклика имеет вид

D()=D()=D()==s2/(1–hii).

Оценка этой дисперсии делается так =s(i)2/(1–hii). Следовательно, получаемые по формуле (8.6.3) нормированные остатки ti можно выразить через  следующим образом

ti=/s(i)=.

Используемая в формуле (8.6.3) статистика s(i)2 оценки дисперсии, при удалённом резко выделяющемся значении переменной отклика, находится по формуле s(i)2=SE(i)/(nр), где SE(i)= y(i)Тy(i)ТX(i)Тy(i). Она может быть найдена без удаления этого i-го наблюдения по формуле

s(i)2=SE(i)/(nр)

=[SE]/(nр).                                       (8.6.10)

Так получается следующим образом. Сумму квадратов значений переменных отклика можно записать

уТу==+yi2=у(i)Ту(i)+yi2.

В силу Х(i)Tу(i)=ХTyxiyi, выражение =(X(i)ТX(i))–1xi можно представить в виде

y(i)TХ(i)=(yTХyixiс)[(XTX)–1xi]

=yTХyixiсyTХ(XTX)–1xi+yixiс(XTX)–1xi

=yTХyiTxi+yihii

=yTХyi+yihii

Подставляя в него =yi, получаем

y(i)TХ(i)=yTХyi(yi)–(yi)+yihii

=yTХyi2+(yiyihiiyi++yihii)/(1–hii)

=yTХyi2+/(1–hii).

Отсюда сумма квадратов остаточных ошибок SE(i) находится из выражения

SE(i)=y(i)Ty(i)y(i)TХ(i)

=yTyуi2–[yTХyi2+/(1–hii)]

=yTyyTХ+/(1–hii)

=SE+/(1–hii).

Еще одним методом обнаружения резко выделяющихся значений переменных отклика является построение графика зависимости обычных остатков =yix от остатков  удаляемых значений yi переменных отклика, рассчитываемых по формулам (8.6.4) или (8.6.9). Если при удалении i-го наблюдения в вычислении  оценка ожидаемых значений переменных отклика существенно не меняется, то точки на графике должны следовать примерно по прямой линии с единичным наклоном. Любая сравнительно отдалённая от этой линии точка является потенциально резко выделяющимся значением.

Сумма квадратов остатков предсказаний

Вычисляемые по формуле (8.6.9) остатки могут быть использованы для проверки постулируемой модели или её улучшения. В формуле (8.6.4) величина =x является предсказанным значением удалённого известного значения переменной отклика. Остаток для него находится по формуле i. Этот остаток называют остатком предсказания. Сумма квадратов остатков предсказания предложена в качестве критерия способности модели осуществлять предсказания [Allen (1974)]. Она определяется в виде

Sop==

=.                                              (8.6.11)

В силу (8.6.9), остаток предсказания является просто взвешенным обычным остатком с весами, определяемыми диагональными элементами hii матрицы Н. Значения переменных отклика, для которых элементы hii имеют большие значения, будут иметь большие значения остатков предсказания. Таким образом, соответствующий большому значению hii остаток  вносит большой вклад в Sop. В качестве критерия насколько хорошо модель прогнозирует будущие наблюдения для определённого набора данных, сумма Sop может быть лучше, чем SE. Когда целью разработки модели является применение её для выполнения предсказаний, то для сравнения разных моделей может использоваться сумма Sop и предпочтение должно быть отдано модели с малым её значением.

Сумму квадратов остатков предсказаний можно использовать для вычисления статистики Rp2 предсказания по формуле [Myers c соавт. (2016) стр. 40]

Rp2=1–Sop/S,                                                (8.6.12)

Лекция "11 Применение микропроцессоров в приводах" также может быть Вам полезна.

где S=уТу–()2/n. Она численно выражает качество предсказания с использованием рассматриваемой модели.

Пример 8.6. Для данных примера 7.1 проведём анализ нормированных остатков. Рассчитанные по формуле (8.6.2) нормированные стьюдентизированные остатки ri представлены в таблице 8.3. График кумулятивных вероятностей распределения нормированных стьюдентизированных остатков показан на Рис.8.6.1.

Этот график представляет ту же информацию, что и график кумулятивных вероятностей распределения обычных остатков на Рис.8.4.2. Так получается потому, что, как видно из таблицы 8.3.3, большинство диагональных элементов hii матрицы Н похожи по величине и отсутствуют необычно большие по абсолютной величине остатки. Однако иногда значения элементов hii значительно отличаются один от другого, и в этих случаях наилучшим является построение графиков кумулятивных вероятностей распределения нормированных стьюдентизированных остатков.

Рассчитанные по формуле (8.6.9) остатки  предсказаний представлены в таблице 8.3.3 и график зависимости обычных остатков  от остатков  показан на Рис.8.6.2. Точки на графике следуют приблизительно по прямой линии с единичным наклоном, и нет точек, находящихся далеко от этой линии и указывающих на резко выделяющиеся значения.

Найденная на основе остатков  предсказаний по формуле (8.6.12) статистика Rp2=0,487. Следовательно, ожидается, что модель коэффициента усиления транзистора описывает 48,7% изменений в предсказании новых значений коэффициента усиления.

Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5173
Авторов
на СтудИзбе
435
Средний доход
с одного платного файла
Обучение Подробнее