Популярные услуги

Любая задача по линалу
КМ-3 Важнейшие аспекты теории графов - любой вариант за 3 суток!
Любая задача по математическому анализу и по интегралам и дифференциальным уравнениям
Решу любую задачу
Любая задача по Линейной алгебре и аналитической геометрии
НОМОТЕХ
Предельные теоремы и математическая статистика
Повышение уникальности твоей работе
Любая задача из Демидовича
Сдам любой тест по дискретке в течение суток на положительную оценку!

Проверка адекватности модели

2021-03-09СтудИзба

6.4. Проверка адекватности модели

Проверка адекватности или соответствия модели данным эксперимента обеспечивается проведением повторных опытов при одних и тех же значениях переменной x. Эти опыты должны быть действительно повторными, а не повторением считывания получаемых в опыте значений переменной отклика. Они должны проводиться не один за другим, а в случайной последовательности наряду с другими опытами эксперимента. Аппаратура для проведения повторных опытов должна подвергаться новой настройке, как и для других опытов, и значение переменной x должно устанавливаться вновь. Таким образом, повторные опыты должны быть подвержены всем обычным ошибкам настройки, выборки и аналитическим ошибкам, которые присутствуют в опытах, проводимых при разных значениях переменной x. Несоблюдение этих условий приведёт к недооценке ошибок и сделает несостоятельным анализ.

Например, в таблице 6.2.1 результатов эксперимента с коэффициентом усиления транзистора опыты 2 и 5 проводились при x=4,60, опыты 1 и 7 проводились при x=4,00 и опыты 6 и 9 проводились при x=4,30. Проведение таких опытов в эксперименте представляет большой интерес, так как различия в значениях переменной отклика между ними позволяют оценить дисперсию ошибок вне зависимости от постулируемой модели.

Положим x1, x2, ..., xm различные значения переменной x. В эксперименте значение x1 используется в п1 опытах, значение x2 используется в п2 опытах, значение x3 используется в п3 опытах и так далее. Если имеется m таких наборов повторных опытов с nj опытами в j–м наборе (j =1, 2,..., m), то суммы квадратов остатков для каждого набора могут быть сложены для формирования суммы квадратов чистых ошибок, имеющей её степенями свободы сумму отдельных степеней свободы из наборов. Таким образом, для всех m наборов повторных опытов сумма квадратов чистых ошибок вычисляется по формуле [Box, Draper (2007) стр. 61]

SPE=                                                           (6.4.1)

с числом степеней свободы, определяемым по формуле

=m.                                                           (6.4.2)

Когда пj=2, то используется более простая формула

=(yj1–yj2)2/2                                        (6.4.3)

Рекомендуемые материалы

и эта сумма квадратов имеет 1 степень свободы.

При регрессии, для любой модели сумма квадратов чистых ошибок всегда является частью суммы квадратов остаточных ошибок. Остаток от u–го значения переменной отклика при j–м значении переменной x можно представить в виде

yju=(yju)–().                                       (6.4.4)

Возводя в квадрат обе части этого выражения, получаем

=+,                (6.4.5)

где при суммировании по u произведение (yju)() превращается в нуль для каждого j. Таким образом, имеем

SE=SPE+SLF.                                                                (6.4.6)

Второй член SLF в правой части называется суммой квадратов неадекватности модели, так как является мерой различия между оценкой  ожидаемого значения переменной отклика и её усреднённым значением  для повторных опытов j–го набора. Соответствующим выражением для степеней свободы является

p=+mp,                                       (6.4.7)

где p – число параметров модели. Очевидно, что необходимо иметь m>p, то есть, число разных значений переменной x не должно быть меньше числа оцениваемых параметров. Если m=p, то не будет ни суммы квадратов неадекватности, ни её степеней свободы.

Преобразование функции модели для проверки её адекватности

Для анализа эксперимента с повторными опытами его данные должны быть соответствующим образом организованы. Исходная матрица модели должна включать только различные значения переменной x. Например, для получения матрицы модели таблица 6.2.1 должна быть преобразована, как показано в таблице 6.4.1.

Таблица 6.4.1. Преобразованная таблица данных эксперимента из примера 6.2.1

Опыты

1

6

2

4

3

8

10

7

9

5

x

4,00

4,30

4,60

4,10

4,20

4,70

4,72

4,00

4,30

4,60

у

1636

1555

1506

1270

1272

1146

1225

1260

1276

1269

В этом случае исходная матрица модели имеет только семь строк Xm=. Она не содержит повторные значения переменной x, использованные для повторных опытов 7, 9 и 5. Чтобы включить в модель данные этих опытов необходимо применить матрицу преобразования исходной матрицы модели без повторных опытов в матрицу модели с повторными опытами. Для данных таблицы 6.4.1 эта матрица состоит из единичной матрицы размеров 7х7 с тремя первыми её строками, добавленными внизу, так как опыты 1, 6 и 2 были повторены опытами 7, 9 и 5. Матрица преобразования имеет вид

С=.

Она преобразует матрицу Xm в матрицу модели с повторными опытами и модель (6.2.7) записывается в виде

у=СXmq+e,                                                   (6.4.8)

где вектор у представлен значениями переменных отклика из таблицы 6.4.1.

Вектор оценки параметров такой модели методом наименьших квадратов находится из выражения =[(СXm)Т(СXm)]–1(СXm)Тy, а сумма квадратов остатков рассчитывается по формуле

SE=yТ[IСXm(XmТСТСXm)–1XmТСТ]y.                       (6.4.9)

Представление данных отклика дисперсионной моделью

Сумму квадратов чистых ошибок модели (6.4.8) тоже можно получить в матричном виде. Для этого данные эксперимента с повторными опытами необходимо представить в виде дисперсионной модели классификации по одному признаку [Себер (1980) стр.235]

yju=+eju,     (j=1, 2, …, m; u=1, 2, …, nj)             (6.4.10)

где  - среднее переменной отклика для j-го набора повторных опытов. Некоторые наборы могут состоять только из одного опыта. Для всех значений переменных отклика, представленных, например, в таблице 6.4.1, эту модель можно записать в матричном виде

у=С+ε,                                                       (6.4.11)

где - вектор средних переменных отклика наборов повторных опытов и С - та же матрица, что и в модели (6.4.8). Эта модель не содержит переменную x. В примере 6.3.1 было установлено, что она является значимой при описании данных эксперимента.

Как и для модели у=Xq+ε, сумма квадратов остатков модели (6.4.11) находится по формуле

SPE=yТ[IС(СТС)–1СТ]y.                                           (6.4.12)

Эта сумма квадратов остатков является наименьшей среди таких сумм квадратов для всех возможных моделей, так как ни одна из детерминированных моделей не может объяснить отклонения значений переменных отклика от их усреднённых значений. При проверке адекватности модели эта сумма квадратов известна как сумма квадратов чистых ошибок, расчёт которой возможен также по формуле (6.4.1).

В формуле (6.4.12) сумма SРЕ является квадратичной формой относительно вектора у. Матрица этой квадратичной формы идемпотентная и имеет ранг[IС(СТС)–1СТ]=пт. По второму и третьему допущениям раздела 6.1 дисперсия D(y)=s2I. Тогда по следствию 2 теоремы 5.5 квадратичная форма yТ(IС(СТС)–1СТ)y/s2 имеет нецентральное распределение c2{пт, (С)T[IС(СТС)–1СТ]С/(2s2)}. В нём параметр не центральности обращается в нуль TСT[IС(СТС)–1СТ]С=T(СTССTС)=0. Следовательно, S/s2 имеет центральное распределение c2(пт).

Проверка адекватности по статистике с распределением F

В силу (6.4.6), сумма квадратов неадекватности модели (6.4.8) находится так SLF=SE SPE. Подставляя сюда выражения (6.4.9) и (6.4.12) соответственно для SE и SPE, получаем

SLF=yТ[С(СТС)–1СТСXm(XmТСТСXm)–1XmТСТ]y.               (6.4.13)

Здесь SLF также является квадратичной формой относительно вектора у. Матрица этой квадратичной формы идемпотентная и имеет ранг[С(СТС)–1СТСXm(XmТСТСXm)–1XmТСТ] =тр. Дисперсия D(y)=s2I и у~N(СXmq, s2I), поэтому по следствию 2 теоремы 5.5 квадратичная форма yТ[С(СТС)–1СТСXm(XmТСТСXm)–1XmТСТ]y/s2 имеет нецентральное распределение

c2{пт, (СXmq)T[С(СТС)–1СТСXm(XmТСТСXm)–1XmТСТ]СXmq/(2s2)}.

В нём параметр не центральности обращается в нуль

qTXmTСT[С(СТС)–1СТСXm(XmТСТСXm)–1XmТСТ]СXmq=qT(XmTСTСXmXmTСTСXm)q=0.

Следовательно, величина S/s2 приобретает центральное распределение c2(тр).

Кроме этого, произведения матриц квадратичных форм SLF и SPE дают нулевые матрицы. Следовательно, по следствию 1 теоремы 5.6.2 квадратичные формы SPE и SLF распределены независимо. Две независимые квадратичные формы, имеющие центральные распределения хи-квадрат, служат основой образования распределения F. То есть, если SLF имеет распределение χ2(тр) и SPE имеет распределение χ2(пт), то их отношение в виде [SLF/(тр)]/[SPE/(пт)] имеет распределение F со степенями свободы (тр) и (пт). Следовательно, статистика проверки адекватности модели может быть рассчитана по формуле

FLF=[SLF/(тр)]/[SPE/(пт)].                                     (6.4.14)

В этой формуле числитель представляет оценку дисперсии, которая не объясняется проверяемой моделью, а знаменатель представляет оценку дисперсии, не объясняемой никакой моделью. Отношение необъяснённой дисперсии проверяемой моделью к необъяснимой дисперсии даёт ещё один критерий рассмотрения регрессионной линейной модели. Проверка по этому критерию позволяет проверить адекватность описания имеющихся данных эксперимента постулируемой линейной моделью.

Как и при проверке значимости регрессии, проверка адекватности модели выполняется сравнением расчётного значения статистики FLF с критическим значением Fкр случайной переменной, имеющей распределение F(тр, пт), при выбранной вероятности 1–α. И, если расчётное значение статистики FLF больше значения Fкр, то модель надо считать неадекватной. Таким образом, таблица 6.3.2 дисперсионного анализа может теперь быть дополнена строками неадекватности и чистых ошибок, как показано в таблице 6.4.2.

Таблица 6.4.2 Дисперсионный анализ с разложением суммы квадратов остатков

Источники дисперсии

Суммы квадратов

Степени свободы

Средние квадратичные

Статистики проверки

Усреднённое

SМ=n

1

SМ/1

FМ=

Регрессия

S=yТX(XТX)–1XТy

yТ11Тy/n

р–1

S/(р–1)

F=

Остатки

SE=yТyXТy

nр

SE/(nр)

   Неадекватность

SLF=SESPE

тр

SLF/(тр)

FLF=

   Чистые ошибки

SPE=yТ[IС(СТС)–1СТ]y

пт

SPE/(пт)

Итого

ST=yТy

n

Пример 6.4.1. Проверим адекватность модели, описывающей зависимость коэффициента усиления транзистора от эмиттерной дозы в примере 6.2.1. Для этого данные эксперимента должны быть представлены в виде таблицы 6.4.1, а рассматриваемая модель записана в виде (6.4.8). Дисперсионный анализ неадекватности представляет собой разложение суммы квадратов остатков на суммы квадратов неадекватности и чистых ошибок. Следовательно, расчёт статистики для проверки адекватности модели можно также представить в виде отдельной таблицы дисперсионного анализа. В ней должны присутствовать те же столбцы, и она представлена таблицей 6.4.3.

Таблица 6.4.3. Дисперсионный анализ адекватности модели

Источники дисперсии

Суммы квадратов

Степени свободы

Средние квадратичные

Статистика проверки

Неадекватность

SLF=7,1502х104

5

1,4300х104

FLF=0,312

Чистые ошибки

SPE=1,3769х105

3

4,5898х104

Остатки

SE=2,0919х105

8

Расчёт суммы квадратов остатков по формуле (6.4.9) даёт SE=2,0919х105, как и в таблице 6.3.3. Расчёт суммы квадратов чистых ошибок по формуле (6.4.12) даёт SРЕ=1,3769х105. Расчёт суммы квадратов неадекватности делается по формуле SLF=SE SPE и даёт SLF=7,1502х104.

Как и в таблице 6.3.3, сумма квадратов остатков SE имеет 8 степеней свободы. Это потому, что ранг матрицы её квадратичной формы

ранг[IСXm(XmТСТСXm)–1XmТСТ]=10–2=8.

Аналогично находится число степеней свободы для суммы квадратов чистых ошибок SPE. Ранг матрицы её квадратичной формы

ранг[IС(СТС)–1СТ]=10–7=3.

Число степеней свободы для суммы квадратов неадекватности находится в виде разности числа степеней свободы для SE и числа степеней свободы для SPE. Это число получается равным 5 и может быть найдено тоже как ранг матрицы квадратичной формы в выражении (6.4.13).

"Введение" - тут тоже много полезного для Вас.

На основе найденных значений сумм квадратов и соответствующих степеней свободы вычисляются средние квадратичные SLF/(тр) и SPE/(пт), как показано в таблице 6.4.2, а результаты расчётов представлены в таблице 6.4.3. Делением значения среднего квадратичного неадекватности на значение среднего квадратичного чистых ошибок находится статистика FLF для проверки неадекватности модели. Найденное значение 0,312 этой статистики много меньше критического значения 9,013 случайной переменной с распределением F(5, 3) при выбранном уровне значимости α=0,05 или вероятности 1–α=0,95. Следовательно, рассматриваемую модель можно считать адекватной.

Здесь необходимо также заметить, что среднее квадратичное SPE/(пт) является независящей от модели оценкой дисперсии s2. Значение этой оценки значительно больше значения оценки, найденного в примере 6.2.2 по формуле, зависящей от модели.

Статистика R2

Статистика R2=SRc/(STn) представляет часть вариации значений переменных отклика относительно их средних значений, которая описывается функцией модели. Она часто используется в качестве обобщённой меры достигнутой адекватности модели [Box, Draper (2007) стр. 63]. При этом надо опять заметить, что никакая модель не может объяснить чистые статистические ошибки. Поэтому максимально возможное значение статистики R2 находится из выражения

Rmax2=(STnSPE)/(STn).

Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5167
Авторов
на СтудИзбе
438
Средний доход
с одного платного файла
Обучение Подробнее