Дженкинс, Ваттс - Спектральный анализ и его приложения (выпуск 1) (1044211), страница 21
Текст из файла (страница 21)
Такое искажение неизбежно из-за ошибок измерения я из-за изменчивости, которую невозможно контролировать. Если модель не вполне соответствует действительности, то ошибка может иметь систематическую компоненту, обусловленную этим несовершенством модели.
Поэтому окончательный вид модели следующий: К.=т1. [ от=0,хи-]-0,хт,+ ... +О„хм+юг, (4.3,2) где а) Ут (1-1, 2, ..., Ат) — случайная величина, соответствующая измеренному отклику у; в 1-м эксперименте; б) хи, хи, ..., хтд — значения, принимаемые входными перемен- НЫМИ Хь Хг, °, Хд В 1-М ЭКСПЕРИМЕНТЕ; в) 31 — случайная величина, представляющая ошибку, причем Е [21] = О.
Заметим, что если ошибки имеют отличное от нуля среднее значение Оь то это можно учесть, считая хи=1 в (4.3.2). Теорема Гаусса. Подход с помощью метода наименьших квадратов к задаче оценивания содержится р фундаментальной теореме Гаусса. Она утверждает, что если ошибки 21 некоррелированы, т. е, Сои [31, Я,:]=0 при 1'эд), и имеют нулевое среднее значение Е[21]=0 и одинаковую дисперсию Е[2гт)=ог, то оптимальными выборочными оценками параметров О„являются значения 0„, минимизирующие сумму квадратов расхождений между наблюденными значениями и подбираемой моделью, т.
е. сумму квадратов 5(01, Ог, ..., Од)= ~~ (Ут — О,хп — ОгХ,г — ... — О хт )'. (4.3.3) Как показано в приложении П4,1, выборочные опенки О, оптимальны в том смысле, что для любой линейной функции Е = — Л,О, †, Л,Ог + ... + ),„О, оценка имеет наименьшую среднеквадратичную ошибку. Выборочные оценки наименьших квадратов 0„(«=1, 2... й) можно получить, дифференцируя 5 (Оь Ог, ..., О„, ..., Од) по О„н решая получившуюся систему из и уравнений: хг, [уг — 61хн — ... — О хт ) =О, «=-1, 2, .
„й, (4.3,4) 1=1 которые обычно называются нормальными уравнениями, Пример. Чтобы проиллюстрировать метод наименьших квадратов Гаусса, рассмотрим ускорение тела, начинающего движение из состояния покоя под действием постоянной силы. Модель в этом случае имеет внд где т1 — скорость тела по истечении времени х.
Был проведен эксперимент, в котором скорости у; (1=1, 2, ..., Ат) тела замеоялись в различные моменты времени хь Измерение моментов времени 137 Таб.тица 4.1 2 хь сек 11 1 1',=Ох,+ х, (4.3.5) (2 121 147 175 247 254 уь лс сек 300 1,2~ — 2,8 — 4,7 7,3 — 5,5 2,3 Остатки 1Ч2 — Ох2 ) 5,0 гд 22 я 8 4 О В 1В 7, овд 5 (О) = ~~ (у, — Охт)'. (4.3.6) Гл. 4. Введение в теорию статистических выводов хе производилось очень точно, в то время как скорость измерялась с ошибкой. Поэтому в качестве вероятностной модели нашего экс- перимента можно взять Р и с. 4.3. Данные «скорость — время» н линия регрессии, полученная методом наименьших квадратов.
На рис. 4,3 и в табл. 4.1 приведены данные (хь ут), полученные в действительном эксперименте. Для этого примера сумма квадратов (4.3.3) имеет вид 4.3. Оценивание с ломоицью наименьших квадратов Данные «скорость †вре» для оненнвания ускорения Дифференцируя эту сумму по 0 и приравнивая нулю производную, получаем единственное нормальное уравнение к ~~ хт(у,.
— Ох,) =О. Следовательно, выборочная оценка наименьших квадратов имеет внд ~ к~у~ (4.3.7) х,. ! =! Для данных, помещенных в табл. 4.1, имеем ~х;ус=8538, 2 ха =, = 285 и, следовательно, О = — = — 29,96 лс1сек'. 285 Подобранная линия у=Ох показана на рис. 4.3. Она называется линией регрессии у на х. Теперь ее можно использовать для пред сказания значения скорости у в заданный момент времени х в лю бых последующих экспериментах при тех же условиях. 4.3.2. Доверительные интервалы для одного параметра Среднее значение н дисперсия оценки наименьших квадратов Как отмечалось выше, существенно иметь меру точности оцениваемого параметра, например в виде доверительного интервала. Этот доверительный интервал можно использовать в свою очередь для построения доверительного интервала для прогноза, сделанного по подобраннои модели. В упоминавшемся выше примере доверительные интервалы для 8 можно вывести, рассматривая выборочные свойства оценки 8, Гл.
4. Введение в теорию статистических вь!водов 138 139 соответствующей выборочной оценке наименьших квадратов (4.3.7). Так как х! являются фиксированными константами, то среднее значение оценки О равно ГЧ ~~ х28 ь=! — 6, х2 ~ х;Е !1т! Е [тт) х2 так что эта оценка несмещенная. Аналогично получаем нз (3.2.!8), что ее дисперсия равна (4.3.8) х, ь=! так как Тгаг[1'с[= ьтаг[лч[=о'.
Следовательно, если бы о' было известно, то (4.3.8) можно было бы использовать для построения доверительных интервалов для О, поскольку из того, что У! распределены нормально, следует, что !9 также распределена нормально. Кроме того, если даже л! не являются нормально распределенными, тем не менее О будет иметь распределение, близкое к нормальному в силу центральной предельной теоремы, и, таким образом, этот анализ будет устойчивым по отношению к предположениям, сделанным о распределении л!.
Оценивание остаточной дисперсии. В общем случае пам потребуется оценивать оа по данным. Чтобы увидеть, как это можно сделать, рассмотрим )~Ее=„х!() ! — 6х,) = Р' (К! — !Зхт-+х;( — 6)), (4.3.9) где пределы суммирования временно опушены. Раскрытие скобок в (4.3.9) дает ;ЕЕ2ь=) (!', — Ех,)'+2 (Š— 6) Х .,(У', — йх,) +( — 6)'2'„хаь, и так как О является оценкой наименьших квадратов, средний член исчезает, что дает Э ()'! — 6х!)'=-,5',(!'! — Йх;) +(!д — 6)'~х1! (4.3.10) Беря математическое ожидание от обеих частей (4.3.10), получаем Атот== Е (У (!', — Йх!) ~+Тгаг (В~ ~' хт, 4.3.
Оиенивание с помои!ью наименьших квадратов и отсюда, используя (4.3.8), получаем с [У !ть — е„)') =!Н вЂ” !!е. 1. =-! и 1 6+ г !1 — —.) м — ! 2 ) -[/ктч 2 (4,3.! !) где О дается равенством (4.3.7), и 1 Гч ( ')2 является выборочной оценкой дисперсии. Заметим, что ~~(у! — 6х,.) = „~' у'; — 6' „)' х',, (4.3.1 2) Таким образом, случайная величина З=„~,~(., В.,)2 ь=! гьоскочьки гйт — 1!52 является является несмещенной оценкой о. Пос . у ( квадратичной формой о формой от нормальных случайных величин и личина ас- Е[(12' — 1)52[=- (А! — !) о2, отсюда следует, что эта величина р пределена как оехь„г Р (4.3.10) вляется частным случаем теоремы (3.3.16) и ', Таким образом, из-за того, что случайные чины У; распределены как ьч'(Охь, а2), левая часть ( .'.
) р р- делена как о уь роэ Кроме того, случайная величина (6 — О) рас- пределена как. (, о,'~~х, и, А!(О, 2ч!~~ ', ) и, следовательно, случайная величина две случайные величины в правой части (4.3.10), имеющие 22-рас- и еделение, независимы. симы. Следовательно, случайную величину в ле- вой части (4.3.10), имеющую т2-распределение с М степенями сво- бо,ы, можно аз ить на две бо,, б на две независимые случайные величины, А! — ! и с одной степенями свободы имеющие 72-распределение с соответственно, Доверительные интервалы для О.
Так как !л к как !л — О ие зависит от 5, то отсюда следует, что случайная величина $/~ х2 (В 8) 5 спределепие с ч = Аь — ! степенями д свобо ы Отсюда им ет .-рзс ал ля 0 имеет вид 100(! — ьх) сл-ный доверительный интервал для 141 Гл. 4, Введение в теорию статистических выводов 140 4.3, Оценаванае с по.ггощью наименьших квадратов и, следовательно, поскольку 0 известно, для вычисления остаточной суммы квадратов и выборочной оценки дисперсии остается сосчитать лишь ~ у'.. г Для данных, приведенных в табл. 4.1, ~,уз=255949. Следо-. вательно, 8 (255949 — (29,96)'(258) ) =21,06 так что 95 гго-ный доверительный интервал для 0 равен о 29,96 ~ ' ' = (29,33; 30,58). )г 2зб Полезно также проверить индивидуальные разности от подобранного уравнения регрессии, чтобы посмотреть, не является ли какое- нибудь наблюдение аномальным или же разности укладываются в рассматриваемую схему.
Для нашего примера индивидуальные разности у — Ох показаны в третьем ряду табл. 4.1. Мы видим, что опи не содержат очевидных выбросов, которые могли бы вызвать сомнение в правильности модели. Остаточную сумму квадратов (4.3.12) можно переписать также в виде ~~ (Уг — Охг) = — (1 г) "~~ уг (4.3.1 3) где лах уг (~ хг ~~Р уг) ь является выборочным коэффициентом корреляции между х; н уг (при условии, что линия регрессии проходит через начало динат) . Отсюда (4.3.!2) можно записать в виде аг коор- (1 т.г) ~ уг ( г~ч~~уг (4.3.14) Результат (4.3.14) показывает, что в этом примере сумма квадратов отклонений у от нуля может быть разбита на составляющую те~ у',, равную сумме квадратов отклонений подобранной прямой линии от нуля, плюс сумму квадратов разностей между подобранными и наблюдаемыми величинами.