ChernishevMathstat (методичка по ТВиМС(МАИ))
Описание файла
Файл "ChernishevMathstat" внутри архива находится в следующих папках: методичка по ТВиМС(МАИ), Generated. PDF-файл из архива "методичка по ТВиМС(МАИ)", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из 4 семестр, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "теория вероятности и математическая статистика" в общих файлах.
Просмотр PDF-файла онлайн
Текст из PDF
Московский авиационный институт(государственный TEXнический университет)Факультет прикладной математикиKафедра «Теория вероятностей»Лабораторная работа по курсу «теория вероятностей и матеметическаястатистика»Студент: П. А. ЧернышевПреподаватель: Е. Р. ГоряиноваМосква, 2009Содержание1 Определение порядка модели,МНК оценка вектора θ1Шаг 0. . . . . . . .
. . . . . . .2Шаг 1. . . . . . . . . . . . . . .3Шаг 2. . . . . . . . . . . . . . .4Шаг 3. . . . . . . . . . . . . . .................................................................................................2 График оценки полезного сигнала3 Интервальные оценки для θ1Оценка θ̂0 . . . . . . .
. . .2Оценка θ̂1 . . . . . . . . . .3Оценка θ̂2 . . . . . . . . . .4Оценка Y . . . . . . . . . .5Доверительная трубка . . .и.....y. .. .. .. .. ......444557..............................................................................................................8891011134 Гистограмма по остаткам от регрессии141Вычисления . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . 142Гистограмма . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 Гипотеза: ошибки наблюдения имеют гауссовское распеределение176 Выводы191Задача:• Написать краткий реферат по методу наименьших квадратов (МНК).• Подобрать порядок модели p , используя критерий Фишера, и оценить векторпараметров θ модели полезного сигнала методом наименьших квадратов.• Построить график оценки полезного сигнала на всем интервале наблюдения [x1 , x2 ].• Найти закон распределения оценки вектора параметров.
Построить доверительные интервалы уровня надежности 0.95 и 0.99 для параметров [θ1 , . . . , θp−1 ]. Дляпроизвольного момента времени найти интервальную оценку полезного сигналанадежности 0.95. Проанализировать полученные результаты• По остаткам от регрессии построить оценку плотности распределения случайной ошибки наблюдения в виде гистограммы.• По остаткам с помощью критерия хи-квадрат К. Пирсона на уровне значимости 0.05 проверить гипотезу о том, что закон распределения ошибки наблюдения действительно является гауссовским.Входной массив X (61 число):1234567891011[−5.0, −4.8, −4.6, −4.4, −4.2, −4.0, −3.8, −3.6, −3.4, −3.2, −3.0,−2.8, −2.6, −2.4, −2.2, −2.0, −1.8, −1.6, −1.4, −1.2, −1.0,−0.8, −0.6, −0.4, −0.2, 0.0, 0.2, 0.4, 0.6, 0.8, 1.0, 1.2, 1.4,1.6, 1.8, 2.0, 2.2, 2.4, 2.6, 2.8, 3.0, 3.2, 3.4, 3.6, 3.8,4.0, 4.2, 4.4, 4.6, 4.8, 5.0, 5.2, 5.4, 5.6, 5.8, 6.0, 6.2,6.4, 6.6, 6.8, 7.0]2Выходной массив Y для 9 варианта (61 число):1[−245.,−227,−213.,−191.,−175.,−162.,−153.,−137.,−120.,−110.,−93.6,−83.1,−76.9,−61.7,−51.0,−50.31Определение порядка модели,МНК оценка вектора θ1Шаг 0.Предположим, что yi = θ0 + εi .θ̂0 = (X T X)−1 X T Y−1 T= 61.0000X Y T= 0.0164 X Y = −118.8174,,yi = (−118.817360656)2Шаг 1.Предположим, что yi = θ0 + θ1 xi + εi .θ̂1 = (X T X)−1 X T Y−161.0000 61.0000XT Y=61.0000 817.40000.0177 −0.0013−104.7378T=X Y =−14.0796−0.0013 0.0013,,yi = (−104.737801163) + (−14.0795594923)xiQn (p) =p−1nXX(yk −(θj xjk ))2 ; Q61 (1) = 761506.581576k=1j=0Q61 (0) − Q61 (1)∼ F (1, 61 − 1 − 1)1Q(1)6161−1−1Квантиль распределения Фишера равна 4.012.
Доверительной областью являетсяинтервал от 0 до 4.012. Kритической областью является интервал от 4.012 до ∞.Значение левой части выражения равно 14.7109302948. Цикл поиска продолжается.43Шаг 2.Предположим, что yi = θ0 + θ1 xi + θ2 x2i + εi .θ̂2 = (X T X)−1 X T Y−161.000061.0000817.4000= 61.0000 817.4000 2330.2000 X T Y817.4000 2330.2000 21476.19680.03500.0017 −0.0015−1.81350.0019 −0.0003 X T Y = 3.9773 = 0.0017−0.0015 −0.0003 0.0001−9.0284,,yi = (−1.81349719008) + (3.97733594158)xi + (−9.02844771696)x2ip−1nXXQn (p) =(yk −(θj xjk ))2 ; Q61 (2) = 611562.387381k=1j=0Q61 (1) − Q61 (2)∼ F (1, 61 − 1 − 2)1Q (2)61−1−2 61Квантиль распределения Фишера равна 4.0138.
Доверительной областью являетсяинтервал от 0 до 4.0138. Kритической областью является интервал от 4.0138 до ∞.Значение левой части выражения равно 84878.254773. Цикл поиска продолжается.4Шаг 3.Предположим, что yi = θ0 + θ1 xi + θ2 x2i + θ3 x3i + εi .5θ̂3 = (X T X)−1 X T Y−161.000061.0000817.40002330.2000 61.0000817.40002330.2000 21476.1968 T= 817.4000 2330.2000 21476.1968 92008.9840 X Y2330.2000 21476.1968 92008.9840 712678.14750.0414 −0.0040 −0.0024 0.0003−1.9032−0.0040 0.00710.0005 −0.0003 X T Y = 4.0586 =−0.0024 0.0005−9.01580.0003 −0.00000.0003 −0.0003 −0.0000 0.0000−0.0042,,yi = (−1.90316693968) + (4.05859073721)xi + (−9.01582528599)x2i + (−0.00420747698948)x3iQn (p) =p−1nXX(yk −(θj xjk ))2 ; Q61 (3) = 424.809831115k=1j=0Q61 (2) − Q61 (3)∼ F (1, 61 − 1 − 3)1Q(3)6161−1−3Квантиль распределения Фишера равна 4.0156. Доверительной областью являетсяинтервал от 0 до 4.0156.
Kритической областью является интервал от 4.0156 до∞. Значение левой части выражения равно 0.173487939996. Оно попадает в доверительный интервал. Цикл поиска остановлен. Порядок полинома равен 2, коэффициенты берем из шага 3. В итоге наш полином равен yi = (−1.81349719008) +(3.97733594158)xi + (−9.02844771696)x2i .62График оценки полезного сигналаНа графике точками изображен график реального сигнала.Синем цветом показана фунция yi = (−118.817360656)Зеленым — yi = (−104.737801163) + (−14.0795594923)xiКрасным — yi = (−1.81349719008) + (3.97733594158)xi + (−9.02844771696)x2i73Интервальные оценки для θ и yТак как θ̂ − θ ∼ N (0, σ 2 (X T X)−1 ), тоНапомним, что0.03500.0017T−10.0019(X X) = 0.0017−0.0015 −0.0003θ̂ ∼ N (θ, σ 2 (X T X)−1 ).−0.0015−1.8135−0.0003 ; θ̂ = 3.9773 ; σ 2 = 7.32430743301;0.0001−9.0284Построим доверительные интервалы для каждого элемента из heta.1Оценка θ̂0Рассмотрим параметр θ̂0θ̂0 ∼ N (θ0 , σ 2 0.0350494184893).Построим доверительные интервалы уровней надёжности 0.95 и 0.99 для этого параметра.
Для N (0, 1) квантили u0.975 = 1.96 и u0.995 = 2.576, соответственно.Возьмем статистикуθ̂i − θiqQ(X T X)−1 [i][i] · n−pθ̂0 − θ0q(X T X)−1 [0][0] ·Q61−3θ̂0 − θ0√0.0350494184893 · 7.32430743301Она будет распределена по Стьюденту в общем случае. С учётом достаточно большого n = 61, можно говорить о нормальном распеределении. Построим эти интервалы:P (−u0.975 < qθ̂i − θi(X T X)−1 [i][i] ·Qn−p< u0.975 ) = 0.95−1.81349719008 − θ0< u0.975 ) = 0.950.506668250795P (−2.806567 < θ0 < −0.820427) = 0.95P (−u0.975 <8P (−u0.995 < qθ̂i − θi(X T X)−1 [i][i] ·Qn−p< u0.995 ) = 0.99−1.81349719008 − θ0< u0.995 ) = 0.990.506668250795P (−3.118675 < θ0 < −0.508320) = 0.99P (−u0.995 <Доверительный интервал для θ0 на уровне надежности 0.95 — [−2.806567, −0.820427]Доверительный интервал для θ0 на уровне надежности 0.99 — [−3.118675, −0.508320]2Оценка θ̂1Рассмотрим параметр θ̂1θ̂1 ∼ N (θ1 , σ 2 0.00185556749208).Построим доверительные интервалы уровней надёжности 0.95 и 0.99 для этого параметра.
Для N (0, 1) квантили u0.975 = 1.96 и u0.995 = 2.576, соответственно.Возьмем статистикуθ̂i − θiqQ(X T X)−1 [i][i] · n−pθ̂1 − θ1q(X T X)−1 [1][1] ·Q61−3θ̂1 − θ10.00185556749208 · 7.32430743301Она будет распределена по Стьюденту в общем случае. С учётом достаточно большого n = 61, можно говорить о нормальном распеределении. Построим эти интервалы:√P (−u0.975 < qθ̂i − θi(X T X)−1 [i][i] ·Qn−p< u0.975 ) = 0.953.97733594158 − θ1< u0.975 ) = 0.950.11657935827P (3.748840 < θ1 < 4.205831) = 0.95P (−u0.975 <9P (−u0.995 < qθ̂i − θi(X T X)−1 [i][i] ·Qn−p< u0.995 ) = 0.993.97733594158 − θ1< u0.995 ) = 0.990.11657935827P (3.677028 < θ1 < 4.277644) = 0.99P (−u0.995 <Доверительный интервал для θ1 на уровне надежности 0.95 — [3.748840, 4.205831]Доверительный интервал для θ1 на уровне надежности 0.99 — [3.677028, 4.277644]3Оценка θ̂2Рассмотрим параметр θ̂2θ̂2 ∼ N (θ2 , σ 2 0.000133378916912).Построим доверительные интервалы уровней надёжности 0.95 и 0.99 для этого параметра.
Для N (0, 1) квантили u0.975 = 1.96 и u0.995 = 2.576, соответственно.Возьмем статистикуθ̂i − θiqQ(X T X)−1 [i][i] · n−pθ̂2 − θ2q(X T X)−1 [2][2] ·Q61−3θ̂2 − θ2√0.000133378916912 · 7.32430743301Она будет распределена по Стьюденту в общем случае.
С учётом достаточно большого n = 61, можно говорить о нормальном распеределении. Построим эти интервалы:P (−u0.975 < qθ̂i − θi(X T X)−1 [i][i] ·Qn−p< u0.975 ) = 0.95−9.02844771696 − θ2< u0.975 ) = 0.950.0312555305913P (−9.089709 < θ2 < −8.967187) = 0.95P (−u0.975 <10P (−u0.995 < qθ̂i − θi(X T X)−1 [i][i] ·Qn−p< u0.995 ) = 0.99−9.02844771696 − θ2< u0.995 ) = 0.990.0312555305913P (−9.108962 < θ2 < −8.947933) = 0.99P (−u0.995 <Доверительный интервал для θ2 на уровне надежности 0.95 — [−9.089709, −8.967187]Доверительный интервал для θ2 на уровне надежности 0.99 — [−9.108962, −8.947933]4Оценка YРассмотрим интервальную оценку полезного сигнала Ŷ для произвольного моментавремени x на уровне надёжности 0.95.Ŷ ∼ N (Y ; K̂Yn ),K̂Yn = cov(∆Ŷn , ∆Ŷn ) = σ 2 L(X T X)−1 LTL = hT = 1 x x2−1.8135σ 2 = 7.32430743301; θ̂ = 3.9773 ;−9.0284(X T X)−10.03500.0017 −0.00150.0019 −0.0003 ;= 0.0017−0.0015 −0.0003 0.0001Используя, символьные вычисления (ну или листок бумаги), получим 0.03500.0017 −0.001512T−1 T2 0.00170.0019 −0.0003x =σ L(X X) L = 1 x x−0.0015 −0.0003 0.0001x20.2567 + 0.0251x − 0.0086x2 − 0.0039x3 + 0.0009x4Возьмем статистикуŶ − Ypσ 2 L(X T X)−1 LT11√Ŷ − Y0.2567 + 0.0251x − 0.0086x2 − 0.0039x3 + 0.0009x4Она будет распределена по Стьюденту в общем случае.
С учётом достаточно большого n = 61, можно говорить о нормальном распеределении. Построим интервал:Ŷ − YP (−u0.975 < p< u0.975 ) = 0.952σ L(X T X)−1 LT−1.8134 + 3.9773x − 9.0284x2 − Y< u0.975 ) = 0.95P (−u0.975 < √0.2567 + 0.0251x − 0.0086x2 − 0.0039x3 + 0.0009x4P(√−1.8134+3.9773x−1.9600 0.2567 + 0.0251x − 0.0086x2 − 0.0039x3 + 0.0009x4 −9.0284x2<Y<√−1.8134+3.9773x+1.9600 0.2567 + 0.0251x − 0.0086x2 − 0.0039x3 + 0.0009x4 −9.0284x2 ) == 0.95Доверительный интервал для Y на уровне надежности 0.95 —√[−1.8134+3.9773x−1.9600 0.2567 + 0.0251x − 0.0086x2 − 0.0039x3 + 0.0009x4 −9.0284x2 ,√−1.8134+3.9773x+1.9600 0.2567 + 0.0251x − 0.0086x2 − 0.0039x3 + 0.0009x4 −9.0284x2 ]125Доверительная трубкаНа графике точками изображен график реального сигнала.Синем цветом показана фунция√y(x) = −1.8134+3.9773x+1.9600 0.2567 + 0.0251x − 0.0086x2 − 0.0039x3 + 0.0009x4 −9.0284x2Зеленым —√y(x) = −1.8134+3.9773x−1.9600 0.2567 + 0.0251x − 0.0086x2 − 0.0039x3 + 0.0009x4 −9.0284x2Красным —y(x) = −1.8134 + 3.9773x − 9.0284x2134Гистограмма по остаткам от регрессии1ВычисленияPp−1Вычислим остатки по формуле yk − j=0(θj xjk ), где = 4, k ∈ [1, 61].