mathstat (554747), страница 2
Текст из файла (страница 2)
Построим эти интервалы:P (−u0.975 < qθ̂i − θi(X T X)−1 [i][i] ·Qn−p< u0.975 ) = 0.95−5.04622273041 − θ2< u0.975 ) = 0.950.0551115402581P (−5.154241 < θ2 < −4.938204) = 0.95P (−u0.975 <10P (−u0.995 < qθ̂i − θi(X T X)−1 [i][i] ·Qn−p< u0.995 ) = 0.99−5.04622273041 − θ2< u0.995 ) = 0.990.0551115402581P (−5.188190 < θ2 < −4.904255) = 0.99P (−u0.995 <Доверительный интервал для θ2 на уровне надежности 0.95 — [−5.154241, −4.938204]Доверительный интервал для θ2 на уровне надежности 0.99 — [−5.188190, −4.904255]4Оценка YРассмотрим интервальную оценку полезного сигнала Ŷ для произвольного моментавремени x на уровне надёжности 0.95.Ŷ ∼ N (Y ; K̂Yn ),K̂Yn = cov(∆Ŷn , ∆Ŷn ) = σ 2 L(X T X)−1 LTL = hT = 1 x x20.3180σ 2 = 22.7718288612; θ̂ = 2.3317 ;−5.0462(X T X)−10.03500.0017 −0.00150.0019 −0.0003 ;= 0.0017−0.0015 −0.0003 0.0001Используя, символьные вычисления (ну или листок бумаги), получим 0.03500.0017 −0.001512T−1 T2 0.00170.0019 −0.0003x =σ L(X X) L = 1 x x−0.0015 −0.0003 0.0001x20.7981 + 0.0782x − 0.0269x2 − 0.0121x3 + 0.0030x4Возьмем статистикуŶ − Ypσ 2 L(X T X)−1 LT11√Ŷ − Y0.7981 + 0.0782x − 0.0269x2 − 0.0121x3 + 0.0030x4Она будет распределена по Стьюденту в общем случае.
С учётом достаточно большого n = 61, можно говорить о нормальном распеределении. Построим интервал:Ŷ − YP (−u0.975 < p< u0.975 ) = 0.952σ L(X T X)−1 LT0.3179 + 2.3317x − 5.0462x2 − Y< u0.975 ) = 0.95P (−u0.975 < √0.7981 + 0.0782x − 0.0269x2 − 0.0121x3 + 0.0030x4P(√0.3179+2.3317x−1.9600 0.7981 + 0.0782x − 0.0269x2 − 0.0121x3 + 0.0030x4 −5.0462x2<Y<√0.3179+2.3317x+1.9600 0.7981 + 0.0782x − 0.0269x2 − 0.0121x3 + 0.0030x4 −5.0462x2 ) == 0.95Доверительный интервал для Y на уровне надежности 0.95 —√[0.3179+2.3317x−1.9600 0.7981 + 0.0782x − 0.0269x2 − 0.0121x3 + 0.0030x4 −5.0462x2 ,√0.3179+2.3317x+1.9600 0.7981 + 0.0782x − 0.0269x2 − 0.0121x3 + 0.0030x4 −5.0462x2 ]125Доверительная трубкаНа графике точками изображен график реального сигнала.Синем цветом показана фунция√y(x) = 0.3179+2.3317x+1.9600 0.7981 + 0.0782x − 0.0269x2 − 0.0121x3 + 0.0030x4 −5.0462x2Зеленым —√y(x) = 0.3179+2.3317x−1.9600 0.7981 + 0.0782x − 0.0269x2 − 0.0121x3 + 0.0030x4 −5.0462x2Красным —y(x) = 0.3179 + 2.3317x − 5.0462x2134Гистограмма по остаткам от регрессии1ВычисленияPp−1Вычислим остатки по формуле yk − j=0(θj xjk ), где = 4, k ∈ [1, 61].
То есть, ε0i =yi − ((0.317975615346) + (2.33173684105)xi + (−5.04622273041)x2i ).Остатки:1[4.496276850154004, 4.1393329303404016, −3.8139131710404257, 6.6365385460116215,3.2906880814964126, −0.55146456458599857, −9.8899193922355977,−6.8246764014523791, −0.45573559223640814, −4.4830969645875811,2.3932394814939997, 1.0732737460083897, −6.7429941710443941,2.8444357303356043, 5.8355634501484062, −7.5696110116059998,−6.8710876549275994, −0.76886647981639555, −0.46294748627240168,6.9066693257043994, 6.9399839561140002, 0.19699640495640125,5.0377066722316002, 2.0121147579396004, 2.1902206620804003,−2.4179756153460001, 1.0275259256604001, 6.2467252850996005,2.4796224629715997, −6.1337825407235993, 2.3865102740140003,−0.90949909281559993, −1.4018106412124007, −3.7304243711763956,0.83465971729240351, −4.7965583758059989, 6.8759213495284062,−2.3479011067043984, −1.2680257445043956, −10.884452563871605,2.4028184351939998, 0.39378725269241244, −0.11154611137641268,−5.6131816570123831, 3.8888806157844016, 5.1946407070140026,−4.2959013833235957, 4.3172543447716265, −3.5658921087004103,2.7546592562603962, 5.178908439654009, 11.006855441480411,−2.761499738260369, −7.1261570995684167, −0.087116642443589853,−3.6443783668859737, 5.2020577271044317, −4.5478083604723452,0.10602337038358201, −1.8364470803276163, 1.6247802873940032]Отсортированные остатки:1[−10.884452563871605, −9.8899193922355977, −7.5696110116059998,−7.1261570995684167, −6.8710876549275994, −6.8246764014523791,−6.7429941710443941, −6.1337825407235993, −5.6131816570123831,−4.7965583758059989, −4.5478083604723452, −4.4830969645875811,−4.2959013833235957, −3.8139131710404257, −3.7304243711763956,−3.6443783668859737, −3.5658921087004103, −2.761499738260369,−2.4179756153460001, −2.3479011067043984, −1.8364470803276163,−1.4018106412124007, −1.2680257445043956, −0.90949909281559993,−0.76886647981639555, −0.55146456458599857, −0.46294748627240168,−0.45573559223640814, −0.11154611137641268, −0.087116642443589853,0.10602337038358201, 0.19699640495640125, 0.39378725269241244,0.83465971729240351, 1.0275259256604001, 1.0732737460083897,141.6247802873940032, 2.0121147579396004, 2.1902206620804003,2.3865102740140003, 2.3932394814939997, 2.4028184351939998,2.4796224629715997, 2.7546592562603962, 2.8444357303356043,3.2906880814964126, 3.8888806157844016, 4.1393329303404016,4.3172543447716265, 4.496276850154004, 5.0377066722316002,5.178908439654009, 5.1946407070140026, 5.2020577271044317,5.8355634501484062, 6.2467252850996005, 6.6365385460116215,6.8759213495284062, 6.9066693257043994, 6.9399839561140002,11.006855441480411]На интервале [−10.88, 11.01] построим гистограмму.
Длинна интрервала равна 21.89.Разобъем интервала на 8 отрезков. Обычно, длины отрезков выбираеются равными,но это совсем не обязательно. Все наши отрезки будут иметь длину hk = 2.74.Граничные точки отрезков будут:[’−10.9’, ’−8.1’, ’−5.4’, ’−2.7’, ’0.1’, ’2.8’, ’5.5’, ’8.3’, ’11.0’]1Отрезки имеют вид:1234[[[[5678[[[[−10.88, −9.89,]−7.57, −7.13, −6.87,−4.80, −4.55, −4.48,−2.42, −2.35, −1.84,−0.09,]0.11, 0.20, 0.39, 0.83,2.84, 3.29, 3.89, 4.14,5.84, 6.25, 6.64, 6.88,11.01,]−6.82, −6.74, −6.13, −5.61,]−4.30, −3.81, −3.73, −3.64, −3.57, −2.76,]−1.40, −1.27, −0.91, −0.77, −0.55, −0.46, −0.46, −0.11,1.03, 1.07, 1.62, 2.01, 2.19, 2.39, 2.39, 2.40, 2.48, 2.75,]4.32, 4.50, 5.04, 5.18, 5.19, 5.20,]6.91, 6.94,]Их длины, можно записать в виде массива:1[2, 7, 9, 12, 14, 10, 6, 1]Вычислим pk = nnk , где nk — число элементов выборки попавших в k-ый отрезок n—всего элементов вывборки.
Найдем высоту прямоугольника гистограмммы vk = pk /hkдля каждого отрезка.Высоты будут иметь вид:1[0, 0.011981699855627031, 0.041935949494694612, 0.053917649350321638,0.071890199133762184, 0.083871898989389224, 0.059908499278135151,0.035945099566881092, 0.0059908499278135156]152Гистограмма165Гипотеза: ошибки наблюдения имеют гауссовскоераспеределениеПроверим гипотезу H0 при помощи хи-квадрат критерия Пирсона на уровне значимости 0.05 по остаткам от регрессии: εi = yi − (θ0 + θ1 xi + θ2 x2i + θ3 x3i ) ∼ N (0, δ 2 ).Параметры подлежащие оценке:• вектор θ,• дисперсия δ 2Имеем:0.3180θ̂ = 2.3317 −5.046261δ̄ 2 =1 X(yi − ((0.317975615346) + (2.33173684105)xi + (−5.04622273041)x2i ))261 − 3 i=1δ̄ 2 = 22.7718288612δ̄ = 4.77198374486Для критерия хи-квадрат, используем инервалы, из раздела про гистограмму, но,так как, область значений гауссовского распределения [−∞, ßf ty] то левая границапервого инервала заменяется на −∞, а правая граница последнего — на ∞.В итоге:1.
[−∞, −8.1480390632]2. [−8.1480390632, −5.41162556253]3. [−5.41162556253, −2.67521206186]4. [−2.67521206186, 0.0612014388044]5. [0.0612014388044, 2.79761493947]6. [2.79761493947, 5.53402844014]7. [5.53402844014, ∞]17Для каждого из этих интервалов надо вычислить вероятность попадания в него реализации гауссовской величины. Для [ai , bi ] будет: p̂i = Φ0 ( bδ̄i ) − Φ0 ( aδ̄i ).−8.1480390632−∞) − Φ0 () = 0.04386697585464.771983744864.77198374486−5.41162556253−8.1480390632Φ0 () − Φ0 () = 0.1591437527264.771983744864.77198374486−2.67521206186−5.41162556253Φ0 () − Φ0 () = 0.2175839442534.771983744864.771983744860.0612014388044−2.67521206186Φ0 () − Φ0 () = 0.2160326587654.771983744864.771983744862.797614939470.0612014388044Φ0 () − Φ0 () = 0.1557637448754.771983744864.771983744865.534028440142.79761493947Φ0 () − Φ0 () = 0.08155046808144.771983744864.77198374486∞5.53402844014Φ0 () − Φ0 () = 0.08155046808144.771983744864.77198374486Φ0 (Если сложить все p̂i , то получится 1.0.
Что соостветствует площади под графикомгауссщвской функции распределения. Всего скорее, наше предположение правильное, применим критерий Пирсона.7Xn2mgn =− 61 ∼ χ2 (7 − 1 − 4)61p̂mm=1Квантиль χ2 распределения на уровне надежности 0.95 равна 5.9915. Квантильχ2 распределения на уровне надежности 0.99 равна 9.2103. Реализация gn есть1.82651753454.
Гипотеза принимается в обоих случаях.186ВыводыВ ходе выполнения лабораторной работы был изучен метод наименьших квадратови примен для оценки полезного сигнала. Был получен результат:ŷ(x) = 0.3179 + 2.3317x − 5.0462x2Построены доверительные интегралы для сигнала и его параметров. Найдена оценкадисперсии ошибки наблюдения.σ 2 = 22.7718288612При помощи критерия Пирсона, была проверена гипотеза, о том, что закон распеределения ошибки гауссовский. Гипотеза принята на уровне значимости 0.05.19.