AlexgpgMathstat (554748), страница 2
Текст из файла (страница 2)
С учётом достаточно большого n = 61, можно говорить о нормальном распеределении. Построим интервал:Ŷ − YP (−u0.975 < p< u0.975 ) = 0.952σ L(X T X)−1 LT3.5241 + 2.0637x + 0.9247x2 − Y< u0.975 ) = 0.95P (−u0.975 < √2.1555 + 0.2114x − 0.0729x2 − 0.0328x3 + 0.0082x4P(√3.5241+2.0637x−1.9600 2.1555 + 0.2114x − 0.0729x2 − 0.0328x3 + 0.0082x4 +0.9247x2<Y<√3.5241+2.0637x+1.9600 2.1555 + 0.2114x − 0.0729x2 − 0.0328x3 + 0.0082x4 +0.9247x2 ) == 0.95Доверительный интервал для Y на уровне надежности 0.95 —√[3.5241+2.0637x−1.9600 2.1555 + 0.2114x − 0.0729x2 − 0.0328x3 + 0.0082x4 +0.9247x2 ,√3.5241+2.0637x+1.9600 2.1555 + 0.2114x − 0.0729x2 − 0.0328x3 + 0.0082x4 +0.9247x2 ]125Доверительная трубкаНа графике точками изображен график реального сигнала.Синем цветом показана фунция√y(x) = 3.5241+2.0637x+1.9600 2.1555 + 0.2114x − 0.0729x2 − 0.0328x3 + 0.0082x4 +0.9247x2Зеленым —√y(x) = 3.5241+2.0637x−1.9600 2.1555 + 0.2114x − 0.0729x2 − 0.0328x3 + 0.0082x4 +0.9247x2Красным —y(x) = 3.5241 + 2.0637x + 0.9247x2134Гистограмма по остаткам от регрессии1ВычисленияPp−1Вычислим остатки по формуле yk − j=0(θj xjk ), где = 4, k ∈ [1, 61].
То есть, ε0i =yi − ((3.52416852864) + (2.0637701845)xi + (0.92478069305)x2i ).Остатки:1[8.0751650676099977, 4.8749811890880004, −5.7991851448779999,12.452666065711997, 5.1305348208579993, −0.91557887943999994,−17.015675035181999, −11.029753646368, −0.41781471299799744,−7.7898582350720034, 4.0241157874100004, 1.8141073544480006,−11.319883533958, 4.822143122192001, 9.6401873228979991, −12.65575093184,−11.385671642022, −1.3395748076480007, −0.69746042871800018,11.520671494767999, 11.614820962810001, 0.34498797540799986,8.3811725325619992, 3.3633746342719997, 3.6515942805379997, −4.01416852864,1.7260862067380001, 10.402358486672, 4.1546483111620001,−10.187044319792001, 3.9872805938100004, −1.5123769480320002,−2.3360169453179997, −6.2636393980480012, 1.4647556937779989,−7.9008316698400014, 11.359598511097998, −3.9339537634080006,−2.0414884933580009, −18.253005678752, 3.9614946804099986,0.30201258412799348, 0.06854803240200269, −8.9388989747680014,6.1796715626179974, 8.6242596445600022, −7.605134728942005,7.4914884421119936, −5.4858708422779969, 4.462787417888002,8.5374632226100005, 16.638156571887997, −4.0351325342780058,−11.082404095887995, −0.40365811294199716, −5.3988945854400043,7.8318864866179965, −7.1113148967680075, 0.77150126440200495,−2.7196650298719902, 1.915186220410007]Отсортированные остатки:1[−18.253005678752, −17.015675035181999, −12.65575093184, −11.385671642022,−11.319883533958, −11.082404095887995, −11.029753646368,−10.187044319792001, −8.9388989747680014, −7.9008316698400014,−7.7898582350720034, −7.605134728942005, −7.1113148967680075,−6.2636393980480012, −5.7991851448779999, −5.4858708422779969,−5.3988945854400043, −4.0351325342780058, −4.01416852864,−3.9339537634080006, −2.7196650298719902, −2.3360169453179997,−2.0414884933580009, −1.5123769480320002, −1.3395748076480007,−0.91557887943999994, −0.69746042871800018, −0.41781471299799744,−0.40365811294199716, 0.06854803240200269, 0.30201258412799348,0.34498797540799986, 0.77150126440200495, 1.4647556937779989,1.7260862067380001, 1.8141073544480006, 1.915186220410007,143.3633746342719997, 3.6515942805379997, 3.9614946804099986,3.9872805938100004, 4.0241157874100004, 4.1546483111620001,4.462787417888002, 4.822143122192001, 4.8749811890880004,5.1305348208579993, 6.1796715626179974, 7.4914884421119936,7.8318864866179965, 8.0751650676099977, 8.3811725325619992,8.5374632226100005, 8.6242596445600022, 9.6401873228979991, 10.402358486672,11.359598511097998, 11.520671494767999, 11.614820962810001,12.452666065711997, 16.638156571887997]На интервале [−18.25, 16.64] построим гистограмму.
Длинна интрервала равна 34.89.Разобъем интервала на 9 отрезков. Обычно, длины отрезков выбираеются равными,но это совсем не обязательно. Все наши отрезки будут иметь длину hk = 3.88.Граничные точки отрезков будут:[’−18.3’, ’−14.4’, ’−10.5’, ’−6.6’, ’−2.7’, ’1.1’, ’5.0’, ’8.9’, ’12.8’, ’16.6’, ’20.5’]1Отрезки имеют вид:12345[[[[[6789[[[[−18.25, −17.02,]−12.66, −11.39, −11.32, −11.08, −11.03,]−10.19, −8.94, −7.90, −7.79, −7.61, −7.11,]−6.26, −5.80, −5.49, −5.40, −4.04, −4.01, −3.93,]−2.72, −2.34, −2.04, −1.51, −1.34, −0.92, −0.70, −0.42, −0.40, 0.07, 0.30, 0.34,0.77,]1.46, 1.73, 1.81, 1.92, 3.36, 3.65, 3.96, 3.99, 4.02, 4.15, 4.46, 4.82, 4.87,]5.13, 6.18, 7.49, 7.83, 8.08, 8.38, 8.54, 8.62,]9.64, 10.40, 11.36, 11.52, 11.61, 12.45,]16.64,]Их длины, можно записать в виде массива:1[2, 5, 6, 7, 13, 13, 8, 6, 1]Вычислим pk = nnk , где nk — число элементов выборки попавших в k-ый отрезок n—всего элементов вывборки.
Найдем высоту прямоугольника гистограмммы vk = pk /hkдля каждого отрезка.Высоты будут иметь вид:1[0, 0.0084572123190795184, 0.021143030797698793, 0.025371636957238552,0.029600243116778311, 0.054971880074016856, 0.054971880074016856,0.033828849276318074, 0.025371636957238552, 0.0042286061595397592]152Гистограмма165Гипотеза: ошибки наблюдения имеют гауссовскоераспеределениеПроверим гипотезу H0 при помощи хи-квадрат критерия Пирсона на уровне значимости 0.05 по остаткам от регрессии: εi = yi − (θ0 + θ1 xi + θ2 x2i + θ3 x3i ) ∼ N (0, δ 2 ).Параметры подлежащие оценке:• вектор θ,• дисперсия δ 2Имеем:3.5242θ̂ = 2.06380.924861δ̄ 2 =1 X(yi − ((3.52416852864) + (2.0637701845)xi + (0.92478069305)x2i ))261 − 3 i=1δ̄ 2 = 61.4996704457δ̄ = 7.84217255903Для критерия хи-квадрат, используем инервалы, из раздела про гистограмму, но,так как, область значений гауссовского распределения [−∞, ßf ty] то левая границапервого инервала заменяется на −∞, а правая граница последнего — на ∞.В итоге:1.
[−∞, −14.3762098731]2. [−14.3762098731, −10.4994140675]3. [−10.4994140675, −6.62261826187]4. [−6.62261826187, −2.74582245625]5. [−2.74582245625, 1.13097334938]6. [1.13097334938, 5.00776915501]7. [5.00776915501, 8.88456496063]8. [8.88456496063, 12.7613607663]179. [12.7613607663, ∞]Для каждого из этих интервалов надо вычислить вероятность попадания в него реализации гауссовской величины. Для [ai , bi ] будет: p̂i = Φ0 ( bδ̄i ) − Φ0 ( aδ̄i ).−14.3762098731−∞) − Φ0 () = 0.03338699381557.842172559037.84217255903−10.4994140675−14.3762098731Φ0 () − Φ0 () = 0.1088870791527.842172559037.84217255903−6.62261826187−10.4994140675Φ0 () − Φ0 () = 0.1639200643827.842172559037.84217255903−6.62261826187−2.74582245625) − Φ0 () = 0.194216846971Φ0 (7.842172559037.842172559031.13097334938−2.74582245625Φ0 () − Φ0 () = 0.1811129807977.842172559037.842172559035.007769155011.13097334938Φ0 () − Φ0 () = 0.1329280054897.842172559037.842172559035.007769155018.88456496063) − Φ0 () = 0.0767841394899Φ0 (7.842172559037.8421725590312.76136076638.88456496063Φ0 () − Φ0 () = 0.03490491381597.842172559037.84217255903∞12.7613607663Φ0 () − Φ0 () = 0.03490491381597.842172559037.84217255903Φ0 (Если сложить все p̂i , то получится 1.0.
Что соостветствует площади под графикомгауссщвской функции распределения. Всего скорее, наше предположение правильное, применим критерий Пирсона.9Xn2mgn =− 61 ∼ χ2 (9 − 1 − 4)61p̂mm=1Квантиль χ2 распределения на уровне надежности 0.95 равна 7.8147. Квантильχ2 распределения на уровне надежности 0.99 равна 11.3449. Реализация gn есть3.62493648079. Гипотеза принимается в обоих случаях.186ВыводыВ ходе выполнения лабораторной работы был изучен метод наименьших квадратови примен для оценки полезного сигнала. Был получен результат:ŷ(x) = 3.5241 + 2.0637x + 0.9247x2Построены доверительные интегралы для сигнала и его параметров. Найдена оценкадисперсии ошибки наблюдения.σ 2 = 61.4996704457При помощи критерия Пирсона, была проверена гипотеза, о том, что закон распеределения ошибки гауссовский. Гипотеза принята на уровне значимости 0.05.19.