4 часть (1081361), страница 58
Текст из файла (страница 58)
~> По выборкам, приведенным в задачах 19.363-19.365, найти оценки параметров и порядок полиномиальной модели. Предполагается, что ошибки наблюдений не коррелнрованы и имеют распределение Ф(0, сс); уровень значимости ст задается. 19.363. се = 0,10. 19.364. ст = 0,05. а) Здесь, ааа обычно при сравнении дисперсий, в числитель ставится ббльшая дисперсия. я 7. Элементы регрессионного анализа 327 19.365. 19.366. Пусть фу(х), у = О, 1, ..., й — 1 — ортогональная система функций на множестве значений хм хэ, ..., х„. Показать, что оценки параметров модели вычисляемые по результатам наблюдений (х;, р,), г = 1, 2, ..., и, не коррелированы. Определить дисперсии этих оценок.
19.367. Показать, что система функций фо(х) = 1, ф1(х) = х — х ортогональна на множестве значений хм хэ, ..., х„. 19.368*. Система функций 1, соях, я1пх, соя2х, я1п2х, , соятх, я1птх ортогональна на множестве значений ха = = 2пЦп, где й = О, 1, 2, ..., п — 1, п > 2т+ 1. Вычислить МНК-оценки параметров модели у = по + а1соях+ р1 апх+ + а,„соятх+ 13 жигах по результатам наблюдений (ха, уа) и найти дисперсии этих оценок. Используя результаты задачи 19.368, найти оценки параметров модели указанного порядка гп и вычислить дисперсии этих оценок по выборкам в задачах 19.369 и 19.370.
19.369. Гл. 19. Математическая статистика 328 19.370. т = 1. 1 — = Ро+ Ах. 1 Обозначим — = у; тогда получим у = По+ 31х. Полученная модель г линейна по параметрам По и Д. Р В задачах 19.371 — 19.376 преобразовать каждую нелинейную модель в линейную по параметрам. 1 1 19.372. — = Д + —.
у Дх' 19.371. 9 — е — д1*+дэ +Д 19374 „зп„у + 19.376. р = Ро+ агх ' 19.375. у = 9охд1 Для нахождения оценок параметров в задачах 19.377-19.381 использовать метод наименьших квадратов, предварительно выполнив преобразование нелинейной модели в линейную по параметрам. 4. Некоторые нелинейные задачи, сводящиеся к линейным моделям. Во многих практически важных задачах зависимость между переменными У и х нелинейна по параметрам.
Однако часто можно найти преобразование переменных, которое приводит к линейной модели. Как правило, вычисление оценок параметров для линейной модели существенно упрощаетсл. Тем не менее следует иметь в виду, что при вычислении оценок параметров по методу наименьших квадратов в этом случае минимизируется сумма квадратов отклонений преобразованных, а не исходных данных. Очевидно, что свойства полученных оценок и возможность их дальнейшего статистического анализа зависят от того, удовлетворяются ли условия, сформулированные в начале этого параграфа, для преобразованных переменных.
Пример б. Зависимость между переменными г и х имеет вид г = 1 . Преобразовать эту модель в линейную по параметрам. Ро+ д1х' а Запишем зависимость между г и х в таком виде: 3 7. Элементы регрессионного анализа 329 19.377. Барометрическое давление связано с высотой следующим соотношением: — = ехр где р — барометрическое давление на высоте г, Т вЂ” температура, а ро и й — параметры. Найти оценки параметров ЦТ и ро по результатам 6 наблюдений, проведенных при приблизительно постоянной температуре: 19.378. Для исследования зависимости давления р насыщенного пара 1Н/см2) от удельного объема о (мз/кг) составлена таблица опытных данных: е 3,334 1,630 0,866 0,423 0,265 0,170 0,115 р 0,482 1,034 2,027 4,247 7,164 11,480 17,60 Считая, что функциональная зависимость между этими переменными имеет вид р=Ро, найти оценки параметров а и 17.
19.379. Функциональная зависимость удельного сопротивления кристаллического кварца р (Ом см) от абсолютной температуры Т1К) имеет вид 16(а!Т 1+5 Используя опытные данные Щм 4 Щм 3 Ц)м 2 Щм 2 Щм 1 5 Щм 1 Н1м Т 335 365 400 445 500 570 670 найти оценки параметров а и 6.
19.380. Исследование зависимости продолжительности 1 реше- ния систем линейных уравнений от порядка системы и дало следующие результаты: п 2 3 4 5 б 7 8 9 10 й мин 12 35 75 130 210 315 445 600 800 Предполагая, что 1 = Апт, найти оценки параметров А и 7. Гл. 19. Математическая статистика 19.381. Получена выборка наблюдений переменных х и у: х 1 2 3 4 5 6 7 330 у 62,1 87,2 109,3 127,3 134,7 136,2 136,9 Для представления этих данных предлагается использовать модель Оценки параметров модели (38) могут быть найдены по формуле |3 = = (АтА) ' Атг', однако более удобно находить оценки для модели в в — |81(х| х|) + Цг(хг хг), Последовательность вычислений в этом случае следую|цап.
Сначала длл каждой переменной находят суммы наблюдаемых значений, суммы квадратов, а также суммы попарных произведений. Затем вычисляют Яю ()х„|.~„„,6~„ю (~„„, используя формулы „, (~ )',,„,, (~..ч)' — х,р, я (~ х||) ~~ хг|) Я„„= ~~~ хнхж— у' = 1, 2. я Далее вычисляют матрицы АтА=( Ю*' 6)*'*' ) ((тА)-' = Ю*' 1",1„ 1, -Ю*,*, ,~'Ъ'=( - ). — Д„„~ 1 / ~.гл~ х 9 = до+ д|х Найти оценки параметров 7уо и 771. 5. Множественная линейная регрессия (случай двух независимых переменных).
Предположим, что зависимость между переменными имеет вид Р = |го + |3|х| + |8гхг, (38) где переменные х| и хг принимают заданные фиксированные значенил, причем между переменными х| и хг нет линейной зависимости. Результаты наблюдения (хн, хги 9|), | = 1, 2, ..., п, представллютсл в виде 9| = 11о+)3|хи+)3гхг;+со 3 7. Элементы регрессвоняого анализа 331 р (4тА)-~А~т = Оценка параметра До вычисляется по формуле )го = у — )ггпу! — Лги. (39) Остаточная сумма квадратов с„), вычисляется по формуле — )ч Агу Предположим, что ошибки наблюдений е, независимы, имеют равные дисперсии и нормально распределены.
В этом случае можно проверить гипотезу Но . Д = )гг = О. Эта гипотеза позволяет установить, находятся ли переменные хг и хг во вааимосвязи с У. Статистикой критерия для проверки гипотезы Но является отношение )3 АтУ/2 Сг,/(и — 3) (40) Если выборочное значение этой статистики Р, ) Р1 „(2, и — 3), то гипотеза Но отклоняется; в противном случае следует считать, что взаимосвязи У с переменными хг и хг нет. Границы доверительных интервалов для параметров д и )уг определяются по формуле уеду .4:1г а/г(и — 3) а, /агу, у' = 1, 2, (41) где а" — диагональный элемент матрицы (А А), в = ~) т -г Юе 1) и — 3 При использовании модели (38) для представления данных необходимо решить вопрос о целесообразности включения переменной хг или хг в модель. Для этого проверяютсягипотезыНо . )31 = О, у = 1, 2.
О). Очевидно, эти гипотезы могут быть проверены непосредственно по доверительным интервалам для параметров д и )уг. если доверительный интервал для Д, у = 1, 2, накрывает нуль, то гипотеза Но . д = 0 О). принимается. В противном случае Ноф) отклоняется. Коэффициент множественной корреляции, характеризующий отклонение результатов наблюдений от плоскости регрессии у = )уо + Ахг + + )угхг, опрелеляется по формуле ,9 АтУ Ят (42) Чтобы исключить потерю точности при использовании элементов матрицы (АтА) ', деление этой матрицы на определитель )АтА! следует выполнять в последнюю очередь. Вектор оценок определяется по формуле Гл.
19. Математическая статистика 332 П ример 7. Температура объекта У зависит от процентного содержания х1 компоненты А в теплоносителе и температуры окружающей среды хэ. Ниже приведены результаты 11 замеров этих данных. Используя эту выборку, выполнить следующие задания: а) найти оценки н доверительные интервалы параметров модели у !60 + 1!1х! + !!2х2 ° б) проверить взаимосвязь У с переменными х1 и хт, в) проверить гипотезы Но® ! (1 = О, у = 1, 2; г) вычислить коэффициент множественной корреляции. Предполагается,что ошибки наблюдений не коррелированы, имеют равные дисперсии и распределены по нормальному закону. Принять уровень значимости а = 0,10.
с2 а) Предварительно вычислим хм = 66, ~~! хтя = — 22, ~у! = 33, ~~~ х21; — 506, хсяхн = — 346, ~ х22; = 484, ~ уэ = 289, ~у!х1! = 85, ~~ у;х21 — — 142, у = 3, х! — — 6, хт — — — 2. Палее находим / 110 -214 ! Матрица А А = ~ — » 440 (, !А А! = 2604. Найдем матрицу (А! А) ', имеем т -1 1 ( 440 214 !1 ( 0 169 0 082 ~ 2604 1 214 110 / 1 0,082 0,042 г' ' 662 = 506 — — = 110, 11 332 1'')т = 289 — — = 190, 11 33 ° 66 Я, т = 85 — — = -113 и Я„, = 484 — = 440, ( — 22) 2 11 Ю*!*2 = — 346 — = — 214 66 ( — 22) 11 Я„„= 142 — = 208. 11 3 7. Элементы регрессионного анализа 333 / — п3 Так как .4~У = ) ), вектор оценок равен () 0,082 0,042 208 -0,530 Найдем оценку параметра 1)о.
По формуле (38) имеем До = 3 — ( — 2,041) 6 — ( — 0,530) ( — 2) = 14,186. Таким образом, уравнение плоскости регрессии имеет вид у = 14,186 — 2,041х1 — 0,53хэ. Определим доверительные интервалы для параметров 61 и бт. Для этого находим остаточную сумму квадратов: Ц (А, Дэ) = 190 — ( — 2,041 — 0,530) ' ~ ) = 69,607. / — 113 1 Далее вычисляем оценку дисперсии ошибок наблюдений: 69,607 — — — — 8,7, а 2,95. я — 3 11 — 3 По таблице Пб нахопим 1о,ээ(8) = 1,860.