Дженкинс, Ваттс - Спектральный анализ и его приложения (выпуск 1) (1044211), страница 37
Текст из файла (страница 37)
Оценивание ковариационньм функций было бы очень сложным. Когда задана параметрическая модель, гораздо лучше использовать методы правдоподобия или наименьших квадратов, которые описаны в гл. 4. Критерий для проверки гипотезы о том, что шум белый. Есть один случай, когда соседние точки выборочной корреляционной функции действительно являются некоррелированными. Это имеет место для чисто случайного временнбго ряда, или белого шума.
В этом случае из (5.3.!9) следует, что при отсутствии коррекции среднего значения ковариация корреляционных оценок равна нулю. Р и с. 5.14. Выборочная корреляционная функция для выборки, образованной слу- чайными нормальнымн числами, г, (0) =! Коррекция среднего значения вносит в ковариацию члены порядка 1)Та, поэтому этими членами можно пренебречь. Можно показать, 112), что, когда число членов ряда достаточно велико, допустимо считать, что гхх(77) распределено по нормальному закону с нулевым средним значением и дисперсией 1/Л(.
В качестве примера в табл. 5.3 приведены выборочные корреляционные функции, сосчитанные по случайным нормальным числам, выданным вычислительной машиной. Результаты некоторого эксперимента по имитации заставили предположить, что эти числа на самом деле были очень непохожи на случайные. Поэтому были взяты массивы чисел, примерно по 1000 штук в массиве, и по ним сосчитаны выборочные корреляционные функции. Типичная такая функция, сосчитанная по 900 числам, частично приведена в табл.5 3 под заголовком «Ряд 1». Поскольку стандартное отклонение выборочной оценки одиночного значения корреляционной функции равно !/7900 = 0,033, то 95о((о-ные доверительные границы для одиночной корреляции рхх(й) приблизительно равны гхх(й) +-0,033 1,95 = 231 230 Гл.
5. Введение в анализ временном рядов 5ль Оценивание паралсегров линейного процесса — гхх(й) ~0,065. 95% ный доверительный интервал изображен рядом с выборочной корреляционной функцией на рис. 5.14. Видно, что 7 из 32 доверительных интервалов не накрывают нуль. Исходя из доверительного уровня, следовало бы ожидать, что примерно бо7о от общего числа доверительных интервалов, т. е. 1 или 2, не накроют нуль, На самом деле, функция на рис. 5.!4 обнаруживает систематическую компоненту с периодом, равным 4, из-за несовершенства метода получения случайных нормальных чисел.
Г!од заголовком «Ряд 2» в табл. 5.3 приведена типичная выборочная корреляционная функция, сосчитанная после того, как метод получения случайных чисел был улучшен. Заметим, что лишь для р.хх(29) доверительный интервал не накрывает нуль. Это находится в согласии с гипотезой о том, что временной ряд является чисто случайным. 5.4. ОЦЕНИВАНИЕ ПАРАМЕТРОВ ЛИНЕЙНОГО ПРОЦЕССА В этом разделе мы применим методы гл. 4 к оцениванию параметров процессов авторегрессии и скользящего среднего, введенных в равд. 5.2.
Предположим, например, что требуется подобрать авторегрессионную модель (Х вЂ” р) =«1(Х, — р)+ ... + а,„(Хг,„— р)+Ее (5.4.1) к наблюденному временнбму ряду хь хв ..., хн. Процедура подгонки состоит в следующем: 1) вынесение решения о порядке т процесса; 2) для заданного т оценивание параметров р, аь ..., а . Поскольку решение о том, каков порядок т процесса, можно вынести, лишь подгоняя процессы различных порядков, сначала необходимо рассмотреть оценивание параметров, 5.4.1. Оценивание параметров авторегрессии методом максимального правдоподобия Приближенная функция правдоподобия.
Предполагая, что процесс Х, является нормальным, можно получить логарифмическую функцию правдоподобия для фиксированного т следующим образом. Во-первых, заметим, что совместную плотность вероятности случайных величин Х,ь Х „з, ..., Хн можно записать в виде 1 У -~ь ...,п(г,.+1 г +з, ...,гм)= [ —,и Х )г2»а ) Х ехр — — л г, а г г= гл+! где Е[Хг]=0, Е[Х',]=из . Если перейти от переменных г к хе согласно формуле (5.4.1), то, учитывая, что якобиан преобразования равен единице, получим Ум-~- ь ..., Ф (Хм-~-1.
""и -~-з ° " хпг ~ х1 ° ° ° хм) = 1 ехр [ — —, х, [(х, — р) — и,(х,, — р— (]г'2»а )~ м ~ 2»з ... — а (х, — р)]з (5.4.2) Обозначения в левой части равенства (5.4.2) подчеркивают, что оно изображает условную совместную плотность случайных величин Х,ь ..., Хн при условии, что величины Хь,, Х~ фиксированы и равны своим выборочным значениям.
Чтобы получить полную плотность вероятности, нужно было бы умножить (5.4.2) на совместную плотность величин Хь ..., Х . Так как обычно т мало, результат такой «концевой поправки» будет несущественным, и, поскольку она значительно усложняет функцию правдоподобия, мы ее опустим. Если хе известны, то (5.4.2) рассматривается как функция !с, аь .... а н дает условную функцию правдоподобия этих параметров при фиксированных хь ..,, х~, Логарифмическая функция правдоподобия, таким образом, ранна 7(р, и,, ..., и„[х,, ..., х )= — (Аà — т)(п]г'2н — (М вЂ” т)1пог— — — [(х, — р) — а, (х,, — р.) — ... — а,„(х, — р.)]з.
г г=т-~-1 (5.4.3 При оценивании параметров 1г, аь ..., а~ важной величиной является сумма квадратов Е(р, а„..., и„[х,, ..., х )= [(х, — р) — а,(х,, — р) — ... — а„(х, „— р)]з (5.4,4) с —. м.~-1 Теперь выборочные оценки максимального правдоподобия, или наименьших квадратов, можно получить, дифференцируя (5.4.4). Рассмотрим некоторые частные случаи.
Процесс авторегрессии первого порядка. Дифференцирование суммы квадратов 8(р., и,)= !' [(х, — р) — а,(х,, — р.)]з гзз гзг (5.4.8) пс (х,, — н ) (х, — р ) а (5.4.5) с м (х,,— р) где — ! "ьз ~л)~ (х, — р,) (х,, — а) ~м(хс с — 1ь) (х,, — сь) с=и с„, (1) = а,с, (О) + аис (1), с„„(2) = а, с „(1) + азсл (0). з'= м'з 5(. ас).
Гл. Д Введенссе в анализ временньен рядов приводит к нормальным уравнениям, аналогичным тем, которые получались в равд. 4.3.3. Таким образом, имеем х, — Р. — а, (хс — 1с) = О, Х ( ( — — 1ь) 1( — ) — ( — )1) =О, где хь х,— средние арифметические первых и последних (Ас — 1) наблюдений соответственно. Отсюда хз — исх, 1 — ис Поскольку х, и хз очень близки к полному среднему х, выборочную оценку 1л можно считать приближенно равной х и, следовательно, выборочную оценку схс — равной г„„(!). Остаточную сумму квадра- 5 (,ь, а,) =,~'„((хс — Р) — а, (х,, — Р)) тов можно упростить, используя (П4.1.11): пс и 5(и, а,)= —,5, (х, — р) — ас,У'„(хс — 1с)(х,, — р). (5.4.6) Аппроксимируя (5.4,6), точно так же как это делалось выше для ас, получаем простое выражение 5 (1, сс,) (М вЂ” 1) 1сл (0) — а,с„(1)1 = (Ас — 1) с„„(0) (1 — г~~ (1)), (5 4.7) Поскольку в 5(1л, ас) фактически входят (АС вЂ” 1) наблюдений и две степени свободы потеряны при подгонке констант 1с, ас, дисперсию процесса Яс можно оценить с помошью длс Оценивиние параметров линеяноео процесса Используя (П4.1,15) и те же самые приближения, что и выше, получаем 100(1 — а) %-ный доверительный интервал для ссс.
(-) )з зл) (1 — и) а,— ас) ( (х — х) Процесс авторегрессии второго порядка. Выборочные оценки максимального правдоподобия можно получить, дифференцируя (5.4,3) по р, схс и ас и приравнивая эти производные нулю. Это приводит к уравнениям (х — а) = а, (х — р.) + аз (хс — р.), 1(, —.)(,,— )=,Х(,,— )'+ + а„'.з(х, , — р.)(х, , — 1 ), :~ (.,—.)(...-=,) =, Х(... —.)(,, —.)+ + сс, Х(х, з — 1с), (5,4.9) и суммирование распространяется от 1= 3 до с =Ж. Если заменить х; полным средним значением х, то шесть функций от наблюдений, входящих в эти уравнения, можно объединить в пары и положить 1с = х.
Например, две функции имеют Ас — 3 общих члена и отличаются только на один член в начале и в конце. С достаточной степенью точности их можно заменить на Асс„,(1), где с „(1) является выборочной оценкой ковариации (5.3.25). Тогда уравнения (5.4.9) можно приближенно переписать в виде 5.4. Оценивание пирометров линейного процесси 234 Гл. 5. Введение в анализ временнй)е рядов Отсюда, вводя выборочные оценки корреляции г„()т) = = схх(й)/схх(0), получаем «хх (!) !! — гхх (2)! ! — ггх (!) 2 — гт гх„ (2) — гхх (!) (5.4.10) Гхх (!) Используя те же самые приближения, что и выше, остаточную сумму квадратов 5(!с, аь аг) можно записать в виде о((ри ам ат)=(Аг — 2)(сх„(0) — а,схх(1) — а,с х(2)~.
(5.4.11) Остаточная дисперсия равна ! у з, = 8(р, а„а,) и имеет А( — 5 степеней свободы, так как исходное правдоподобие (5.4.13) содержит Лl — 2 наблюдения и еше 3 степени свободы потеряны при подгонке трех параметров )с, а1 и аз. Снова используя то же приближение, что и в (П4.1.15), получаем совместную !00(1 — а)%-ную доверительную область для параметров (аь аг): (а, — а,) + 2г„(1) (а, — а!~ (,ат — ат) + (ат — ат) ( <2 Ф Х ("т-х)' г=! В качестве примера рассмотрим данные о партиях продукта, приведенные на рис.
5.2. В равд. 5.4.3 будет показано, что к этим данным вполне подходит процесс авторегрессии второго порядка. Используя значения г в(!) н гн (2) из табл. 5.2 и формулу (5.4.10), получаем выборочные оценки параметров а!= — 032 и аз=+О,!8, Остаточная сумма квадратов 5(аь ат) равна 7768,5, так что з' = = 7768,5(65=!!9,6.
Следовательно, приближенная 95%-ная доверительная область имеет вид (а, + 0,32)т — 0,78 (а, + 0,32) (ат — О, 18) + (ат — О, 18)т ( 0,077. На рис. 5.!5 показаны линии уровня точной суммы квадратов, изображенные на плоскости (аь аг) в области, где процесс стационарен. Заштрихованная область является 95%-ной доверительной областью. Видно, что она лежит целиком внутри области стационарности. Р и с. б,!б. Линии уровня суммы квадратов двя пропессв ввторегрессии второго поряднв, подобранного к данным о партиях продукта, изображенным нв рис.