Болч К._ Хуань К.Дж. - Многомерные статистические методы для экономики (1185342), страница 43
Текст из файла (страница 43)
Таким образом, для любого 1 существует некоторое распределение значений 1"». Если на рис. 4.1 заменить Х на 1,томы получим наглядную иллюстрацию такого толкования. Теперь выборку, определяющую временной ряд, можно составить из произвольной комбинации наблюдений„извлекаемых из генеральных совокупностей, соответствующих последовательным моментам времени ~. Однако, если ряд стационарный (в том смысле, что среднее и дисперсия каждой нз этих генеральных совокупностей остаются одними и теми же при переходе от одного момента времени к другому, то можно показать, что с увеличением объема выборки (т.
е. числа временных точек, в которых зарегистрированы значения временнбго ряда) среднее и дисперсия любого конкретно~о выборочного временного ряда (отдельной реализации) асимптотически приближаются к среднему и дисперсии каждой из генеральных совокупностей, рассматриваемых в фиксированный момент времени. Таким образом, в предположении стационар- насти мы можем кое-что сказать обо всем ансамбле на основании одной из реализаций ряда. При этих условиях можно определить теоретическую спектральную плотность генеральной совокупности, и Бартлет в ~9] показал, чта (8.28) не является состоятельной оценкой этой спектральной плотности.
Действительно, дисперсия в (8.28) не уменьшается с увеличением объема выборки. Следовательно, (8.28) может определить пики, свидетельствующие о больших значениях относительной мощности, в то время как в генеральной совокупности таких значений не существует. В связи с этим в современном спектральном анализе с целью улучшения оценки этой функции генеральной совокупности используют ряд модификаций выражения (8.28), Мы рассмотрим сейчас эти изменения, и они приведут пас к конечной вычислительной формуле. Во-первых, »»е все Ж вЂ” 1 коэффициентов автокорреляции применяются для оценивания. Мы уже отмечали„что для коррелограммы вычислялись не все коэффициенты автакорреляции. Теоретически выбор числа коэффициентов автокорреляции связан с неопределенностьюПредпалажим„что мы взяли не более Е ~ Л' — 1 коэффициентов автокорреляции, где Е называется тачкой усечения.
Можно показать, что при увеличенин Е дисперсия выборочной спектральной плотности также возрастает. Однако прн уменьшении Е увеличивается смещение выборочной спектральной плотности как оценки истинной спектральной плотности. Это противоречие — возможность достижения меньшего смещения только ценой большей дисперсии — занимает централь1а Выражение (8.30) иожно принять н качестве основного представления выборочного спектра мои»»»ости. ~ Такого типа стационарные нослеловательности принято также называть эргодичес»сими. — Примеч. ред. 981 ное место в спектральном оценивании, и, пожалуй, все, что можно сделать па практике, — это выбрать несколько различных значений А и для каждого из них вычислить спектральные оценки.
Практически обычно начинают с малого значения Е (составляющего, скажем, 10«4 от Й) и затем увеличивают Е. Такую процедуру иногда называют закрытием окна. Спектральная плотность при малом Е дает оценки со значительным смещением (малой надежностью). Увеличение Е часто позволяет увидеть подробности спектра, но в то же время (ввиду увеличения дисперсии) создает опасность обнаружения пиков там, где их быть не должно. Правила здесь различны, однако согласно большинству из них Е должно составлять от 10 до 40о~' от Ж, причем часто принимают 20вф.
Позтому оценивание требует значительного опыта и критики спектрального арализа с готовностью указывают, что исследователь оказывается в трудном положении, стремясь понять смысл конкретной спектральной функции плотности, так как ее вид может изменяться вследствие изменения Ь. В действительности подобная проблема возникает в статистике во многих случаях. Приведем только один пример: выбор числа интервалов группировки при построении любого распределения частот связан с определенным компромиссом между потерей информации и общностью. Если интервал группировки выбран один, мы получаем распределение частот, которое показывает, что «все данные лежат между а и Ь».
Если же число интервалов выбрано равным числу наблюдений, то распределение частот будет совпадать с исходными данными и само распределение частот потеряет смысл. Разумным образом выбирая интервалы группировки, мы при помощи распределения частот пытаемся получить некоторое содержательное представление о свойствах данных. А это именно то, что мы стараемся делать в спектральном анализе, соответствующим образом выбирая Е. Аналогия между построением «хорошего» распределения частот и построением «хорошего» набора спектральных оценок станет еще яснее„если вспомнить, что в обоих случаях мы используем априорную информацию для облегчения анализа. Так, мы часто постулируем, что распределение частот, например, унимодально и его правый «хвост» стремится к нулю.
Такой набор предположений помогает нам правильно определить число интервалов группировки. При спектральном анализе мы часто постулируем, скажем, 20-летний строительный цикл илп 4-летпий цикл для товаров длительного пользования, после чего увеличиваем Е до тех пор„пока такие циклы появятся или не появятся. Во-вгорых, в современном спектральном анализе спектральные оценки сглаживают при помощи «окон». «Окна» применяют с целью уменьшения дисперсии выборочной спектральной плотности. Предложено много разновидностей «окон»", но авторы получили хорошие ре- 1«Джон Тычки назвал задачу построении этих «окон» «прорсзанием окон».
Многие виды «окон» приводит Парзен в 1723. Сравнительный анализ нескольких «окон» дается в книге [121. В частности, «окно» Парзена никогда не приводит к отрицательным оценкам спектральной плотности, 282 $. зультать», пользуясь аокном»„которое предложил Парзен: 1 — — 1 — —, О=К-'- —; 6К~ Х,а Х„' 2 (8.31) ' 2 — 1 — К Покажем немного подробнее, как пользоваться этим аокном». Включим эти две модификации в (8.28): 1+2 "~'. д(К) г(К)соя(2л~» К) К 1 , » =- О, 1, ..., Е.
(8.32) Сравните выражения (8.32) и (8.28), обратив внимание на то„что верхний предел суммирования изменяется с У вЂ” 1 на Ь вЂ” 1 и что вводит- '. ся также токио» д (К). Кроме того, индекс» начинает пробегать зна- ' чения с нуля, а не с единицы. Включение оценки на нулевой частоте позволяет нам проверить, был ли исключен тренд перед проведением спектрального анализа или нет.
Линейный тренд, как и среднее значение, может рассматриваться как гармоника с нулевой частотой. Поэ- -' тому пик спектра на нулевой частоте может означать, что в выборочном ряде остался тренд". Наконец, последняя модификация выражения (8.32). В этом выра- * женин ~» — — »l2Е. Следовательно, ~» =0,1/2Ь, 2/2Е, ..., 1/2. Если, например, »'.. = 2, то ~~ — — О, 1»'4, 1»'2, что дает столько же оценок частот (за исключением ~ = О), сколько имеется запаздываний. Такие интервалы между частотами оказываются слишком большими, чтобы давать хорошие результаты, поэтому обычно рекомендуется вычислять спектр для большего в 2 — 4 раза числа частот.
Так как О ~ ~» с.' .1/2, то для . получения более тесного расположения частот можно разделить ~» на, некоторую постояпну»о с. Если с выбрана равной 2, то ~» = ~»/2 и Д = 0,1/4»-, 2/4Е„...„1/2. Таким образом, если Ь = 2, то мы имеем «»' =- О, 1/8, 2/8, И8, 1/2, что дает вдвое больше оценок, чем ранее. Хотя эта постоянная не обязательно должца быть равной 2, в этой книге мы выберем ее именно такой, чтобы не вводить помимо Ь еще одну переменную.
Отсюда окончательная формула имеет вид » — 1 МК 1+ 2 ~ а (К) к (К) сов ( — ) ], ~ = О, 1, 2, ..., 2Е. ~8.33) " Это может также означать наличие ~утечки» из циклов с низкой частотой. Этот вопрос рассматривается в следующем разделе. Разумеется, если мы последуем совету Парзена (см. примечание 8), то оценка иа нулевой частоте может представлять только среднее значение. Проиллюстрируем эти вычисления на примере некоторого условно-: го ряда. В табл. 8.4 приведен ряд, который, по-видимому, обладает ' возрастающим трендом.
Надеясь снять этот тренд, мы взяли первые разности значений ряда. При этом одно наблюдение теряется, так что Ж = 11. Возможно, читатель захочет в качестве упражнения повто- рить эти вычисления, пользуясь остатками от линии тренда, прове- денной по методу наименьших квадратов. Выберем максимальное за- паздывание Ь = 4. Т а блица 8.4 Условный ряд и его первые разности Коэффициенты автокорреляцни, вычисленные согласно (8.21)„равны: аОкноэ Парзена согласно (8.31) имеет вид: вычисление 2 1 —— О,ООООО 0 1 2 3 Г.=4 1,0000 — 0,0419 — 0„7822 0,0923 0,6399 1,0ОООО 0„71875 0,29ХЮ 0,03125 Заметим, что при К =,~У2 вычислять еокнов можно, пользуясь ~ (К) = 2 (1 — ~~~)а = 2 (1 — О,5)з = 0,250.
Вычислимтеперь сок (жК/2Х,) для К = 1, 2,3 и с = 0„1,2, ...,8. Сделаем это для г = — О и 2, предоставив вычисление остальных точек читателю. Для ~ = О и 2 значения косинусов равны: 1, ОООО 1, 0000 1;ОООО О,ОООΠ— 1,ОООО 0,0000 Е,— 1 Теперь можно найти ~~ д (К)г (К) соя (жК/2Ц для ~ = О, 1, ..., 4.