Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 68
Текст из файла (страница 68)
Необходимость подобных моделей обусловлена невозможностьюмногих экономических процессов продолжительное время развиватьсяс постоянными темпами роста или по полиномиальным моделям, в связис их довольно быстром ростом (или уменьшением).Первое представление о возможном характере тренда дает графиче"ское представление временного ряда. Так, график роста урожайностизерновых культур (рис. 11.1а) позволяет предположить наличие ли"нейного тренда в этом временном ряде. Аналогичное предположениеочевидно справедливо и для ряда роста курса доллара весной и летом1994 г. (рис. 11.1б).При прогнозировании тренд используют в первую очередь для долго"временных прогнозов.
Точность краткосрочных прогнозов, основанныхтолько на подобранной кривой тренда, как правило, недостаточна. Ме"тоды выделения и удаления тренда подробно рассматриваются в пункте12.3.1, а также в главе 8.О временных рядах в технических приложениях. В техническихприложениях мы часто знаем физические законы или технические ха"339xt = a cos(ωt + θ) + εt(11.3)Здесь детерминированная компонента представляет собой косинусо"идальную функцию с амплитудой a, частотой ω, периодом 2π/ω и фазойθ. Величины a, ω и θ в выражении (11.3) являются константами.Комментарий. В технических приложениях часто рассматриваются моде"ли типа (11.3), в которых амплитуда a является случайной величиной с нулевымсредним или фаза θ является случайной равномерно распределенной величи"ной в интервале (0, 2π). Такой подход, превращающий процесс (11.3) и емуподобные в стационарные процессы, часто обусловлен необходимостью обосно"вания возможности применения методов исследования стационарных процессовк процессам типа (11.3).Круг данных, описываемых чисто косинусоидальной моделью (11.3),невелик.
Во"первых, часто встречаются периодические зависимости,которые описываются не косинусоидальной, а более сложной функцией.Во"вторых, обычно в изучаемом процессе можно выделить не одну, анесколько периодических компонент с разными периодами.Как известно из математического анализа, любую гладкую пери"одическую функцию G(t) с периодом p (то есть функцию, для кото"рой G(t + kp) = G(t) для любого целого k) можно представить в видеряда Фурье:G(t) =paj cos(jωt + θj ),(11.4)j=1где ω = 2π/p называется основной (Найквистовой) частотой, aj , θj —некоторые параметры. Частоты jω называются гармониками основнойчастоты.Функцию, являющуюся суммой нескольких периодическихфунк"цийсразнымипериодами,можнозадатьввидеG(t)=G(t) =kkacos(jωt+θ).Такимобразом,получаемследующееобобще"jkkjkj, kние модели (11.3).340Определение.
Говорят, что временной ряд описывается полигармонической моделью, если он представлен в виде:xt =ajk cos(jωk t + θjk ) + εt(11.5)j, kгде ωk = 2π/pk , а εt является белым шумом (см. п. 11.7).Пример ряда, описываемого полигармонической моделью, приведенна рис. 11.3.Рис. 11.3. а) — 500 значений ряда, описываемого полигармоническойππмоделью xt = 2 cos( 60t + π6 ) + cos( 120t) + εt , где εt — белый шум сдисперсией 0.16; б) — детерминированная компонента этого ряда11.7. $ … ……Прежде чем перейти к вопросам практического анализа временныхрядов, кратко остановимся на математических основаниях этого анали"за.
При первом чтении этот параграф можно пропустить (тогда к немувремя от времени придется возвращаться впоследствии).Случайные процессы. Практический опыт показывает, что обычновременной ряд не удается полностью описать одной лишь детермини"рованной компонентой. В нем, как правило, присутствует и нерегу"лярная, случайная компонента. Ее поведение нельзя точно предсказатьзаранее. Для ее описания приходится привлекать понятия из теориивероятностей.Для описания нерегулярной компоненты и всего временного ряда вцелом используют понятие случайного (стохастического) процессаили случайной последовательности (как процесса от целочисленногоаргумента). Ниже будут приведены некоторые сведения из теории слу"чайных процессов, необходимые для понимания процедур прикладногоанализа временных рядов. Более подробное изложение математическойтеории случайных процессов можно найти в [25], [97], [51], [123].Определение.
Случайным процессом X(t), заданном на множестве T , называют функцию от t, значения которой при каждомt ∈ T является случайной величиной.Если периоды pk известны, то для определения величин ajk и θjkможно использовать методы линейного регрессионного анализа. Еслипериоды pk не известны, для их определения используют методы спек"трального анализа. Мы практически не будем затрагивать этот вопросв настоящей главе, так как он требует достаточно высокой математи"ческой подготовки читателей, и ограничимся лишь кратком рассказомоб одном из его простейших случаев — периодограмме (см. п. 11.10).Наиболее полный обзор современного состояния методов прикладногоспектрального анализа на русском языке дан в [75].
Этим методампосвящено много различной специальной литературы: [37], [52], [87],[51], [123], [62], [31].Исторически анализ временных рядов из различных областей дея"тельности, включая экономику, начинался в конце прошлого и началеэтого века именно с подбора полигармонических моделей для их опи"сания. Однако с середины этого века стали появляться более простыемодели и методы анализа временных рядов, включая линейные параме"трические модели типа авторегрессии"скользящего среднего, на которыхи будет в основном сосредоточено наше внимание.341Выделяются случайные процессы с непрерывным временем (когда T —интервал на числовой оси, например) и с дискретным временем (когда T —натуральный ряд или его часть, например). Последние чаще называют случай"ными последовательностями.Если T — конечное множество, то случайный процесс — это просто сово"купность случайных величин.
Для статистического описания такой совокупно"сти надо указать распределение вероятностей в конечномерном пространстве.Для этого можно использовать многомерную функцию распределения или плот"ности, если распределение непрерывное.Если T — бесконечное множество, то для описания бесконечной сово"купности случайных величин (которые в этом случае и составляют случайныйпроцесс) применяется следующая конструкция.Определение. Говорят, что случайный процесс X(t) задан, если длякаждого t из T определена функция распределения величины X(t):Ft (x) = P (X(t) x),(11.6)для каждой пары элементов t1 , t2 из T определена функция распределениядвумерной случайной величины (X(t1 ), X(t2 ))Ft1 ,t2 (x1 , x2 ) = P (X(t1 ) x1 , X(t2 ) x2 ),342(11.7)и вообще для любого конечного числа элементов t1 , t2 , . .
. , tn измножества T определена nмерная функция распределения величины(X(t1 ), X(t2 ) . . . , X(tn ))Из (11.9) следует, что для последовательности независимых слу"чайных величин все ее конечномерные распределения определяются спомощью одномерных распределений (11.6).Ft1 ,t2 ,...,tn (x1 , x2 , .
. . , xn ) =Определение. Белым шумом называют временной ряд (случайный процесс) с нулевым средним, если составляющие его случайныевеличины X(t) независимы и распределены одинаково (при всех t).P (X(t1 ) x1 , X(t2 ) x2 , . . . , X(tn ) xn )(11.8)При этом распределения (11.6)–(11.8) должны быть согласованы в томсмысле, что «старшие» распределения определяют «младшие».
Например,Ft1 ,t2 ,...,tn (x1 , x2 , . . . , xn ) =limxn+1 →∞Ft1 ,t2 ,...,tn ,tn+1 (x1 , x2 , . . . , xn , xn+1 )Функции (11.6) – (11.8) называют конечномерными распределениями слу"чайного процесса.На практике общее определение случайного процесса используетсяредко. Чаще случайные процессы задают с помощью предположенийтипа независимости приращений, марковского свойства траекторий ит.д. Примеры подобных определений будут даны чуть позже.Гауссовские случайные процессы. Важным классом случайныхпроцессов являются нормальные (гауссовские) случайные процессы.Все конечномерные распределения этих процессов являются нормаль"ными. (Определения одномерного и двумерного нормального распреде"лений даны в пунктах 2.4 и 2.5.
Аналогичным образом можно опреде"лить многомерные нормальные распределения.) Для полного описаниянормальных случайных процессов достаточно указать его двумерныераспределения. Если эти распределения должным образом согласованы,то с их помощью можно задать любые конечномерные распределениявида (11.8). Это обстоятельство играет важную роль в прикладноманализе гауссовских процессов, позволяя ограничиться исследованиемматематического ожидания и корреляционной функции процесса.Белый шум.
Математически простейшей моделью случайной ком"поненты временного ряда является последовательность независимыхслучайных величин. Независимость двух случайных величин была опре"делена ранее (смотри, например, п. 1.6). Аналогично определяется инезависимость произвольного числа случайных величин. С помощьюфункций распределения независимость последовательности случайныхвеличин определяется так:Определение. Пусть T — множество типа t = 0, 1, 2, .