Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 66
Текст из файла (страница 66)
Чаще всего значениявременного ряда получаются непосредственной записью значений неко"торого процесса через определенные промежутки времени. Например,если ежесуточно в определенное время записывать показания термо"метра, то получится временной ряд со значениями температуры в томместе, в котором находится термометр.Иногда значения элементов временного ряда получаются накапли"ванием некоторых данных за определенный промежуток времени (на"пример, суммарное число посетителей магазина за день), усреднением(средняя температура за день) и т.д.11.2.
:…ƒ …… ƒРис. 11.1. a) – урожайность зерновых культур в СССР с 1945 по 1989 гг.в ц/га; б) – курс доллара на торгах ММВБ с 1.03 по 31.08 1994 г. в рублях;в) – ежемесячные продажи шампанского за 7 последовательных лет; г) –среднечасовая нагрузка телекоммуникационного канала Москва – Париж в течение2"х недель (в Кбит/сек); д) – гауссовский «белый шум» с параметрами 0 и 1Видно, что поведение временных рядов может быть весьма различ"ным.
Так, динамика урожайности зерновых в СССР (ряд а)) имеет329Анализ временных рядов. Исследование временных рядов отли"чается от других задач анализа данных как кругом представляющихинтерес вопросов, так и методами, применяемыми для исследования.Поэтому наука об исследовании временных рядов — анализ временных рядов, — образует самостоятельную и весьма обширную областьстатистики.Разделы анализа временных рядов.
Временные ряды, возника"ющие в различных предметных областях, имеют различную природу,поэтому для их изучения оказались эффективными разные методы. Ис"следователи придумывали и развивали многочисленные методы анализа,подходящие для изучения временных рядов в разных предметных обла"стях. И в результате анализ временных рядов превратился в довольно330разветвленную науку. Вот только некоторые из видов временных ря"дов, исследование которых можно рассматривать как самостоятельныйраздел теории анализа временных рядов:•••стационарные случайные процессы, то есть последовательно"сти случайных величин, вероятностные свойства которых неизменяются во времени. Стационарные случайные процессышироко применяются в радиотехнике, теории связи, механикежидкости и газа, океанологии, метеорологии и т.д.;диффузионные процессы возникли при изучении процесса диф"фузии, то есть взаимопроникновения различных жидкостей илигазов.
Эти процессы используются при построении моделейнепрерывных процессов, в которых существенна случайная со"ставляющая;точечные процессы используют для описания таких явлений,как поступление вызовов или заявок на обслуживание, момен"тов несчастных случаев, стихийных и техногенных катастроф,каких"либо приметных явлений и т.п. Они широко применяют"ся в таких разделах статистики, как теория очередей, теориямассового обслуживания и т.д.Всех этих обширных разделов анализа временных рядов в даннойкниге мы касаться не будем. Вместо этого мы хотим рассказать отех прикладных аспектах анализа временных рядов, которые полезныи важны при решении практических задач в экономике, финансах, атакже в различных гуманитарных науках. В частности, мы расскажемо методах подбора математической модели для описания временногоряда, об изучении взаимозависимостей временных рядов, выявления вних периодических и других составляющих, прогнозировании поведениявременных рядов и т.д.Как мы будем рассказывать об анализе временных рядов.
Вэтой главе (главе 11) мы обсудим основные понятия статистическойтеории временных рядов. Мы расскажем о структуре временных рядов;о вероятностных предпосылках для их анализа; о детерминированныхкомпонентах временных рядов и о причинах, их порождающих; о кор"реляционной структуре ряда; о случайной составляющей временногоряда и ее описании и т.д.
В главе 12 обсуждаются вопросы прикладно"го анализа временных рядов, а в главе 13 мы опишем, как различныепрактические задачи анализа временных рядов решаются с помощьюстатистических пакетов Эвриста и SPSS. Наконец, в главе 14 мы вновьвозвратимся к теории и расскажем о некоторых математических моде"лях временных рядов, важных для прикладного анализа.331Мы будем стараться вести изложение на уровне, доступном широ"кому читателю. Наш рассказ мы сопроводим обсуждением примеров(как тех, что привели на рис. 11.1, так и многих других).Литература. Те читатели, которые захотят глубже изучить тео"ретические или прикладные аспекты анализа временных рядов, могутобратиться к литературе. По большинству разделов анализа временныхрядов существует множество книг разной степени подробности и мате"матической сложности.
Одни из этих книг рассчитаны на математиков,другие — на практических работников и инженеров. Укажем некоторыенаиболее известные из этих книг:•••••в области теории временных рядов — [6], [97], [51], [123], [127],[25];в области общего прикладного анализа — [13], [14], [17], [52],[87], [11];в области прикладного спектрального анализа — [37], [75];в области радиотехнических приложений — [62], [31];в области экономических приложений — [130], [67] и др.11.3.
B, …ƒ …… Цели анализа временных рядов. При практическом изучениивременных рядов исследователь на основании наблюденного отрезкавременного ряда (конечной длины) должен сделать выводы о свойствахэтого ряда и о вероятностном механизме, порождающем этот ряд. Чащевсего при изучении временных рядов ставятся следующие цели:••••краткое (сжатое) описание характерных особенностей ряда;подбор статистической модели (моделей), описывающей вре"менной ряд;предсказание будущих значений на основе прошлых наблюде"ний;управление процессом, порождающим временной ряд.На практике эти и подобные цели достижимы далеко не всегда и да"леко не в полной мере.
Часто этому препятствует недостаточный объемнаблюдений (недостаточная длительность); еще чаще — изменяющаясяс течением времени статистическая структура временного ряда. Из"заэтих изменений значение прошлых наблюдений обесценивается, и ониуже не помогают предвидеть будущее.33211.4. &……… …'* …… Стадии анализа временных рядов. Обычно при практическоманализе временных рядов последовательно проходят следующие этапы:•••••••графическое представление и описание поведения временногоряда;выделение и удаление закономерных составляющих временногоряда, зависящих от времени: тренда, сезонных и циклическихсоставляющих;выделение и удаление низко" или высокочастотных составляю"щих процесса (фильтрация);исследование случайной составляющей временного ряда, остав"шейся после удаления перечисленных выше составляющих;построение (подбор) математической модели для описания слу"чайной составляющей и проверка ее адекватности;прогнозирование будущего развития процесса, представленноговременным рядом;исследование взаимодействий между различными временнымирядами.Методы анализа временных рядов.
Для решения указанных вы"ше (а также многих других) задач исследователями предложено боль"шое количество различных методов. Отметим из них наиболее рас"пространенные:•••••корреляционный анализ позволяет выявить существенные пе"риодические зависимости и их лаги (задержки) внутри одногопроцесса (автокорреляция) или между несколькими процессами(кросскорреляция);спектральный анализ позволяет находить периодические и ква"зипериодические составляющие временного ряда;сглаживание и фильтрация предназначены для преобразованиявременных рядов с целью удаления из них высокочастотных илисезонных колебаний;модели авторегрессии и скользящего среднего оказываютсяособенно полезными для описания и прогнозирования процес"сов, проявляющих однородные колебания вокруг среднего зна"чения;прогнозирование позволяет на основе подобранной модели пове"дения временного ряда предсказывать его значения в будущем.Как уже говорилось, в этой книге мы расскажем не обо всех из этихметодов, а лишь о тех, которые наиболее важны для экономическихи гуманитарных наук.333Следуя основной идее статистики, при анализе временного рядавидимую его изменчивость стараются разделить на закономерную и слу"чайную составляющие.
Закономерные изменения членов временногоряда следуют какому"то определенному правилу и поэтому предсказуе"мы. Эта составляющая xt может быть вычислена при каждом t как не"которая функция от текущего момента t. Эта функция может зависеть,помимо t, также от некоторого набора параметров. Когда эти параметрынеизвестны, их приходится оценивать по имеющимся наблюдениям —как, например, бывает в случае регрессии.Изменчивость, оставшаяся необъясненной, иррегулярна и хаотич"на.
Для ее описания необходим статистический подход (за неимениемлучшего).Определение. Под закономерной (детерминированной) составляющей временного ряда x1 , . . . , xn мы будем понимать числовуюпоследовательность d1 , . . . , dn , элементы которой dt вычисляютсяпо определенному правилу как функция времени t.Детерминированная составляющая часто отражает действия каких"либо определенных факторов или причин.
Так, у временных рядов изразличных областей техники детерминированная составляющая обычнообязана своим возникновением действиям физических законов или усло"виям эксплуатации оборудования. Например, если значения временногоряда соответствуют положениям маятника в определенные моменты вре"мени, то в качестве детерминированной компоненты ряда можно взятьрешение дифференциального уравнения движения маятника в эти мо"менты времени. В экономических и многих других приложениях матема"тические модели изучаемых процессов нам обычно не известны, так чтотенденции, отраженные в поведении временного ряда, нам приходитсявыявлять по наблюдаемым значениям временного ряда.
Например, приизучении данных о месячном производстве молока в России (рис. 11.2)мы можем пытаться описать закономерную часть данного временногоряда в виде комбинации линейной функции (в течение последних летпроизводство молока, нашедшее отражение в статистической отчетно"сти, постепенно уменьшалось) и периодической функции с периодом12 месяцев. Эта периодическая компонента отражает влияние временигода на производство молока.Для многих рядов в экономике и социальных науках причины, поро"ждающие их закономерные составляющие, могут не быть столь ясными.334Если в приведенном выше соотношении перейти к логарифмам, томы вновь получим формулу (11.1) — но не для самих xt , а для ихлогарифмов.log(xt ) = log(dt ) + log(εt )приt = 1, .
. . , nУказанное соотношение объясняет распространенность логарифми"ческих шкал при анализе экономических временных рядов.11.5. Š…, ƒ…… ……Рис. 11.2. Ежемесячное производство молокав России с 01.1992 по 10.1996 (в тыс. тонн)Тем не менее, их совокупное влияние может быть устойчивым в течениедостаточно длительных промежутков времени. Это обеспечивает воз"можность прогноза для подобных временных рядов.