Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 70
Текст из файла (страница 70)
Положим по определениюr(k) = corr(X(t), X(s)) = corr(X(t), X(t + k)).Корреляционная функция случайного процесса X(t) — этовеличина:cov(X(t), X(s))corr(X(t), X(s)) =.σ(t)σ(s)Как и ковариационная функция, корреляционная функция такжезависит от пары переменных (t, s).При фиксированных t и s corr(X(t), X(s)) по определению являет"ся коэффициентом корреляции (см. п. 1.6) случайных величин X(t) иX(s), и для него выполняются свойства 1—4 п.
1.6. Из определенияcov(X(t), X(s)) и corr(X(t), X(s)) следует их симметрия относитель"но t и s:Автокорреляционная функция. Автокорреляционной функцией стационарного процесса X(t) называют функцию r(k) =corr(X(t), X(t + k)), где k > 0 — целое число.cov(X(t), X(s)) = cov(X(s), X(t)),Вообще говоря, выполнение свойства (11.12) не гарантирует того,что процесс X(t) является стационарным в смысле приведенного вышеопределения стационарности в узком смысле. Тем не менее, свойство(11.12) определенно отражает некую неизменность во времени свойствпроцесса X(t).
Поэтому принято следующееcorr(X(t), X(s)) = corr(X(s), X(t))Заметим, что функции m(t), B(s, t) могут и не существовать: какмы знаем, не всегда случайные величины имеют математическое ожи"347Величину k часто называют задержкой, или лагом. Она указываетрасстояние между членами временного ряда, для которых вычисляетсякоэффициент корреляции.11.9. , …… ; 348Определение.
Случайный процесс X(t) называется стационарным в широком смысле, если его среднее значение m(t) постоянно,а ковариационная функция B(s, t) зависит только от расстояниямежду аргументами, т.е. от |t − s|.личные статистические критерии, базирующиеся на одной реализациислучайного процесса. Наиболее важные из таких критериев основанына выборочных оценках автокорреляционной функции и спектральнойплотности (см. [123]).Свойство стационарности в широком смысле играет важную рольпри нахождении оценок числовых характеристик временных рядов(см. п. 11.10).Замечание.
Для некоторых протекающих во времени процессов модельгауссовского случайного процесса дает приемлемое по качеству описание. Ксожалению, в полном объеме проверить по наблюдениям, верна ли эта модель,невозможно. Поэтому гауссовский случайный процесс представляет собой, впервую очередь, удобный математический объект.Белый шум в широком смысле. Аналогичное определение можнодать для белого шума:Определение. Временной ряд (случайный процесс) X(t) называют белым шумом (в широком смысле), если для любого t выполняется M X(t) = 0 и 2σ , когда s = t,cov(X(s), X(t)) =0,когда s = t.Из этого определения видно, что этот белый шум является стацио"нарным (в широком смысле) случайным процессом.
На практике разли"чие между двумя видами белого шума (в широком и в узком смысле) невсегда проводятся четко. В дальнейшем, говоря о белом шуме в связи сприкладными исследованиями, мы чаще всего будем иметь в виду белыйшум именно в только что введенном широком смысле.Хотя на практике процессы белого шума в чистом виде встречаютсяне часто, они играют фундаментальную роль как в теории, так и в при"кладном анализе временных рядов. Типичным для такого анализа явля"ется, например, процесс «выбеливания» временного ряда, т.е.
исклю"чения из него тренда, циклической, сезонной и прочих компонент, такчтобы остаток статистически не отличался от процесса белого шума.Гауссовские процессы. Ясно, что стационарный в узком смыслеслучайный процесс является одновременно и стационарным в широкомсмысле, если существуют функции двух первых моментов. Уже отмеча"лось, что обратное, вообще говоря, неверно.Одно из исключений составляют нормальные, или гауссовские слу"чайные процессы, то есть процессы, конечномерные распределения ко"торых (11.8) являются гауссовскими. Для гауссовских процессов лю"бые конечномерные распределения определяются через функции m(t)и B(s, t).
Поэтому гауссовские процессы, стационарные в широкомсмысле, одновременно являются стационарными в узком смысле. Этовесьма важное и полезное обстоятельство, так как на практике проверкастационарности в узком смысле не осуществима. Судить о стационарно"сти в широком смысле значительно проще. Для этого существуют раз"349Преобразование процесса в стационарный. Наиболее распро"страненным случаем нарушения стационарности на практике являетсяизменение среднего значения m(t) с изменением времени t.
В техслучаях, когда m(t) удается тем или другим способом оценить, пре"образование Y (t) = X(t) − m(t) превращает процесс в стационарный.Далее Y (t) изучают как стационарный, используя для этого его спе"цифические свойства.11.10. … …… В каждый фиксированный момент времени t случайный процессX(t) является случайной величиной. Следовательно, для построенияоценок его моментов m(t) и B(s, t) теоретически можно использоватьте же методы, что и для обычных случайных величин.
Напомним(см. п. 1.8.1 и п. 4.3), что при этом требуется некоторая совокупностьнезависимых реализаций этой случайной величины X, полученных приповторении опыта в неизменных условиях. Другими словами, нужнавыборка x1 , . . . , xk . Применение этой методики к случайному процессуX(t) требует от нас набора реализаций (траекторий) этого процессаx1 (t), . . .
, xk (t).В технических приложениях возможности для независимых повто"рений опыта иногда имеются. Скажем, изучая колебания напряженияв электрических сетях в течение суток, мы можем считать временныеряды, полученные в разные сутки, независимыми реализациями одно"го случайного процесса. Для большей уверенности, что повторениянаблюдений произведены в неизменных условиях, можно сопоставлятьданные за определенные дни недели (за вторники, например), отдельнопо разным сезонам и т.д.Однако в экономических, социальных, демографических и подобныхпроцессах мы обычно имеем дело с единственной траекторией развития,повторить которую невозможно. Поэтому при изучении статистических350свойств таких процессов приходится обходиться этой самой единствен"ной реализацией.
Зато длина ее может расти. Значительная частьматематических результатов о временных рядах относится к стационар"ным рядам, наблюдаемым на растущем интервале времени (0, T ). Ониформулируются в виде предельных теорем при T → ∞. Многие физиче"ские, технические и естественнонаучные приложения статистическойтеории нуждаются именно в такой постановке проблемы.Впрочем, для упомянутых экономических, социальных и т.п. вре"менных рядов эти результаты дают не очень много. Во"первых, этиряды обычно довольно коротки. Во"вторых, они не стационарны, так какусловия, в которых они протекают, изменяются с течением времени.Поэтому наблюдения даже из относительно недавнего прошлого пороймало что говорят о современных тенденциях.По единственной реализации процесса X(t) мы не можем составитьоценки для его среднего, дисперсии, ковариации и т.д., как мы сделалибы это, располагая выборкой.
Но некоторые похожие средние величинысоставить можно.Оценка среднего значения. Имея ряд x(t1 ), . . . , x(tn ) последова"тельных наблюдений случайногоn процесса X(t), можно составить «среднее по реализации»: m = n1 i=1 x(ti ). В теории временных рядов длянаблюденных значений x(t1 ), . . . , x(tn ) используют более короткую фор"му записи x1 , . .
. , xn . В этих обозначениях среднее по реализации есть1m=xi .n i=1n(11.13)Оказывается, при некоторых условиях это среднее может служитьоценкой математического ожидания процесса X(t). Первым из такихусловий является стационарность случайного процесса X(t) (в широкомсмысле).
Поскольку для стационарного процесса все моменты времениравноправны и его числовые характеристики неизменны во времени, вкачестве оценки m(t) = m естественно рассмотреть именно m. Легкоубедиться, что m как оценка m для стационарных процессов являетсянесмещенной, т.е. M m = m.Рассмотрим вопрос о точности этой оценки. Естественно, хоте"лось бы, чтобы эта оценка m приближалась к неизвестному истинномузначению с ростом числа наблюдений n, то есть была бы состоятель"ной (см.
п. 4.5). Так как отклонение оценки от истинного значенияможно описать с помощью ее дисперсии, то для состоятельности до"статочно, чтобыDm → 0при n → ∞.К сожалению, одна лишь стационарность случайного процесса необеспечивает выполнения (11.14). Простейший и отчасти вырожденныйпример стационарного процесса, для которого не выполняется свойство(11.14), устроен следующим образом.
Рассмотрим стационарный про"цесс, для которого с вероятностью единица X(t) = X(1) для любого t.Ясно, что траектории этого процесса являются константами. При этом:m = x1В более общем случае типичным примером невыполнения условия(11.11) являются смеси, т.е. процессы, у которых различные участкитраекторий сформированы при разных условиях. Более подробно модельтаких процессов описана в [123].Хоть мы и говорили о том, что предельные теоремы математическойтеории мало полезны для интересующей нас области приложений, всеже приведем одно из достаточных условий для выполнения (11.14).Теорема Слуцкого.
Для стационарного в широком смысле случайного процесса X(t) оценка его среднего значения (11.13) состоятельна тогда и только тогда, когда:n−11rt → 0n t=0при n → ∞,(11.15)где rt — автокорреляционная функция процесса.Мы не будем более подробно обсуждать этот результат. Обратимвнимание лишь на то, что для выполнения (11.15) достаточно, чтобыrt → 0 при t → ∞. Последнее замечание позволяет на практике судитьо том, можно ли использовать осреднение по одной реализации дляполучения состоятельных оценок его характеристик.
Таким образомтеорема Слуцкого подчеркивает важность анализа поведения автокор"реляционной функции случайного процесса.Еще два замечания о точности приближения оценки m к истинномузначению. Первое из них касается скорости сходимости m к m. Можнопоказать, √что стандартное отклонение m при больших n пропорцио"нально 1/ n, то есть увеличение точности оценки обратно пропорци"онально квадратному корню из объема наблюдений. Второе замечаниеотносится к случаю, когда объема временного ряда недостаточно дляполучения достаточно точной оценки среднего значения. Определимвеличину T в виде:T =(11.14)351Dm = const.∞k=0352rkсчитая, что указанная сумма конечна.
Величина T называется временемкорреляции и дает представление о порядке величины промежутковвремени τ , на которых сохраняется заметная корреляция между X(t) иX(t + τ ). Если объем n рассматриваемой реализации временного рядаменьше T , то оценка m считается весьма неточной. Введенная величинаT позволяет также указать более точную скоростьсходимости m к m.А именно, эта скорость пропорциональна T /n.Выборочная автокорреляционная функция. В главе 9 (п. 9.5.1)была подробно разобрана оценка коэффициента корреляции (9.17) парыслучайных величин, построенная по выборкам.
Методика полученияоценок значений автокорреляционной функции r(k) во многом напоми"нает случай двух выборок. Разберем ее устройство на оценке r(1) —корреляции между соседними членами временного ряда Xt и Xt+1 . (На"помним, что большие буквы X мы используем для обозначения случай"ного процесса, а малые буквы x — для обозначения реализации этогослучайного процесса.)Образуем из временного ряда x1 , x2 , .