Алгоритмы прогнозирования нестационарных временных рядов (1102322), страница 17
Текст из файла (страница 17)
в промежутки, содержащие х(») и х(»+1). Если х(»-и+1) попал л»' ж ~ |ю' ж,»' в этот промежуток, вероятность чего равна а(»-т-1), то для того, чтобы минимальный объем выборки был меньше либо равен т, необходимо и достаточно, чтобы выполнялось неравенство 1'(Т,2;х,») <; а 'ФТ > т+1. Вероятносп этого события равна, как следует из определения (3.8), А», 1. Если >ке х(»-и-1) не попал в згот промежуток, вероятность чего равна 1-а(»-т-1), то в него попал элемент х(»-и-2). Вероятность этого события равна а(» — т-2) и неравенство 1"(т+1,2;х,») < к обеспечено автоматически. Поэтому для того, чтобы минимальный объем выборки был меньше либо равен т, нсобходимо и достаточно, чтобы выполнялось неравенство ру (»,2) < е ~Т > и+2.
Вероятность этого собьпия равна Л», 2. Тем самым доказана формула: Аг =а(з-т-1).А1 1+а(г-т-2) (1-а(» — т-1)) А~ 2. (3.9) Если ряд х(г) стационарный, то вероятность а(г) не зависит от времени: а(г1)=а(г2)=а Чг1,~2. В этом случае величины Аг в (3.9) также не зависят от ~ и образуют линейную рекуррентную последовательность, характеристическое уравнение которой имеет вид 2 а ~: ч4а-За я =а Л,+а(1-а) С4 Л.12 = =:~ Ая — С1 ЛЧ +С2 Я2 у (3.10) 2 где константы С1 2 определяются из начальных условий Ао = А1 = 1. В результате получаем Аь = юг+а(1- )Ж„-..п, 21 Я2 (3,11) Легко показать, что Вь представляет собой полипом по натуральным степеням а.
Это означает, что величины А1, как и найденное выще выражение (ЗА), имеют распределение геометрического типа. Напомним, что в выражениях (3.10), (3.11) и =- ай, согласно (3.7). Следовательно, для функций распределения получаем я Ч2в(М4 к+2)= > Агйр;рз, р2в(т)=Ч2,(т) — Ч2 (т-1), (3.12) 1,/ 1 Формулу (ЗА 1) можно представить в виде отношения опредслигелсй Вандермонда, чго является обпзим результатом для распределения горизонтного ряда прн сдвиге ВФР на произвольный интервал г, если расстояние между ВФР заключено в наибольшем из промежутков, в которых лежат значения соответствующего функционала (1.6): 2(г -1) 2г — < Ь(г, г; в) < —, В свою очередь, определители Ваидермопда позволяют „2(г-1) г 2г области значений < Ь(г, г',в) < —. Тогда условная вероятность Аь ~ АК(11, „1„) того, что значения горизонтного ряда не превосходят заданного числа т из указанного диапазона нри условии попадания значений исходного ряда х(Х) в нромезкутки Л;1,Л;~,...„Л;, выражается через интеграл Коши но коллинзу, охватыванзшему нули использовать технику вычетов для нахолсденил аналитического выражения для вероятностей А~, введенных вьппе.
Этот рсзульта.г был получен автором в работе 1641, У Теорема 4. Пусть ряд хф) стаиионарный и горизонтный ряд рассматривается в харакптериетического многочлена Д(Л) рекуррентиой лоследоеательности для определеняя Ая, Я1) г Иг Ая — -1-— 2т' Яг) (г-1) Доказательство. Обозначим вероятность того, что т значений временного ряда попали соответственно в промежутки Л;1,Ь;~,...,Ь;, „через а м а(11,...,1,): Аналогично рассмотренному выше случаю для т = 2 обозначим вероятность того„ что значения горизонтного ряда не превосходят заданного числа т при задействовании промсжугков Л;,Л;~,...,Ь;~, через А* ж АЬ(11,...,1 ): (3.14) Проводя рассуждения, аналогичные выводу (3.9), получаем соотношение А~ =а(1-т-1) А1, 1+а(г-т-2) (1-а(г-т-1)) Ал 2+ +а(г-т-3) (1-а(г-т-1)) (1-а(г-т-2)) А1, 3+...+ г-1 + а(1 — и — г) П(1- а(à — т — 1))А~, если ряд (х(г)1 стационарсн, то а = сока, тогда для всех г величины А1, также не зависят от г и образуют линейную рекуррентную последовательность, характеристическое уравнение которой имеет вид: 1 =- '~" а(1-а) А = а — с=> Р® -— л (1-а)"-1" „1"'"1 — ~" +а(1-а)" — О.
(3.16) 1-а-Х Х-(1-а) В (3. 16) для удобства восприятия обозначено г = о. Обозначим Л1,..., 1.„корни уравнения Д(Л) = О. В качестве общего положения все корни считаем разлнчнымн. Из (3.16) и из того, что О < а с1слсдует, что все значения 11 заключены внутри объединения двух кругов единичного радиуса с центрами в О и 1.
Тогда (ЗА7) где С; суть константы, опредсляемые из начальных условий: АО =А1 — —... = А„,,1 =1. Решение соответствующей системы уравнений относительно С; находится с помощью определителей Ваидермоида Я1)~ гЖ ХА а(1), гй,1, + (7(1)~~~~ 2 Да(Н -) Ик)(к — «) 2ж ййз) (е-1) (320) Здесь П вЂ” контур, образованный отрезками прямых йе к = -2, Ке я --3, Ьп г = ~2 (см.
Рис, 27). Вместо указанного контура П можно взять любой другой контур, содержащий все корни подынтегрального выражения. Рис. 27. К вычислению распределения вероятностей А«, в (3.20) Внд этой формулы показывает, что величины А1 могут быть представлены тогда с помоп1ью в~~е~~в ~срез соответствующий интеграл Коши: РНВ,И )= .-.(' Ю) -«)= 2 ЄР(4,(,„.„3-4,4(л„,.„)) =23. (32н 1 Иллн Л В ..ВР Р Р Р 4, Р,-Р-((Л. ° (32Н)- (3.21)внл Ф Р 1 (3 22) =- „(ВИ .и н 41 4(у, и)..-- — а" 44 44(4" 'а) 2( -1) ул Р Р уРву н и и Ов 4ИВ 1 н р л Ну,и ) р ба н и н нр н —, валю ра рниунпннн ае уи инара н В Нл.
Р 424.рие:лиае 3(г,ал)» а ен н рун нврлнурренни 4аи н В П(н 4(у. Ил)л в н и ав нюнвню н ин|п ину Аи' ва ил 4 Н(ю Н -11 — ВФ,ИН)н — "юли ю а аюреине 2( -Н 2( -( 11 л, )44..( ° ( )(1- )л... ) )(1- ) лл рл+.. ) )(1- 1 л, „1 (ую) В Ф» л е "3(3.4(.Н р ан 1 Ян У 44'н н(3 3), иу и люию:4*4 1 и ° (и У 44 иуниу, у н и нле у вн* н Юю иа ( н«нюн Нее рани 41 Однако в подавляющем большинстве случаев реально возникщощих временных рядов отсутствие явной формулы для распределения горизонтного ряда г»»п е (т) м Р1»г1», и; е) = т '» пРн пРоиз вольных т не ЯвлаетсЯ пРеплтствием длЯ практического применения этой статистики, т,к.
с уменьшением т распределение 2п г»»п е(пг) зкспонепциально убывает от своего максимального значения — практически е 2(п-1) до нуля, так что при т «вероятность Ч'и е(т) весьма мала. Главный порядок убывания интегрального распределения горизонтпого ряда может быть найден из анализа рскуррентпого соотношения (3.15) и характеристического многочлена (3 16). У Пред»голсение 2. Пусть — <»г(», и;е)< —. Тогда распределение г»»п е(12п/е~-т) 2(п — 1) 2п асииптопгически стремится к нули как гео»метрическая ггрогрессия со зиаленателель равным максилигльному корггю характеристического много ~егга (3.16). Доказательство. Из (3.17) следует, что — = Лг+Π—, где А, и Л вЂ” наибольший по А, (.1з1 А„, ~1 ~' модулю и следующий за ним корни характеристического уравнения (ЗЛ6).
Мы считаем, что эти корни различны в силу обшности положения распределения исходного времещюго ряда. При болыпих т второе слагаемое в правой части зтого равенства будет пренебрежимо мало. Напомним„что величины А» в (3.15) зависят от индексов»г,...,»п. Обозначим корпи А, и 1 уравнения (3.16) как Я(»1,„.,»п) и Х(гг„.„»п) соответственно. Тогда гр е(~2п/е)-т)»аале(~2н»е)-т+1)-- ,'> р; ...р; ф~,...,»„)+О ' *" . (3.24) А(гг ...~»п) Вторые слагаемые в правой части малы прн больших ьи Предложепис 2 доказано. а» Ответить на вопрос, каково же распредсление горизонтного ряда при малых т„ помогает 2(п-1) 2п Т Предложение 3. Пусть — <»г(», п;е) < —.
Тогда распределение г»»п е(12п/е1 — т) при 1 < т ~ п является равномерг»ьыг. Доказательство. С учетом начальных условий А„= А, = ... = А„, =1 непосредственной подстановкой выражения А„+„, =1 — (1+(т-1)а)(1-а)" в выражение (3.15) при 1 < т < п проверяется, что А» =а-(А»ч+(1-а) А» +..+(1-а)™ ° А,). Такимобразом„ Последнее выражение ие зависит от т. Предложение 3 доказано. А У С!!еде!!!еие. Доказательство следует из цепочки равенств: ! 1 1 л 1 Ь1 -,!т =1 (3.27) Следствие доказано. А 3.4.
Квазнстацнонарность Распределения оптимальною объема выборки Исследуем некоторые свойства функции распределения оптимальных объемов выборки для стационарного ряда. Рассмотрим сначала случай, когда требуется построить прогноз па один шаг вперед, т.е. будем анализировать распределение случайной величины Ь(Г,1;к), принимакпцей целочисленные значения от 1 до М = 12/а1 с вероятностями, определенными и (3.11: (4 1) Отметим> что распределение (4.1) имеет максимум точке !!! = М, т.к. последовательность ~1 (т)~2 монотонно возрастает независимо от вида распределения $м вероятностей Р; исконного ряда: Ф р1 (и)-р1 (и-1)= ~) р;~~ "'"~(1-рг) >О, 2<щ<М. (4 2) Распределение (4Л) обладает тем экстремальным свойством, что супремум распределения вероятностей горизоцтного ряда, достигающийся, как это следует из (4.2), в значении т=М, имеет абсолютный максимум на равномерном распределении вероятностей р;.