Алгоритмы прогнозирования нестационарных временных рядов (1102322), страница 16
Текст из файла (страница 16)
Это означало бы, что оптимальный объем выборки Н(г;в), определяемый до начала прогнозирования, в последующем не будет иметь статистически значимого тренда в течение промежутка времени т. С другой стороны, для более точного прогнозирования можно в каждый момент времени скользящим образом определять оптимальный объем выборки для прогноза на еше один шаг вперед, однако такая процедура сущесгвепио более затратив по количеству вычислений, Может оказаться, что для прогнозирования в реальном времени, как это бывает нужно в биржевой торговле, в силу ограничения допустимого времени счета более эффективным будет метод„развитый для устойчиво прогнозируемых рядов.
В заключение этого параграфа отметим, что статистики горизонтиого ряда ф, г;е) н ряда допустимых сдвигов г(~, Т;в) являются локальными индикаторами статистических свойств ряда х(г). Изменение с течением времени функций распределения этих величин будет свидетельствовать об изменении условий функционирования той физической системы, которая и порождает рассматриваемый случайный процесс. 3.3.
Функция распределения стационарного горизонтного ряда Исследуем свойства временного ряда Ь(г, г;н), являющегося горнзонтным рядом для некоторого стационарного ряда х(г) . Построим распределение вероятное сей статистики /г(г, г;х), Рассмотрим сначала простейший случай, когда т = 1, Сравним ВФР, построенную по выборке (г-Т, г, с ВФР, построенной по выборке того жс объема, но сдвинутой вперед на 1 щаг по времени, т,е. по выборке (/ — Т+1, /+ Ц.
При таком сдвиге из исходной выборки искл1очается первый се элемент х(г-Т+1) и добавляется один новый элемент х(/+1), Возможны следующие ситуации: х(/-Т+1) и х(/+1) принадлежат одному и тому же промежутку Л;, и тогда К(Т,1;х,/) =О; либо х(г-Т+1) и х(/+1) принадлежат разным промежугкам, и тогда К(Т 1;х г) =2/Т, Поэгому, если к > 2/Т, то в пределах одного шага по времени любое выборочное распределение с объемом Т является с-стационарным. Если же а «2/Т, то условие а-стационарности применительно к данному моменту времени означает, что должно быть Р'(Т,1;х,г) =О, Вероятность реализации последнего условия равна вероятности попадания двух фиксированных элемен гон временного ряда — х(г — Т+1) и х(/+ 1) — в Один и тот жс, но произвольный, промежуток Л;.
Для конкретного промежутка Л; эта вероятность равна р;, где р, есть вероятность того, что элемент исходного ряда попал в Л;. В силу 2 предполагаемой независимости собьггий вероятность попадания двух значений У временного ряда в один произвольный нромсжуток равна ~у р; . /=1 Поскольку величины /з(/,1;н) принимают только натуральные значения, то для нахождения их распределения следует определить вероятность того, что /з(г, 1;л) = ш. В обозначениях (1. 10) это есть вероятность ~кз к (и), Прежде всего заметим, что если т > 12/г1, то Р1/й/,1;к) = ж) = О, Если жс ж «12/к1, то минимально допустимый объем выборки /з(/) в данный момент времени / должен обладать тем свойством, что при сдвиге на 1 шаг выборок объемов т, т + 1, т + 2, ..., 12/с1 — 1 выполнено условие К(т,1; х,/) = О, т.е. первый элемент рассматриваемого ряда (этот элемент имеет помер г-У) и сщс 12/в1 — и элементов принадлежат одному и тому жс произвольному промежутку Ь», а элемент с номером»-Т+т ему не принадлежит.
Следовательно, р1«»ф,1;к)=т, 1<т<М»=~;р~' +'(1-р»), где для краткости обозначено М = 12»а1. Вероятность того, что «««1», 1;г) =1, означает, что реализовалось событие, когда все М элементов выборки попали в один промежуток разбиения, т.е. Р1«««~», 1; к) = 1.» = ~> р»и Наконец, вероятность того, что»»1»,1;к)=М, определяется из условия нормировки: М ~«Р(Ь(», 1„г) = т» = 1, т.с, М-1 Ф ь«м р1»«1»,1;к)=М»=1- ~„~,р~» 111-р;)-~,р»и =1-~р~ т=2»--1 Поскольку выше была найдена вероятность того, что два фиксированных значения а« временного ряда попали в один промежуток — она равна р р;, то полученное выше «=1 выражение есть, очевидно, вероятность того, что два фиксированных значения временного ряда не попали в один промежугок.
Одновременно с этим доказано, что сумма вероятностей всех допустимых исходов для ряда»»(»,1;е) равна 1. Легко видеть, что вероя пюсть события (»»(», 1;а) = М» может бьггь представлена в виде »«» л« Р1»/ф,1;к)=М»=1-~~~ р; = ~«р;11-р;), те, в виде, аналогичном вероятности события «ь=1 « =-1 1»»1»,1;к) — -т» при 1<т <М, Итак, при г =1 получено распределение «»», . («»») случайной величины Ь(», г;а), принимающей целочисленные значения от 1 до М = 12/а1: »Ч ~ рь», т=1 Ж ~~~ р, ~'+ 11-р;), 1<т<М=12/ь). «=1 О, т>М Таким образом, распределение (3.1) можно назвать, по аналогии с известным геометрическим распределением рЬ = а (»- а), О < а < 1, й =1,2,...
(см., напр., 1361), А конечно-аддитивн ым геометрическим распределением. Построим теперь распределение величин л(г, 2; г) для того же стационарного ряда. Эти величины представляют собой минимальныс объемы выборок, интегральная абсолютная разность которых при сдвигс начальной точки на 2 шага по времени меньше е. Возможныс значения функционала г'(Т,2;х,г) следующие: О, если промежугки принадлежносги первых двух элементов выборки совпали с точностью до перестановки элементов с промежутками принадлежности двух новых значений х(Т+1), х(Т+2); 2/У; если в рассматриваемых двух под-выборках объема 2 только по одному элементу попали в разные промежутки Ь;; 4~Т, если ие совпали промежутки принадлежности для обоих элементов.
Зададим а н положим Очевидно, при Т > Мг получаем г'(Т,2;х,г) < а. Пусть с з; 2~Т. найдем вероятность события»Ь»г, 2 в) =1), Для этого заметим, что оно может реализовагься в двух вариантах: либо все значения временного ряда х(г) от 1 до Мг попали в один промежуток и в него же попало хотя бы одно из двух новых значений сдвинутой выборки, либо ряд состоит из повторяющихся упорядоченных пар значений, попадающих в заданные два промежутка Поэтому (1) — '~~ рмг+1+ ~" ~р.р,~~(згг+1)~21~р + ~ ) Аналогично для определения вероятности события ~~ф, 2„е) = т» следует рассмотреть варианты, когда первые два значения исходного ряда попали в один промежуток, и тогда последующие Мг — и значений также попали в этот промежуток, а х(1 — Мг + т) попал в другой промежуток, либо первые два элемента попали в разные промежутки„и тогда любые два соседних элемента ряда из последующих Мг — т попадают в те же два промежутка, а элемент х(г-Мг+ т) попадает в третий промежуток.
Исходя из этого, получаем для 1<и <Мг Ф л' Мг — -2(», )+2~ ~ з"~ )1+1(М2-»+1)пф ) (34) Для произвольных значений т и 0 < к < 2г/Т распределения верояпюстей выглядят весьма громоздко. Однако основной интерес представляют крайние случаи болыпих и малых значений с из вышеуказанного интервала, для которых можно получить явные аналитические выражения. Рассмотрим случай малых г, когда при сдвиге выборки объема Т на т шагов задана точность, характеризуемая величиной нормы я < 2/Т. Тогда распределение вероятности у» 2/т(т) „получаегся с помощью тех же комбипаторных рассуждений, что и формулы (3.1), (3.3) и (3,4). Заданное значение точности рса«изуется, только если первые г элементов исходной выборки и последние г элементов сдвинутой выборки отличя«отея не более чем одним элементом, т.е.
г-1 элементов обеих указанных подвыборок совпал«вот с точностью до перестановок. Введем обозначение симметрированного произведения г — 1 различных вероятностей по выборке объема г Условие того, что индексы в кратных суммах не совпадщот, будем обозначать звездочкой над знаком суммы. Как и в (3.1), положим М = 12/а1. В этих обозначениях всроят«юсть того, что минимальный объем выборки равен 1, представляется выражением (1) "«; М+г-1+ у *~ ~(М+г--1)И1~ ) 1=.1 »,/=! х «'/ МУи+г-1)/з1/ ~Р;Р,Р~/ «Р«'Р/+ Р«'Р/«+ Р/«Р/' «+ - = 1,/,1=1 ((М+ »-1) / »««1 =Х Х ПРя 6»»««1 ь-'~«»я) »»«=1 «1,...,«»»« =1»«=1 При малых к вероятность (3.6) исчезающее мала, т.к.
ее зависимость от к пе степенная, а показательная — вида «/ /"',0<«/ <1. Аналогичные, но более громоздкие формулы получаются и для случая, когда минимальный объем выборки равен»л > 1. При малых т «М в«жодь«будуг те же самые — плотность распределения экспоненциально стремится к нулю, если к -+ 0. Для рассмотрения других а применим следующую индуктивну«о процедуру, которая может быть распространена и на общий случай. Вернемся к случаю г = 2 и найдем распределение вероятностей «/»з .(в«) при 2/к<ля<4/к.
Для этого введем вероятность а; (») того, что значения х(»), х(»+1) попадают соответственно в»-ый или»- ьгй промежутки единичного отрезка, но ие в один и тот же вместе ад(») = Я!»»»)+3(7!Ж»)-~(»»Ж»)Х(»7»»,») = Р»+ Ру — Р»Р), (37) Формула (3.7) записана для общего случая пестационарпого выборочного распределения ,» (х,»), т.к, предлагаемый метод допускает такое обобщение.
Для стационарного случая вероятность а; не зависит от» и представляется вторым равенством в (3.7). Удобно рассмотреть интегральную функцию распределения горизоптного ряда. Обозначим получая>щееся в этом конкрепюм случае (1-го и»'-го отрезков разбиения) интегральное распределение условной вероятности горизонтного ряда при условии, что последовательные значения х(»), х(»+1) попадают соответственно в»-ый или»-ый промежутки единичного отр~ка, через А~~ (»): .4к (») = р1»»(» 1„') < и =11/ '1- 2 — к» Далее в промежуточных рассу>каспиях индексы у для краткости опускаются. Поскольку ВФР, построенная иа данных из промежутка 1»-т, ») и ВФР, сдвинутая па два шага вперед и построенная на данных из промежутка 1»-т+2, »+2), могут различаться лишь элементами х(»-т+1), х(»-и+2), х(») и х(»+1), то для выполнения условия близости (1.6) в виде 2 ~'(т„2;х,») = ~„»' (х,»+2)-/;„(х,»)~»Й < — < н -1 необходимо, чтобы хотя бы один из элементов х(»-т+1) и х(»-и+2) попал в промежуток | » ~+Я ~,У ~+11 —,— ) ~-' | —,— ~, т.с.