Алгоритмы прогнозирования нестационарных временных рядов (1102322), страница 18
Текст из файла (страница 18)
Действительно, рассматривая сумму (4,1) при т =- М как интегральную в пределе Ф -+ сс, р, -+ р(х), легко найти, что максимум функционала р1 . (М) м К(р) = ) р(х)(1- р(х))сх 1 при дополнительном условии нормировки ) р(х)г/х = 1 достигается при -1 где Л есть множитель Лагранжа задачи па условный экстремум для функционала Цр1 = ~р(хф - р(х))йс - Л ~р(х~сЬ.. В данном случае из условия нормировки следует, что Л = О. Проиллюстрируем этот вывод, полагая р = солхг =1/ У непосредственно в (4Л). Для вероятности распределения горизонтного ряда цри т = М тогда имеем выражение (М) = 1.-1/ Лг. Сделаем вариацию равномерного распределения вероятностей исходного ряда, увеличив одну из рг на малую величину Б, а другую, например, р, уменьшив на ту же величину для сохранения нормировки. Для нового распределения получаем из (4.1) р1 „(М) =1 — 1/У-2Б' < р1,.(М), что и требовалось. Наблюдение (4,2) о независимости качественного поведения распределения р1 .(т) от распределения р; позволяет сделать предположение о том, что статистика 6(/,1;к) будет более предсказуема, чсм статистика, например, скользящих средних врсменного ряда х(г).
В частности, с методической целью полезно вновь рассмотреть простую точно рсшаему1о модель, когда ряд х(г) имеет равномерное распределение на отрезке (О; 11. Итак, пусть р; = р = 1/ Ж, / = 1,..., Ф. Математическое ожидание для этого распределения равно у=1/2, а дисперсия о. =1/12, так что среднеквадратичное 2 относительное отклонение равно з = о /,и =1/~ГЗ, т.е. корень из дисперсии составляет более 57% от математического ожидания. Сравним этот результат с относительным среднеквадратичным отклонением для распределения (4.1), построенным по данному равномерному распредслекчпо.
М М М (Ь)= ~~ иихф(т)=игр +ге(1-р)р ~~ ~~ тр ~ =М- — +— м=1 в=2 Аналогично М М Ь ) ~т~р(т) = Фр +М(1-р)р~+~ ~е~р" т=1 и=2 г М- — + -+р Отсюда следует, что дисперсия распределения щ1 (т) равиа (1 )2 (1 р) (1 )2 (4.3) Поскольку е = 2/М, то главная часть выражения (4.3) прн малых е равна р/(1- р), а остальные члены в этом выражении имеют экспоненциальный порядок малости р~~е, мсныпий любой степени о, тлс. О < р <1. Тогда главная часть относительного среднеквадратичного отклонения распределения щ1,(т) равна Х о.. + о(1 / И) = — е+ о(е). (Ь) М(1- р) 2(1- р) (4.4) Стремление выражения (4.4) к нулю равномерно по Ф, т.к. р=1!Ф и з, м —.
у у У 1' у~~ 5. ХС б б~~р рдае еераат ~е~й Ц, дюе го нуля и едицииьь относительное среднекеадратичное отклонение расиределени» Следовательно, относительное среднеквадратичное отклонение распределения у~1 .(т) моя~ет быть сделано в рассматриваемом случае сколь угодно малым. Пусть теперь распределение вероятностей р; в (4.1) произволыю (с учетом сделанного раисе замечания относительно того, что р; ~ 1). Тогда также может быть доказано утверждение, аналогичное (4.4). горизонтного ряда нри сдвиге на 1 шаг имеет порядок малости не больше расстояния между двуми соответствующими ВФР, т.е. моэсет быть сделано сколь угодно малым. Доказательство.
Первые два момента распределения (4.1) имеют вид: М Мз — — ~ т~у~1 (т) = М~ — 2М ~ — '+~) — ' ~1+ р;+р; -Зр; ). (4.6) ~я=1 — 1=.1 (1 Рг) Как и выше при выводе оценки (4.4), рассмотрим эти выражения при больших М, Ф М т.е. при малых с. Обозначим д=шахр;. Из очевидной оценки р р; <гг р; =1 и с %~ 2 1 1=1 1=.1 учетом условия отделимости вероятностей р; от пуля и единицы следует оценка для первого момента: М-1~(1-Ч) <М, <М. Оценка (4,7) сверху получается из (4.5) очевидным образом, а оценка снизу получается из М 1 1 Ж того, что поскольку кар ' <,то М1 > М--~~~ р; /(1 — а). Р! 1-Р1 1-Ч Таким образом, при любом распределении Р; первый момент распределения р1,.
(т) нмсст порядок 1/е. Дисперсия же о. = МЗ вЂ” М1 имеет порядок 0(1); 2 и и+1 и 1 и-1 и г — у р~1 -Р' + Г Рг (1+р,+р„'- 1 — Зри)= -Р. „-,(1-;) 2 (1 — р;); 11 Р<; 11 Рг; 11 Рю' 1 1 < + — +о(в). (1-д)' 1-Ч Следовательно, относительное срсднеквадра.гичное отклонение о.,/М1 распределения р1,,(т) имеет по крайней мере первый порядок е. Теорема 5 доказана. А Полнномиальиость формул вида (4.! ) позволяет предположить, что теорема 5 будет верна и в случае квазистационарного ряда.
Рассмотрим следующий пример, Пусть распределение ряда х(г) является с -стационарным в смысле определения 3 параграфа 3.1. Это означает, что выборочные функции распределения одного и того жс объема выборки Т в два различных момента времени отличаются не более чем на е: 1=1 Пусть в новой выборке р; = р;(г+ г) изменились значения ровно двух вероятностей, а остальные остались прежними.
Покажем, что тогда с точностью о(е) распределение (4.1) также к -стационарно, Это означает, что в (4,1) достаточно ограничиться рассмотрением случая Ф = 2, так что р1 = р, р2 =1- р = и. В другой момент времени это распределение вероятностей примет вид р = р+ с ~ 2, д = д — е! 2, Согласно (4.1), тогда имеем, например, для рЩ: Поскольку М = 12/е1, то при а -+ 0 (т.е, цри М -++~с) главная часть последней суммы равна а т,к. вероятности р и ~у строго меньше 1, то выражение в правой части последнего неравенства стремится к нулю быстрее любой конечной степени е.
Аналогично показывается, что главным среди суммы у7(ги) — уфи) является слагаемое при щ =- М, для которого р(1-Р)+Ч(1-В-р(1-р)-Ч(1-Ч) =2(Я-М) =кй-р)+о(е). Заключительная оценка получается теперь в силу того, что ~4-р~ =-~1-2р~ <1, причем р может быть сколь угодно близким к пулю„так что рассматриваемый модуль разностей вероятностей действительно не превосходит е „по и пе существенно меньше этого числа, Итак, проведенный в параграфе 3.4 анализ горизонтной статистики для стационарных временных рядов показал„что эта статистика имеет распределение геометрического типа. Поскольку независимо от распределения значений исходного временного ряда горизонтиый ряд имеет распределение определенного функционального вида, то можно ожидать, что и для квазистационарных временных рядов внутри горизонта прогноза горнзонтный ряд являегся к-стационарным. Это позволит использовать одну и ту же величину оптимального объема выборки на каждом шаге прогноза.
Ряд практических примеров подтверждают эту гипотезу. В следующей главе 1~1 на основе вып1еопнсанной методики строится численный алгоритм прогнозирования ВФР н временного ряда с заданной точностью. Глава 1У. Прогнозирование квазиетационарных временных рядов 4.1. Алгоритм построения распределения оптимальной выборки На основе теории, изложенной в главе Ш диссертации, соискателем построен численный алгоритм, позволяющий прогнозировать нестационарные временные ряды в заданном временном интервале и с заданной з очностью.
Задача численного моделирования и прогнозировании временного ряда объединяет несколько подзадач, реализованных в работе в виде отдельных алгоритмов. Основным явтяется алгоритм СНЯ (Сопзггас6оп о1 Ног1хоп Бег1ез), разработанный для решения задачи об определении оптимального объема выборки, необходимого для прогнозирования на т шагов вперед с ошибкой ВФР не выше в. Его блок-схема приведена в приложении и предполагает следующие этапы. 4.1.1.
Получение массива с временным рядом (х(1)) с дискретным временем 1 " гпах. 4.1.2. Предобработка ряда существующими методами. Например, для ряда, имеющего явный тренд, предобработка может включать в себя переход к разностям порядка, равного степени аппроксимирующего тренд полинома. Для ряда с хорглао выраженной циклической компонентой можно определить периоды, анализируя частну|о автокорреляционную функцию, найти цнклическу|о составляющую путем усреднения ряда но периоду и перейти к остатку ряда после вычитания циклической компонентьь Если выраженных циклов несколько, то операцию можно повтор~пь несколько раз„от больших периодов к мальва.
Предобработка заканчивается в тот момент, когда, по пап|ему мнению, ряд нельзя улучшить имеющимися в наличии методами. Получишпнйся остаток и будет объектом нашего исследования. В конце ряд преобразуется так, чтобы его значения заключались в пределах от -1 до +1. В качестве примера на Рис.
29 приведен фрагмент ряда дневной цены закрьпня акций компании Пепега1 Б1ес1пс (6Б) за 2004-2005 гг. по данным (9б1 до и после обработки. 20 -20 ' Рн 29.мо ломб«локк! мр Ерюн ! юе л мм ае к а юню оч 4*11 сч ' н "л юм маю а!1' Тт(Р') емко!6 елкою лз а й »и рабов клв9лр ак нр а (н воеюеип бм46 нороннммрнм).н " ю аю кюпн юааоню маню«6 л.
н я кроен, Зклм бпе.м. НОР 4«а лл о нк и+н лл 1126! ХТО)А. О) -О~ЭЯ1 —,-(яя(()4 — ' '-1, «((6-Т!6)~. (1Ю 11 2( 2(141! 'Т1 Ф )( Злю!мамо!4«от2(а1,„,)монлнкяю1е((монокля «Оюл(1. 444. 04 ко 'кя мклн» т(2,9,!). «рюя юв ею юаа ркон е а (3.!.6). З к 4к нн л В н он!!1«но! 'н л«! мб 19 а елТ яноккюяок(кн !какя ЭВР. о 4 клан юрюл. ен (2.1.6), не но енм ею 1 ~! 1 (Т ! () — ~,)ТТ(2() М-!.! 1)-ТТ(3(М-Щ, (1. ) )Л 1=6 но! Т! м ню.! 4 и лак зяв!но! ' «ло 416 0 бк аканж о а о 40.,*)=акр''!(3 91) . ), прекр л)н н елее юко(ю !юнонн л й «06(Р«.21)лр «ан ннрн.лб. 4.1.6.д ! лню юпн р вен ! не мпюа л йе йюр.я м клж ЛО., ) бк. малю Г. «(е н кро камр юа ака:р ю юка .
кама еюб мл (а ра р ю Р 6 1).к тра~або 2А! н к! ал оа о. н я мд лл» о 6 Рк об н лр, .я). Ю Юь Юь 1 ( Ь Ю ье Юь Пьем Р )бур арл н р р»Э ю р эас э сс»* 2эм-2665 с)«. р» и ае нрс ею«2)л нь(ь ю) ул сй 1« р « 1 р» а й.йб и,й) » ее 6.1.7 СП ««ю м бе 6 раа р .ейа м нара э П26) е ю. а Э е ю«,ие» у;6(с,с, ), а(с. ) у(в (цс,с, ).22), Вслуен, с а лп ма««вем ра«а лнс, л, 1 а леьь еи«сьэюнм л вне»«е 6(св) був.;»мы»на срули«ми Длв м«йа«юея «ввеспе «ынссюиай а асюеум лиэю юаэ«юсююев юа минерв мн меррем»»«ми ь внюаэеь рив (цс)) юа у«иве эюме имеем нвамер а. пр» и у«сне» 1«мюв э»в« в«авюь юла«нар.
сасюеава эеьмам. В еамвв»ю» и«еа»а* 6,1з-ьу.б ар сисмемэсип1««1, сев мс пйй,сбь 1«мгврнауюрюру'мап1юс е«с Пэм а а сан» «еююы Цс, ) юэр» юавр«сел ю эе ув «р и-м маме« рю и«с )мнем»ем щ л н» »с -Зу(Цс,с)) ю с свв и 2 (ай «В с16О. 2«!э и(6) ь эм«еа «1 с а иь ннс»и и в» рл ЭН ую1» 1 Л ва) е и» ввэен юмсювв иэю вюй с в ию элп, меюиим. с е 6*пенн«бр«вемьеувс н лву, и луна юа с еа а лм ц, ), бумм иу.и*и«ьэ риис«.а'у р«и лва Эь рьь лв . «ь ру ь юу аюй ц, ) аув» м «О) ю «э у(у,с.().рема м 166 мюаи;вэей)нб сбм юлсбрвьюаарюееьа ввб иь а,'еввьлр»Ю меме.«!сп а 5м»с\ ю е 1 вь ию Полученная величина Ь(г,е) является оптимальным объемом выборки, на основе которой строится прогноз на г шагов вперед, По построению, ВФР ряда па промежутке (г„,„„+г-Ь(г,в),~~®, +г) будет отличаться от ВФР, построенной на промежутке ~~я„х — А(г, в), гп„„) не более, чем па с.