Алгоритмы прогнозирования нестационарных временных рядов (1102322), страница 3
Текст из файла (страница 3)
Следовательно, разработка целостной методики создания прогнозных моделей нестационарных случайных процессов является актуальной задачей. В настоящей диссертации «Алгоритмы прогнозирования пестационарных временных рядов» исследуются проблемы, возникшощие при анализе, моделировании и прогнозировании нестационарных временных рядов, Иа основе проведенного анализа в диссертации предложена математическая модель прогнозирования нестационарной выборочной функции распределения временного ряда, а также и самого ряда. Обоснованием модели является разработанная соискателем методика построения производных статистик, позволяющих определить при заданной точности прогноза оптимальный объем текущей выборки и максимальный горизонт прогнозирования, Предложенная модель реализована в виде числснного алгоритма и протестирована па ряде практических примеров.
Следует подчеркнуть, что на практике статистический анализ данных всегда связан с численным алгоритмом, реализующим ту или иную методику, Поэтому создание эффективных численных алгоритмов для целей математической статистики является практически важной задачей. Применение статистических методов в практичсскнх исследованиях с помощью универсального или специализированного программного обеспечения рассматривалось во многих работах, посвященных оптимизации вычислительных алгоритмов для целей различных задач, решаемых средствами математической статистики: 16„21, 69, 75, 781, Необходимость включения в более или менее стандартные пакеты новых алгоритмов, позволяющих повысить точность статистических оценок при проверке вероятностных гипотез, обсуждалась в работах 141, 421, Перспективы развития программного обеспечения для решения задач математической статистики рассматривались в 11, 13, 571.
Отметим, что недостаточность существующих методов, как тсоретичсских, так и численных, для прогнозирования временных рядов, встречающихся, в частности, на рыл~как ценных бумаг 1241, обсуждастся во многих публикациях. Например, как показано в работах 139, 43, 44, 56), встречающиеся на практике задачи параметрического оцепивалия не всегда могут быть решены с помощью асимптотики нормального распределения.
Некоторые приемы изучения предельных распределений статистик содержатся в 13, 14, 31, 32, 423. Методы корреляционного анализа данных подробно изложены в монографии 183~, где рассмотрены также и ограничения их применимости на практике. Подробный обзор статистических методов н моделей, применяемых на рынках ценных бумаг, содержится в монографии Г543, Во многих примерах, рассмотренных в ~54), случайный фактор, определяющий сто хаотическое поведение цен, предполагается возможным описать в рамках винеровского нлн пуассоповского процессов, Как правило, остатки, т.е.
разности между реальным н модельным поведением наблюдаемой величины, предполагй1отся В таких моделях распределенными норманы!о или с плотностью, позволяющей по эмпирическим выборкам определить параметры этих распределений. Непарамстрнчсские критерии оценивания данных, использующие методы математического моделирования Монте-Карло ~22, 23~, рассматривались в работах ~74, 76, 79~. Существенно„однако, что этн методы применимы только к стационарному распределению, н не могут корректно, т,е. с точностью, оцениваемой по стационарным критериям, использоваться для анализа нсстацнонарных временных рядов.
Таким образом, обзор литературы в области математической статистики и статистического моделирования показывает, что существ~от проблема корректного анализа нестационарпых временных рядов, В настоящей работе предложен подход к решению этой задачи на основе эмпирического оператора эволюции выборочной функции распределения. Подчеркнем, что в этом подходе нс нспользукггся стационарные критерии, Диссертация «Алгоритмы пропшзировання пестационарных временных рядов» посвящена разработке методики прогнозирования нестационарных временных рядов, математическому обоснованию этой методики, описанию прогнозной модели и построению соответствующего численного алгоритма.
Ниже кратко дается постановка задачи и описываются идеи, лежащие в основе ее решения. Конкретной целью данного исследования является минимизация ошибки прогноза выборочной функции распределения н собственно временного ряда на заданном временном горизонте. Ошибка понимается в смысле среднего квадратичного. Параметром, по которому минимизируется ошибка прогноза, является текущий объем выборки элементов ряда. Оптимизация объема выборки возможна в силу того, что ошибка прогноза складывается нз ошибок двух типов, Ошибка первого типа — это погрешность оценки статистических свойств временного ряда за счет конечности объема выборки, т.е, за счет недостаточной репрезентативности. Ошибка второго типа — это погрешность за счет нестационарпостн статистики.
Ошибка первого типа с ростом объеьш вь|борки уменьшается, а ошибка второго типа возрастает. Для определения оптимального объема выборки и создания адекватной прогнозной модели временного ряда в диссертации ставятся и решаются следующие задачи, Первой задачей является создание системы необходимых понятий для корректного прогнозирования нестационарных временных рядов, когда отсугствует само понятие генеральной совокупности. Второй задачей является разработка подходящего теоретического инструмента (аналога статистики Колмогорова-Смирнова) для определения выборки оптимального обьема с точки зрения общей цели исследования, сформулированной выше.
Таким инструментом стала статистика «горизонтного» ряда (терминология автора), степень нестационарности которого, как доказывается в диссертации, существенно меньше, чем исходного анализируемого ряда Третья задача связана с созданием математической прогнозной модели для выборочной функции распределения. Рассматривая задачу прогнозирования как задачу о построении оператора эволюции функции распределения, можно сконструировать «эмпирическое» уравнение Лиувилля и определить некоторый кинетический аналог скорости изменения плотности вероятности, т,е, построить квазидинамическую модель временного ряда, Четвертая задача — создание численного алгоритма, реализующего предложенную методику, и проведение тестовых расчетов, Для решения этих задач диссертантом был разработан соответствующий инструментарий, введена система понятий и доказаны свойства новых введенных им статистик, позволя|ощих корректно использовать оценки, получаемые на нестациопарных выборках, в практической деятельности, На этой методической основе была получена конструктивная связь между объемом выборки„при котором ошибка прогноза минимальна в среднем квадратичном, горизонтом прогноза и точностью прогнозирования функции распределения, понимаемой как расстояние в пространстве суммируемых функций.
В работе предложена новая прогнозная модель для выборочной функции распределения и собственно временного ряда, использующая эмпирическое уравнение Лиувилля, Эта модель позволяет локально по времени сопоставить текущей выборке некоторую квазидинамическую систему. Новизна результатов диссертапии сосгоит также и в разработке численного алгоритма для построения прогзюза выборочной функции распределения и самого временного ряда на основе разработанной методики, Отметим, что алгоритм построения статистик, введенных автором для повьплеиия точности прогноза временных рядов, 12 отсутствует во всех широко используемых программных статистических пакетах. Также в существующем программном обеспечении нет алгоритма для прогноза функции распределения на основе эмпирического кинетического уравнения, Метод пропюзировання, разработанный в настоящей диссертации, использует взаимосвязь между объемом выборки и горизонтом прогноза, возникающую прн задании точности прогноза.
В существующих прогнозных моделях стационарных временных рядов эги понятия разобщены, причем горизонт н точность прогноза зачастую вообще отсутствуют, Последнее связано с тем, что если ряд приведен к форме разложения по теореме Вальда, то прогноз белого шума, по предположению, например, гауссовского, делается с извсстнои* точностью, определяемой дисперсией шума, на произвольный промежуток времени. В то же время ясно, что такая идеализация в реальных процессах не наблюдается. Исследователь же вес возникающие погрешности часто перекладывает «по привычке», выработанной применением различных стандартных критериев, на доверительную вероятность оцснок нормальности и стационарности.
Тем самым он лишает себя возможности понизить ошибку нроттюза по некоторой используемой им стационарной модели, поскольку нс рассматривает оптимальный объем выборки, определяемой величиной «приближенной сгационарности» процесса. Введенная автором «горизонтпая» статистика оптимальных объемов выборки оказалась практически полезным и эффективным инструментом для конструирования более точных прогнозных моделей. Например, анализ этой статистики показал, что для многих рядов, генерируемых процессами на финансовых рьшках, характерно представление в виде процесса с переменной долей хаоса, Эта статистика, таким образом, может выступать как квазнстациопарный индикатор состояния рынка, что является полезной информацией при принятии решений.
Итак, задача о моделировании нестационарных временных рядов на основе анализа выборочных функций распределения позволила не только получить новые результаты собственно в математической статистике, но и построить численный алгоритм прогноза временного ряда на заданный промежуток времени с заданной точностью. Алгоритм определения оптимального объема выборки может быль полезен и для анализа временных рядов существующими программными средствами„поскольку он позволяет повысить точность прогноза, который строится в предположении о стацнонарности ряда.
Глава 1. Обзор методов статистического анализа временных рядов 1.1. Основные методы анализа и прогнозирования временных Рядов В этом параграфе рассмотрены основные методы анализа временных рядов, часто применяемые иа практике. Эти методы в силу свосй общеупотребитсльпости служат базисом для сравнения с ними вновь разрабатываемых статистических моделей.