Отчёт 2 (Лабораторная работа №2)
Описание файла
Файл "Отчёт 2" внутри архива находится в папке "Лабораторная работа №2". Документ из архива "Лабораторная работа №2", который расположен в категории "". Всё это находится в предмете "анализ временных рядов" из 11 семестр (3 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "лабораторные работы", в предмете "анализ временных рядов" в общих файлах.
Онлайн просмотр документа "Отчёт 2"
Текст из документа "Отчёт 2"
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ им. Н.Э.БАУМАНА
Кафедра ИУ5
Отчёт
по лабораторной работе №2
по курсу «Анализ временных рядов»
«Выборочная оценка мер волатильности нестационарного временного ряда»
Выполнил:
студент группы ИУ5-114
Шевченко Р.В.
Дата:_______________
Подпись:___________
Проверил: Лабунец Л. В.
____________________
Москва 2013
Цель работы: изучить модели и методы формирования мер волатильности НВР.
Задачи:
-
сформировать непараметрическую оценку дисперсии НВР;
-
сформировать параметрическую оценку среднего квадрата отклонения НВР;
-
исследовать описательную статистику центрированного и нормированного временного ряда;
-
сформировать линии поддержки и сопротивления.
Формирование непараметрической оценки дисперсии НВР
Первым делом для исходных данных строим график остатка:
Возводим в квадрат:
Получаем квадрат остатка.
Сохраняем квадрат остатка в таблице.
Далее делаем сглаживание:
На рабочей панели выберем вкладку Snuffing (сглаживание).
При выборе временного интервала сглаживания следует придерживаться характерным периодам сезонных компонент, поэтому выбираем интервал сглаживания N=12
На закладке нажимаем преобразовать.
Получаем первого претендента на непараметрическую оценку дисперсии:
Нам график ничего не говорит, поэтому удаляем его, но мы получили новую запись — результат сглаживания — это первая непараметрическая оценка нашей дисперсии.
Поставив тут флажок Prior мы получим смещённую оценку, ассоциировав значения скользящей средней с правым интервалом сглаживания (что в общем то нам не надо).
Второй претендент сглаженный с периодом 24
Третий претендент сглаженный с периодом 36
Теперь у нас в быстром доступе 5 записей из которых у нас первая основная, квадрат остатка и 3 претендента на роль непараметрической оценки дисперсии с периодами 12, 24 и 36. Нанесём их на один график со вкладки Review & plot.
Выбрав 4 графика:
В результате на графике квадрата остатка получим наших претендентов SMA с периодами (12,6), (24,12) и (36,18).
Чётко видны недостатки:
-
поскольку оценка центрированная, у нас левый и правый сегмент не имеют соответствующих значений оценок дисперсии.
-
оценка достаточно неравномерна (достаточна волотильна, особенно для интервала сглаживания в 12 месяцев).
Сохраним результаты исследования в таблице, нажав кнопочку save variable. Копируем значения из появившейся вспомогательной таблицы из третьего столбца (в котором пустые первые 6 и последние 6 ячеек) и вставляем в нашу главную с соответствующей позиции. Теперь у нас в шестом столбике непараметрическая оценка дисперсии, основанная на простой скользящей средней, центрированная, поэтому сдвинутая назад на 6 шагов времени т.е. на половину интервала сглаживания:
Формирование параметрической оценки среднего квадрата отклонения НВР
Настроим наш рисунок.
Оставим из претендентов только того, что с периодом сглаживания в 12 месяцев.
На оставленную дисперсию, не побоюсь этого термина, накладываем параметрическую модель (Fit tape – Polynomial, Polynomial order – Quadratic):
В результате на графике появится зелёная парабола:
Теперь добавляем претендента (Fit tape – Polynomial, Polynomial order – Cubic):
В результате на графике появится чёрная парабола (при увеличении можно увидеть разницу):
Сохраняем формулу полинома третьей степени в нашу табличку (вместо x подставив везде номер месяца v1).
В результате мы посчитали не только первые и последние 6 значений, но и сделали прогноз на 12 месяцев вперёд.
Теперь строим квадрат остатка и кубическую аппроксимацию простой скользящей средней на одном графике:
В результате у нас получилась параметрическая оценка дисперсии.
На полученном графике аппроксимация получилась не очень. Её немного «тянет» вверх.
Если бы мы использовали формулу полинома второй степени, то вышло бы лучше:
Исследование описательной статистики центрированного и нормированного временного ряда.
Формируем оценку СКО – меры волатильности, доля которой описывает огибающую.
Для вычисления стандартной девиации СКО нужно извлечь корень квадратный из дисперсии т.е. вычислим в 8 столбик корень квадратный от значений 7 столбца.
В результате получили оценку дисперсии.
Выполним промежуточный контроль проверив на сколько оценка СКО согласуется с остатком, поместив на график значения 4 и 8 столбика.
Если бы мы использовали формулу полинома второй степени, то вышло бы лучше:
Формирование линий поддержки и сопротивления
Для построения линий поддержи и сопротивления сначала формируем центрированный и нормированный временной ряд. В девятом столбике вбиваем формулу: остаток (4 столбец) делим на оценку СКО (8 столбик) т.е. всё приводим к стандартному единичному масштабу.
Получаем центрированный и нормированный временной ряд.
Смотрим график этого результата.
Мы должны подтвердить гипотезы относительно этого результата:
-
Математическое ожидание средний уровень ноль, что вроде похоже потому, что ряд, центрированный.
-
СКО в диапазоне единички, что тоже более-менее похоже.
Проверяем статистики центрированного и нормированного временного ряда. Для этого выделяем 9 столбик и идём в базовые статистики:
Далее в рабочей панельке выбираем описательные статистики:
Появляется рабочая панель с загруженным 9 рядом. Заходим на закладку Advanced и отмечаем там нужные нам статистики (как на картинке):
Здесь представлены статистики:
Valid N – объём выборки;
Mean – математическое ожидание;
Standard Deviation – стандартная девиация (СКО);
Variance – дисперсия;
Sum – суммма;
Median – среднее;
Mode – значение во множестве наблюдений, которое встречается наиболее часто;
Skewness – асимметрия (коэффициент асимметрии). На сколько наше распределение скошено в лево или в право относительно гауссоиды;
Kurtosis – эксцесс (коэффициент эксцесса). Если эксцесс положительный, то значит вершина более острая чем у гауссоиды и более толстые хвосты, а значит наш ряд должен иметь больший масштаб чем гауссовское распределение. И наоборот при отрицательном эксцессе.
Minimum & Maximum – минимум и максимум;
Percentile boundaries – определяет выбор доверительной вероятности, с которой данные могут попадать в линии поддержки и сопротивления.
Тут надо нарисовать график типа такого:
Итак, нажимаем Summary и получаем статистики:
Математическое ожидание (Mean) ожидали 0, а стандартная девиация (Std. Dev.) ожидали 1. Получили достаточно близкие значения.
Асимметрия положительная – значит распределение будет смещено вправо.
Kurtosis отрицательный т.е. диапазон сжат, тонкие хвосты, плоская вершина, меньший масштаб чем у гауссоиды. Поэтому задавать доверительную вероятность большую нет никакого смысла.
Percentile 10% и Percentile 90% будут определять коэффициенты S и R в моделях линий поддержки и сопротивления.
Далее приходим на закладку Normality.
Number of intervals – количество разрядных интервалов (параметр сглаживания наших данных). Если выберем чрезмерно большое количество разрядных интервалов, то получим её сильно изрезанной. Если выберем чрезмерно маленькое количество разрядных интервалов, то мы сгладим всю возможно существующую модальную (кластерную) структуру данных. Выбираем оптимальное количество разрядных интервалов гистограммы по простейшему правилу Старджиса. Так же рекомендуется выбирать не чётное число.
N – объём выборки
M – количество разрядных интервалов
Получаем гистограмму на которой мы видим, что у нас всё скошено справа:
Заключительный шаг – строим линии поддержки и сопротивления добавив два столбика и набрав в них формулы. Линия поддержки вычисляется как разность модели тренда (3 столбик) и коэффициента Percentile 10% умноженного на СКО (8 столбик).
Линия сопротивления вычисляется как сумма модели тренда (3 столбик) и коэффициента Percentile 90% умноженного на СКО (8 столбик).
Построив всё на одном графике.
Получилась достаточно грубая оценка потому, что центрированный и нормированный временной ряд обладают корреляцией. Поэтому нужно оперировать не одномерным, а многомерным распределением, которое учитывает влияние прошлых значений на текущее значение и строить условное распределение.
Выводы
В результате проделанной работы были изучены модели и методы формирования мер волатильности НВР.
В рамках практического задания были отработаны навыки работы с программой STSTISTICA. В ходе выполнения работы была сформирована непараметрическая оценка дисперсии НВР. На основе непараметрической оценки, была сформирована параметрическую оценку среднего квадрата отклонения НВР. Далее были построена и исследована описательная статистика центрированного и нормированного временного ряда.
В заключении были сформированы линии поддержки и сопротивления временного ряда. Получилась достаточно грубая оценка потому, что центрированный и нормированный временной ряд обладают корреляцией. Чтоб это исправить, нужно оперировать не одномерным, а многомерным распределением, которое учитывает влияние прошлых значений на текущее значение и строить условное распределение.
Список литературы
-
Лабунец Л.В. Конспект лекций по курсу «Анализ временных рядов», 2012.
-
Боровиков В. Искусство анализа данных на компьютере: Для профессионалов. – СПб.: Питер, 2003. – 688 с., ил.
-
Э.Е. Тихонов. Методы прогнозирования в условиях рынка: учебное пособие. – Невинномысск, 2006. – 221 с.