Диссертация (1151153), страница 18
Текст из файла (страница 18)
Рассмотрим подход, основанный на дифференцированииряда. Первая разность дает нестационаный ряд. Но модели АРПСС получаютсядовольно плохого качества. Еще одно дифференцирование дает ряд похожий набелый шум. Для первых разностей непрологарифмированного ряда получаеммодель авторегрессии первого порядка. По результатам верификации на двухпоследних точках было получено вполне допустимое отклонение 1,5% и 1%.Экспоненциальное сглаживание в данном случае дает менее точнуюаппроксимацию, чем АРПСС.
Отметим, что для республики Кабардино-Балкарияи Тюменской области вообще не удалось построить модель АРПСС.Прогноз показателя накопленной за год интенсивности рождений.Построен прогноз на 3 года вперед и доверительный интервал прогноза,основанный на распределении Стьюдента c числом степеней свободы, равным 15(22 наблюдения – 3 степень полинома – 4 узла сетки). Основной тренд направленвверх, но внутри доверительного интервала 95% возможно и снижениерождаемости.Рисунок 10 – Прогноз рождаемости на три года вперед с доверительныминтервалом 95%99Прогноз для Тюменской области и Кабардино-Балкарской республикипредставлен в Приложении 3.3.2. Анализ и прогнозирование смертностиПрогноз накопленной за год интенсивности смертей на основе АРПССмоделей.
Поскольку процесс смертности носит по большей части биологическийхарактер, различия между регионами будут меньше, чем при анализерождаемости, на которую в значительной мере влияет социально-экономическоеи информационное окружение. Для анализа временных рядов смертностииспользован подход Бокса-Дженкинса и экспоненциальное сглаживание.Исходными данными для анализа является показатель «Число умерших врасчете на 1000 населения за год».
График значений показателя имеет следующий20181614122010200820062004200220001998199619941992101990Общий к-т смертности,чел. на 1000 населениявид:Время, годРисунок 11 – Общий коэффициент смертности в Вологодской области по годамГрафики для других регионов представлены в Приложении 4.Судя по графику, можно предположить нестационарность ряда. Однакоимитационное моделирование реализаций процесса авторегрессиипорядкаX t 0,9 X t 1 t , t 1, 2, 3,, 21, ( t ) ~ N (0, 2 ) и независимыпервогосо случайновыбранными начальными значениями показало, что при таких условияхполучение нестационарных на вид траекторий – довольно частый результат.
Этотфакт объясняется коротким рядом наблюдений. Тест Дики-Фуллера при уровне100значимости10%позволяетнеотвергатьгипотезуостационарностиинтенсивности смертей на территории региона.Из трех полученных в результате применения подхода Бокса-Дженкинсаальтернативных спецификаций с ограничением компонент моделипервом случае натретьем – наAR : X t 0,89 X t 1 t ,ARиво втором наMA : X t 0,83 X t 1 0,35 t 1 t ,IиARIMAMA : X t t 0,31 t 1 ,ввс учетом предположения остационарности процесса смертности была выбрана последняя.
Значениеинформационного критерия Акаике для нее чуть ниже, чем для интегрированноговарианта, и чуть выше, чем для варианта без скользящего среднего(информационные критерии применяются для сравнения качества моделей сразным числом параметров на основе суммы штрафов за число параметров исумму остатков; чем меньше значение информационного критерия, тем лучше).Рассмотрим теперь кривую экспоненциального сглаживания (далее – ЭС).Для выбора коэффициента сглаживания использован метод поиска по сетке.Выбор основывался на критерии наилучшего прогноза последнего наблюдения иодновременно хорошего прилегания к данным. Выбрано значение сглаживающегокоэффициента 1 0,3 , для которого сумма квадратов остатков минимальна сучетомточностипредсказанияпоследнегонаблюдения.Дополнительноиспользуем прилегающие к нему сверху и снизу варианты: 2 1 50% 0,15 (более сильное сглаживание), 3 1 150% 0,45последнего(болеенаблюдениякомпромиссныйивариантвычисленногомеждузначенияучетомфункцииэкспоненциального сглаживания).На графике представлены вышеописанные модели, их прогнозы на 3 годавперед и доверительные интервалы 95% (на основе квантилей нормальногораспределения).
Видно, что кривые экспоненциального сглаживания даютдостаточно близкие друг к другу прогнозы и доверительные интервалы (ДИ).Доверительный интервал модели АРПСС сначала значительно уже, затемдостигает границ доверительных интервалов экспоненциального сглаживания.101Рисунок 12 – Прогнозы общего коэффициента смертностиДля Тюменской области и Кабардино-Балкарской республики прогнозпостроен только экспоненциальным сглаживанием (Приложение 5), так как в силунедостаточного объема данных демографической статистики подходящую модельАРПСС построить не удалось.Послетого,каксоставленпрогнознакопленнойинтенсивностидемографических процессов за год, приступаем к следующему этапу –моделированию числа событий (фактов регистрации смертей) по месяцам наоснове модели пуассоновского процесса с полученной на предыдущем шагенакопленной годовой интенсивностью.
Для расчета использован показатель«Число зарегистрированных умерших в расчете на 1000 населения (оперативныеданные)». Его график имеет следующий вид:1.512201120102009200820072006120К-т смертности на 1000населения102Время, мес.Рисунок 13 – Наблюдаемая интенсивность смертности в расчете на 1000населения по месяцамТестДики-Фуллерасвидетельствуетостационарностиряда,представленного на рис. 13. График сглаженной эмпирической плотностираспределения сечений этого ряда построен в пакете «R», использован параметрЧастотасглаживания по умолчанию.Интенсивность смертности, чел./мес. на 1000 населенияРисунок 14 – График сглаженной эмпирической плотности распределенияежемесячной интенсивности смертейВизуальнораспределениесмертностипомесяцамсоответствуетнормальному закону.
Гипотеза о нормальном распределении числа смертей за103месяц принимаетсяс уровнем значимости 6% на основе критерия согласияШапиро-Уилка на соответствие наблюдений нормальному распределению.Число смертей на N тысяч человек постоянного населения ( N определено впредыдущейj( j ),главе)j 1, 2,, nвмоментымоделируемнаскачковосновепуассоновскогонормальногопроцессараспределения.i 1Параметры нормального распределения оцениваем по выборке наблюдаемойинтенсивности смертности по месяцам и масштабируем для получения среднегозначенияравного1.Возможностьполученияотрицательныхзначенийигнорируем, так как среднее в 14 раз превышает стандартное отклонение (дляданных по Вологодской области). Таким образом, получаем маркированныйпуассоновский процесс, в котором моменты скачков маркируются весами,равными количеству смертей, разыгранному с использованием нормальногораспределения.
Разыгрываемые веса независимы от ведущего пуассоновскогопроцесса и совокупно между собой.Наилучшее согласие с пуассоновским распределением для значений общегокоэффициента смертности по месяцам было достигнуто при ˆ (1) 136 человек на8 тысяч постоянного населения в месяц. Значение параметра было подобрано посетке значений на основании критерия Пирсона для распределения Пуассона.Однако для значения ˆ (1) 95 проверка согласия с пуассоновским законом даеттакже неплохой результат ( p статистика 0,97 ).Для оценки разброса числа смертей по месяцам построено множествомодельных траекторий и коридор на основе выборочного стандартногоотклонения накопленной интенсивности смертей на каждый месяц.
Видно, чторазброс вокруг эталонной траектории к концу года увеличивается и растетнеопределенность при увеличении горизонта прогноза. Отношение угловыхкоэффициентов линий регрессии и линий, образующих коридор, составляет около1,14.104Накопленная интенсивностьсмертности120100Исходнаясмертность80Смертностьмодель6040Исходнаясмертность +2 ст.откл.200123456789 10 11 12Время, мес.Исходнаясмертность -2ст.откл.Рисунок 15 – Результаты моделирования траекторий смертности по месяцамЗамечание: при появлении новых оперативных данных следует строитькорректирующий прогноз с месяца, следующего за месяцем последнегонаблюдения,иучитывающийфактическинакопленнуюсначалагодаинтенсивность смертности.Декомпозиция прогноза накопленной интенсивности смертей повозрастным группам.
Осуществляется на основе статистики возрастныхкоэффициентов смертности для РФ, возрастной структуры населения региона сиспользованием ( x) A R exаналитическогозаконасмертностиГомперца-Мейкема(подробнее – в описании формулы 2.1). Для унификацииобозначений интенсивности процесса смертности вместо (x) далее используем (x) . Построена нелинейная регрессия кривой Гомперца-Мейкема на рядпоследних данных демографической статистики возрастных коэффициентовсмертности (за 2011 год). Использована функция «nls()»7 пакета «R».