95644 (702735), страница 17
Текст из файла (страница 17)
Регрессионный анализ
Регрессионный анализ используется после того, как с помощью корреляционного анализа выявлено наличие статистически значимых связей между переменными и оценена степень их тесноты.
Регрессионным анализом называется метод статистического анализа зависимости случайной величины у от переменных
, рассматриваемых в регрессионном анализе как неслучайные величины, независимо от истинного закона распределения xj.
Предполагается, что случайная величина у имеет нормальный закон распределения с условным математическим ожиданием ỹ, являющимся функцией от аргументов xj и постоянной, не зависящей от аргументов дисперсий 2.
Наиболее часто встречаются следующие виды уравнений регрессии:
Полиномиальное, гиперболическое и степенное уравнения приводятся к линейному.
А. Простейшее линейное уравнение регрессии.
а) Оценка уравнения регрессии.
Предполагаем, что в «среднем» у есть линейная функция от х, т.е. уравнение регрессии имеет вид:
где
‑ условное математическое ожидание М(у/х);
‑ коэффициенты, которые необходимо оценить по результатам выборочных наблюдений.
Оценить
‑ это значит найти их оценки по выборке (оценки обозначают как в0 и в1). Говорят, что имеем оценку уравнения, т.е. в0 и в1 – найденны, например, методом наименьших квадратов.
Оценка уравнения регрессии записывается в виде:
| Параметры уравнения регрессии | Оценки параметров |
| 0 1 2 | в0 в1 s2 |
б) Определение интервальной оценки
где в0 – оценка 0, т.е. Мв0 =0;
t ‑ t распределение для уровня значимости =1- и числа степеней свободы
v=n-2
в) Проверка значимости 1 (значимости уравнения регрессии)
проверяется гипотеза о равенстве нулю 1 при альтернативной гипотезе
H0: 1=0
H1: 10
Гипотеза H0: 1=0 отвергается с вероятностью ошибки при выполнении неравенства t1 >tкр (, =n-2) и уравнение регрессии считается значимым
где
‑ несмещенная оценка среднего квадратического отклонения величины в1;
tкр (, =n-2) находится по таблице t-распределения при заданном и =n-2
г) Определение интервальной оценки для
при заданном х=х0
tv находится по таблице t –распределения Стьюдента для уровня значимости =1- и числа степеней свободы v=n-2
Анализ рядов динамики
Показатели, характеризующие различные объекты и процессы в мировой экономике постоянно меняются во времени, образуя ряды динамики. Такие числовые данные называют так же динамическими или временными рядами. В зависимости от регистрации данных ряды динамики являются дискретными или непрерывными.
Существует несколько классификаций циклов в теории циклов, которая исследует различного рода периодические колебания с различной продолжительностью периодов. Одна из классификаций классифицирует циклы следующим образом:
-
длинные волны – период колебаний 40-60 лет;
-
средние волны – период 15-20 лет;
-
главные циклы – от 6 до 11 лет;
-
второстепенные циклы – от 2 до 4 лет;
-
сезонные циклы – 2, 3, 4 месяца
Цели анализа рядов динамики следующие:
-
Определить в каком направлении развивается явление: наблюдается ли тенденция возрастания или падения, или значения варьируются вокруг определенного уровня.
-
Выявить причины вариации явления и функцию, описывающую вариации во времени (выявление и измерение периодических колебаний в рядах динамики).
-
Определить какие факторы влияют на вариацию явления, и установить функциональную зависимость показателей, характеризующих явление, от факторов.
-
Осуществить прогнозирование развития явления в будущем.
При анализе рядов динамики встречаются следующие понятия:
-
автоковариация;
-
автокорреляция;
-
тренд;
-
тенденция среднего уровня;
-
тенденция дисперсии;
-
тенденция автокорреляции;
-
случайный процесс.
Для использования в рядах динамики корреляционного анализа, регрессионного анализа, ряды динамики необходимо предварительно обработать.
Предварительная обработка рядов динамики заключается в выполнении следующих процедур:
-
выявление случайной компоненты ряда динамики;
-
определение тенденции в рядах динамики;
-
выявление сезонной компоненты;
-
выявление основных гармоник;
-
проверка наличия автокорреляции в рядах динамики.
а) Выявление случайной компоненты ряда динамики.
Выявление случайной компоненты – элиминирование (исключение) тенденции из ряда динамики.
Ряд динамики Yt содержит тенденцию Y(t) и случайную компоненту εt
Yt = Y(t) + εt
Тенденция Y(t) представляет собой функцию времени.
Автокорреляцией называется связь между уровнями ряда динамики. Теснота связи оценивается коэффициентом автокорреляции.
где RL – коэффициент автокорреляции с лагом L;
где Сx(L) – автокорреляция лага L;
M – значок математического ожидания;
L – временный сдвиг (так же называемый лагом), L = 1,…T
Для исключения тенденции используют различные методы – метод скользящей средней, метод конечных разностей. Ниже изложен метод конечных разностей. Он заключается в том, что последовательно находятся конечные разности. Остатки εt распределены приблизительно нормально, имеют среднюю 0 и дисперсию σ2.
Основной проблемой является определение порядка разностей, при которых влияние тенденции исключено и разности следующего порядка определять не надо.
Для этого определяют и сравнивают дисперсии.
где yt - значение показателя в t-й период времени;
T - количество периодов времени;
Δkyt - конечная разность k–го порядка для t–го периода;
2kCk – биномиальный коэффициент, определяемый из таблиц.
Если определены разности, при которых влияние тенденций исключено, то
Vk ≈ Vk+1 ≈ Vk+2 ≈…
В практике ограничиваются определением таких разностей, при которых дисперсии приблизительно равны между собой.
Если V0 ≈ V1 , то конечные разности первого порядка исключают тенденцию и, следовательно, остатки yt1 соответствуют требованиям корреляционного и регрессионного анализа.
-
Определение тенденции в рядах динамики.
Необходимо отметить, что тип функции должен быть адекватен характеру изменения рассматриваемого ряда динамики и должен иметь причинно-следственную обоснованность.
При определении тенденции часто принимают следующие функции:
Функция, которой соответствует минимальная среднеквадратическая ошибка, является наиболее подходящей.
После определения тренда вычитают значение тренда из соответствующих уровней первоначального ряда динамики и в дальнейшем анализе пользуются отклонениями от тренда.
Если данные не содержат какую-нибудь явную, ярко выраженную тенденцию, то следует начать определение тенденции с самого простого полинома – прямой линии.
-
Подход к выявлению и измерению периодических колебаний в рядах динамики.
В рядах динамики могут содержаться заметные периодические колебания вокруг общей тенденции, для выявления которых следует применить методику анализа, называемую гармоническим анализом.
Задачей гармонического анализа является определение основных гармоник, содержащих основные закономерности развития исследуемого явления. В наиболее продвинутых исследованиях гармонического анализа постулируется, что функцию х(t) можно записать в виде:
x(t) = g(t) + u(t),
где g(t) – периодическая функция;
u(t) – случайная функция времени с нулевым математическим
ожиданием и дисперсией σ2.
Функция g(t) имеет вид:
Найти данную функцию – это значит найти значения ak, bk, T0 (T – период функции, связанный с частотой зависимостью
).
В частном случае функция g(t) может иметь вид:
Задача выявления периодичности, скрытой в рядах динамики, решается около двухсот лет. Кроме нахождения ak, bk, T, что не представляет серьезных трудностей, для исследователя важным является нахождение причинного механизма, который год за годом, а иногда десятилетия за десятилетием воспроизводит одну и ту же косинусоидальную волну.















