Диссертация (1024839), страница 25
Текст из файла (страница 25)
Коэффициентмножественной корреляции определяется по формуле:152Ryxz =√2 + 2 − 2 · ·21− ,(4.4)где cyx, cyz, cxz – простые коэффициенты линейной парной корреляции.В следующих пределах заключен коэффициент множественной корреляции0≤ R≤ 1.С помощью множественного коэффициента делается вывод о теснотевзаимосвязи.Для измерения частных зависимостей (между у и хj) приняты коэффициентычастной корреляции. Расчетная формула выглядит следующим образом:cyx·z= − ·2 )(1− 2 )√(1−.(4.5)Отличие этого коэффициента состоит в том, что с помощью его измеряетсяпарная корреляция ( и ), а влияние фактора () отсутствует.Частный и парный коэффициенты корреляции могут принимать значения от-1 до 1.На практике при формировании структуры уравнения регрессии можностолкнутьсясявлениеммультиколлинеарности.Мультиколлинеарность-взаимосвязь независимых переменных уравнения регрессии, которые могут иметьмежду собой линейную зависимость.
При функциональной зависимости возникаетстрогаямультиколлинеарность.Нообычнозависимостьявляетсялишьприблизительной, в этом случае мультиколлинеарность называется нестрогой.Чтобывычислениеобнаружитьматрицы,вмультиколлинеарность,которойблизкиенеобходимок±1произвестипоказываютналичиемультиколлинеарности переменных.Решение проблемы достигается методом исключения – отсев факторов.Данный метод основан на последовательном исключении факторов c помощью tкритерия. Построив уравнение регрессии и оценив значимость всех коэффициентоврегрессии, можно начинать процесс исключения из модели того фактора,коэффициент при котором незначим и имеет наименьшее значение t-статистики поабсолютной величине.
Вслед за этим, получив новое уравнение множественной153регрессии, можно снова проводить оценку значимости всех остальныхкоэффициентов регрессии. В случае наличия среди них незначимых происходитпроцесс дальнейшего исключения фактора с наименьшим значением t-критерия.Эта процедура останавливается в том случае, если все регрессионныекоэффициенты значимы.Производяотборфакторов,необходимопользоватьсяследующейпропорцией: количество включаемых факторов обычно в 6-7 раз меньше объемаданных, по которым строится модель.
Следствием нарушения этого положенияявляется то, что параметры модели будут статистически незначимыми, а значениекритерия Фишера меньше табличного.Этап четвертый: исследование адекватности модели.Для оценки модели на адекватность необходимо провести анализ значенийостаточного ряда е . Модель будет адекватной, когда при анализе остаточного рядаматематическое ожидание близко или равно нулю, а значения случайны инезависимы и удовлетворяют закону нормального распределения.Проверку модели на адекватность можно разбить на несколько шагов.Шаг 1. Случай, когда математическое ожидание равняется нулю, означает,что:̅=∑=1 ≈ 0.(4.6)Но, применяя метод наименьших квадратов (МНК), подобная проверкаявляетсялишней,таккакприменениеметоданаименьшихквадратовподразумевает выполнение равенства ∑=1 =0. Это означает, что математическоеожидание равно нулю.Шаг 2.
Проверку элементов остаточного ряда можно проводить сприменением критерия поворотных точек. Каждый элемент ряда ( ) сравниваетсяс предыдущим и последующим элементами.Если ряд является случайным, то выполняется следующее неравенство:>[2(−2)где r- число поворотных точек;3− 2√(16 − 29)/90],(4.7)154Шаг 3. Проверяется независимость остаточного ряда, то есть определяется востаточном ряду отсутствие автокорреляции, используя d-критерий Дарбина–Уотсона.Значение критерия Дарбина–Уотсона определяется по формуле:=2∑=2( −−1 )2∑=1 .(4.8)Вычисление значения критерия d сравнивается с нижним (1 ) и верхним (2 )значениями по таблице. Вычисленное значение d может быть больше двух (d2),поэтому для сопоставления значение d необходимо преобразовать: ′ = 4 − .Значения ряда сильно автокоррелированы, если 0 <d < 1 .Автокорреляции нет, если 2 < < 2Если 1 < < 2 , то можно для оценки воспользоваться автокорреляциейпервого порядка:(1) =∑=2 −12∑=1 .(4.9)Вычисленное значение сравнивается с табличным.
Если |(1) < | (приn< 15, табл = 0,36), то гипотеза о том, что автокорреляция в ряду имеется,отвергается.Шаг 4. Проверяется остаточный ряд на соответствие нормальному закону.Для этого можно использовать RS-критерий: = −,(4.10)где - наибольшее значение; - наименьшее значение;=√2∑=1 −1– значение среднеквадратического отклонения.Гипотеза принимается, если значение RS при заданном уровне вероятностипопадает в табулированные границы.Для оценки точности разработанной модели определяют среднююотносительную ошибку:155| |1̅отн = ∑=1 100%.(4.11)Средняя относительная ошибка менее 5% свидетельствует о высоком уровнеточности, а приемлемой считается ошибка до 15%.Этап 5. Моделирование интервальных и точечных прогнозов.Регрессионная модель может использоваться как для экстраполяции(прогнозирование переменной y при условии [ < < ]), так и дляинтерполяции (прогнозирование переменной y [ > > ], при условии > ) зависимой переменной y .При подстановке значений в регрессионное уравнение определяетсяточечный прогноз.На практике для прогнозирования зависимой переменной у независимыефакторы определяются исходя из их среднего прироста в выборочнойсовокупности:̅ = −−1,(4.12)где и - наибольшее и наименьшее значение в выборочнойсовокупности.При экстраполяции значения , для вычисления прогнозного значения ,значения определяются по формуле: = + ̅k ,(4.13)где k - шаг прогноза (k=1,2..).Подставляя значение в уравнение регрессии, получим точечный прогноз .На практике чаще используется вычисление доверительных интервалов,границы которых можно вычислить по формуле:ГП = ̂ ± ,(4.14)где ГП – граница прогноза;̂ - значение точечного прогноза ; - значение отклонения от точечного прогноза в точке приустановленном значении вероятности.Для линейного уравнения значение определяется по формуле:156( −̅ )² = S* √(1 + 1/) + ∑=1( −̅ )2(4.15),где S – оценка остаточного ряда (4.10), –значение t-статистики по таблице для вероятности.Если разработанная регрессионная модель адекватна, то с заданнойвероятностью можно считать, что при неизменности функционирования системыпрогнозируемое значение попадает в определенный интервал.Этап 6.
Разработка прогностических функций.С помощью разработанной модели можно определять прогнозное значениепеременной Y на t+̃ период и подставить в основное уравнение регрессии.Методологияпрогнозированиянаосновестатистическихданныхзаключается в том, что для каждого выделенного ряда определяется модель,проводится по различным критериям их сравнение и выбор наилучших моделей.В общем виде временной ряд представляется как:Ф = + +е ,(4.16)где - тренд, обуславливающий наличие систематического измененияпоказателя; – сезонная составляющая;е – случайная величина (случайная компонента).Исследование временного ряда заключается в определении аномальныхзначений и его сглаживании.Для определения аномальных значений можно применить критерий Ирвина.Используются две точки Ф и Ф−1 .
Если Ф , отличается от Ф−1 больше, чемсреднеквадратичное отклонение, то точка Ф считается аномальной: =|Ф −Ф−1 |,(4.17)где - критерий Ирвина; - среднеквадратическое отклонение:=̅√∑=1(Ф −Ф)−1̅ – среднеарифметическое значение ряда.где Ф,(4.18)157Точка считается аномальной, если > таб. .
Табличные значения таб.уменьшаются с ростом длины ряда.Для случайных колебаний используется простая скользящая средняя. Внекоторыхслучаяхиспользуютсредневзвешеннуюскользящуюисреднехронологическую, а также экспоненциальное сглаживание.На данном шаге выполняется сглаживание временного ряда, что позволяетвыявить и устранить аномальные значения уровней ряда и определить наличиетренда, а также характеристик в исходном временном ряду.Важно при исследовании временного ряда выявить тенденции его развития:закон развития, тренд, основная тенденция.Для исследования тенденции можно применить различные методы,например, для определения наличия тенденции и ее тренда можно использовать Т– критерий, критерий Валлисса и Мура (это непараметрический метод оценивания),метод Фостера–Стюарда, метод скользящей средней, метод аналитическоговыравнивания, критерий Кокса–Стюарда.При исследовании рядов могут быть выявлены сезонные колебания(внутригодичные колебания), циклические (с периодичностью более года).Существуют различные подходы к исследованию сезонных или циклическихколебаний.Тренд-сезонные компоненты рядов исследуются с помощью итерационныхметодов, но исследование скользящей средней может привести к потере некоторойинформации на концах исследуемого временного ряда, поэтому можноиспользовать метод Четверикова.Временному ряду должны соответствовать формальные свойства функций,которые используются для прогнозирования.
Для моделирования основнойтенденции используют уравнение экспоненты, полиномы, различные логическиекривые и иные функции.Можно использовать полиномы:первой степени Ф = 0 + 1 ∗ ;второй степени Ф = 0 + 1 ∗ + 2 ∗ 2 ;(4.19)158n-ой степени Ф = 0 + 1 ∗ + 2 ∗ 2 + ⋯ + ∗ .На практике уравнения должны отражать тип динамики временного ряда.Так, например, к монотонно убывающим или возрастающим функциям относятся:параболическая; линейная; степенная; гиперболическая; экспоненциальная;логарифмическая парабола; комбинированная.При стремлении временного ряда к предельной величине применяютсялогические функции:Ф =или Ф =1+ −0 1+ 0+1 ,(4.20)где e – основание натуральных логарифмов.При наличии экстремальных значений можно использовать кривуюГомперца: Ф = ∗ 0 1 .(4.21)Прологарифмировав функцию Гомперца, получим:Ф =lgd+1 lg0 .(4.22)Следовательно, после логарифмирования получим модифицированнуюэкспоненту.При выборе модели тренда можно применять и эмпирические методы:дисперсионного анализа; разностного исчисления; расчета и анализа среднейквадратической ошибки и другие.Оценку качества можно выполнить с помощью наиболее распространённыхстатистических критериев:критерий относительной ошибки аппроксимации:1| |= ∑=1*100%,где е = -Ф - ошибка прогноза; - значение показателя по фактическим данным;Ф – значение, полученное в результате прогноза.(4.23)159Показатель применяется для сравнения точности результатов прогноза поряду моделей.
Если <10%, то точность модели высокая, при =10-20% точностьмодели хорошая, при =20-50% точность модели удовлетворительная.Критерий среднеквадратичной ошибки:̂ =√1−∑=1 2 ,(4.24)где k - количество исследуемых коэффициентов.Выбранная в результате исследования модель должна отражать характертенденции.