Методические указания (1161391), страница 11
Текст из файла (страница 11)
переменных,
- в логическом анализе результатов прогнозирования.
Наиболее старым и широко используемым математическим методом обработки статистических данных является метод наименьших квадратов.
При реализации метода оценки неизвестных коэффициентов, входящих в экстраполяционную зависимость,
, находятся из условия минимума суммы квадратов отклонений :
где N - число точек статистики - число точек наблюдений за прогнозируемым процессом (j=1 . . N).
Если детерминированная основа прогнозируемого процесса линейна относительно неизвестных коэффициентов, и процесс, отражающий влияние разного рода неопределенностей имеет вид
нормально распределенный случайный процесс с нулевым математическим ожиданием и априорно неизвестной дисперсией, то имеется возможность аналитического решения задачи прогнозирования.
С ростом количества наблюдений N , при усложнении вида детерминированной основы процесса (n>3) вычислительные трудности резко возрастают.
При заданном виде детерминированной основы задача прогнозирования сводится к тому, чтобы по информации о N наблюденных значений сделать следующее :
- оценить значения неизвестных коэффициентов ,
- оценить математическое ожидание значения процесса при
(прогноза) в точке прогноза (точечный прогноз),
- построить доверительный интервал (по некоторой вероятности Р,
например Р=0.95) значений прогноза в точке в прогноза (интервальный
прогноз),
- произвести математическую оценку значимости (степени влияния на y )
отдельных переменных и всего уравнения
в целом.
Оценки неизвестных коэффициентов для процессов вышеприведенного вида могут быть определены из выражения : ,
где - столбец независимых N наблюдений
прогнозируемого процесса,
- матрица размера (n, N) значений независимых переменных
при различных наблюдениях ( элемент
, стоящий на
пересечении i строки и j столбца, означает значение i
составляющей при j наблюдении),
«Т» - операция транспонирования матрицы, а «-1» - обращение.
Из теории известно, что при сделанных допущениях о характере помехи, оценки неизвестных коэффициентов :
- имеют нормальное распределение,
- не смещены, т.е. мат.ожидание оценок равно их истинному значению,
- состоятельны, т.е. при увеличении объема статистики оценки сходятся к
значениям самих коэффициентов,
- обладают наименьшей дисперсией.
Тогда математическое ожидание значения процесса в точке прогноза (точечный прогноз) определяется из выражения :
Оценка дисперсии помехи определяется из выражения :
Ошибка прогноза в точке прогноза характеризуется оценкой :
Интегральный прогноз может быть записан в виде :
t - табулированная величина, зависящая от вероятности Р, по которой строится доверительный интервал, и которая имеет вид распределения ошибки прогноза (в частности, для нормального распределения при Р=0.997, t=3).
В ряде случаев, когда априорно не известно, насколько существенно влияние того или иного параметра ( ) на прогнозируемую величину, может быть проведена математическая оценка значимости соответствующих коэффициентов (
) и всей детерминированной основы в целом. Физически незначимость коэффициента
означает, что соответствующий параметр
с точки зрения имеющейся в нашем распоряжении статистики
не оказывает (с вероятностью Р=1-q) влияния на прогнозируемую величину у и поэтому может быть исключен из детерминированной основы.
Условие значимости коэффициента запишем в виде :
оценка дисперсии величины
,
равная i - диагональному элементу
Табулированный q- процентный матрицы .
предел для распределения Стьюдента.
Для значений N-n >20 можно пользоваться нормальным распределением.
При оценке значимости детерминированной основы в целом проверяется гипотеза о том, что .
При этом условие дисперсии прогнозируемого процесса у равна дисперсии помехи, так как :
Условие незначимости основы в целом записывается в виде
где величина справа - табулированное значение распределения Фишера с N и N-n степенями свободы. А величина F -
В тех случаях, когда детерминированная основа процесса содержит нелинейно-входящие, подлежащие определению коэффициенты, и не может быть сведена к линейной, например : ,
задача прогнозирования, реализующая метод наименьших квадратов, не может быть решена аналитически.
В этом случае может быть использован специальный алгоритм поиска оценок этих коэффициентов и вычисление точечного и интервального прогнозов с помощью ЭВМ.
Алгоритм следующий :
- Исследователь выбирает начальное значение искомых коэффициентов
- Машина вычисляет остаточную сумму квадратов вида (*) ,
и делает шаг (делается приращение коэффициентам
) определенной
длины в направлении, противоположном градиенту.
- В новой точке вычисляется и сравнивается с предыдущим
значением.
Если произошло уменьшение , то операция повторяется. При этом за
начальную точку принимается данная.
Если уменьшения S- квадрат не происходит, то делается попытка
уменьшения шага.
Процесс продолжается до тех пор, пока уменьшение не прекратится или не
достигнет заданного предела. Тогда описанный Градиентный метод
считается исчерпавшим себя.
- После этого дальнейшее уменьшение S- квадрат ищется путем
производства случайного шага в некоторую «окрестность» найденного
градиентным методом значения искомых коэффициентов, и при новых
значениях коэффициентов определяется S- квадрат.
Если это значение меньше предыдущего, то производится переход к новым
значениям искомых коэффициентов.
Если в результате ряда подобных случайных шагов удается установить
направление дальнейшего уменьшения функции , то следующие шаги
делаются в этом направлении с использованием градиентного метода до
тех пор, пока процесс уменьшения не прекратится.
Снова с использованием случайных шагов осуществляется поиск нового
направления, и если его найти не удается, то считается, что достигнут
некоторый локальный минимум.
- Следующей операцией является проверка этого минимума на
глобальность, так как в отличие от случая с линейно-входящими
коэффициентами, имеющего единственный минимум, данная функция
может иметь несколько минимумов, и требуется найти самый глубокий из
них.
Для проверки глобальности найденного локального минимума из точки
делается случайный шаг в достаточно широкую окрестность этой
точки и осуществляется поиск минимума описанным выше способом.
Если за несколько таких шагов не находится ни одного локального
минимума, в котором значение ,
то этот локальный минимум - глобальный.
Если же такое значение находится, то новая точка снова проверяется на
глобальность.
Следует подчеркнуть, что выбор нелинейной относительно неизвестных коэффициентов детерминированной основы может быть оправдан только в случае , если исследователь имеет на это твердые физические основания.
2.4.2. Использование критерия минимума «взвешенной» суммы квадратов при решении задач.
До сих пор мы рассматривали статическое прогнозирование процессов при допущении о неизменности их моделей как на участке наблюдения за этими процессами, так и на участке прогнозирования. При принятом допущении вся информация о процессе, в том числе и получаемая в процессе прогнозирования, имеет одинаковую ценность и используется в расчетах с одинаковым весом.
В ряде случаев весьма затруднительно ответить на вопрос, является ли отклонение нового наблюдения от ожидаемого следствием влияния помехи или оно произошло вследствие изменения в модели (изменения характера протекания прогнозируемого процесса).
Если - второе, то новые данные должны иметь большую ценность, чем старые? Желательно, чтобы модель позволяла распознавать изменения в законе протекания процесса и учитывать новые измерения весовым коэффициентом.
Одним из путей решения этой задачи является применение метода наименьшей «взвешенной» суммы квадратов. При реализации этого метода оценки неизвестных коэффициентов находятся из условия :
квадрата разности измерения значения процесса и его оценки.
Закон измерения веса наблюдений может быть принят самый разнообразный :
- убывание веса по геометрической прогрессии со временем,
- одинаковый вес для К последних наблюдений, а для остальных вес
равен 0 (метод движущейся средней).
Для критерия минимума взвешенной суммы квадратов оценки неизвестных коэффициентов могут быть найдены из выражения