Калиткин, Карпенко, Михайлов, Тишкин, Черненков - Математические модели природы и общества - 2005 (947500), страница 60
Текст из файла (страница 60)
Однако при прогнозировании развития социально-экономических явлений возникает более сложная ситуация, когда многие входные воздействия сами по себе остаются неизвестными и отражаются в наблюдениях лишь косвенно, через изменения выходных характеристик изучаемых объектов. Ситуация также усугубляется осложнениями, причина которых — наличие скрытых внутренних влияний характеристик одних явлений па характеристики других явлений В таких ситуациях задача оценки и краткосрочного прогнозирования развития социально-экономических явлений или объектов 1всюду далее под объектом будем понимать не только обьект, но и любое явление, характеризуемое набором показателей, изменяющимися во времени) может быть решена лишь на базе двух гипотез: гипотезы повторяемости 1в прогплом встречались такие же илн аналогичные внешние воздействия) и гипотезы адекватности реакции 1похожис воздействия вызывают похожие реакции), являющейся очевидной модификацией гипотезы локалыюй компактности.
Для решения данной задачи предлагается использовать обучающийся генетический алгоритм 1.ПАР ().еагп1пд Сгепе11с А1йог!11пп 1ог Ргодпоз1з), наиболее подробно описанный в работе [4), который извлекает закономерности 1знания) из специфичного рода данных и использует эти знания для краткосрочного прогнозирования. Применение данного метода обусловлено тель что большинство классических алгоритмов прогнозирования временных рядов не учитывают специфику и сложность задачи многофакторного прогнозирования развития социально-экономических объектов. В основном они рассчитаны на прогноз в одномерном случае и не учитывают взаимосвязей, которые существуют между различными показателями, а тем более между объектами и поэтому носят сугубо ограниченный, локальный характер и не позволяют давать достоверный прогноз.
Те же методы, которые способны учитывать многомерный случай имеют слишком большое время работы и их работа практически невозможна без серьезного предварительного анализа данных. Поэтому они не могут применяться в силу ограниченности специалистов математиков-аналитиков и вычислительных ресурсов. Рассматриваемый' же алгоритм 1РПА предназначен для исследования многомерных временных рядов, что позволяет ему избавиться от многих недостатков присущих традиционным методам в качественном смысле, а применение такого новейшего аппарата.
как генетические алгоритмы дает ему возможность во много раз уменьшить временную сложность работы. В алгоритме ВОАР выделяется четыре этапа работы: 1) формирование базовых алел»ентов (базовых штамлшв); 2) отбор компетентных штаммов; 3) выработка частных вариантов прогноза; 4) получение окончательного прогноза. Пояснение алгоритма будет происходить с помощью рис. !.
штаммов. Вместо трехвходовой обычно рассматриваемой в задачах прогноза социально-экономического развития, алгоритм будет описан на примере двухвходовой таблицы «объект-врел»я». Каждый элемент )лл таблицы (протокола событий за Т прошедших дней, месяцев а а и т.д.) отражает значение одной характеристики 1-го объекта (1 =- 1,2, ...,У) в 1-й момент времени. Моменты времени (1= 1,2, ..., Т) упорядочены в таблице по «возрасту»: самые свежие данные имеют индекс 1 = 1, данные за предшествующий день 1 = 2 и т.д.
до дня а с индексом 1 = Т. Обычно в алгоритмах данного уровня компетентность элементов оценивается по их похожести на некоторос базовое подмножество элементов, которые находятся в одной и той же строке или в однол» и тола же столбце. В данном случае пеле- сообразно рассматривать более общий случай, когда в состав базового множества могут входить С любых элементов таблицы, взятых из протокола за т последних дней.
Такие множеами мощности С. В протоколе за т У х т). Мощность базовых штам- 2.2. Формирование базовых таблицы »объект-свойство-время»ч о о а о Рис. 1. Принцип работы алгоритма ства называются базовыми штамм дней имеется Х элементов (Х = 296Гл. 1' Митемигпи шское моделироеииие сложно»х трудиогрорми шзуемыл Э 2 Прогиозироеиллие зкикеиии покизителей ору шющимся 297 мов можно изменять в пределах от 1 до Х. При каждой заданной мощности С штаммы могут иметь разную «архитектуру», вследствие чего количество вариантов базовых штаммов моппюсти С равно числу сочетаний из Хпо С, а общее количество разных базовых штаммов выражается равенством Нетрудно видеть, что испьнание всех базовых штаммов может превысить возможности даже самого мощного суперкомпьютера.
Для сокращения перебора предлагается использовать комбинацию метода последовательного наращивания числа элементов с методами генетического программирования. Метод последовательного наращивания выглядит так. Вначале оценивается ожидаемая ошибка прогноза элемента Ьл о при использовании в качестве базовых всех Х элементов по одному (С вЂ”. 1). Выбирается подмножество из п, наилучших вариантов (п < Х).
Зателл просматриваются базовые штаммы из пар, образованных каждым из и элементов, отобранных на первом шаге, и всеми остальными (Х вЂ” 1) элементами. Таких вариантов имеется п х (Х вЂ” 1). Из них выбираются и лучших пар, к которым по очереди добавляем по одному все остальные (Х вЂ” 2) элеллента (здесь число вариантов около и х (Х вЂ” 2)). Тем же путем отбираются лучшие тройки и т.д.
до заданного количества элементов С в базовом штамме. При постоянной величине и общее число вариантов имеет значение порядка С х п х лу, что, например, при С =- 12, и .— — !2, и = 2 и Х =- Зб меньше объема полного перебора в миллион раз.
Описанный процесс можно считать некоторой моделью, сочетающей мутация (в виде появления новых элементов у потомков) с естественным отбором лучших из них для использования в качестве «родительскихи штаммов в следующем поколении (©). Однако известно, что этот метод обеспечивает получение лишь локально-оптимального решения. Чтобы попытаться улучшить найденные решения, нужно применить на каждолл шаге (т.е.
при каждом новом значении С) процедуру «скрещиванияя. Для этого следует упорядочить элементы отобранных базовых штаммов по индексу времени. Если два элемента имеют одинаковый индекс ! (т.е. находятся в одной строке таблицы), то упорядочивание этих элементов происходит по номеру объекта г (по номеру столбца). В соответствии с этим порядком присваивается каждому элементу в базоволл штамме номер от единицы до С.
Из каждой пары родителей формируется определенное количество потомков путем замены к элеллентов первого родителя на й элементов второго родителя с одинаковыми порядковыми номерами этих элементов. При каждом значении й число новых потомков будет равно Ссе:. Можно ограничиться меньшим числом потомков, например двумя от каждой родительской пары, путем соединения первой половины одного 298рл. 1' Митсии~ииииское моделироеииив сложных трудиофории шзуелых родителя со второй половиной второго (и наоборот). Но наиболее перспективный вариант, когда выборка й элементов происходит случайно, при этом начинает осуществляться своеобразный стохастический направленный поиск нужного штамма.
Качество таких гибридных штаммов оценивается наряду с качеством породивших их родителей и из этого набора отбирается и наилучших штаммов для последующего участия в мутациях и естественном отборе. Графически процесс скрещивания можно представить следуюпгим образом: (аыа, аьил, ...,а„..., иг;) скрещивание (иы бз~,6, агь ..., Ь;, ..., аг,) (Ьы Ь,'. Ь-'и Ь,,, .., Ь,',.,., Ь,;) (Ьы аз, из, Ьп..., а,,..., Ьы) Таким образом, можно, формально сказать, что на данном этапе решается оптимизационная задача по максимизации функции качества (компетентности) базового штамма, а если быть точнее (забегая немного вперед) порожденной им группы изоморфных штаммов, по которой строится прогноз.
Аналитическое представление данной функции может быть различной и зависит от некой априорной информации; один из вариантов такой функции будет приведен ниже. Итак, упоминаемая постоянно процедура оценки качества базовых штаммов включает в себя этап поиска компетентных штаммов и этап оценки ожидаемой ошибки предсказания с использованием этих штаммов. Перейдем к описанию процедуры отбора множества компетентных штаммов. 2.3.
Отбор компетентных штаммов. Элементы базового штамма ~Ь начинающегося с элементов 1-й строки, в массиве исходных данных помечены их порядковыми номерами и в штамме: (1,1). (2, Ь), ..., (д, Ь), ..., (С, 1). Набор адресов этих элементов описывает структуру (архитектуру) конкретного штамма, состоящего из С элементов. Если индекс 1 у всех элементов штамма увеличить на заданное число р, то мы получим штамм той же структуры, что и исходный, но только сдвинутый во времени на р шагов назад. Такой штамм называется изоморфным данному базовому штамму.