Диссертация (Методы и алгоритмы интеллектуализации принятия решений в условиях неопределенности на базе аппарата нейронных сетей и эволюционного моделирования), страница 4
Описание файла
Файл "Диссертация" внутри архива находится в папке "Методы и алгоритмы интеллектуализации принятия решений в условиях неопределенности на базе аппарата нейронных сетей и эволюционного моделирования". PDF-файл из архива "Методы и алгоритмы интеллектуализации принятия решений в условиях неопределенности на базе аппарата нейронных сетей и эволюционного моделирования", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МПУ. Не смотря на прямую связь этого архива с МПУ, его также можно найти и в других разделах. Архив можно найти в разделе "остальное", в предмете "диссертации и авторефераты" в общих файлах, а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст 4 страницы из PDF
Принято выделятьнесколько причин, по которым эволюционные методы используются дляобучения и оптимизации нейросетей. Так, к преимуществам эволюционнойкоррекции весовых коэффициентов и пороговых значений ИНС относятся:1. Снижение риска возникновения проблемы локального оптимума [29]. Сувеличением количества примеров в обучающей выборке и сложности топологии18ИНС сложность пространства поиска также возрастает. Для функции ошибкиопределяется все больше и больше локальных минимумов, распределенных порастущему пространству поиска. Градиентные алгоритмы обучения ИНС [24] непредназначены для выхода из локального оптимума для нахождения глобальногоэкстремума.
Эволюционные методы (в частности, генетические алгоритмы)прекрасно зарекомендовали себя в области эффективного перемещения побольшому пространству поиска со сложной структурой для определенияоптимального или квазиоптимального решения. При этом с ростом сложности иразмера пространства поиска растет и эффективность ГА для обучения ИНС вкачестве альтернативы градиентным методам обучения.2.Универсальностьэволюционныхметодов[79].Способностьэволюционных методов к обобщению заключается в том, что для их применения кИНС различного типа требуются минимальные изменения в самом методе. Ониоптимизируют веса для рекуррентных ИНС и ИНС прямого распространения,ИНС с сигмоидными, линейными и даже ступенчатыми функциями активации,градиентные методы обучения для которых в принципе не применимы.Тем не менее, нейроэволюционный подход обладает качествами, которые вряде случаев могут быть расценены как недостатки: большое количествоэвристик, заложенных в нейроэволюционном методе [34]; множество параметров,оптимальные значения которых выявляются опытным путем; отсутствие методаформализации априорных знаний о проблеме и процесса управления поискомрешения [96].
Ключевым элементом универсальности эволюционных методовявляетсявозможностьприменениякИНСпроизвольнойфункцииприспособленности, в том числе и разрывных функций, формирующихся попринципу минимальной длины описания (MDL, minimum description length) [24].Согласно принципу минимальной длины описания, следует минимизироватьобщую длину описания данных с помощью модели и описания самой модели.Применительно к нейросетевому моделированию данный принцип позволяетповысить качество обобщения ИНС.19Использование произвольной оценочной функции требуется не столько вклассических нейросетевых задачах (распознавание образов и аппроксимацияфункций), сколько в задачах управления и поддержки принятия решений.Вданных областях вычисление эффективности ИНС выходит за рамки расчетасреднеквадратической ошибки сети и является нетривиальной задачей.3.
Эволюция правил обучения. Очевидно, для различных топологий и задачобучения требуются и различные алгоритмы. Поиск оптимального иликвазиоптимального правила обучения, как правило, происходит с учетомэкспертных знаний и зачастую - методом проб и ошибок [32, 33]. Поэтому весьмаперспективным является развитие автоматических методов изменения правилобученияИНС.Широкимивозможностямивэтойобластиобладаетэволюционный подход. Схема хромосомного представления в случае эволюцииправил обучения отражает такие динамические характеристики как вероятность ивид мутации, размер популяции, правила применения кроссинговера.
Подстатическими параметрами в данном случае понимаются топология и значениявесовсети,которыекодироватьзначительнопроще.Всравнениисостандартными методами обучения с подкреплением нейроэволюционные методыболее робастны и стойки к зашумленным и поврежденным входным образам.Несмотрянаперечисленные достоинстваэволюционногообучения,согласно теореме NFL (No Free Lunch theorem) [124] на полном множестве задачнельзя выделить самый лучший метод оптимизации. Поэтому с большойвероятностью нейроэволюционные методы покажут не лучшие результаты посравнению со специально разработанными методами: если алгоритм выигрываетпо своим характеристикам при решении некоторого класса задач, то этокомпенсируется худшими характеристиками для остальных задач. Однако однимиз главных достоинств нейроэволюционных систем является предоставляемыйими унифицированный подход к решению различных проблем.
В частности, длясложныхпереборныхзадач(большинствоизкоторыхNP-полные),нейроэволюционные алгоритмы показывают блестящие результаты [125, 126].201.3 Анализ и классификация нейроэволюционных методовпринятия решенийВ настоящее время, несмотря на бурное развитие теории нейроэволюции,число эффективных методов, которые целесообразно применять на практике,невелико. Прежде чем перейти к их рассмотрению, необходимо дать некоторыеопределения.
Генетические алгоритмы манипулируют популяциями – конечныммножествомхромосом.Хромосомыпредставляютсобойупорядоченныепоследовательности генов, каждый из которых кодирует какой-либо параметрИНС [99]. Структура, содержащая набор хромосом конкретной особи, называетсягенотипом.G – пространство генотипов в выбранной схеме кодирования, котороеможет быть задано напрямую перечислением или косвенно грамматикой Г сязыком L(Г) = G.Фенотип – это декодированный генотип, то есть одно изрешений в пространстве поиска. Аллель - это значение гена, размещенного вконкретной позиции (локусе) хромосомы.Функция декодирования D для формирования фенотипа p определяется поформуле = (, ), где D – функция декодирования фенотипа p,соответствующего генотипу в окружающей среде , в случае, если средавлияет на параметры функции.соответствующимD может быть стохастической функцией свероятностнымраспределениемнапространствефенотипов [63].2 = (1 , ) – функция обучения, преобразующая под влиянием средыфенотип 1 в фенотип 2 .
Среда может включать в себя обучающую выборку имножество дополнительных параметров (например, скорость обучения).P – пространство всех возможных в данной схеме кодирования фенотипов:(∀ ∈ )(∃ ∈ )((1 = (, ) ∩ ( = (1 , )))(1.2)21– функция приспособленности (функция оценки, фитнес-функция),которая представляет меру приспособленности каждой особи в популяции [64].S–множестворешений:структурынейросетей,т.е.фенотипы(подмножество P), которые удовлетворяют критериям, заданным функцией всреде . В нейроэволюционной системе с представлением R существует решениев случае, если ⊆ , или хотя бы ∩ ≠ ∅.
Таким образом, данная схемакодирования должна генерировать по крайней мере одно решение.A – множество приемлемых решений, также называемых «хорошими». Вобщем случае возможны ситуации, когда ∩ = ∅, но для практическогоиспользования нейроэволюционная система должна отвечать критерию∩ ≠∅(1.3)Нейроэволюционный процесс [35] в общем случае состоит из этапов,представленных на рисунке 1.1.ДекодированиеНоваяОбученная ИНСпопуляцияФенотипГенотипПрименениеПроцесс обучениягенетическихРасчет функцииоператоровприспособленности икодированиеРисунок 1.1 – Основные этапы нейроэволюцииОчевидно, процессы кодирования и декодирования хромосом играютважную роль в процессе нейроэволюции. А так как эффективность их реализацииво многом определяется схемой кодирования, то от нее во многом зависитпространственная и временная сложность метода. При помощи введеннойтерминологии далее изложены 12 основных нейроэволюционных методов,проанализированы их достоинства и недостатки.221.3.1 Метод эволюции нейронных систем путем стохастического синтезаENS3 (Evolution of Neural Systems by Stochastic Synthesis, эволюциянейронных систем путем стохастического синтеза) – метод, основу которогосоставляет биологическая теория коэволюции [101].
Метод был разработан в2007 г. в Институте теоретической математики имени Макса Планка ФрэнкомПаземаном и Ульфом Дикманом. Коэволюция [87, 112] – это процесс совместнойэволюции, при котором приспособленность отдельных особей зависит от другихособей популяции. Метод ENS3 применим для ИНС, состоящих из нейронов,использующих сигмоидную функцию активации, но не накладывает ограниченийна количество нейронов и топологию. Он единовременно оптимизируеттопологию нейросети и ее параметры: пороги активации, весовые коэффициенты.Метод основан на поведенческо-ориентированном подходе к проектированиюнейронных систем. Изначально он был разработан для изучения сложнойдинамикивсенсорно-двигательныхсистемахавтономныхроботовипрограммных агентов.Метод ENS3 состоит из шести основных шагов:1.
Генерация начальной популяции (0), состоящей из n(0) нейросетей.2. Создание следующей популяции ′ (0) путем репродукции начальнойпопуляции ().3. Изменение структуры и параметров особей популяции ′() споследовательным применением стохастических операторов S, E, V. Оператор V(Variation operator) – стохастический аналог мутации, реализующий добавление иудаление нейронов, связей и корректировку параметров. Результат егоприменения зависит от вероятностей, постоянных для отдельных нейронов исвязей.
Оператор расчета E (Evaluation operator) определяется решаемой задачей ив общем случае задается в терминах функции приспособленности. Операторселекции S (Selection operator) определяет количество особей, попадающих вновую популяцию.234. Оценка каждой особи исходной и производной популяций () и ′(),расчет функций приспособленности их особей.5. Генерация популяции ′( + 1) с использованием ранговой селекцииособейпопуляций()и′()всоответствиисихзначениямиприспособленности.6.Проверкадостижениякритериевостановки(подостижениюмаксимального количества эпох или заданной точности нейросетевого вывода).Если ни один из критериев не достигнут, осуществляется переход к шагу 2.К достоинствам метода относятся простота реализации и хорошаяпроизводительность для нейросетей маленького и среднего размера.