Часть 1. Искусственные нейронные сети в задачах системного анализа (1245270), страница 4
Текст из файла (страница 4)
Прохождение данных по нейронной сети и их преобразования,напротив, не могут быть заранее определены по причине иерархическойструктуры сети и распределенности по связям весовых коэффициентов.Кроме того, входные данные могут быть недоопределены или определены20нечетко, что в традиционных программах не представляется возможным.Поставленная задача может быть решена нейросетью, даже если входнаяинформация не рассматривалась ранее при обучении, при условии, что обрабатываемые данные не выходят за предъявляемые к ним ограничения.Нейронные сети занимают небольшой объем памяти, так как сохраняетсялишь структура нейронной сети и матрица весовых коэффициентов. Аппаратные реализации ИНС идеально подходят для решения задач идентификации и управления, так как обеспечивают, благодаря параллельной структуре, чрезвычайно высокую скорость выполнения операций.Для решения таких прикладных задач, как прогнозирование и выдачарекомендаций (управление) на основе анализа данных могут быть использованы как экспертные системы, так и нейронные сети.
Основное преимущество нейронных сетей заключается в возможности избежать традиционной процедуры программирования и сбора информации (или «знаний»)при помощи экспертов или конечных пользователей. При создании экспертных систем, наоборот, требуется проводить «интервью» с экспертамидля получения «правил» поведения исследуемой системы при определенных условиях, что требует значительных временных затрат и материальных вложений.
Более того, процедура получения экспертных оценок можетне дать желаемого эффекта, так как нет гарантии, что все необходимыеправила будут получены и что экспертная система будет работать в различных (изменяющихся) условиях.Дополнительное преимущество нейронных сетей состоит в способностивыделять общие принципы (обобщение) при предъявлении некоторого набора обучающих векторов с неполным набором данных (абстрагирование).Необходимо также отметить способность ИНС получать желаемый выходв случае неполного или нечеткого набора данных, что приводит к ошибочным результатам в случае использования традиционных компьютерныхалгоритмов и программ.21Способность нейронных сетей выделять взаимосвязи в экспериментальных данных, к сожалению, связана с невозможностью проследить, какимобразом этот результат достигнут.
То есть нейронная сеть представляетсобой если не «черный ящик», то, по крайней мере, ящик с полупрозрачными стенками. Тем не менее при сравнении входных данных и откликовнейронной сети некоторые тенденции могут быть прослежены и полученообъяснение того или иного поведения нейросети.Не следует недооценивать трудоемкости процедуры обучения нейронной сети. Набор обучающих векторов должен быть составлен таким образом, чтобы точно описать задачу и граничные условия обучения нейросети. Так же как и при обучении человека, именно качество примеров, на которых производится обучение, определяет дальнейшую работоспособностьсистемы.2223ГЛАВА 2РЕАЛИЗАЦИЯ ПРОЦЕДУРЫ ИДЕНТИФИКАЦИИДИНАМИЧЕСКИХ СИСТЕМ НА ОСНОВЕ НЕЙРОСЕТЕВЫХМОДЕЛЬНЫХ СТРУКТУРВ настоящей главе рассматривается комплексный формализованный подход к реализации многоэтапной процедуры идентификации динамическихобъектов с использованием нейросетевых модельных структур.
Нейросетевые методы идентификации рассматриваются как естественное развитиетрадиционной теории линейных систем, методов оптимизации функциймногих переменных, нелинейной регрессии. Особое внимание уделяетсяпрактическим аспектам: созданию репрезентативной выборки экспериментальных данных и их предварительной обработке, рациональному выборуструктуры нейросетевой модели, адаптации алгоритмов поиска минимумафункций многих переменных к обучению нейронных сетей, проверке адекватности полученной модели, структурной оптимизации нейросетевых моделей с целью улучшения рабочих характеристик. В качестве основной задачи рассматривается построение логически законченной процедуры, позволяющей пользователю получить эффективные нейросетевые моделисложных нелинейных динамических объектов.2.1. ОСНОВНЫЕ ЭТАПЫ ПРОЦЕДУРЫ ИДЕНТИФИКАЦИИЗадача идентификации состоит в построении оптимальной в силу некоторого критерия модели (формализованного описания) по результатам на-24блюдений над входными и выходными переменными системы [9].
Напрактике реализация процедуры идентификации (рис. 2.1) требует решения целого ряда вспомогательных задач, основными из которых являются:• планирование / проведение эксперимента и предварительная обработкаэкспериментальных данных;• выбор модельной структуры;• оценка (оптимизация параметров) модели;• принятие решения об адекватности модели.Прокомментируем каждый из этих этапов.Проведение экспериментаВыбор структуры моделиОценка модели(оптимизация параметров)Принятие решения обадекватности моделине адекватнаадекватнаРис. 2.1. Обобщенная схема реализации процедуры идентификацииПланирование / проведение эксперимента.
Основной задачей на данном этапе идентификации является сбор необходимого количества данныхво всем рабочем диапазоне системы:{Z N = [u(t ), y (t ) ] , t = 1, N} (рис. 2.2). Полно-та и достоверность данных во многом определяют качество идентификации. Значения входных и выходных сигналов могут регистрироваться впроцессе проведения целенаправленных идентификационных экспериментов, когда пользователь может определить перечень и моменты измерениясигналов, причем некоторые из входных сигналов могут быть управляемыми.
Задача планирования экспериментов, таким образом, состоит в том,чтобы, учитывая возможные ограничения, выбрать максимально информативные данные о сигналах системы. В ряде случаев пользователь можетбыть лишен возможности влиять на ход эксперимента и должен опираться25на данные наблюдений в режиме нормальной эксплуатации. Основнымимоментами на этапе планирования / проведения эксперимента являютсярациональный выбор частоты дискретизации; синтез входного (тестового)сигнала; фильтрация, удаление из экспериментальных данных нежелательных эффектов (трендов, случайных (необоснованных) «выплесков» сигнала); тестирование на нелинейность.Выбор структуры модели. Множество моделей-кандидатов устанавливается посредством фиксации той группы моделей, которые подходят дляописания исследуемой системы (например, ARX или ARMAX модели).
Затем общая форма представления модельной структуры должна быть конкретизирована на основе сведений об общей динамике системы (например,ARX(2, 2, 1), где описание (2, 2, 1) определяет временную задержку наодин период дискретизации и зависимость текущего выходного сигналасистемы от двух предыдущих входов и двух предыдущих выходов). Тоесть необходимо определить вектор входов (регрессор) для выбранногосемейства моделей-кандидатов.
В случае использования нейросетевых моделей значительную роль играет не только выбор регрессора, но и заданиевнутренней структуры НС – число скрытых слоев и количество нейронов вкаждом скрытом слое.Возмущения, v ( t )СИСТЕМАВход, u (t )Выход, y(t)Рис. 2.2. Схема получения множества экспериментальных данныхZ N = {[u ( t ), y (t )], t = 1, N }на этапе проведения экспериментаВыбор модельной структуры является наиболее важным и в то же времянаиболее трудоемким этапом процедуры идентификации. На этом этапе26знание формальных свойств моделей необходимо соединить с априорнымзнанием об объекте, инженерным искусством и интуицией.Оценка модели. После принятия решения об использовании некотороймодельной структуры необходимо выбрать определенную модель, наилучшим образом удовлетворяющую некоторому критерию.
Традиционнойстратегией оценки модели являются результаты оценки одношагового прогнозирования в силу критерия среднеквадратичной ошибки [9, 5, 19]. Термин оценка (параметризация) модели пришел из теории статистическойобработки данных; для нейросетевых моделей используется термин «обучение».Принятие решения об адекватности модели. Построенная модельдолжна быть адекватна реальной системе и условиям, в которых ее предполагается использовать. Этап установления адекватности (подтверждения) модели требует непосредственного участия инженера-разработчика.Если полученная модель не удовлетворяет какому-либо критерию, то повторяются предыдущие этапы процедуры идентификации, вплоть до проведения новой серии экспериментов.Таким образом, алгоритм реализации процедуры идентификации порождает следующую естественную логику действия: собрать данные; выбрать множество моделей; выбрать наилучшую в этом множестве модель;принять решение о возможности (невозможности) использования модели.Результатом осуществления первых трех этапов процедуры идентификации является конкретная модель – одна из множества, определенноговыбором модельной структуры, причем такая, которая в соответствии свыбранным критерием наилучшим образом воспроизводит данные наблюдений.Вполне вероятно, что первая из найденных моделей не выдержит проверки на этапе подтверждения.
В этом случае повторяется один (или несколько) из предыдущих этапов процедуры идентификации.27Существует несколько причин несовершенства моделей, обусловливающих повторение того или иного этапа процедуры идентификации:• численный метод не позволяет найти наилучшую по выбранному критерию модель: рекомендуется возврат к этапу оценки модели (возможно, врезультате градиентной процедуры оценки достигнут локальный минимум);• критерий оценки выбран неудачно: рекомендуется выбор иного (возможно, регуляризованного) критерия оптимизации с последующим возвратом на этап оценки модели;• множество моделей оказались неполноценными в том смысле, что вэтом множестве вообще нет «достаточно хорошего» описания системы:рекомендуется переход на стадию выбора модельной структуры (возможно, усложнение модели).
В случае использования нейросетевых модельных структур проблема может быть решена путем выбора заведомодостаточно «большой» модельной структуры, которая впоследствииподвергается структурной оптимизации;• множество данных наблюдений не было достаточно информативнымдля того, чтобы обеспечить выбор хороших моделей: рекомендуется переход на этап планирования / проведения эксперимента. Возможно, некоторые режимы из рабочего диапазона системы не были отражены вполученных экспериментальных данных.По существу, главным в приложениях идентификации является итеративное решение всех этих вопросов, особенно третьего, на основе априорной информации и результатов предыдущих попыток [9].2.2.