Часть 1. Искусственные нейронные сети в задачах системного анализа (1245270), страница 6
Текст из файла (страница 6)
число входов (число нейронов во входном слое МНС) определяется количеством элементов регрессора, число выходов (число нейронов в выходном слое) определяется количеством прогнозируемых величин.34При выборе внутренней структуры нейросетевой модели должен быть получен ответ на следующие вопросы:• сколько скрытых слоев должна содержать НС?• какое число нейронов должно быть в каждом скрытом слое?• какой вид активационной функции должен быть выбран?Ответы на эти вопросы так или иначе зависят от характера взаимосвязей«вход-выход», которые должны быть реализованы НС. В первой главе настоящей работы показано, что любые непрерывные функции могут бытьаппроксимированы с заданной точностью при помощи нейросети, содержащей один скрытый слой нейронов с сигмоидальными функциями активации и выходной слой с линейными активационными функциями.
Однаковопрос о числе нейронов в скрытом слое остается открытым. Следует отметить, что увеличение числа нейронов в скрытом слое и увеличение числаскрытых слоев повышают репрезентативные возможности нейронной сети,т.е. дают возможность моделировать более сложные взаимосвязи, но приводят к увеличению временных затрат как на обучение МНС, так и на работу в режиме прогнозирования. В силу простоты применения, обучения истатистического анализа обычно применяются НС, содержащие одинскрытый слой нейронов с сигмоидальными функциями активации и выходной слой с линейными активационными функциями.
Число нейронов вскрытом слое определяется сложностью взаимосвязей «вход-выход».Незначительные изменения внутренней структуры нейросетевой модели, как правило, не оказывают существенного влияния на ее качество, тогда выбор глубины регрессии, т.е. числа отсчетов сигналов в предыдущиемоменты времени, играет решающую роль. Недостаточная глубина регрессии приводит к модели, в которой не учтена существенная часть динамических свойств, чрезмерная глубина регрессии также становится причинойряда проблем [9, 45].35В последующих разделах будут представлены специальные методы оптимизации НС-моделей, использующие в качестве основного алгоритмапоследовательное сокращение структуры НС-модели вплоть до полученияоптимальной. Однако инициализация НС-модельной структуры методомпроб и ошибок является трудоемкой процедурой, что приводит к естественному желанию получить какие-либо рекомендации по первоначальномувыбору как глубины регрессии, так и внутренней структуры НС.
Следуетеще раз отметить, что правильный выбор регрессора значительно упрощает процедуру инициализации нейросетевой модели. В случае отсутствияаприорной информации о порядке системы могут быть использованы приведенные выше эмпирические правила оценки необходимой глубины регрессии.
В работе [58] предложили подход к оценке глубины регрессии длядетерминированных моделей, основанный на предположении о возможности представления реальной системы достаточно гладкой функцией регрессоров. Подобный метод для систем, подверженных влиянию внешнихвозмущающих воздействий, предложен в работе [72]. Далее приводитсяосновная концепция методов определения глубины регрессии.Предположим, что реальная система может быть представлена модельютипа NNARX:y (t ) = g (ϕ(t ), θ) .Регрессионный вектор задан следующим выражением:ϕ(t ) = [ϕ 1 ϕ 2 ϕ 3 ...
ϕ z ] =T= [ y (t − 1) ... y (t − n ) u(t − d ) ... u(t − d − m) ] .T(2.19)Имеется множество экспериментальных данных, состоящее изNпар«вход-выход»:{}Z N = [ϕ(t ), y (t )] , t = 1, N .(2.20)Предположим, что амплитуда производных реальной системы по каждому регрессору ограничена некоторым положительным значением В:gl =∂g 0≤ B, l = 1, z.∂ϕ l(2.21)36Для всех возможных сочетаний пар «вход-выход» вводится коэффициент Липшицаy (t i ) − y (t j )q ij =где•ϕ(t i ) − ϕ(t j )обозначает евклидову норму. В соответствии с условием Липшицадля непрерывной функциит.е.(2.22), i ≠ j,g0коэффициентыq ijявляются ограниченными,0 ≤ q ij ≤ L .Введем в рассмотрение следующие дифференциалы:δϕ l = ϕ l (t i ) − ϕ l (t j ) .При малом значенииδϕ lδy = y (t i ) − y (t j ) ,имеет место следующее соотно-шение:δy =∂g∂gδϕ 1 +δϕ 2 +∂ϕ 1∂ϕ 2+∂gδϕ z = g 1δϕ 1 + g 2 δϕ 2 +∂ϕ z+ g n δϕ z .
(2.23)Следовательно, коэффициент Липшица должен соответствовать выражениюq ij( z ) =δy2( δϕ 1 ) ++ ( δϕ z )=2где верхний индексg 1δϕ 1 + g 2 δϕ 2 +(z)2( δϕ 1 ) ++ g n δϕ z+ (δϕ z ) 2(2.24)≤ z B,относится к общему числу регрессоров;gl– част-ные производные, определяемые в соответствии с выражением (2.21). Используя выражение (2.24), интересно рассмотреть два случая: избыточныйи недостаточный размер регрессора.Недостаточное число компонент регрессора. Предположим, что компонента z отсутствует, тогда соотношение (2.24) принимает следующийвид:q ij( z −1) ==δy( δϕ1 ) 2 ++ ( δϕ z )( δϕ1 ) 2 +( δϕ1 ) 2 +=2+ ( δϕ z )2+ ( δϕ z −1 )2g 1δϕ 1 + g 2 δϕ 2 +( δϕ 1 ) 2 ++ g n δϕ z+ ( δϕ z )2(2.25).В качестве предельного варианта положим, чтоключениемl=z.δϕ l = 0для всех l , за ис-В случае, если выход зависит от z-компоненты, сущест-вуют точки, в которыхδy ≠ 0 .Таким образом, пренебрежение z-37компонентой приводит к бесконечному коэффициенту Липшица.
В общемслучае вероятность существования такого предельного варианта в множестве экспериментальных данных невелика, однако можно предположить,что недостаточное число компонент регрессора приведет к чрезвычайнобольшим значением коэффициента. Более того, нехватка нескольких компонент приведет к значительному возрастанию коэффициента.Избыточное число компонент регрессора. Большое число компонент(значений сигналов в предыдущие моменты времени) приводит к избыточности информации, содержащейся в регрессионном векторе.
Рассмотримслучай включения одной дополнительной компоненты в регрессионныйвектор:q ij( z +1) ==δy(δϕ 1 ) 2 ++ ( δϕ z +1 ) 2( δϕ 1 ) 2 +(δϕ 1 ) 2 +=+ ( δϕ z ) 2g 1δϕ 1 + g 2 δϕ 2 ++ ( δϕ z +1 ) 2( δϕ 1 ) 2 ++ g n δϕ z+ (δϕ z ) 2(2.26).Очевидно, что дополнительная компонента оказывает лишь незначительное влияние на коэффициент Липшица, т.е. приводит к небольшомууменьшению коэффициента.Рассмотренные особенности положены в основу следующей процедурыопределения оптимального регрессионного вектора:• для заданной глубины регрессии определить коэффициенты Липшицадля всех возможных комбинаций пар «вход-выход»;• выбратьp = 0,01N ∼ 0,02 Nнаибольших коэффициентов (обычно наиболь-шие коэффициенты возникают при небольшом значенииδϕ l );• произвести оценку критерия1q(n)⎛ p⎞p= ⎜⎜ ∏ nq ( n ) ( k ) ⎟⎟⎝ k =1⎠;(2.27)• повторить вычисления для ряда структур регрессора (последовательноувеличивая глубину регрессии);38• построить зависимость критерия от глубины регрессии и выбрать оптимальное значение как абсциссу точки излома.Вычисление всех значений коэффициентов для различных структур регрессионного вектора является чрезвычайно трудоемкой процедурой дажепри использовании процессоров с высоким быстродействием.
Особенносильно этот недостаток проявляется при больших значениях N и значительных вариациях структуры регрессора. Поэтому рекомендуется производить пошаговое одновременное увеличение числа предыдущих значенийвхода и выхода.Применение метода к оценке экспериментальных данных, полученных врезультате моделирования нелинейной системы второго порядка, приведено на рис.
2.3.q10 1n, m10 012345678Рис. 2.3. Изменение значения критерия q (2.27) от числа элементоврегрессионного вектора ( n = m = 1:12 )2.3. ПЛАНИРОВАНИЕ И ПРОВЕДЕНИЕ ЭКСПЕРИМЕНТАОсновной задачей на стадии планирования и проведения экспериментаявляется получение множества данных о функционировании реальной системы, необходимых для дальнейшей параметрической оптимизации выбранной модельной структуры. Достоверность и информативность входо-39выходных данных{Z N = [u(t ), y (t )] , t = 1, N} в большей мере определяет качествомодели. Особенное значение данный этап имеет при идентификации нелинейных систем.
Наиболее существенными моментами на этапе планирования и проведения эксперимента являются:• проверка системы на нелинейность;• разработка и реализация тестирующих (входных) сигналов с целью получения информативного множества экспериментальных данных;• предварительная обработка экспериментальных данных.Несмотря на тот факт, что разработка и размещение датчиков на реальном объекте также являются составной частью проведения эксперимента, внастоящей работе предполагается, что система изначально оснащена необходимыми датчиками и, таким образом, входо-выходные последовательности являются доступными.
Кроме того, предполагается наличие возможности управления входными сигналами в соответствии с выбранным закономих изменения. В большинстве случаев данные предположения вполне допустимы.2.3.1.Тестирование системы на нелинейностьВ случае, когда процедура идентификации проводится с целью получитьмодель реального объекта, пригодную для дальнейшего синтеза регулятора, достаточно часто пользуются линейными моделями, несмотря на нелинейность реальной системы. Основной причиной является значительнаяпростота синтеза систем управления по линейным моделям.