CBRR1557 (716719), страница 3
Текст из файла (страница 3)
Численный метод предназначен для решения не-
линейных дифференциальных уравнений.
Берется из апприорных (начальных условий)
,
подставляется в правую часть уравнения (5) и
т.д. Это называется реккурентностью.
Качественная теория решения нелинейных диффе-
ренциальных уравнений (в приложении к нелинейным систе-
мам)
В отличие от численного метода (Метод Эйлера), который
дает решение в 1й точке ( не дает траекторию (нужно де-
лать 1000 точек, чтобы получить траекторию)).
Пуан Каре в 19 веке дал качественную теорию решения диф-
ференциальных уравнений, она используется для решения не-
линейных дифференциальных уравнений в виде некоторого фа-
зового портрета (некоторый графический материал, по ко-
торому можно анализировать траекторию движения динамичес-
кой системы, т.е. фактически получить решение (1-го из
решений).
На примере X и Y :
f(x,y) - некоторая нели-
a dy нейная функция
функция
x
Найти решение означает - найти y=j(x) (2),
которая удовлетворяет (1).
Пуан Каре развил метод , как найти (2) прямо на
плоскости.
Метод изоклин
Если f(x,y)=const, то
, а
, на кривой
f(x,y)=const все производные имеют одно и тоже значение,
такая кривая называется изоклиной. (tga=const, a=const)
Можно вычислить множество изоклин, это множество дает по-
ле направлений. Касательная к этому полю и есть решение,
т.о. это есть траектория, которую мы разыскиваем.
y
- решение диф. - изоклина
уравнения
x
x
Величина радиуса - значение производной, любая окружность - изоклина. Решение (касательная к полю направления) -
-есть касательная к векторам, расположенная на изоклинах.
- изоклина
¬ решение
- Уравнение Вандер Поля
x(t) - напряжение на контуре автогенератора, фазовая пе-
ременная
= const - параметр
Учитывая это имеем :
- изоклина
-
фазовый портрет
-
Решение дифференциаль-
ного уравнения Вандер
Поля - окружность
(при
= 0)
Если на входы X и Y осцилографа подать две синусоиды, то
получим окружность (фигура Лиссажу), следовательно окруж-
ность дает решения синусоидального колебания.
x Y
t t
Пусть
¹ 0 (см. ур-е (1)’) фазовый портрет будет 2х ти-
п
ов :
Y X(t)
X
t
Выводы :
1) Динамические системы радиоавтоматики описыва-
ются дифференциальными уравнениями 1, 2 и бо-
лее высокого порядка ( например: колебатель-
ная система(солнечная система, автогенератор,
полет космического аппарата в поле притяже-
ния земли) описывается диф. уравнением 2-го
порядка и выше.
2) Линейные динамические системы описываются ли-
нейными диф. уравнениями. Линейная динамичес-
кая система составленная из R,L,C - цепочек и
активных элементов (транзисторов и т.д.).
Любая линейная система путем преобразования
Лапласа может быть представлена в виде пере-
даточной функции.(Диф. уравнение преобразует-
ся по Лапласу). Передаточная функция записы-
вается для удобства в комплексном виде, на
мнимой оси p=jw можно найти АЧХ и ФЧХ линей-
ной системы. Передаточная функция дает инфор-
мацию об устойчивости системы.
3) Нелинейные динамические системы описываются
нелинейными диф. уравнениями, в этих системах
обязательно есть нелинейность вида (
и др.), общих решений и анализа через переда-
точную функцию как правило не существует, по-
этому есть два метода :
а) численный метод (Эйлера и др.) (восстановле-
ние по точкам)
б) решение диф. уравнений методом фазового порт-
рета (качественная теория). (Это наглядный
путь выяснения поведения нелинейной системы)
Стохастические системы
Стохастика - случайность.
Определение: Динамическая система называется стохастичес-
кой , если она описывается дифференциальным
или разностным уравнением, в правую часть
которого входит случайный процесс.
Такую систему можно представить в виде линейного или не-
линейного четырехполюсника, на вход которого подается шум
Стохастическая
x
(t) система X(t)
x(t)- шум
X(t)- выходной процесс
Составление модели любой динамической системы должно
в реальных условиях(например движение самолета или раке-
ты) составляться с помощью предварительных экспериментов
над движением реальной системы. (Как правило это диффе-
ренциальные или разностные уравнения) и в эти уравнения
вставляется некоторый шум, который является случайным
процессом.
Для дальнейшего составления модели используется иден-
тификация модели на основании эксперимента или экспери-
ментальных данных.
Идентификацией называется оценка коэффициентов разност-
ного уравнения и оценка параметров шума:
дисперсии, мат. ожидания, ковариации и др.
Идентификация служит для того, чтобы реальный процесс и
модель были близки.Получив модель мы имеем возможность,
используя эту модель, получить близкую к реальной карти-
не ситуацию движения системы и создать управление ситуа-
цией по нашей модели.
Вывод: Модель нужна, чтобы на ЭВМ научиться проектировать
управляемые динамические системы для любых такти-
ческих ситуаций, известных из практики.
Правильно созданная модель - это максимум успеха в проек-
тировании эффективной систе-
мы. После создания и отработки модели стохастической ди-
намической системы создается аппаратура по этой модели,
которая проверяется на динамическом стенде.
Динамический стенд - 2й этап моделирования реальной ситу-
ации уже с аппаратурой.
3й этап состоит в проверке аппаратуры на полигоне.( На
борту транспортного или военного средства).
Моделирование случайных процессов с дискретным временем
(1)
- выборка случайного процесса с дискретным
временем.
X(t) Процесс (1) в общем виде очень
трудно анализировать, этот про-
цесс, как правило, получен из
эксперимента. Этот реальный
процесс обычно аппроксимируется
другим процессом, который поз-
волит нам математически созда-
t вать модели, близкие к реально-
му процессу.
Такое создание моделей называется - аппроксимацией.
Сам аппроксимирующий процесс называется агрегат.
Марковская аппроксимация случайных процессов
Марковским процессом называется такой процесс, у которого
многомерная плотность вероятности
факторизуется в следующем виде :
. Некоторые
значения фазовых переменных в n-мерном пространстве - это
многомерная плотность вероятности
Двумерная плотность Многомерная ФПВ несет всю ин-
вероятности формацию о случчайном процес-
W(x,y) се. Больше информации не су-
ществует.
Однако использовать эту мно-
гомерную ФПВ чрезвычайно сло-
жно на практике, поэтому час-
то прибегают к некоторым ап-
проксимациям процесса :
Y
X
Аппроксимировать - выбрать такие отсчеты
процесса в моменты времени
, чтобы все
были
независимы, тогда многомерная ФПВ факторизуется следую-
щим образом:
- факторизация.
Однако при такой факторизации может потеряться информа-
ция о случайном процессе. Есть потеря информации для
произвольных отсчетов (кореллированность процесса).
Существует 2й способ аппроксимации - марковский способ
аппроксимации. Для марковских процессов многомерная ФПВ
факторизуется так :
ловная плотность вероятности.
Факторизация (2) позволяет сильно упростить математичес-
кие выкладки в задачах фильтрации и управления.
Определение : Процесс называется марковским, если выпол-
няется условие (2)
Оказывается, существует очень много генераторов марковс-
ких процессов. Мы переходим к их рассмотрению.
Процессы авторегрессии
Процесс авторегрессии - простой генератор марковского
процесса.
1. Односвязная регрессия
ч
ивый процесс 1 2 3 4 n
®¥ (P=1)
x(t) ¬a=0.9
a³1
¬a=0.3
1 2 3 4 5 n t
а=1 - модель взрыва. Если
- гауссовский случайный про-
цесс, то легко доказать, что многомерная ФПВ факторизует-
ся.
а - коэффициент регрессии.
Если 0 корреляций между Если процесс изменяется очень медленно, то он сильно кор- релирован. Коррелированными процессами очень легко управ- лять и они очень легко анализируются и прогнозируются. Генератор марковского процесса, реализующий авторегрессию 1-го порядка i = 0,1,2...n Утверждение (1) : процесс (1) является марковским. Доказательство: Пусть ной. Пусть В формуле (2) разность имеет гауссовкий процесс распре- (3) получено из (4) и (2) заменив Утверждение доказано. Процесс (1) является марковским. Структурная схема генератора марковского процесса T Это структурная схема 4х полюсника, которая реализует генерацию марковского случайного процесса тор с внешним возбуждением, который возбуждается с по- мощью независимого гауссовского процесса Сетка дискретного времени: |¾¾|¾¾|¾¾|¾¾® t T Утверждение (2) На выходе 4х полюсника процесс ван, с коэффициентом корреляции ‘a’. Доказательство: Из (1) имеем ожидание, Утверждение доказано. Вывод: На вход схемы рис.1 идет некоррелированный слу- чайный процесс (если процесс гауссовский и некоррелированный, то он независимый, для других процессов это неверно) В природе наиболее часто встречается гауссовский случайный процесс. На выходе схемы - зависимый коррелированный марковский процесс, у которого плотность факторизуется по условным плотностям. Процесс (1) называется односвязный марковский процесс. Замечание: Процесс (1) получен при дискретизации непре- рывного линейного диф. уравнения 1-го порядка. На сетке дискретного времени имеем : стохастическую) авторегрессию. Tc+1=a Авторегрессия 2-го порядка - двухсвязный процесс Коэффициенты сии. Уравнение (1) без стохастической правой части легко получается из диф. уравнения 2-го порядка. Уравнение (1) реализует генератор марковского процесса, который называ- ется двухсвязным в зависимости от входного процесса двухсвязного процесса На вход генератора действует белый шум. На выходе - двух связный марковский процесс. В зависимости от коэффициентов личные процессы. Процесс (1) получается из линейного диф. уравнения 2-го порядка, если это диф. уравнение рассмат- ривать на временной сетке (дискретна во времени). Известно, что диф. уравнение 2-го порядка имеет реше- ние в виде комплексной экспоненты, если корни характерис- тического уравнения комплексные, аналогично для некоторых значений коэффициентов иметь вид стохастической синусоиды. Генератор двухсвязного марковского процесса Изменение по синусоиде называется синусоидальный тренд. Марковский процесс 2-го порядка более богатый, чем 1-го, с помощью него можно моделировать более сложные процессы. Авторегрессия m-го порядка Процесс (2) получен из диф. уравнения m-го порядка путем дискретизации. Это марковский процесс с дискретным време- нем. Этот процесс значительно более информативен, чем ра- нее рассмотренные, ибо он может моделировать сложномоду- лированные случайные процессы. Он может модулировать АМ, ЧМ, ФМ путем подбора но идентифицировать очень многие случайные процессы ре- ально существующие на практике, например : хорошо моду- лируется движение летательнвх аппаратов при маневре (рег- рессия m=6¸16), речь, полет космического корабля, посадка на планету.Стохастическая модель удобна потому, что она адекватна реальным ситуациям. Генератор m-связного марковского процесса Разностные модели на примере модели 2-го порядка (3) процесса Разностные модели 3-го порядка 1-я разность характеризует скорость изменения случайного процесса. 2-я разность характеризует ускорение. Модель (3) и (4) очень широко иcпользуется на практи- ке, т.к. здесь почти нет коэффициентов, которые нужно идентифицировать ( а и по методу наименьших квадратов. Для этого надо иметь ре- альный процесс отсчетов , модель (4) и нужно воспользо- ваться следующей формулой МНК/метод наименьших квадратов/ Суть МНК состоит в следующем : Есть m-отсчетов реального процесса, есть m-отсчетов модели, составляется сумма квадратов и подбираются пара- метры (а, ся это на ЭВМ)(метод перебора) но в авторегрессии m-го порядка. Сделать это очень сложно. Модели скользящего среднего Пусть М Тогда процесс называется процессом скользящего среднего. Этот процесс сформирован полностью из шума путем сдвига и весового суммирования. ( процесс Генератор скользящего среднего для формулы (1) : Модель авторегрессии и скользящего среднего авторегрессия скользящее среднее случайного сигнала авторегресии Здесь Между генераторами процесс коррелирован. Многомерная марковская модель Это самая распространенная модель В модели (1) шумы характеризуются матрицей ковариации в отличие от авторегрессии, под которой понимается следую- щее: Элементы матрицы шума. Столбики между собой коррелированы. Модель нелинейной регрессии В формулах (3)(матричная форма записи),и (4)(скалярная форма записи) индексы при ‘Х’ это не степени, а номера в формуле столбика. (3) и (4) - самая информативная модель , все предыдущие модели получаются как частный случай из этой модели. Нап- ример модель речи линейная и нелинейная, но нелинейная более точная. Глава 4 Динамические системы наблюдаемые на фоне шумов Одномерные динамические системы и фильтр Калмана Шумы мех). Задачу фильтрации будем решать методом наименьших квадратов. Задача фильрации требует уменьшить Вводим эмпирический риск : - Это есть классическая запись метода наименьших квадра- тов . Эмпирический риск назван так потому, что в риск минимизировать риск, а следовательно уменьшить влияние шумов. Если бы не была придумана модель уравнения (1), тогда невозможно было бы записать риск так выбрать Эти Она получается путем дифференцирования Проделав математические операции получаем одномерный фильтр Калмана. n=1,2... Комментарий к формуле (3) : Фильтр Калмана сглаживает шумы и оказывается, если шу- мы n ® ¥ Т.е. среднеквадратическая ошибка будет минимизирована. Если шумы няется когда n ® ¥ . Формула (4) является критерием минимума среднеквадрати- ческой ошибки. Фильтр Калмана дает оценку процесса т.е. по критерию минимума среднеквадратической ошибки. Замечание 1 : Оптимальность означает, что не существует другого фильтра, который мог бы дать такие же результаты по среднеквадратической ошибке.(Остальные фильтры дают большую ошибку) Замечание 2 : Фильтр Калмана, в отличие от согласованного фильтра, выделяет форму сигнала наилучшим образом. (Согласованный фильтр обнаруживает сигнал и дает максимум отношения сигнал/шум на выходе и сильно искажает сигнал) Для согласованного фильтра все равно какая форма сигнала на выходе, а фильтр Калмана выдает тот же сигнал, что и на входе. Т.е. согласованный фильтр - для обнаруже- ния сигнала, а фильтр Калмана - для фильтрации от шумов. Замечание 3 : Фильтр Калмана записывается во временной области, а не в частотной, как фильтр Вин- нера. Фильтр Виннера - реализован в частотной области. (5) K(w) - оптимальная функция передачи, которая мини- мизирует среднеквадратическую ошибку. случайного процесса). однако фильтр Калмана проще ре- ализуется на ЭВМ. Поэтому его и Анализ фильтра Калмана x(t)- ненаблюдаемый случайный процесс y(t)- наблюдаемый случайный процесс на использует наблюде- ния и начальные усло- процесс x(t). Фильтрация медленных процессов При а=0.999, (3).В этом случае прошлая и текущая оценки поч- ти одинаковы. В таком фильтре Калмана почти полностью иг- норируются наблюдения. При оценке ситуации фильтр Калмана не доверяет наблюдениям, а доверяет лишь прошлой оценке. Это годится для процессов, которые можно легко предска- зать. Фильтрация быстрых процессов Тогда дениям. Это значит, что фильтр Калмана не доверяет прош- лым оценкам. Вывод : Фильтр Калмана минимизирует и флуктуационную и динамическую ошибку. Динамической ошибкой называется разница между оценкой истинным значением Флуктуационная ошибка - тоже, но за счет шума. При быстром процессе шумы фактически не фильтруются. Невязка корректирующего члена, который в формуле (3) учитывает ситуацию, которую дают наблюдения. Оценка на шаге ‘n’ равна экстраполированной оценке плюс некоторый корректирующий член, который есть невязка, которая взята с весом наблюдения на шаге ‘n’) Вес мику системы (модели). Вывод (по одномерному фильтру Калмана): 1) Фильтр Калмана можно построить в виде реккурентного алгоритма только в том случае, если имеется модель случайного процесса, который он фильтрует. 2) Фильтр Калмана оптимален для реального процесса только в том случае, если реальный процесс близок к модели, которую мы используем. Многомерный фильтр Калмана - вектор (столбики) A - матрица k´k, H - матрица m´k. Запишем (1) в скалярной форме. covx=Q, covh=P. Многомерный фильтр Калмана для модели (1) : где Г рованная матрица (сопряженная). Траекторные изменения Часто требуется получить оценку траектории летательного аппарата. Летательный аппарат может быть зафиксирован с помощью радиолокатора, либо некоторой навигационной сис- темой. Летательный аппарат рассматривается в некоторой сис- теме координат : Z динат (см.ниже), то можно точ- ния всех координат существуют строятся на базе фильтра Калмана. Y Траекторный фильтр 2-го порядка Первые две строки (1) - это модель, последняя строка - - наблюдение. Составим многомерный фильтр Калмана , для этого по мо- дели (1) составим многомерную модель. Из формулы (2) имеем : Траекторный фильтр 3-го порядка (4) последняя строка - наблюдения H = [1,0,0] ; Теория нелинейной фильтрации Здесь нелинейные модели записываются в виде : (1) ная регрессия, нижняя - уравнение наблюдений. Функция торый случайный процесс торого случайного процесса, более богатая, чем все преды- дущие модели. Уравнение наблюдений : наблюдается не сама которая функция j( 1) Требуется найти оценку Формула (2) - критерий минимума среднеквадратической ошибки. 2) Требуется получить реккурентную оценку, такую же как в фильтре Калмана. В чистом виде получить оптимальную оценку нельзя, есть лишь приближенные решения, когда функции f(x) и j(x) - - линеаризуются. Тейлоровская линеаризация - используется ряд Тейлора, линейная часть (1-я, 2-го члена). ( j(x) и f(x) - имеют непрерывные первые про- изводные). Разложение в ряд Тейлора в точке где ся находить. Эти линеаризованные функции подставим в (1) и получим линейную систему : Коэффициенты a,b,c,d находятся после подстановки. Будем использовать метод наименьших квадратов для на- хождения оценок Выпишем эмпирический риск : r - функционал. После линеаризации : производная из r берется легко Продифференцировав и воспользовавшись методом индукции получаем : (3) Выводы : 1. В связи с тем, что начальная точка разложения в ряд Тейлора функции j(x) была выбрана в точ- ке нение (3) получилось как нелинейное и оно по- хоже на уравнение (1) модели. 2. В отличие от фильтра Калмана, в курентном его вычислении входит ‘x’ на первом шаге. Коэффициент усиления можно вычислить заранее за ‘n’ шагов (в фильтре Кал- мана). Но здесь этого сделать нельзя. Сущест- вует так называемая обратная связь. Пример нелинейной фильтрации : T - период колебания t - период дискретизации t - текущее время Т Отношение сигнал/шум может быть меньше 1. Требуется получить оценку фазы, такую, чтобы разница в квадрате б (5) Перемножим и пренебрежем 2й гармоникой : (6) (5) - ФНЧ, фильтрует 2-ю гармонику полностью(раз- ностное уравнение) Структурная схема ФАП На вход поступает аддитивная смесь. Принцип работы ФАП Измеритель фазы является следящей системой с отрицатель- ной обратной связью. Опорное колебание зой экстраполяция, т.е. чем меньше нее будет оценка. Глава 5 Оптимальное управление дискретными динами- ческими системами Существует два типа детерминированных управляемых процес- сов (детерминированных систем) (1) времени, которая входит в разностное уравнение динамической системы) Стохастическая управляемая система (2) а может быть и небелым, например, описываться сколь- Критерий оптимального управления Пусть модель (1) или (2) генерирует случайный процесс : временем, т.е. процесс должен развиваться таким образом, чтобы минимизировать некоторую функцию риска, тогда уп- равление называется оптимальным. Математически это выглядит так : где f(×) - выпуклая функция При движении ракеты по некоторой траектории из точки А в точку В траектория должна быть такой, чтобы минимизиро- вать энергетические затраты на управление. Пример 2 : Существует некоторая эталонная траектория. цесса к эталону за минимальное время. Это называется оптимизация x(t) вления. Метод динамического программирования Имеется детерминированная система : (1) Принцип Бэлмана - состоит в том, что оптимальное управ- ление ищется с конца в начало (из будущего в прошлое). Задача решается в обратном направлении. (2) Аналитическое решение задачи по Бэлману Предположим, что мы отправились из брали. Принцип динамического программирования основывает- ся на том, что любой кусок траектории оптимального управ- ления является оптимальным. (3) Траектория от (k+1) до ‘n’ называется хвостом. N - последняя точка в управлении Допустим, что начиная от шага (k+1) до ‘n’ в формуле (4) оптимальное управление уже выбрано. k=N,N-1,...,1 Формула (6) называется уравнением Бэлмана (уравне- ние динамического программирования) Выводы: (из уравнения (6)) Уравнение (6) позволяет в реккурентной форме вы- вычислить управление, шаг за шагом, от точки N до 1 (из будущего в прошлое) получить минимиза- цию (6) на каждом шаге. Получить ния управления фактически получаются методом пе- ребора. Оптимальная траектория вестна до самого последнего шага. Если задача имеет большую размерность, то сложность при вычислении очень большая. Если вводить динамические системы (т.е. модели), то можно значительно упростить метод нахождения оп- тимального управления. Т.е. получить управление в замкнутом виде (в виде некоторой формулы). Синтез оптимального управления для марковских динамичес- ких систем. Управление должно менять причем управляется динамическая система не по всем коор- динатам. Динамическая система, сама как таковая, не наблюдается, а наблюдается j( менная) с шумом. В этом случае говорят, что динамическая система ненаблюдаема напрямую. Для того, чтобы сделать ее наблюдаемой необходимо использовать теорию нелинейной фильтрации (см. предыдущие лекции). В этом случае получаем оценку нелинейной динамической системы в условиях линеаризации по Тейлору : (2) Синтез оптимального управления используя (2) проведем применив квадратичный критерий качества, причем управле- ние динамической системой будем вести к некоторому этало- ну, т.е. задано : Критерий оптимизации где || - норма, Риск складывается из двух слагаемых : 1-е слагаемое : Это есть квадрат отклонения траектории от эталона. Оно должно быть минимизировано с учетом формулы (2). 2-е слагаемое : Это есть сумма с квадратом самого управ- ления (некоторая сила) должны быть мини- мизированны (так должно быть всегда) Минимизация (3) - это достаточно сложная задача вариаци- онного исчисления (просто взять здесь производную по ‘u’ не удается). Для минимизации (3) используем уравнение Бэлмана : В формуле (4) минимизируя шаг за шагом получим : (5) Выводы : (к формуле (5)) Оптимальное управление (5) реализуется с ис- пользованием линейной оценки динамической сис- темы, и это управление вставляется в формулу : Если упростить критерий и привести его к виду (3’): то минимизация дает оптимальное управление эталона: Оптимальное управление пропорционально разности меж- ду экстраполированной оценкой и эталоном, т.о. полу- чим : Оценка (7) подставляется в (6). Со временем, при ми- нимизации в этом случае сама оценка эталону. Пример синтеза динамической системы управления частотой генератора Общая постановка : Пусть имеется некоторая эталонная траектория Если эталон защищен, то его фильтруют. Имеется управляемая динамическая система : Управляемая динамическая система - фаза генератора или траектория, которая должна подстроиться под эталон. им пренебрегают. Пусть Рассмотрим более сложную модель фазы рассматриваемого ге- нератора. Считаем, что в (1),(3) уход фазы очень медленный,т.е. В (4) решение уравнения относительно Выше было доказано, используя уравнение Бэлмана, что : (6) Структурная схема реализации оптимального управления под- стройки частоты к эталону (4’) (5’) э г На выходе - частота подстраиваемого генератора. Подстраиваемый генератор имеет следующий вид: действует /вырабатывающаяся на прошлом шаге (i-1)/ она должна подстраивать генератор так, чтобы она стремилась к эталону. Для этого : имеется устройство управления, которое воз- действует на контур подстраиваемого генератора так, чтобы (путем воздействия на варикап) Управляемая система с обратной связью: если есть откло- нение фазы на тогда решающее усторойство дает оценку тому, что ство управления, которое ликвидирует приращение. (правое кольцо называется - кольцо ФАПЧ). Глава 6 Управление нелинейными динамическими систе- мами с помощью отрицательной обратной связи Постановка задачи Определение : Следящим измерителем называется система, осуществляющая оценку некоторого параметра (который является случайным процессом) в следящем режиме. Параметр может иметь следующий физический смысл : а) Угловые координаты некоторого летательного аппарата, которые изменяются во времени. б) Изменение во времени доплеровской частоты. в) Дальность до объекта. Пример : летательный аппарат D(t) - дальность Y y - угол места Доплеровская частота : Любая движущаяся система, облучае- мая электромагнитной энергией, из- лучает эту энергию. Структурная схема следящего измерителя y(t)=S(t,q(t))+h(t)) - рис.1 D(t) - невязка. Эта схема была построена в 30х годах инженерами-учеными. Однако сначала 60х годов оказалось, что ее можно синтези- ровать, используя теорию нелинейной фильтрации. На рис.1 представлена схема следящего измерителя, где управление осуществляется с использованием ООС. Эта структура состоит из 3х блоков. 1й блок: - дискриминатор. На вход его подается смесь сиг- нала S(t,q(t))+h(t) (аддитивная смесь), где q(t) - меняющийся парметр. Нужно получить его оценку На другой вход дискриминатора подается копия сигнала S(t,q(t)), которая должна повторять сигнал, спрятанный в шумах. Это достигается путем экстраполяции (предсказание) случайного процесса. На входе дискриминатора образуется невязка : фильтрации. 2й блок: - фильтр экстраполятор (блок фильтрации). На его вход поступает невязка. 2й блок формирует те- кущую оценку случайного процесса q(t). Это окончательный нелинейный фильтр - расширенный фильтр Калмана. В этом же блоке формируется оценка экстраполяции (см. далее) и эта оценка подается на синтезатор опоры. 3й блок: - формирует копию сигнала. Оценка q(t) формиру- - критерий среднеквадратической ошибки. Оптимальная оценка по критерию минимума среднеквадрати- ческой ошибки получается с помощью только лишь нелиней- ной фильтрации. Замечание : Фильтрация нелинейна потому, что невязка фор- мируется нелинейно ( оцениваемый параметр q(t) входит в сигнал нелинейно), S(t,q(t)) - нелинейно. Принцип экстраполяции для задач синтеза следящих измери- телей управляемых с помощью ООС Следящий измеритель отслеживает некоторый (многомерный) параметр (1) функция В радиоавтоматике,в непрерывном времени это выглядит так: А -амплитуда гармонического колебания, которая, например, несет информацию об угловом положении цели. Т - время наблюдения t - время запаздывания, несет информацию о временном по- y(t)- модуляция сигнала (известна заранее) j(t)- некоторая начальная фаза сигнала, которая несет ин- формацию об угловом положении цели. Либо j(t)- ме- шающий параметр. Система слежения за q(t) - следящий измеритель. Общий вид записи см. (1). Решение проблемы синтеза следящего измерителя : Пусть q(t) где Используя (3) модель (2) преобразуется : А - матрица 3´3, такая, что получается модель (2). Используя модель (4) видим, что верхнее уравнение линей- ное, а нижнее уравнение нелинейное. Используя теорию не- линеной фильтрации получим оценку : (5) (5) - уравнение нелинейной фильтрации. Структурная схема, которая реализует алгоритм следящего дискриминатор фильтр экстраполятор опоры Экстраполяция.a,b,g - фильтры Реализация нелинейного фильтра по формуле (5) несмотря на ее реккурентный характер достаточно сложна для реализации на сигнальных процессорах, поэтому часто используют еще одно упрощение - переходят от векторно-матричной записи нелинейной фильтрации по формуле (5) к скалярной записи. (заметим, что формула (5) реализует следящий измеритель некоторого параметра) a,b,g - фильтры значительно упрощают синтез следящих измерителей. Идея состоит в том, что вместо матричного коэффициента личины. Проектирование a,b,g - фильтра Модель : Был введен параметр : Поскольку мы ввели этот параметр, фильтр получился 3х мерный. Далее вместо фильтра (5) запишем эвристический фильтр: (Эвристика - полуинтуитивное мышление) a<1, b<1, g<1 Комментарии к (6) и (7) : Справа - невязки, взяты из тео- рии нелинейной фильтрации. Од- нако в (6) экстраполированное значение получается из фор- мулы (7). (7) - это кусок ряда Тейлора. В нелинейной фильтрации экстраполяция получается ав- томатически. А здесь мы ее искусственно создали в формуле (7) , но она очень сильно близка к формуле (5). | Фильтрация | Первое слагаемое в (6) (верхняя строка) есть координаты | рующий член, который есть невязка. Эта невя- зка корректирует экстраполяцию за счет ново- го наблюдения. | Фильтрация | Первое слагаемое во второй строке (6) - есть приращения | экстраполяция полного приращения( | | 3-я формула в (6) - фильтрация второго при- | ращения координаты. | Коэффициенты a,b,g получаются экспериментально. (8) - метод наименьших квадратов, подбор a,b,g на ЭВМ. Структурная схема следящего измерителя за параметром по формулам (6), (7). Синтез следящего измерителя доплеровской частоты П И П с частотой для повышения помехоустойчивости РАС и для наведения ра- кет. Поскольку цель движется, то меняется a и следова- тельно и но следить. Проблема : синтезировать следящий измеритель доплеровской частоты. Приходящий сигнал : j(t) будем записывать в дискретные моменты времени. Дискретная модель фаз : g<1, такой, чтобы система была устойчива. Предполагаем, Синтез цифрового оптимального следящего измерителя доп- леровской частоты. y(t)=Acos(wt+j(t))+h(t) j(t) - фаза, которая содержит доплеровскую частоту Обычно для реализации цифрового измерителя используется квадратичный канал : Оптималный рис. 1 нелинейный y синхронизация После такого преобразования снимается несущая, остается только доплеровская частота. e(t) - низкочастотный шум. Acosj(t),Asinj(t) - НЧ компоненты. На большей После цифровой обработки (АЦП) модель записывается : Вектор динамической системы двумерный и динамическая сис- темы тоже двумерная. Фильтр (3) дает оцнеку логично как в a,b,g - фильтрах. Синтез аналого-цифрового следящего измерителя. Калмана Ф-3 - узкополосный фильтр Ф-1,Ф-2 - расстроенная пара фильтров Ф-1 Дискриминационная f Дискриминационная характеристика - это разность фильтров Ф-1 и Ф-2. Она формирует невязку Эта система используется для оценки доплеровской частоты, меняющейся во времени. Это следует из уравнения (1), где нижнее уравнение дает поправку доплеровской частоты за один шаг.Невязка формируется также как в a,b,g - фильтрах. Глава 7 Устойчивость стохастических систем В радиоавтоматике все без исключения системы являются стохастическими, т.е. сама динамическая система описыва- ется стохастическими разностными уравнениями. Наблюдения тоже записываются с учетом шумов. 1) Линейные стохастические системы с - матрица перехода Устойчивость определяется нормой матрицы ‘c’. Достаточным условием устойчивости (1) является : (2) с =| Если условие (2) выполняется, то система всегда бу- дет устойчива. Замечание: В некоторых случаях система может быть устой- чивой , если ляется достаточным, но не необходимым. Пример стохастической системы 1-го порядка: Оценка чива при 0 c>1 мым и достаточным условием устойчивости системы. Устойчивость нелинейных систем Нелинейная стохастическая система : Устойчивость нелинейных динамических систем опре- деляется функцией Ляпунова. Определение устойчивости по Ляпунову для детерминирован- ной системы. Вводится специальная функция, называемая функцией Ляпуно- ва. Обозначается : условиям : 2. Приращение функции Ляпунова во времени D т.е. функция должна быть убывающей: устойчивости для системы (3) будет следующим: Анализ качества работы стохастических систем радиоавтома- тики Качество линейных и нелинейных стохастических систем оп- ределяется реальным качеством фильтра. (см. выше) Синтез предполагает, что модель соответствует реальному случайному процессу, который мы фильтруем. В этом случае качество определяется следующим образом : Пример: Одномерный фильтр Калмана. фильтра Калмана Качество фильтрации определяется адекватностью модели и реального процесса. Как проверить адекватность модели реальному процессу ? Сделать это i Теорема : Процесс тогда и только тогда адекватен модели, когда невязка является белым шумом. Замечание: Это может случиться только тогда, когда Проблема качества определяется проблемой экстраполяции.
и
.
- марковский случайный процесс
- генератор случайных чисел (в ЭВМ)
заданная величина. Процедура (1) называется реккурсивной или иттеративной, рекурент-
~
, где 0-среднее,
- дисперсия.
на
. Поскольку
- независимые по условию, то имеем :
реализация рекурсии
|¾¾| - линия задержки.
. Это генера-
.
,i=1,2...n - коррелиро-
, берем мат-
,
, а следовательно независимый.
- не факторизуется
без учета стохастической правой час-
;
- получаем обычную ( не
называются коэффициентами регрес-
.
генератор
g(f)
белый шум
0 f f
ны выходе будут раз-
, процесс авторегрессии будет
|¾¾| |¾¾|
, а также подбором
мож-
|¾¾| ...... |¾¾| |¾¾|
- разностная модель 2-го порядка
- приращение, характеризует скорость изменения
Модель с приращением удобна в том
плане, что не требуется заранее
- 1-я разность
- 2-я разность
), они легко подбираются на ЭВМ
) так, чтобы минимизировать эту сумму (делает-
- независимая случайная величина, с произвольным распределением (очень часто гауссовское распределение)
=0 ; М
=
;
(процесс не коррелирован)
(из белого шума)
- весовые коэффициенты). Сумма (1) генерирует
. Процесс
- коррелированный марковский
a
i
x
генератор генератор
- белый шум;
- марковский(модельный)процесс, n=1,2....
- строка
состоят из корреляции внутри столбика
- называются шумами наблюдения (для активных по-
.
входят наблюдения. Согласно формуле (2) требуется
. Необходимо
, чтобы получить минимум по всей траектории.
будем обозначать :
- оптимальная траектория
, i=1,2...n
гауссовские, то этот фильтр является оптимальным.
не являются гауссовскими, то такая оценка
является ассимптотически минимальной, т.е. (4) выпол-
истинного процесса
для гауссовских шумов, оптимальную по критерию (4),
y(t)
- Оценка оптимальна. Она минимизирует СКО.
- энергетический спектр (распределение энергии
- энергетический спектр помехи.
Фильтр Калмана и Виннера дают
-
одинаковое качество фильтрации,
АЧХ (пунктир) используют.
-
режекция
помехи
Фильтр
Калмана
y(t) На входе фильтр Калма-
вия. На выходе фильтра
x(t) получается исходный
x(t)
есть медленный процесс, тогда
-
t - экстраполяция (прогноз),т.е.
x(t)
динамическая ошибка
t
, в этом случае
(оценка) равна самим наблю-
и
процесса.
-
=динамическая ошибка.
входит в фильтр Калмана и выполняет роль
. (Корректирующий член учитывает
учитывает апприорную дина-
,
- вес,
- невязка.
=
Г
; Начальные условия задаются из аппри-
; орных условий
.
- транспони-
Если известны точно все 9 коор-
л.а. но навести ракету. Для определе-
р X траекторные фильтры, которые
, первые две строки - модель,
; здесь : верхняя функция - нелиней-
генерирует на любом интервале неко-
. Это есть модель неко-
, а не-
);наблюдения ведутся на фоне шумов
- шум нелинейной динамической системы (шум модели)
, такую, чтобы :
- оценка, которую мы еще не знаем, но собираем-
и
имеют произвольное распределение.
.
, то несмотря на линеаризацию, урав-
, при рек-
- оценка
- фаза гармонического колебания с амплитудой равной 1
процесс наблюдается на фоне шума
t
ыла минимальной.
- ФАПЧ
¬
a
опоры
с фа-
- экстраполированная фаза.
º
. Чем точнее
, тем точ-
- детерминированная система
- управление (некоторая функция от дискретного
, где
- шум(может быть белым
- управляемый процесс с дискретным
,
Необходимо привести движение про-
x(t)-эталон по быстродействию. Существует мно-
жество способов аналитического на-
хождения оптимальной функции упра-
и прошли траекторию:
. И предположим, что за ‘k’ шагов управление вы-
С учетом (3) запишем :
. Значе-
) неиз-
- управление;
- шум динамической системы.
- траекторию, и изменять ее так, чтобы минимизировать средний критерий качества,
- управляемый случайный процесс.
)(нелинейно преобразованная фазовая пере-
, i=1,2...n
.
; где
- матрица
устремляется к
. Используя нелинейную функцию оценка эталона:
имеет вид :
шум
талонный нелиненый Решающее Подстраи-
енератор фильтр
устройство ваемый ге- вых
Т Т нератор
a c
устройство
+ -
управления
- изменяется по закону (4), управляющая функция воз-
; a = с, тогда
.
, (т.е. отклонение частоты) (
),
. Это приведет к
отклонится, напряжение подается на устрой-
z
(t) - угол азимута
D
X Все эти 3 параметра входят в
y некоторый сигнал.
+ D(t) Фильтр
тор
опоры (блок 3)
.
- это есть невязка нелинейной
, причем имеются наблюдения :
, где
- некоторая нелинейная
, где
; 0
ложении сигнала
t Т
t
.Рассмотрим q(t) на дискретной сетке ®
,
, Dt - интервал дискретизации.
- фазовая координата
- приращение скорости
- ускорение (второе приращение)
+ S
Dt
синтезатор
в формуле (5) подставляются скалярные ве-
, плюс взвешенный, с весом a корректи-
)
формирователь невязки
остановка задачи
- вектор скорости
цели
меется РАС.
осылается сигнал от РАС
. l=1¸3см. Обратный сигнал будет на частоте
;
. Доплеровская частота используется
. Отсюда вывод: за доплеровской частотой нуж-
´ RC-фильтр АЦП
(t) тактовая ¾® фильтр (3)
´ RC-фильтр АЦП
требуются очень сложные и дорогие АЦП.
. Реализация невязки ана-
экстра-
УПЧ ´ Ф-3 полятор
опоры
характеристика :
вычитателя
f
Ф-2 Df
.
- шум наблюдений
- m-мерный вектор
, где
- элементы матрицы ‘c’
|, i=1,...,m ; k=1,...,m
, потому что условие (2) яв-
- система будет устой-
,
0
. Функция удовлетворяет следующим
0,
Для стохастической системы (3)
обычно функцию Ляпунова выби-
i®¥ (ассимптотически)
- апостариорная дисперсия
- коэффициент усиления
i - дискретное время
Модель :
y (1)
y Пример1:
a |¾¾|
min
(4)
синтезатор t
4)
8)
+ S















