CBRR1557 (716719), страница 3

Файл №716719 CBRR1557 (Теории управления) 3 страницаCBRR1557 (716719) страница 32016-08-01СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 3)

Численный метод предназначен для решения не-

линейных дифференциальных уравнений.

Берется из апприорных (начальных условий) ,

подставляется в правую часть уравнения (5) и

т.д. Это называется реккурентностью.

Качественная теория решения нелинейных диффе-

ренциальных уравнений (в приложении к нелинейным систе-

мам)

В отличие от численного метода (Метод Эйлера), который

дает решение в 1й точке ( не дает траекторию (нужно де-

лать 1000 точек, чтобы получить траекторию)).

Пуан Каре в 19 веке дал качественную теорию решения диф-

ференциальных уравнений, она используется для решения не-

линейных дифференциальных уравнений в виде некоторого фа-

зового портрета (некоторый графический материал, по ко-

торому можно анализировать траекторию движения динамичес-

кой системы, т.е. фактически получить решение (1-го из

решений).

На примере X и Y :

y (1) , где

f(x,y) - некоторая нели-

a dy нейная функция

- нелинейная

функция

x

Найти решение означает - найти y=j(x) (2),

которая удовлетворяет (1).

Пуан Каре развил метод , как найти (2) прямо на

плоскости.

Метод изоклин

Если f(x,y)=const, то , а , на кривой

f(x,y)=const все производные имеют одно и тоже значение,

такая кривая называется изоклиной. (tga=const, a=const)

Можно вычислить множество изоклин, это множество дает по-

ле направлений. Касательная к этому полю и есть решение,

т.о. это есть траектория, которую мы разыскиваем.

y Пример1: ;

y


- решение диф. - изоклина

уравнения


x


x

Пример 2: ,

Величина радиуса - значение производной, любая окружность - изоклина. Решение (касательная к полю направления) -

-есть касательная к векторам, расположенная на изоклинах.








­ - изоклина

¬ решение

- Уравнение Вандер Поля

x(t) - напряжение на контуре автогенератора, фазовая пе-

ременная

= const - параметр

- вторая фазовая переменная

Учитывая это имеем :

(1) пусть = 0

(1)’’



- изоклина



- фазовый портрет

- Решение дифференциаль-

ного уравнения Вандер

Поля - окружность

(при = 0)


Если на входы X и Y осцилографа подать две синусоиды, то

получим окружность (фигура Лиссажу), следовательно окруж-

ность дает решения синусоидального колебания.

x Y


t t

Пусть ¹ 0 (см. ур-е (1)’) фазовый портрет будет 2х ти-

п ов :

Y X(t)



X

t

Выводы :

1) Динамические системы радиоавтоматики описыва-

ются дифференциальными уравнениями 1, 2 и бо-

лее высокого порядка ( например: колебатель-

ная система(солнечная система, автогенератор,

полет космического аппарата в поле притяже-

ния земли) описывается диф. уравнением 2-го

порядка и выше.

2) Линейные динамические системы описываются ли-

нейными диф. уравнениями. Линейная динамичес-

кая система составленная из R,L,C - цепочек и

активных элементов (транзисторов и т.д.).

Любая линейная система путем преобразования

Лапласа может быть представлена в виде пере-

даточной функции.(Диф. уравнение преобразует-

ся по Лапласу). Передаточная функция записы-

вается для удобства в комплексном виде, на

мнимой оси p=jw можно найти АЧХ и ФЧХ линей-

ной системы. Передаточная функция дает инфор-

мацию об устойчивости системы.

3) Нелинейные динамические системы описываются

нелинейными диф. уравнениями, в этих системах

обязательно есть нелинейность вида (

и др.), общих решений и анализа через переда-

точную функцию как правило не существует, по-

этому есть два метода :

а) численный метод (Эйлера и др.) (восстановле-

ние по точкам)

б) решение диф. уравнений методом фазового порт-

рета (качественная теория). (Это наглядный

путь выяснения поведения нелинейной системы)

Стохастические системы

Стохастика - случайность.

Определение: Динамическая система называется стохастичес-

кой , если она описывается дифференциальным

или разностным уравнением, в правую часть

которого входит случайный процесс.

Такую систему можно представить в виде линейного или не-

линейного четырехполюсника, на вход которого подается шум


Стохастическая

x (t) система X(t)

x(t)- шум

X(t)- выходной процесс

Составление модели любой динамической системы должно

в реальных условиях(например движение самолета или раке-

ты) составляться с помощью предварительных экспериментов

над движением реальной системы. (Как правило это диффе-

ренциальные или разностные уравнения) и в эти уравнения

вставляется некоторый шум, который является случайным

процессом.

Для дальнейшего составления модели используется иден-

тификация модели на основании эксперимента или экспери-

ментальных данных.

Идентификацией называется оценка коэффициентов разност-

ного уравнения и оценка параметров шума:

дисперсии, мат. ожидания, ковариации и др.

Идентификация служит для того, чтобы реальный процесс и

модель были близки.Получив модель мы имеем возможность,

используя эту модель, получить близкую к реальной карти-

не ситуацию движения системы и создать управление ситуа-

цией по нашей модели.

Вывод: Модель нужна, чтобы на ЭВМ научиться проектировать

управляемые динамические системы для любых такти-

ческих ситуаций, известных из практики.

Правильно созданная модель - это максимум успеха в проек-

тировании эффективной систе-

мы. После создания и отработки модели стохастической ди-

намической системы создается аппаратура по этой модели,

которая проверяется на динамическом стенде.

Динамический стенд - 2й этап моделирования реальной ситу-

ации уже с аппаратурой.

3й этап состоит в проверке аппаратуры на полигоне.( На

борту транспортного или военного средства).

Моделирование случайных процессов с дискретным временем

(1) - выборка случайного процесса с дискретным

временем.

X(t) Процесс (1) в общем виде очень

трудно анализировать, этот про-

цесс, как правило, получен из

эксперимента. Этот реальный

процесс обычно аппроксимируется

другим процессом, который поз-

волит нам математически созда-

t вать модели, близкие к реально-

му процессу.

Такое создание моделей называется - аппроксимацией.

Сам аппроксимирующий процесс называется агрегат.

Марковская аппроксимация случайных процессов

Марковским процессом называется такой процесс, у которого

многомерная плотность вероятности

факторизуется в следующем виде : . Некоторые

значения фазовых переменных в n-мерном пространстве - это

многомерная плотность вероятности

Двумерная плотность Многомерная ФПВ несет всю ин-

вероятности формацию о случчайном процес-

W(x,y) се. Больше информации не су-

ществует.

Однако использовать эту мно-

гомерную ФПВ чрезвычайно сло-

жно на практике, поэтому час-

то прибегают к некоторым ап-

проксимациям процесса :

Y

X

Аппроксимировать - выбрать такие отсчеты

процесса в моменты времени , чтобы все были

независимы, тогда многомерная ФПВ факторизуется следую-

щим образом: - факторизация.

Однако при такой факторизации может потеряться информа-

ция о случайном процессе. Есть потеря информации для

произвольных отсчетов (кореллированность процесса).

Существует 2й способ аппроксимации - марковский способ

аппроксимации. Для марковских процессов многомерная ФПВ

факторизуется так :

(2) , где - ус-

ловная плотность вероятности.

Факторизация (2) позволяет сильно упростить математичес-

кие выкладки в задачах фильтрации и управления.

Определение : Процесс называется марковским, если выпол-

няется условие (2)

Оказывается, существует очень много генераторов марковс-

ких процессов. Мы переходим к их рассмотрению.

Процессы авторегрессии

Процесс авторегрессии - простой генератор марковского

процесса.

1. Односвязная регрессия

(3)

- задано.

- от генератора белого шума

- корреляция.

Если а<1, то ®0 имеем

устойчивый процесс.

a<1

Е сли а>1 - неустой-

ч ивый процесс 1 2 3 4 n

®¥ (P=1)

x(t) ¬a=0.9


a³1

¬a=0.3

1 2 3 4 5 n t

а=1 - модель взрыва. Если - гауссовский случайный про-

цесс, то легко доказать, что многомерная ФПВ факторизует-

ся.

а - коэффициент регрессии.

Если 0

корреляций между и .

Если процесс изменяется очень медленно, то он сильно кор-

релирован. Коррелированными процессами очень легко управ-

лять и они очень легко анализируются и прогнозируются.

Генератор марковского процесса, реализующий авторегрессию

1-го порядка

(1)


Генератор

- марковский случайный процесс

- генератор случайных чисел (в ЭВМ)

i = 0,1,2...n

Утверждение (1) : процесс (1) является марковским.

Доказательство: Пусть заданная величина. Процедура (1) называется реккурсивной или иттеративной, рекурент-

ной.

(2)

Пусть ~ , где 0-среднее, - дисперсия.

В формуле (2) разность имеет гауссовкий процесс распре-

деления или :

(3)

(4)

(3) получено из (4) и (2) заменив на . Поскольку

- независимые по условию, то имеем :

Утверждение доказано. Процесс (1) является марковским.

Структурная схема генератора марковского процесса

реализация рекурсии

a |¾¾| рис. 1

T


|¾¾| - линия задержки.

Это структурная схема 4х полюсника, которая реализует

генерацию марковского случайного процесса . Это генера-

тор с внешним возбуждением, который возбуждается с по-

мощью независимого гауссовского процесса .

Сетка дискретного времени:

|¾¾|¾¾|¾¾|¾¾® t

T

Утверждение (2)

На выходе 4х полюсника процесс ,i=1,2...n - коррелиро-

ван, с коэффициентом корреляции ‘a’.

Доказательство: Из (1) имеем , берем мат-

ожидание, ,

, - коэффициент корреляции.

Утверждение доказано.

Вывод: На вход схемы рис.1 идет некоррелированный слу-

чайный процесс , а следовательно независимый.

(если процесс гауссовский и некоррелированный, то

он независимый, для других процессов это неверно)

В природе наиболее часто встречается гауссовский

случайный процесс. На выходе схемы - зависимый

коррелированный марковский процесс, у которого

плотность факторизуется по условным плотностям.

- не факторизуется

- факторизуется

Процесс (1) называется односвязный марковский

процесс.

Замечание: Процесс (1) получен при дискретизации непре-

рывного линейного диф. уравнения 1-го порядка.

без учета стохастической правой час-

ти

На сетке дискретного времени имеем :

; - получаем обычную ( не

стохастическую) авторегрессию.

Tc+1=a

Авторегрессия 2-го порядка - двухсвязный процесс

(1)

Коэффициенты называются коэффициентами регрес-

сии. Уравнение (1) без стохастической правой части легко

получается из диф. уравнения 2-го порядка. Уравнение (1)

реализует генератор марковского процесса, который называ-

ется двухсвязным в зависимости от входного процесса .

генератор

марковского рис.2

двухсвязного

процесса

На вход генератора действует белый шум. На выходе - двух

связный марковский процесс.

g(f)




белый шум


0 f f

В зависимости от коэффициентов ны выходе будут раз-

личные процессы. Процесс (1) получается из линейного диф.

уравнения 2-го порядка, если это диф. уравнение рассмат-

ривать на временной сетке (дискретна во времени).

Известно, что диф. уравнение 2-го порядка имеет реше-

ние в виде комплексной экспоненты, если корни характерис-

тического уравнения комплексные, аналогично для некоторых

значений коэффициентов , процесс авторегрессии будет

иметь вид стохастической синусоиды.

Генератор двухсвязного марковского процесса


|¾¾| |¾¾|




T - период дискретизации

Изменение по синусоиде называется синусоидальный тренд.

Марковский процесс 2-го порядка более богатый, чем 1-го,

с помощью него можно моделировать более сложные процессы.

Авторегрессия m-го порядка

(2)

- возбуждающий белый шум.

Процесс (2) получен из диф. уравнения m-го порядка путем

дискретизации. Это марковский процесс с дискретным време-

нем.

Этот процесс значительно более информативен, чем ра-

нее рассмотренные, ибо он может моделировать сложномоду-

лированные случайные процессы. Он может модулировать АМ,

ЧМ, ФМ путем подбора , а также подбором мож-

но идентифицировать очень многие случайные процессы ре-

ально существующие на практике, например : хорошо моду-

лируется движение летательнвх аппаратов при маневре (рег-

рессия m=6¸16), речь, полет космического корабля, посадка

на планету.Стохастическая модель удобна потому, что она адекватна реальным ситуациям.

Генератор m-связного марковского процесса

|¾¾| ...... |¾¾| |¾¾|


Разностные модели на примере модели 2-го порядка

(3) - разностная модель 2-го порядка

- приращение, характеризует скорость изменения

процесса

Модель с приращением удобна в том

плане, что не требуется заранее

знать коэффициенты регрессии.

Разностные модели 3-го порядка

(4)

- 1-я разность

- 2-я разность

1-я разность характеризует скорость изменения случайного

процесса.

2-я разность характеризует ускорение.

Модель (3) и (4) очень широко иcпользуется на практи-

ке, т.к. здесь почти нет коэффициентов, которые нужно

идентифицировать ( а и ), они легко подбираются на ЭВМ

по методу наименьших квадратов. Для этого надо иметь ре-

альный процесс отсчетов , модель (4) и нужно воспользо-

ваться следующей формулой МНК/метод наименьших квадратов/


min где, - модель,

- реальный процесс

Суть МНК состоит в следующем :

Есть m-отсчетов реального процесса, есть m-отсчетов

модели, составляется сумма квадратов и подбираются пара-

метры (а, ) так, чтобы минимизировать эту сумму (делает-

ся это на ЭВМ)(метод перебора) но в авторегрессии m-го

порядка. Сделать это очень сложно.

Модели скользящего среднего

Пусть - независимая случайная величина, с произвольным распределением (очень часто гауссовское распределение)

М =0 ; М = ; (процесс не коррелирован)

Тогда процесс

(1)

называется процессом скользящего среднего. Этот

процесс сформирован полностью из шума (из белого шума)

путем сдвига и весового суммирования.

( - весовые коэффициенты). Сумма (1) генерирует

процесс . Процесс - коррелированный марковский

процесс.

Генератор скользящего среднего для формулы (1)

a


i


x


: i

:






Модель авторегрессии и скользящего среднего

авторегрессия скользящее среднее

генератор генератор

случайного сигнала авторегресии

Здесь - белый шум;

- марковский(модельный)процесс, n=1,2....

Между генераторами процесс коррелирован.

Многомерная марковская модель

(1) , где

; ;

Это самая распространенная модель

(2)

В модели (1) шумы характеризуются матрицей ковариации в

отличие от авторегрессии, под которой понимается следую-

щее:

; ;

- столбец

- строка

Элементы матрицы состоят из корреляции внутри столбика

шума. Столбики между собой коррелированы.

Модель нелинейной регрессии

(3)

(4)

В формулах (3)(матричная форма записи),и (4)(скалярная

форма записи) индексы при ‘Х’ это не степени, а номера в

формуле столбика.

(3) и (4) - самая информативная модель , все предыдущие

модели получаются как частный случай из этой модели. Нап-

ример модель речи линейная и нелинейная, но нелинейная

более точная.

Глава 4

Динамические системы наблюдаемые на фоне

шумов

Одномерные динамические системы и фильтр Калмана

(1) ;

Шумы - называются шумами наблюдения (для активных по-

мех). Задачу фильтрации будем решать методом наименьших

квадратов. Задача фильрации требует уменьшить .

Вводим эмпирический риск :

(2)

- Это есть классическая запись метода наименьших квадра-

тов . Эмпирический риск назван так потому, что в риск

входят наблюдения. Согласно формуле (2) требуется

минимизировать риск, а следовательно уменьшить влияние

шумов.

Если бы не была придумана модель уравнения (1), тогда

невозможно было бы записать риск . Необходимо

так выбрать , чтобы получить минимум по всей траектории.

Эти будем обозначать : - оптимальная траектория

Она получается путем дифференцирования , i=1,2...n

Проделав математические операции получаем одномерный

фильтр Калмана.

(3) ; - задано

n=1,2...

Комментарий к формуле (3) :

Фильтр Калмана сглаживает шумы и оказывается, если шу-

мы гауссовские, то этот фильтр является оптимальным.

(4)

n ® ¥

Т.е. среднеквадратическая ошибка будет минимизирована.

Если шумы не являются гауссовскими, то такая оценка

является ассимптотически минимальной, т.е. (4) выпол-

няется когда n ® ¥ .

Формула (4) является критерием минимума среднеквадрати-

ческой ошибки.

Фильтр Калмана дает оценку процесса истинного процесса

для гауссовских шумов, оптимальную по критерию (4),

т.е. по критерию минимума среднеквадратической ошибки.

Замечание 1 : Оптимальность означает, что не существует

другого фильтра, который мог бы дать такие

же результаты по среднеквадратической ошибке.(Остальные

фильтры дают большую ошибку)

Замечание 2 : Фильтр Калмана, в отличие от согласованного

фильтра, выделяет форму сигнала наилучшим

образом. (Согласованный фильтр обнаруживает сигнал и дает

максимум отношения сигнал/шум на выходе и сильно искажает

сигнал) Для согласованного фильтра все равно какая форма

сигнала на выходе, а фильтр Калмана выдает тот же сигнал,

что и на входе. Т.е. согласованный фильтр - для обнаруже-

ния сигнала, а фильтр Калмана - для фильтрации от шумов.

Замечание 3 : Фильтр Калмана записывается во временной

области, а не в частотной, как фильтр Вин-

нера.

Фильтр Виннера - реализован в частотной области.

(5)

K(w) - оптимальная функция передачи, которая мини-

мизирует среднеквадратическую ошибку.

y(t) - Оценка оптимальна. Она минимизирует СКО.

- энергетический спектр (распределение энергии

случайного процесса).

- энергетический спектр помехи.

Фильтр Калмана и Виннера дают

- одинаковое качество фильтрации,

однако фильтр Калмана проще ре-

ализуется на ЭВМ. Поэтому его и

АЧХ (пунктир) используют.


-


режекция

помехи

Анализ фильтра Калмана


Фильтр

Калмана


;

x(t)- ненаблюдаемый случайный процесс

y(t)- наблюдаемый случайный процесс

y(t) На входе фильтр Калма-

на использует наблюде-

ния и начальные усло-

вия. На выходе фильтра

x(t) получается исходный

процесс x(t).


Фильтрация медленных процессов

x(t)

При а=0.999,

,

есть медленный процесс, тогда

, это следует из формулы

(3).В этом случае -

t - экстраполяция (прогноз),т.е.

прошлая и текущая оценки поч-

ти одинаковы. В таком фильтре Калмана почти полностью иг-

норируются наблюдения. При оценке ситуации фильтр Калмана

не доверяет наблюдениям, а доверяет лишь прошлой оценке.

Это годится для процессов, которые можно легко предска-

зать.

Фильтрация быстрых процессов

- большая величина (>1); .

x(t)

динамическая ошибка



t

Тогда , в этом случае (оценка) равна самим наблю-

дениям. Это значит, что фильтр Калмана не доверяет прош-

лым оценкам.

Вывод : Фильтр Калмана минимизирует и флуктуационную и

динамическую ошибку.

Динамической ошибкой называется разница между оценкой и

истинным значением процесса.

- =динамическая ошибка.

Флуктуационная ошибка - тоже, но за счет шума.

При быстром процессе шумы фактически не фильтруются.

Невязка входит в фильтр Калмана и выполняет роль

корректирующего члена, который в формуле (3)

учитывает ситуацию, которую дают наблюдения.

Оценка на шаге ‘n’ равна экстраполированной оценке

плюс некоторый корректирующий член, который есть невязка,

которая взята с весом . (Корректирующий член учитывает

наблюдения на шаге ‘n’) Вес учитывает апприорную дина-

мику системы (модели).

Вывод (по одномерному фильтру Калмана):

1) Фильтр Калмана можно построить в виде реккурентного

алгоритма только в том случае, если имеется модель

случайного процесса, который он фильтрует.

2) Фильтр Калмана оптимален для реального процесса только

в том случае, если реальный процесс близок к модели,

которую мы используем.

Многомерный фильтр Калмана

(1) , где - текущее время, -

- вектор (столбики)

A - матрица k´k, H - матрица m´k.

- вектор, - шум наблюдения

; - шум динамической системы.

Запишем (1) в скалярной форме. covx=Q, covh=P.

Многомерный фильтр Калмана для модели (1) :

,

где - вес, - невязка.

; где - единичная матрица

= Г ; Начальные условия задаются из аппри-

Г ; орных условий . - транспони-

рованная матрица (сопряженная).

Траекторные изменения

Часто требуется получить оценку траектории летательного

аппарата. Летательный аппарат может быть зафиксирован с

помощью радиолокатора, либо некоторой навигационной сис-

темой.

Летательный аппарат рассматривается в некоторой сис-

теме координат :

Если известны точно все 9 коор-

Z динат (см.ниже), то можно точ-

л.а. но навести ракету. Для определе-

ния всех координат существуют

р X траекторные фильтры, которые

строятся на базе фильтра Калмана.

Y

Траекторный фильтр 2-го порядка

(1) ; a<1

Первые две строки (1) - это модель, последняя строка -

- наблюдение.

Составим многомерный фильтр Калмана , для этого по мо-

дели (1) составим многомерную модель.

;

(2) ;

; ; H=[1,0]

Из формулы (2) имеем :

; ;

; ;

Траекторный фильтр 3-го порядка

(4) , первые две строки - модель,

последняя строка - наблюдения

; ; ; ;

H = [1,0,0] ;

; ;

Теория нелинейной фильтрации

Здесь нелинейные модели записываются в виде :

(1) ; здесь : верхняя функция - нелиней-

ная регрессия, нижняя - уравнение наблюдений.

Функция генерирует на любом интервале неко-

торый случайный процесс . Это есть модель неко-

торого случайного процесса, более богатая, чем все преды-

дущие модели.

Уравнение наблюдений : наблюдается не сама , а не-

которая функция j( );наблюдения ведутся на фоне шумов

- шум нелинейной динамической системы (шум модели)

1) Требуется найти оценку , такую, чтобы :

(2)

Формула (2) - критерий минимума среднеквадратической

ошибки.

2) Требуется получить реккурентную оценку, такую же как в

фильтре Калмана.

В чистом виде получить оптимальную оценку нельзя, есть

лишь приближенные решения, когда функции f(x) и j(x) -

- линеаризуются.

Тейлоровская линеаризация - используется ряд Тейлора,

линейная часть (1-я, 2-го

члена). ( j(x) и f(x) - имеют непрерывные первые про-

изводные).

Разложение в ряд Тейлора в точке

где - оценка, которую мы еще не знаем, но собираем-

ся находить.

Эти линеаризованные функции подставим в (1) и получим

линейную систему :

(2)

Коэффициенты a,b,c,d находятся после подстановки.

и имеют произвольное распределение.

Будем использовать метод наименьших квадратов для на-

хождения оценок .

; ;

Выпишем эмпирический риск :


r - функционал.

После линеаризации :

производная из r берется легко

Продифференцировав и воспользовавшись методом индукции

получаем :

(3)

; - задано

Выводы :

1. В связи с тем, что начальная точка разложения

в ряд Тейлора функции j(x) была выбрана в точ-

ке , то несмотря на линеаризацию, урав-

нение (3) получилось как нелинейное и оно по-

хоже на уравнение (1) модели.

2. В отличие от фильтра Калмана, в , при рек-

курентном его вычислении входит - оценка

‘x’ на первом шаге. Коэффициент усиления можно

вычислить заранее за ‘n’ шагов (в фильтре Кал-

мана). Но здесь этого сделать нельзя. Сущест-

вует так называемая обратная связь.

Пример нелинейной фильтрации :

;

T - период колебания

t - период дискретизации

t - текущее время

- фаза гармонического колебания с амплитудой равной 1

процесс наблюдается на фоне шума

- дискретная частота;

(4)

t

Т

Отношение сигнал/шум может быть меньше 1. Требуется получить оценку фазы, такую, чтобы разница в квадрате

б ыла минимальной.

. Из (3) получаем :

(5)

Перемножим и пренебрежем 2й гармоникой :


(6) - ФАПЧ

(5) - ФНЧ, фильтрует 2-ю гармонику полностью(раз-

ностное уравнение)

Структурная схема ФАП

- на вход


вх

¬



a


синтезатор t

опоры

­

На вход поступает аддитивная смесь.

Принцип работы ФАП

Измеритель фазы является следящей системой с отрицатель-

ной обратной связью. Опорное колебание с фа-

зой - экстраполированная фаза. º . Чем точнее

экстраполяция, т.е. чем меньше , тем точ-

нее будет оценка.

Глава 5

Оптимальное управление дискретными динами-

ческими системами

Существует два типа детерминированных управляемых процес-

сов (детерминированных систем)

(1) - детерминированная система

- управление (некоторая функция от дискретного

времени, которая входит в разностное уравнение

динамической системы)

Стохастическая управляемая система

(2) , где - шум(может быть белым

),

а может быть и небелым, например, описываться сколь-

зящим средним ( ).

Критерий оптимального управления

Пусть модель (1) или (2) генерирует случайный процесс :

- управляемый процесс с дискретным

временем, т.е. процесс должен развиваться таким образом,

чтобы минимизировать некоторую функцию риска, тогда уп-

равление называется оптимальным.

Математически это выглядит так :

,

где f(×) - выпуклая функция

При движении ракеты по некоторой траектории из точки А в

точку В траектория должна быть такой, чтобы минимизиро-

вать энергетические затраты на управление.

Пример 2 :

Существует некоторая эталонная траектория.

Необходимо привести движение про-

цесса к эталону за минимальное

время. Это называется оптимизация

x(t)-эталон по быстродействию. Существует мно-

жество способов аналитического на-

хождения оптимальной функции упра-

x(t) вления.

Метод динамического программирования

Имеется детерминированная система :

(1)

Принцип Бэлмана - состоит в том, что оптимальное управ-

ление ищется с конца в начало (из будущего в прошлое).

Задача решается в обратном направлении.

(2)

Аналитическое решение задачи по Бэлману

Предположим, что мы отправились из и прошли траекторию:

. И предположим, что за ‘k’ шагов управление вы-

брали. Принцип динамического программирования основывает-

ся на том, что любой кусок траектории оптимального управ-

ления является оптимальным.

(3)

Траектория от (k+1) до ‘n’ называется хвостом.


N - последняя точка в управлении



С учетом (3) запишем :

(4)

Допустим, что начиная от шага (k+1) до ‘n’ в формуле (4)

оптимальное управление уже выбрано.

(5)

k=N,N-1,...,1


( 6)

Формула (6) называется уравнением Бэлмана (уравне-

ние динамического программирования)

Выводы: (из уравнения (6))

Уравнение (6) позволяет в реккурентной форме вы-

вычислить управление, шаг за шагом, от точки N

до 1 (из будущего в прошлое) получить минимиза-

цию (6) на каждом шаге. Получить . Значе-

ния управления фактически получаются методом пе-

ребора. Оптимальная траектория ) неиз-

вестна до самого последнего шага.

Если задача имеет большую размерность, то

сложность при вычислении очень большая. Если

вводить динамические системы (т.е. модели), то

можно значительно упростить метод нахождения оп-

тимального управления. Т.е. получить управление

в замкнутом виде (в виде некоторой формулы).

Синтез оптимального управления для марковских динамичес-

ких систем.

(1) ; ; ; где -

- управление; - шум динамической системы.

Управление должно менять - траекторию, и изменять ее так, чтобы минимизировать средний критерий качества,

причем управляется динамическая система не по всем коор-

динатам.

- управляемый случайный процесс.

Динамическая система, сама как таковая, не наблюдается, а

наблюдается j( )(нелинейно преобразованная фазовая пере-

менная) с шумом. В этом случае говорят, что динамическая система ненаблюдаема напрямую. Для того, чтобы сделать ее

наблюдаемой необходимо использовать теорию нелинейной

фильтрации (см. предыдущие лекции).

В этом случае получаем оценку нелинейной динамической

системы в условиях линеаризации по Тейлору :

(2)

Синтез оптимального управления используя (2) проведем применив квадратичный критерий качества, причем управле-

ние динамической системой будем вести к некоторому этало-

ну, т.е. задано : , i=1,2...n

Критерий оптимизации

(3) ;

где || - норма, .

Риск складывается из двух слагаемых :

1-е слагаемое : Это есть квадрат отклонения траектории от

эталона. Оно должно быть минимизировано с

учетом формулы (2).

2-е слагаемое : Это есть сумма с квадратом самого управ-

ления (некоторая сила) должны быть мини-

мизированны (так должно быть всегда)

Минимизация (3) - это достаточно сложная задача вариаци-

онного исчисления (просто взять здесь производную по ‘u’

не удается).

Для минимизации (3) используем уравнение Бэлмана :

( 4)

В формуле (4) минимизируя шаг за шагом получим :

(5) ; где - матрица

Выводы : (к формуле (5))

Оптимальное управление (5) реализуется с ис-

пользованием линейной оценки динамической сис-

темы, и это управление вставляется в формулу :

Если упростить критерий и привести его к виду (3’):

( 3’)

то минимизация дает оптимальное управление эталона:

(6)

Оптимальное управление пропорционально разности меж-

ду экстраполированной оценкой и эталоном, т.о. полу-

чим :

(7)

Оценка (7) подставляется в (6). Со временем, при ми-

нимизации в этом случае сама оценка устремляется к

эталону.

Пример синтеза динамической системы управления частотой

генератора

Общая постановка :

Пусть имеется некоторая эталонная траектория

(1) , где - шум

Если эталон защищен, то его фильтруют.

Имеется управляемая динамическая система :

Управляемая динамическая система - фаза генератора или

траектория, которая должна подстроиться под эталон.

(2) ; шума часто нет, поэтому

им пренебрегают. Пусть

(3)

Рассмотрим более сложную модель фазы рассматриваемого ге-

нератора.

(4)

Считаем, что в (1),(3) уход фазы очень медленный,т.е.

. Используя нелинейную функцию оценка эталона:

(4’)

В (4) решение уравнения относительно имеет вид :

(5) ; с<1.

Выше было доказано, используя уравнение Бэлмана,

что :

(6)

Структурная схема реализации оптимального управления под-

стройки частоты к эталону

(4’) (5’)

шум

э талонный нелиненый Решающее Подстраи-

г енератор фильтр устройство ваемый ге- вых

Т Т нератор



a c

устройство

+ - управления


На выходе - частота подстраиваемого генератора.

Подстраиваемый генератор имеет следующий вид:

- изменяется по закону (4), управляющая функция воз-

действует /вырабатывающаяся на прошлом шаге (i-1)/ она

должна подстраивать генератор так, чтобы она стремилась

к эталону.

Для этого : имеется устройство управления, которое воз-

действует на контур подстраиваемого генератора так, чтобы

(путем воздействия на варикап) ; a = с, тогда .

Управляемая система с обратной связью: если есть откло-

нение фазы на , (т.е. отклонение частоты) ( ),

тогда решающее усторойство дает оценку . Это приведет к

тому, что отклонится, напряжение подается на устрой-

ство управления, которое ликвидирует приращение. (правое

кольцо называется - кольцо ФАПЧ).

Глава 6

Управление нелинейными динамическими систе-

мами с помощью отрицательной обратной связи

Постановка задачи

Определение : Следящим измерителем называется система,

осуществляющая оценку некоторого параметра

(который является случайным процессом) в

следящем режиме.

Параметр может иметь следующий физический смысл :

а) Угловые координаты некоторого летательного аппарата,

которые изменяются во времени.

б) Изменение во времени доплеровской частоты.

в) Дальность до объекта.

Пример : летательный аппарат

D(t) - дальность

z (t) - угол азимута

- доплеровская частота


D

X Все эти 3 параметра входят в

y некоторый сигнал.

Y y - угол места

;

Доплеровская частота : Любая движущаяся система, облучае-

мая электромагнитной энергией, из-

лучает эту энергию.

; где - радиальная скорость.

Структурная схема следящего измерителя

y(t)=S(t,q(t))+h(t))

+ D(t) Фильтр

Дискриминатор экстраполя-

тор

-

рис.1


Синтезатор

опоры (блок 3)

D(t) - невязка.

- оценка.

Эта схема была построена в 30х годах инженерами-учеными.

Однако сначала 60х годов оказалось, что ее можно синтези-

ровать, используя теорию нелинейной фильтрации.

На рис.1 представлена схема следящего измерителя, где

управление осуществляется с использованием ООС. Эта

структура состоит из 3х блоков.

1й блок: - дискриминатор. На вход его подается смесь сиг-

нала S(t,q(t))+h(t) (аддитивная смесь), где

q(t) - меняющийся парметр. Нужно получить его оценку .

На другой вход дискриминатора подается копия сигнала S(t,q(t)), которая должна повторять сигнал, спрятанный в

шумах. Это достигается путем экстраполяции (предсказание) случайного процесса. На входе дискриминатора образуется

невязка : - это есть невязка нелинейной

фильтрации.

2й блок: - фильтр экстраполятор (блок фильтрации). На его

вход поступает невязка. 2й блок формирует те-

кущую оценку случайного процесса q(t). Это окончательный

нелинейный фильтр - расширенный фильтр Калмана. В этом же

блоке формируется оценка экстраполяции (см. далее) и эта

оценка подается на синтезатор опоры.

3й блок: - формирует копию сигнала. Оценка q(t) формиру-

ется по следующему критерию :

- критерий среднеквадратической ошибки.

Оптимальная оценка по критерию минимума среднеквадрати-

ческой ошибки получается с помощью только лишь нелиней-

ной фильтрации.

Замечание : Фильтрация нелинейна потому, что невязка фор-

мируется нелинейно ( оцениваемый параметр

q(t) входит в сигнал нелинейно), S(t,q(t)) -

нелинейно.

Принцип экстраполяции для задач синтеза следящих измери-

телей управляемых с помощью ООС

Следящий измеритель отслеживает некоторый (многомерный)

параметр , причем имеются наблюдения :

(1) , где - некоторая нелинейная

функция

В радиоавтоматике,в непрерывном времени это выглядит так:

, где ; 0

А -амплитуда гармонического колебания, которая, например,

несет информацию об угловом положении цели.

Т - время наблюдения

t - время запаздывания, несет информацию о временном по-

ложении сигнала


t Т

t

- доплеровская частота.

y(t)- модуляция сигнала (известна заранее)

j(t)- некоторая начальная фаза сигнала, которая несет ин-

формацию об угловом положении цели. Либо j(t)- ме-

шающий параметр.

Система слежения за q(t) - следящий измеритель. Общий

вид записи см. (1).

Решение проблемы синтеза следящего измерителя :

Пусть q(t) .Рассмотрим q(t) на дискретной сетке ® ,

где , Dt - интервал дискретизации.

(2) ; g<1

(3) - 3х мерный вектор,

- фазовая координата

- приращение скорости

- ускорение (второе приращение)

Используя (3) модель (2) преобразуется :

(4)

h=|1 0 0| - вектор 3´3 ,

А - матрица 3´3, такая, что получается модель (2).

Используя модель (4) видим, что верхнее уравнение линей-

ное, а нижнее уравнение нелинейное. Используя теорию не-

линеной фильтрации получим оценку :

(5)

(5) - уравнение нелинейной фильтрации.

Структурная схема, которая реализует алгоритм следящего

измерителя ( ) выглядит так :


дискриминатор фильтр экстраполятор


+ S

А

Dt

синтезатор

опоры

Экстраполяция.a,b,g - фильтры

Реализация нелинейного фильтра по формуле (5) несмотря на ее реккурентный характер достаточно сложна для реализации

на сигнальных процессорах, поэтому часто используют еще

одно упрощение - переходят от векторно-матричной записи

нелинейной фильтрации по формуле (5) к скалярной записи.

(заметим, что формула (5) реализует следящий измеритель

некоторого параметра)

a,b,g - фильтры значительно упрощают синтез следящих

измерителей. Идея состоит в том, что вместо матричного

коэффициента в формуле (5) подставляются скалярные ве-

личины.

Проектирование a,b,g - фильтра

Модель :

; а<1

- скалярное наблюдение

Был введен параметр :

Поскольку мы ввели этот параметр, фильтр получился 3х

мерный. Далее вместо фильтра (5) запишем эвристический

фильтр: (Эвристика - полуинтуитивное мышление)

(6)

a<1, b<1, g<1

(7)

Комментарии к (6) и (7) : Справа - невязки, взяты из тео-

рии нелинейной фильтрации. Од-

нако в (6) экстраполированное значение получается из фор-

мулы (7). (7) - это кусок ряда Тейлора.

В нелинейной фильтрации экстраполяция получается ав-

томатически. А здесь мы ее искусственно создали в формуле

(7) , но она очень сильно близка к формуле (5).

|

Фильтрация | Первое слагаемое в (6) (верхняя строка) есть

координаты | , плюс взвешенный, с весом a корректи-

  • рующий член, который есть невязка. Эта невя-

  • зка корректирует экстраполяцию за счет ново-

  • го наблюдения.

|

Фильтрация | Первое слагаемое во второй строке (6) - есть

приращения | экстраполяция полного приращения( )

|

| 3-я формула в (6) - фильтрация второго при-

| ращения координаты.

|

Коэффициенты a,b,g получаются экспериментально.

( 8) } -подбор a,b,g

(8) - метод наименьших квадратов, подбор a,b,g на ЭВМ.

Структурная схема следящего измерителя за параметром

по формулам (6), (7).

формирователь невязки

+ S S

-


Синтезатор A

опоры S(×)

; ; Þ

Синтез следящего измерителя доплеровской частоты

П остановка задачи - вектор скорости

цели

И меется РАС.

П осылается сигнал от РАС

с частотой . l=1¸3см. Обратный сигнал будет на частоте

; . Доплеровская частота используется

для повышения помехоустойчивости РАС и для наведения ра-

кет. Поскольку цель движется, то меняется a и следова-

тельно и . Отсюда вывод: за доплеровской частотой нуж-

но следить.

Проблема : синтезировать следящий измеритель доплеровской

частоты.

Приходящий сигнал :

j(t) будем записывать в дискретные моменты времени.

, i=1,2,...n ;

Дискретная модель фаз :

(1) ;

; ; T - период колебания.

g<1, такой, чтобы система была устойчива. Предполагаем,

что за Dt не меняется .

Синтез цифрового оптимального следящего измерителя доп-

леровской частоты.

y(t)=Acos(wt+j(t))+h(t)

j(t) - фаза, которая содержит доплеровскую частоту

j(t)=

- неизвестны, но постоянны.

Обычно для реализации цифрового измерителя используется

квадратичный канал :


´ RC-фильтр АЦП

Оптималный

рис. 1 нелинейный

y (t) тактовая ¾® фильтр (3)

синхронизация


´ RC-фильтр АЦП

После такого преобразования снимается несущая, остается

только доплеровская частота.

e(t) - низкочастотный шум.

Acosj(t),Asinj(t) - НЧ компоненты.

На большей требуются очень сложные и дорогие АЦП.

После цифровой обработки (АЦП) модель записывается :

(2) , где ;

h = |1 0| ; ;

Вектор динамической системы двумерный и динамическая сис-

темы тоже двумерная.

(3)

Фильтр (3) дает оцнеку . Реализация невязки ана-

логично как в a,b,g - фильтрах.

Синтез аналого-цифрового следящего измерителя.


Рис. 2 Ф-1 Д АЦП Фильтр

Калмана

экстра-

УПЧ ´ Ф-3 полятор

Ф-2 Д АЦП

Синтезатор

опоры

Ф-3 - узкополосный фильтр

Ф-1,Ф-2 - расстроенная пара фильтров


Ф-1 Дискриминационная

характеристика :

вычитателя

f

Ф-2 Df


f

Дискриминационная характеристика - это разность фильтров

Ф-1 и Ф-2. Она формирует невязку .

(1)

Эта система используется для оценки доплеровской частоты,

меняющейся во времени. Это следует из уравнения (1), где

нижнее уравнение дает поправку доплеровской частоты за

один шаг.Невязка формируется также как в a,b,g - фильтрах.

Глава 7

Устойчивость стохастических систем

В радиоавтоматике все без исключения системы являются

стохастическими, т.е. сама динамическая система описыва-

ется стохастическими разностными уравнениями. Наблюдения

тоже записываются с учетом шумов.

1) Линейные стохастические системы

(1) ;

- шум динамической системы

- шум наблюдений

- m-мерный вектор

с - матрица перехода

Устойчивость определяется нормой матрицы ‘c’.

Достаточным условием устойчивости (1) является :

, где

(2) , где - элементы матрицы ‘c’

с =| |, i=1,...,m ; k=1,...,m

Если условие (2) выполняется, то система всегда бу-

дет устойчива.

Замечание: В некоторых случаях система может быть устой-

чивой , если , потому что условие (2) яв-

ляется достаточным, но не необходимым.

Пример стохастической системы 1-го порядка:

(1)

Оценка - система будет устой-

чива при 0

, 0

c>1 мым и достаточным условием

устойчивости системы.

Устойчивость нелинейных систем

Нелинейная стохастическая система :

(3)

Устойчивость нелинейных динамических систем опре-

деляется функцией Ляпунова.

Определение устойчивости по Ляпунову для детерминирован-

ной системы.

Вводится специальная функция, называемая функцией Ляпуно-

ва. Обозначается : . Функция удовлетворяет следующим

условиям :

1. Если x=0, то =0

2. Приращение функции Ляпунова во времени D 0,

т.е. функция должна быть убывающей:

Для стохастической системы (3)

обычно функцию Ляпунова выби-

рают так: . А условие

устойчивости для системы (3)

будет следующим:

1) ,

i®¥ (ассимптотически)

2)

Анализ качества работы стохастических систем радиоавтома-

тики

Качество линейных и нелинейных стохастических систем оп-

ределяется реальным качеством фильтра. (см. выше)

Синтез предполагает, что модель соответствует реальному случайному процессу, который мы фильтруем. В этом случае

качество определяется следующим образом :

Пример: Одномерный фильтр Калмана.

Фильтр : ;

- шум наблюдений

- апостариорная дисперсия

- коэффициент усиления

фильтра Калмана

i - дискретное время

Модель :

Качество фильтрации определяется адекватностью модели и реального процесса. Как проверить адекватность модели

реальному процессу ? Сделать это

можно только по невязке: ,

где .


i

Теорема : Процесс тогда и только тогда адекватен модели,

когда невязка является белым шумом.

Замечание: Это может случиться только тогда, когда

Проблема качества определяется проблемой экстраполяции.

Характеристики

Тип файла
Документ
Размер
1,72 Mb
Тип материала
Учебное заведение
Неизвестно

Список файлов реферата

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
7041
Авторов
на СтудИзбе
260
Средний доход
с одного платного файла
Обучение Подробнее