Радиолокационные измерители дальности и скорости by Саблин В. Н. (z-lib.org) (852905), страница 13
Текст из файла (страница 13)
Для невозмущенной линейной динамической системы (1.9.8) имеемx(t) = F(t)x(t),(1.9.16)а для вектора наблюдений (1.9.11) -z(t) = H(t)x(t).(1.9.17)Уравнение (1.9.16) имеет решениеx(t) = O(t,t0)x(t0),где O (t,t0) удовлетворяет уравнениюФ(1, t0) = F(t)0(t, t0), O(t0, t0) = E.Подставляя (1.9.18) в (1.9.17), получаем(1.9.18)z(t) = H(t)«D(t,t0)x(to).(1.9.19)Необходимым и достаточным условием того, что x(to) можетбыть определено из (1.9.18) по наблюдениям z(t) на интервале[to,tk] является невырожденность матрицыM(t0,tk) = j [H(t)®(t, t0)]TH(t)4>(t, t0) dt.(1.9.20)40В [59] показано, что невырожденность матрицы (1.9.20) эквивалентна условиюrank п;п;(1.9.21)где rank - ранг матрицы; N - размерность вектора х;n„=H(t);=Щ_1+ПИР(1),i = 1,N-1.(1.9.22)Для стационарных систем, в которых F=const, H=const, условия (1.9.21), (1.9.22) приводятся к видуrank НтFTHT= N.(1.9.23)Анализ (1.9.21Н 1.9.23) позволяет прийти к следующим заключениям.
Наблюдаемость зависит от вида детерминированныхсвязей оцениваемого процесса, определяемых в (1.9.16) матрицейF(t), и от набора и вида измерителей, определяющих в (1.9.17)матрицу H(t). Проведенные исследования показали [34], что в общем случае при увеличении числа m измерителей наблюдаемостьулучшается. Аналогичный критерий можно привести и для дискретных моделей состояний и измерений. Для этого достаточно в(1.9.21)-(1.9.23) заменить матрицу F(t) фундаментальной матрицей Ф(к,к-1 ) процесса (1.4.17).Физический смысл условий (1.9.21)—(1-9-23) состоит в том, чтопри их выполнении можно на основе (1.9.16) и (1.9.17) получитьN независимых уравнений с N неизвестными, однозначно связывающими измерения с оценками фазовых координат. В прикладном плане, наряду с выяснением самой возможности синтеза оптимальной системы, критерии (1.9.21)-(1.9.23) позволяют определить минимально необходимый набор измеряемых координат, прикотором будет обеспечиваться оценивание требуемого вектора состояния.
Как правило, для получения всех нужных оценок необходимо, чтобы в каждой группе функционально связанных координат измерялись, как минимум, наименьшие производные вектора состояния. Например, для формирования оценок дальности доцели, скорости сближения с ней и относительного ускорения, необходимо, по крайней мере, измерять дальность до цели.Другим важным понятием в теории систем является «управляемость», которая характеризует наличие или отсутствие управления u(t), позволяющего изменять состояние системы в нужнокнаправлении. Математически это формулируется следующим образом.
Системаxy(t) = Fy(t)x ,( t ) + B X t).(1.9.24)называется системой с управляемым состоянием на интервале[t0,tjJ тогда и только тогда, когда существует управляющая функция, определенная на данном интервале, которая переводит любойначальный вектор состояния x(to) в любой конечный вектор состояния x(tk).Возможность целенаправленного изменения всех фазовых координат с помощью заданного набора сигналов управления можноопределить на основании критериев управляемости. Пока подобные критерии получены лишь для линейных стационарных систем.
В зависимости от ограничений, накладываемых на систему, iвида управления (аналогового, релейного или импульсного) могупопользоваться различные критерии [42]. Для линейных стационарных аналоговых систем с сигналами управлениящ (j = 1 ,г ),hiпревышающими допустимых значений Uflonj, критерий управлявмости можно сформулировать следующим образом.
Для целенаправленного изменения всех п фазовых координат х ± систем!(1.9.24) посредством воздействия г сигналов управления Uj необхедимо и достаточно, чтобыrank В,FyB yF „BУ ГF y ^ B у |= п ,(1.9.25)где п - размерность вектора ху.Выполнение условия (1.9.26) означает, что для модели (1.9.24)можно получить систему п независимых уравнений с п неизвестными, однозначно связывающих сигналы управления с выходными фазовыми координатами. О системах, для которых выполняется условие (1.9.25) говорят, что они вполне управляемы.
Критерий(1.9.25) позволяет определить минимально возможный наборуправляющих сигналов, с помощью которых можно целенаправленно изменять все фазовые координаты системы. Для выполнения (1.9.25) необходимо, чтобы в каждой группе функционально78связанных фазовых координат управлялась хотя бы самая высокая производная.Условия полной управляемости для дискретных стационарныхлинейных систем по внешнему виду совпадают с (1.9.26). Однаковместо матриц F и В необходимо использовать их дискретные аналоги из моделей в виде разностных уравнений.1.9.3.Т еоремаразд ел ен и я и усл ови я уп ро щ ен и я син тезаУсловия упрощения синтеза оптимальных стохастических систем управления определяются фундаментальной теоремой разделения или статистической эквивалентности.
Теорема гласит: длялинейных моделей (1.9.8) и (1.9.11) в условиях гауссовских возмущений £и ипри оптимизации систем по квадратичным функционалам качества (например такому, как (1.9.9)) процедура синтеза распадается на два независимых этапа - синтез оптимальногоуправления без учета действия шумовых возмущения (т.е. решение детерминированной задачи управления) и решение задачи оптимального оценивания вектора х, описываемого уравнением(1.9.8), по наблюдениям (1.9.11) при известных управлениях u(t)(разделение). После этого сформированные оптимальные оценки хподставляются в оптимальный закон управление вместо х (статистическая эквивалентность).Требования линейности моделей, квадратичности функционалов и гауссовости шумов называются условиями линейно-квадратично-гауссовской (ЛКГ) задачи синтеза.
Для такой задачи теорема разделения (статистической эквивалентности) доказываетсястрого [20, 74]. Если обобщенный объект управления или измерители аппроксимируются нелинейными моделями, то теорема разделения не имеет строгого доказательства. Однако, при достаточнобольших отношениях энергии сигнала к спектральной плотностишума, когда в радиоэлектронных системах имеют место точныеизмерения, ее также можно разделить на фильтр, формирующийоптимальные оценки фазовых координат и параметров системы, ирегулятор, вычисляющий сигналы управления. При этом текущаяоптимальная оценка х определяется нелинейным фильтром. Необходимо отметить, что полученное таким способом приближенноерешение задачи раздельного синтеза фильтра и регулятора темточнее, чем выше точность оценивания.Одним из наиболее часто используемых методов оптимизацшсистем управления, имеющим несложную физическую интерпретадию, является стохастическое динамическое программирование.Простота и наглядность процедуры оптимизации обусловлены использованием принципа оптимальности, введенного Р.
Веллманом[56]. Суть этого принципа состоит в том, что независимо от исходного состояния оптимизируемой системы все последующиесигналы управления должны быть оптимальными по отношениюк состояниям, возникающим в результате воздействия предыдущих управлений.Учитывая приведённую в разделе 1.9.3.
теорему разделения, атакже для простоты изложения и понимания сути метода, будемполагать, что используются детерминированные модели состоянияи все фазовые координаты измеряются точно (т.е. шумы £х и ^отсутствуют). В общем случае метод динамического программирования позволяет для многомерного обобщенного объекта управления (ООУ)х = f(x,u,t)(1.9.26)отыскать вектор и сигналов управления, оптимальный по минимуму функционала качестваI(x,u,t) = \ ® T[x(t),u(t),t]dt 44>k[x(tk),u(tk),tk].(1.9.27)ОЗдесь Фт[ •] и Ф ^М - обобщенные выражения подынтегральных(текущих) и терминального (конечного) членов функционала качества (например (1.9.9)).
В соответствии с принципом оптимальностиуправление должно быть таким, что0z т+ДtK tбы функционал (1.9.27) был миминимальным на на любом интервалеРис. 1.9.1.[x.tjJ, где 0<x<tk (рис. 1.9.1).Функцияftk]S[x(t), t] = ffiinj 1 ф т[х(1з), u(t), t] dt+cDk[x(tk), u(tk), t k] l , (1.9.28)представляющая функционал, минимизированный выбором и напроизвольном участке [x ,t k], называется функцией Веллмана.80Существование функции S [ x ( t) , t ] Веллмана указывает на наличие управления, минимизирующего функционал (1.9.27). Необходимо отметить, что функция x(t), являющаяся решением системы (1.9.26) на интервале [T,tJ определяется ее начальным состоянием х(т) и управлением u(t) при xctetfc.
Кроме того, поскольку вправой части выражения (1.9.28) предполагается, что выполненаоптимизация по и, т.е. выбрано оптимальное управление, тофункция Веллмана не зависит от вектора управления и, а зависиттолько от аргументов х(т) и т. Из (1.9.28) следует, что при 1 = ^функция Веллмана принимает значение:8[ХЫ Л ] = Ф к ^ к М У Л ]-(1.9.29)Представим интеграл в (1.9.28) в виде суммы двух слагаемых:{ ф.К ‘ Н ‘ И <)‘ +[т’Чtk+ I ф т[х М> и(4■>t]dt +Фк[фк)> u(tk), tk]j>т+Д(1.9.30)JВ соответствии с принципом оптимальности управление на каждом последующем участке должно быть оптимальным независимоот состояния системы на предыдущих интервалах.
Следовательно,при оптимальном управлении функционал качества должен бытьминимальным и на участке [т+А, t j . Тогда+®k[x(tk),u(tk),tkj O x[x(t), u(t), tjdt 4S[x |t + a ), t +(1.9.31)Полагая u(t) непрерывной функцией времени, а интервал Aдостаточно малым, получаем:т+А} <£T[x(t), u(t), t]dt * <I>T[x(t), u(t), t]A;(1.9.32)S[x (t + Д), t + Д] * S[x(t). т] + [х (1 + Д ) - х ( т)]тW+x] + ^™+№+1 a , (1.9.33)где xSt<x+A, а x(x + д) - x(x) » х(х)Д.Подставив (1.9.32) и (1.9.33) в (1.9.31), имеемs[x(tH* щ {ф*№* uW’ *1А+s[xW *]+[т,т+Д], .3 S [ x ( t) , t19 х (т)ав[х(т),т]дтПоскольку функции S[x(t),t] и 98[х (т), х]/5 с не зависят от переменной u(t), их можно вынести за знак операции минимума.
В результате получим соотношение- ^Ид * m m - Ф т[х ( г ) ,и ( ^ г ] л + x (T) £ 5 l ^ l Z l д .[х,т+Д]Разделив обе части на Д и заменив х на текущее время t, приД-»0, получим уравнение для функции Веллмана:at(u(t)} Tl v ^ v. (1.9.34)В процессе решения (1.9.34) при граничном условии (1.9.29) иопределяется управление, минимизирующее функционал (1.9.27).Из (1.9.34) и (1.9.29) следует, что решение уравнения Веллманазависит от вида минимизируемого функционала (1.9.27) и моделиООУ (1.9.26).