STOXAST (932351), страница 6
Текст из файла (страница 6)
Поскольку в рассматриваемой задаче оба конца траектории полностью фиксированы, то условиятрансверсальности (5.5) не содержат полезной информации, а следовательно, не позволяют найти константы C1 и C2 . Поскольку же конечный момент T не фиксирован, то полезным для нахождения одной28из этих констант может быть только второе условие в (5.6). Однако вданном случае в этом нет необходимости.Из условия (5.7) получаем, что оптимальное управление имеет видu(t) = sign{p2 (t)} = sign(C2 − C1 t).Так как p2 (t) — линейная функция времени, то оптимальное управление для траекторий, начинающихся в произвольной точке фазовогопространства, есть кусочно-постоянная функция со значениями ±1,меняющая знак не более одного раза.
Следовательно, при любых начальных условиях все оптимальные траектории состоят из участков,на которых u(t) = 1 и (или) u(t) = -1. Подставляя пару этих оптимальных значений управления в систему уравнений (5.9), деля одноиз уравнений этой системы на другое и интегрируя полученное уравнение, получаем, что на фазовой плоскости (y1 , y2 ) любая конкретнаяоптимальная траектория состоит не более чем из двух (поскольку возможен не более чем один момент переключения управления) участковпарабол: y1 = y22 /2 + C3 , y1 = −y22 /2 + C4 . Полученный синтез оптимального управления изображен на рис. 1 в [9, с. 13].Если теперь вернуться к исходному стохастическому уравнению(5.8), описывающему исходную динамическую систему, то нет необходимости, к примеру, изучать его с позиций изложенной в предыдущемразделе теории стохастических уравнений и искать управление, переводящее материальную точку в начало координат фазовой плоскостис минимальной дисперсией.
Даже если эта последняя задача и былабы решена, практического толка от нее было бы неизмеримо меньше,чем от полученного синтеза задачи (5.9), поскольку найденный синтезпри любых возмущениях |w(t)| < 1 обеспечит переход материальнойточки в начало координат за минимальное время (даже в условияхстохастического возмущения w(t)) из любого положения на фазовойплоскости, в то время как оптимальное в смысле минимума дисперсииуправление переведет материальную точку не в начало координат, а вкакую-то его окрестность, характеризуемую размером дисперсии.СПИСОК ЛИТЕРАТУРЫ1.
Острем K.Ю. Введение в стохастическую теорию управления.М.: Мир. 1973.2. Флеминг У., Ришел Р. Оптимальное управление детерминированными и стохастическими системами. М.: Мир, 1978.3. Брайсон А., Хо Ю-Ши Прикладная теория оптимального управления. М.: Мир, 1972.4. Гихман И.И., Скороход А.В. Управляемые случайные процессы.Киев: Наукова Думка, 1977.295.
Пугачев В.С., Синицын И.Н. Стохастические дифференциальныесистемы. М.: Наука, 1990.6. Пугачев В.С., Синицын И.Н. Теория стохастических систем. М.:Логос. 2000.7. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука.1969.8. Варга Дж. Оптимальное управление дифференциальными ифункциональными уравнениями. Пер с англ. М.: Наука. 1977.9. Смольяков Э.Р. Оптимальное управление и численные методыоптимизации. М.: МГТУ им. Н.Э.Баумана. 1992.10. Смольяков Э.Р. Методология определения оптимального управления. М.: МГТУ им. Н.Э.Баумана. 1996.30.