В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем (1158263), страница 33
Текст из файла (страница 33)
При замене x = y − z справедливо разложение исходной системы (D28.5) на подсистему по возмущенную (28.12) и поуправлению (28.13). Множество достижимости Gu , соответствующее системе(28.13), представляет собой отрезок прямой на оси z3 , а множеству достижимости системы (28.12) соответствуют две точки Gv = {y1w , y2w } (рис. D28.4).Будем считать для простоты, что точки y1w и y2w лежат по одну сторону от осиz3 , а их проекции на ось z3 принадлежат множеству Gu .Оптимальной чистой стратегией управлений будет точка z ∗ , так как в нейдостигается min max J(y, z) (см. рис. D28.4).z∈Gu y∈GvНайдем смешанную стратегию возмущений η ∗ при условии, что ни одна източек y w не лежит на множестве Gu . Для этого определим вероятности η1 , η2 ,соответствующие смешанной стратегии.234z 1 , y1y1wy2wz∗z∗Gu0z 3 , y3Рис.
D28.4.Математическое ожидание выигрыша в точке z определяется из соотношения K(η ∗ , z) = η1 |z − y1w | + η2 |z − y2w |. Градиент этой функции по z вz−y wz−y wпроекции на множество Gu имеет вид K = (η1 |z−y1w | + η2 |z−y2w | , e3 ).12Если принять во внимание тот факт, что уравнение K = 0 имеет единственный корень на Gu при фиксированных η1 , η2 , то придем к следующемуутверждению:Необходимым и достаточным условием седловой точки является следующее условие для вероятностей η1 и η2 :(η1z ∗ − y1wz ∗ − y2w+ η2 ∗, e3 ) = 0.w∗|z − y1 ||z − y2w |Найденные таким образом цена игры J0 = min max J(y, z), чистая страz∈Gu y∈Ωvтегия управлений z ∗ и смешанная стратегия возмущений η ∗ позволяют реализовать второй и третий этапы методики тестирования.235Предметный указательграмиан наблюдаемости, 26дифференциальная антагонистическая игра, 204дисперсия, 59задача Булгакова о накоплениивозмущений, 198запас устойчивости, 17игольчатая вариация, 162инерциальная навигационная система (ИНС), 103инвариантноененаблюдаемоеподпространство, 51инвариантное управляемое подпространство, 45коэффициент корреляции, 60критерий устойчивости Гурвица,17линейное матричное неравенство,148марковский случайный процесс,66математическое ожидание, 59матрица корреляции, 65матрица ковариации, 59матрица наблюдаемости, 28множество достижимости, 156непрерывный фильтр Калмана, 99обратный фильтр Калмана, 216особые участки оптимальной траектории, 178плотность вероятности, 58порядок особой траектории, 181процесс белого шума, 72процесс с независимыми приращениями, 69робастная стабилизация, 153седловая точка игры, 206сингулярные числа, 221сингулярно возмущенная система, 122скобки Пуассона, 180сопряженная система, 121среднеквадратичное (стандартное) отклонение, 59стабилизируемость, 19стационарный случайный процесс, 66уравнение Беллмана, 174уравнение Ляпунова, 149условная функция распределениявероятности, 58уравнение Риккати, 99формула приращения функционала, 134функция Беллмана, 173функция Понтрягина, 121центральная предельная теорема, 62центрированная случайная величина, 59236Основная литература[1] Александров В.В., Злочевский С.И., Лемак С.С., Парусников Н.А.
Введение в динамику управляемых систем. М.: Изд-вомех-мат МГУ, 1993.[2] Александров В.В., Болтянский В.Г., Лемак С.С., Парусников Н.А., Тихомиров В.М. Оптимальное управление движением.М.: ФИЗМАТЛИТ, 2005.[3] Голован А.А., Парусников Н.А. Математичские основы навигационных систем. Часть 1. М.: Изд-во Моск. ун-та, 2007.[4] Голован А.А., Парусников Н.А. Математичские основы навигационных систем. Часть 2. М.: Изд-во Моск. ун-та, 2008.[5] Ройтенберг Я.Н. Автоматическое управление. М.: ФИЗМАТЛИТ, 1992.Дополнительная литература[11] Алексеев В.М., Галеев Э.М., Тихомиpов В.М. Сбоpник задач пооптимизации. М.: Наука, 1984.[12] Александров В.В.
К задаче Булгакова о накоплении возмущений// Докл. АН СССР. Сер. Кибернетика и теория регулирования.1969. Т. 186, №3. С. 526–528.[13] Арутюнов А.В. Условия экстремума. М.: Факториал, 1997.[14] Брайсон А., Хо Ю-Ши. Прикладная теория оптимального управления. М.: Мир, 1972.[15] Булгаков Б.В. О накоплении возмущений в линейных колебательных системах// Докл.
АН СССР. 1946. Т. 51. С. 339–342.[16] Габасов З.Р., Кириллова Ф.М. Особые оптимальные управления. М.: Наука, 1973.[17] Галеев Э.М., Тихомиpов В.М. Кpаткий куpс теоpии экстpемальных задач. М.: Изд-во Моск. ун-та, 1989.[18] Гантмахер Ф.Р. Теория матриц. М.: Наука, 1988.[19] Гнеденко Б.В. Курс теории вероятности. М.: Наука, 1969.[20] Григорьев И.С. Методическое пособие по численным методамрешения краевых задач принципа максимума в задачах оптимального управления. М.: Изд-во ЦПИ при мех-мат. ф-т. МГУ,2005.[21] Девис М.Х.А.
Линейное оценивание и стохастическое управление. М.: Наука, 1984.237[22] Демидович Б.П. Лекции по математической теории устойчивости. М.: Наука, 1967.[23] Зеликин М.И. Оптимальное упpавление и вариационное исчисление. М.: УРСС, 2004.[24] Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М.:Наука, 1974.[25] Калман Р., Фалб П., Арбиб М. Очерки по математической теории систем. М.: Мир, 1971.[26] Красовский Н.Н. Проблемы стабилизации управляемых движений (прил.) // Малкин И.Г. Теория устойчивости движения. М.:Наука, 1966.[27] Красовский Н.Н.
Управление динамической системой. М.: Наука, 1985.[28] Крылов И.А. Черноусько Ф.Л. О методе последовательных приближений для решения задач оптимального управления// Журн.вычислит. мат. и мат. физ., 1962, т.2, № 6.[29] Малкин И.Г. Теория устойчивости движения. М.: Наука, 1966.[30] Парусников Н.А., Морозов В.М., Борзов В.И.
Задача коррекции в инерциальной навигации. М.: Изд-во Моск. ун-та, 1982.[31] Петросян Л.А., Зенкевич Н.А., Семина Е.А. Теория игр. М.:Высш.шк., 1998.[32] Поляк Б.Т., Щербаков П.С. Робастная устойчивость и управление. М.: Наука, 2002.[33] Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов.М.: Наука, 1969.[34] Понтрягин Л.С. Обыкновенные дифференциальные уравнения.М.: Наука, 1968.[35] Розанов Ю.А. Случайные процессы. М.: Наука, 1979.[36] Ройтенберг Я.Н. Автоматическое управление.
М.: Наука, 1978.[37] Maybeck P.S. Stochastic Models, Estimation and Control. NewYork: Academic Press. 1979.Александров Владимир Васильевич,Лемак Степан СтепановичПарксников Николай АлексеевичЛекции по механике управляемых систем.Издательство Московского университета, 240 стр.Оригинал макет изготовлен издательской группой механико-математического факультетаМГУПодписано в печать 15.12.2011 г.Формат 60×90 1/16.
Объем 15 п.л.Заказ 2Тираж 200 экз.Издательство Московского университетаг. Москва, Ленинские горы.Отпечатано на типографском оборудовании механико-математического факультета239.