Основы ТАУ - Ч-3 Оптимальные, многосвязные и адаптивные системы - Воронов [1970] (1189551), страница 2
Текст из файла (страница 2)
Л. С. Понтрягиным и его учениками был разработан метод, получивший название «принцип максимума». В качестве иллюстраций применения этого метода использованы широко известные примеры, с разработки которых фактически началась теория оптимального управления. В гл. 3 рассмотрен также метод динамического программирования, разработанный в США Р. Беллманом примерно в те же годы, что и принцип максимума. С помощью принципа максимума и динамического программирования класс задач оптимизации был существенно расширен. Методом динамического программирования, в частности, был решен ряд задач оптимального оперативного управления предприятиями, а также экономико-математических задач.
Таким образом, в теории оптимального управления был переброшен один из первых мостиков, связавших теорию автоматического управления техническими объектами с современной общей теорией управления системами более общего класса, ранее относившихся только к сфере социально-экономических наук. В последние годы внимание специалистов было привлечено к использованию методов функционального анализа для исследования ряда задач управления, в том числе оптимального управления.
Представление сложных ситуаций и процессов в функциональном абстрактном пространстве открывает перспективы для широких обобщений, установления единого подхода к многообразным явлениям. В теории оптимального управления эти методы представляются весьма обещающими для полного изучения оптимальных систем с различными ограничениями. Понятия абстрактного пространства испольауются и в других разделах теории управления.
В данной книге они частично используются при рассмотрении проблем оптимального управления и обучения автоматов распознаванию образов. Основная цель гл. 4 все же состоит не столько в достаточно широком рассмотрении методами функционального анализа задач различных типов, сколько в доведении этого аппарата до сведения инженеров. Значительная часть главы — конспективное, справочное изложение некоторых основных положений функционального анализа, даваемое, естественно, без доказательств. По-видимому, через некоторый промежуток времени этот материал, как известный инженерам, будет исключаться из курсов теории управления подобно тому, как в настоящее время в них уже не рассматривается аппарат преобразования Лапласа, включавшийся в первые книги по современной теории регулирования. В оптимальных системах с неполной информацией и пассивным наблюдением, образующих второй класс по принятой нами классификации, для выработки решения об оптимальном управлении используются статистические методы.
Один из вариантов этих систем представляет собой некоторый «фильтр», на который поступают случайные полезный сигнал и шум. Сначала отыскиваются структура и параметры «оптимального фильтра«, выходная величина которого в некотором статистическом смысле будет наиболее близка к желаемой, т. е. будет в наименьшей степени искажаться помехами. Оценка близости производится по некоторому статистическому критерию оптимальности (например, по ожидаемой среднеквадратичной интегральной ошибке). Когда оптимальный фильтр найден, он разделяется на объект и управляющее устройство, и этим решение задачи теоретического синтеза завершается.
Часть примеров систем этого класса (классические задачи Колмогорова, Винера и некоторые другие) рассматривались нами в ч. 2 монографии. Здесь, в гл. 5, мы рассмотрим некоторые дополнительные примеры, использующие методы теории статистических решений. В этой же главе рассматриваются также системы третьего класса — с неполной информацией и ее активным накоплением, в которых управляющее устройство оказывает на объект специально организованные пробные поисковые воздействия.
Анализируя реакцию объекта на эти воздействия, автомат восполняет информацию об объекте и определяет вид оптимального управляющего воздействия. Воздействие автомата на объект имеет, таким образом, двойственный или, по терминологии А. А. Фельдбаума, дуальный характер: оно является с одной стороны изучающим, с другой — направляющим. Коли критерий оптимальности выражается функцией текущих значений координат системы, то задача автомата изменяется и сводится к удержанию системы вблизи экстремума в каждый данный момент времени.
Наиболее распространенный путь определения отклонения состояния системы в данный момент времени от экстремума — это также путь использования дуального управления в виде поиска. Одним из видов систем дуального управления, отыскивающих экстремум функции методом поиска, являются группы систем экстремального регулирования, которые рассмотрены в гл. 6 и 7. Глава 6 содержит описание ряда принципов построения систем экстремального регулирования, седьмая — некоторые вопросы динамики действия этих систем. Восьмая глава несколько выпадает из общего плана.
Она рассматривает некоторые проблемы, относящиеся к теории многосвязного регулирования. Исторически один из ее разделов (теория автономного регулирования) появился еще в «класси- ,юс„ийэ период развития теории автоматического регулирования. Т орик многосвязного регулирования рассмотрена неполно, изл я,екы лишь три своеобразных подхода к синтезу многосвязных „стем: 1) с позиций автономности, при котором стремятся сдедать неаависимыми друг от друга контуры регулирования отельных величин; 2) с позиций инвариантности,при котором преследуют цель подобрать связи в системе так, чтобы изменение определенных внешних воздействий не сказывалось на изменении некоторых (или всех) координат, и 3) с позиций уменыпения ошибок системы по всем кооРдинатам пУтем испольвованиЯ стРУктУР, допускающих неограниченные коэффициенты усиления.
В этой же главе излагаются понятия управляемости и наблюдаемости. В последние годы переход к управлению объектами с изменяющимися случайным образом в широких пределах характеристиками и параметрами вызвал к жизни новый класс систем управления — адаптивных, т. е. автоматически приспосабливающихся к изменению внешних условий систем. Последняя гл. 9 содержит изложение теории некоторых типов адаптивных САУ. Рассмотрены самонастраивающиеся системы с моделью, системы, осуществляющие индентификацию объекта (т.
е. определение его характеристики) по данным опыта, и некоторые статистические методы индентификации. Далее рассматриваются некоторые принципы обучения автоматических устройств, позволяющие решать проблемы классификации сложных ситуаций. Рассмотренные в главе пятой принципы дуального управления, основывающиеся на методах статистических решений, представляют болыпой интерес для осуществления оптимального управления сложными системами и в условиях неопределенности, причиной которой могут быть случайные помехи или же недостаток информации о характеристиках объекта и среды. Но, как можно было видеть из проводимых в главе примеров, даже для таких простых систем, как линейные системы первого порядка, анализ и синтез связаны с весьма громоздкими вычислениями.
Поэтому в настоящее время, когда еще не разработаны достаточно удобные для практического использования методы, алгоритмы и вычислительные программы для дуального управления, инженерные приложения метода существенно ограничены. Тем не менее изложение теории дуального управления в книге приводится, так как его основные идеи представляются весьма перспективными. В поисках более удобных для практической реализации методов оптимизации управления в условиях неопределенности мысль исследователей обратилась к вероятностным итеративным методам, в частности — методам стохастической аппроксимации.
Зги методы были известны довольно дазно,но до последних лет они практически не находили применения для решения технических задач. В последнем параграфе главы девятой приводится краткое изложение рааработанного в [Л. 194] интересного общего подхода к решению задач адаптации, обучения и самообучения, основанного на методе стохастической аппроксимации. При этом подходе выбор шага, приближающего систему к оптимальному значению стохастического критерия оптимальности, осуществляется на основе анализа по различным алгоритмам измеренных значений реализаций приращений критерия оптимальности. Рассмотренный материал подготавливает читателя в известной мере к изучению новейших разделов теории управления, относящихся к исследованию «больших систем», в функционировании которых участвуют люди, машины, материальные и денежные средства.
Это исключительно вах<ная и большая проблема, которой надлежит посвятить отдельную книгу. Автор выражает глубокую благодарность чл.-корр. АН СССР проф. А. А. Красовскому, внимательно прочитавшему рукопись и в рецензии сделавшему много ценных замечаний, к. т. н. Ю. С. Попкову, приложившему много труда для выполнения трудной работы по научному редактированию и Э. С. Мезеновой, оказавшей большую помощь в быстром и качественном оформлении рукописи. Пожелания и замечания просим направлять по адресу: г. Ленинград, Д-41, Марсово поле, 1, Ленинградское отделение издательства «Энергия».
ГПАВА ПЕРВАЯ ВАРИАПИОННЫЕ МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИИ 1-1. Поотановиа вариационной задачи об оптимальном управлении Для того чтобы поставить и решить задачу об оптимальном управлении, нужно выполнить ряд условий. Прежде всего нужно иметь достаточно точное математическое описание объекта, которым мы управляем; цели, которая поставлена перед управлением; среды, в которой работает объект и которая влияет на результат управления.
Далее должна быть дана математическая формулировка критерия оптимальности, имеющего в рабочей области экстремум, достижение которого и указывает на оптимальное состояние или поведение системы. Пусть критерий оптимальности выражается функционалом от координат х„хю..., х„и управляющих воздействий (в дальнейшем они для краткости называются просто управлениями) и„ ию..., им, величина которого зависит от вида функций х(1) и и(А).