Диссертация (1152160), страница 26
Текст из файла (страница 26)
Взависимости от принятой идеологии в системе управления эти этапы могутбыть разделены или совмещены во времени.После построения модели объекта начинается управление, котороерассчитывается на основе информации полученной на этапе обучения и текущей информации по наблюдениям за входом и выходом объекта :U ( N ) ( X ( N ), y ( N ), yˆ ( N )) ,где ( .
) – закон управления.(3.19)146В тех случаях, когда априорные оценки слишком грубы, наличие этапаобучения позволяет произвести их предварительную корректировку. Для ТПпроизводства, например, ПГК такой подход позволяет удерживать выходныехарактеристики качества продукта в более жѐстких границах и тем самым повысить качество выпускаемой продукции.Разделение во времени обучения и управления необходимо для оптимизации в реальном масштабе времени системы управления, однако при этом негарантируется оптимальность на всѐм протяжении процесса (т.е. оценки коэффициентов модели являются локально оптимальными).Таким образом, в общем виде адаптивную систему управления ТПпроизводства ПГК, для многомерного односвязного объекта управления, можем представить в виде схемы и в аналитической форме:y ( N ) L1 ( A( N ), B( N ), X ( N ), Y ( N 1)),yˆ ( N ) L ( Aˆ ( N ), Bˆ ( N ), X ( N ), Yˆ ( N 1)),2a i ( N ) F 1( a i ( N 1), ai , ai ( N )),bi ( N ) F 2 (bi ( N 1), bi , bi ( N )),aˆ i ( N ) G1 ( aˆ i ( N 1), y ( N ), yˆ ( N ), X ( N )),bˆ ( N ) G (bˆ ( N 1), y ( N ), yˆ ( N ), X ( N )),i2(3.20)iU ( N ) ( X ( N ), y ( N ), yˆ ( N )),гдеY ( N 1) ( y ( N 1), y ( N 2),..., y ( N m)),Yˆ ( N 1) ( yˆ ( N 1), yˆ ( N 2),..., yˆ ( N m)),A( N ) ( a1 ( N ), a 2 ( N ),..., a m ( N )),B( N ) (b1 ( N ), b2 ( N ),..., bn ( N )),Aˆ ( N ) ( aˆ ( N ), aˆ ( N ),..., aˆ ( N )),12mBˆ ( N ) (bˆ1 ( N ), bˆ2 ( N ),..., bˆn ( N )).В дальнейшем, такую адаптивную систему управления ТП будем называть адаптивной системой с идентификатором (АСИ).Для нестационарных объектов типа производства ПГК, обучение системы (АСИ) происходит многократно в процессе функционирования ТП.
Началоэтапа обучения точно известно и определяется началом поступления новой партии исходного сырья (какао бобов). Для каждой новой партии сырья (какао бо-147бов) коэффициенты ai (N ), b j (N ) изменяются скачком, но случайным образом,то есть амплитуда изменения неизвестных ненаблюдаемых коэффициентовслучайна:b j ( N 1) b j ( N ) j ( N ) ;a i ( N 1) a i ( N ) i ( N ) ; j ( N ), i ( N ) ~ N (0,1) .(3.21)(3.22)Значение амплитуды коэффициентов остаѐтся постоянным в течениевсего времени обработки партии сырья (какао бобов) Ts , где s = 1, S .Такой характер изменения коэффициентов описывает следующая модель марковских параметров:H (T ) H (T 1) (T ),(3.23)где компоненты шума (T ) являются стохастическим гауссовым процессом ине коррелированны между собой: R (T ), N SM { ( N ) T ( S )} 10, N S(3.24)где R1(T) – дисперсия ζ (Т).В выражении (3.24) мы предполагаем, что дисперсия коэффициентовможет изменяться при переходе от одной партии какао бобов к другой – этообщая модель.
В условиях реального производства, когда существует жѐсткийконтроль входных характеристик сырья согласно требованиям стандарта(ГОСТ, ОСТ, ТУ и т.д.), возможно предположить стационарность дисперсиикоэффициентов: 2 , N SM { ( N ) T ( S )} 0, N S(3.25)Предполагаем, что коэффициенты объекта a i (T ), b j (T ) изменяются несущественно при переходе от одной партии виноматериала к другой:b j (T 1) b j (T ) b j (T ) ;(3.26)ai (T 1) a i (T ) a i (T ).(3.27)148Данное предположение позволяет в известные моменты времени размыкать контур управления и переводить ТП в кратковременный режим подстройки коэффициентов модели (в режим идентификации).Уравнение объекта для этого этапа принимает вид:mni 1j 1y ( N ) ai ( N ) y ( N i ) b j ( N )x j ( N ) ( N )(3.28)или в векторной форме:y ( N ) H T ( N ) ( N ) ,(3.29)где: T(N) =(a1(N),…,am(N), b1(N),…,bn(N)) – оцениваемый вектор коэффициентов объекта;T(N)=(y1(N-1),…,ym(N-m), x1(N),…,xn(N) – обобщенныйвектор входа объекта.Для идентификации ТП в условиях неопределѐнности (когда неизвестныизменяющиеся во времени коэффициенты модели) целесообразно применятьадаптивные прогнозирующие модели с обобщенным входом:ˆ (N ) ,yˆ ( N ) K T ( N 1)гдеyˆ ( N )(3.30)- оценка выхода объекта (выход модели);TK ( N 1) (aˆ1 ( N 1),..., aˆ m ( N 1), bˆ1 ( N 1),..., bˆn ( N 1)) - вектор коэффициентов мо-дели; ˆ T ( N ) ( yˆ 1 ( N 1),..., yˆ m ( N m), x1 ( N ),..., xn ( N )) - обобщѐнный вектор входамодели.
Следует подчеркнуть, что модель (3.30) объекта (3.28) также являетсядинамической.При переходе от одной партии сырья (какао бобов) к другой, характервыходов объекта управления y(N) и прогнозирующей модели y(N) можно оценить аналитически с использованием уравнений: (3.28) и (3.30), или получить спомощью имитационного моделирования.
Неизвестные коэффициенты оцениваются с помощью выбранного алгоритма идентификации.3.2.3. Алгоритмы идентификацииАлгоритмы идентификации предназначены для определения коэффициентов моделей ТП производства пищевой продукции.149Неоспоримыми достоинствами для аналитического и численного исследований систем управления, в смысле простоты реализации и скорости сходимости, обладают проекционные алгоритмы, которые на каждом шаге минимизируют текущее значение ошибки идентифицируемого вектора коэффициентов.Наиболее часто используемым из них является алгоритм Качмажа [75], исследовавший как статические, так и динамические объекты.В нашем случае, этот алгоритм имеет следующий вид:K ( N ) K ( N 1) y ( N ) K T ( N 1) ( N ) ( N ). T ( N ) ( N )(3.31)Наличие помех измерений приводит к тому, что оценки порождаемыеалгоритмом (3.31) сходятся только в среднем - по математическому ожиданию.Для обеспечения сходимости, например, в среднем квадратичном, необходимодополнительное сглаживание этих оценок.Алгоритм идентификации на базе фильтра Калмана-Бъюси является оптимальным для нестационарных объектов [75] в том смысле, что оценки K ( N )порождаемые алгоритмом :K ( N ) K ( N 1) L( N ) ( N ), K (0) K 0 ,(3.32)минимизируют средний квадрат ошибки слежения за неизвестными нестационарными коэффициентами модели объекта:M {( N )T ( N )} M {( K ( N ) H ( N )( K ( N ) H ( N )) T } .Основной недостаток алгоритма идентификации (3.32), построенного набазе фильтра Калмана-Бьюси, состоит в том, что его параметры весьма редкоизвестны пользователям.
Это является препятствием получения оптимальногорешения. В общем случае использование фильтра Калмана-Бьюси позволяетполучить оптимальные оценки вектора коэффициентов модели объекта, однаков силу существенной нелинейности общий анализ системы управления в целомосуществить сложно.Априорно известный характер изменения нестационарных коэффициентов уравнения объекта (3.18), позволяет использовать метод "замороженных"150коэффициентов. Этот метод обычно применяют для нестационарных объектов сочень низкой частотой изменения коэффициентов.
Коэффициенты "замороженного" объекта равны коэффициентам исходного нестационарного объекта, взятым при некотором фиксированном значении (в нашем случае N=Ts).Свойства исходной нестационарной системы при таком подходе исследуются путѐм изучения свойств последовательности "замороженных" в моменты Ts стационарных моделей [75]. Введенные предположения о свойствах объекта управления и характере изменения его коэффициентов позволяют сделатьнекоторые оценки системы при разомкнутом контуре управления:D{ y ( N )} M {H T ( N )( N ) H T ( N )( N )} M 2 {H T ( N )( N )} . (3.33)С учѐтом независимости расширенного вектора входов Ф(N) от векторакоэффициентов объекта H(N) получим:D{ y ( N )} M {H T ( N ) H ( N )}M { T ( N )( N )} ( M {H T ( N )}) 2 ( M {( N )}) 2 . .
(3.34)Оценки дисперсии выхода объекта и модели можно получить аналитически с использованием уравнений (3.29), (3.30), (3.33), (3.34), либо путемимитационного моделирования.3.2.3. Структурная схема идентификации нестационарного ТПКритерий качества J(N) на выходе y(N) ТП, используемый в адаптивнойсистеме с идентификатором, не учитывает всех особенностей выходного продукта ТП производства ПГК. Для повышения качества производимого продукта, к контуру адаптации необходимо добавить внешний контур управления,включающий группу экспертов (ЛПР – лицо, принимающее решение), вырабатывающих усреднѐнное решение о качестве производимого продукта (рисунок3.6). Это решение включает в себя вербальную модель процесса (Модель2), наоснове которой в функционирование регулятора вносятся изменения.
Тогдауправляющее воздействие примет вид:U ( N ) F ( X ( N ), y ( N ), yˆ ( N )) ( y ( N ),1 L ЛПР ) ,L 1(3.35)151где: (...) - приращение управления, устанавливаемое технологом на базе решения экспертов;1 L ЛПР - усреднѐнное решение L экспертов о качествеL 1продукта.Корректирующее управление, вносимое технологом, состоит в изменении: диапазонов регулирования технологических параметров; режимов обработки сырья и полуфабрикатов; уставок параметров качества поставляемых ингредиентов, состава шоколадной массы и т.д.