Л.А. Растригин - Теория и применение случайного поиска (1121205), страница 13
Текст из файла (страница 13)
В процессе обучения вычисляется апостериорная плотность вероятности неизвестных параметров, которая затем используется для оптимальной оценки неизвестных статистических характеристик. Задачи обучения и самообучения распознавания образов могут быть сформулированы также как задачи отыскания оценок наибольшего правдоподобия для неизвестных параметров, которые определяют условные распределения изображений каждого образа. Для общности в число неизвестных параметров включаются и априорные вероятности образов !140, !4!]. Особенностью приведенных задач управления н распознавания, отличающих нх от задач обнаружения н выделения сигналов на фоне помех, является меньшая мера априорной информации, обычно выражаемая функционально через плотности вероятностей, параметры сигналов, спектральные плотности нлп корреляционные функции шумов.
Всем вышеописанным задачам синтеза оптимальных адаптивных самообучающихся (обучающихся) систем управления и распознавания образов, сформулированным на языке теории статистических решений, присуща общая важная особенность, состоящая в том, что решение этих задач включает в себя втой или иной форме нахождение оценок неизвестных параметров объекта илп соответствующих плотностей распределения.
Задачи определения параметров объекта управления имеют большое практическое значение н определенную самостоятельную ценность. Ниже приводится оозор работ по определению параметров н характеристик объектов управления статистическими методами при пассивном н активном наблюдении, рассматриваются вопросы сходимости оценок. Изучается также задача определения параметров объекта экстремального управления в процессе поиска и построения с использованием оценок статистического метода поиска с адаптацией. Данный обзор не претендует на полноту и включает в себя работы отечественных и зарубежных авторов, опубликованные в различных периодических изданиях в последние годы. 82 $4ЗЕ ОЦЕНКА ПАРАМЕТРОВ ОБЪЕКТА УПРАВЛЕНИЯ В РЕЖИМЕ НОРМАЛЬНОЙ ЭКСПЛУАТАЦИИ Роль неизвестных параметров объекта неодинакова в процессе управления, Некоторые из них оказывают существенное влияние на работу ооъекта, и знание их необходимо для обес- геченнз требуемого качества управления.
Такие параметрга и 1!531 названы существенными в отличие от несущественных параметров, влиянием которых при регулнровчйнщ объекта зюжно пренебречь. Общая постановка задачи оценки параметров обьекта управления методами статистических решений сделана в [153. 1541. Объект, в общем случае инерционный, с одним входом х,. и выходом п„характеризуется неизвестным вектором существенных параметров Х и неизвестными параметрами (обозначим их через вектор ф, влияние которых на процесс управления не учитывается (рис.
4.1). Оператор объекта считается известным. Входная и выходная величины через каналы связи Н и Е, в которых происходит известным образом взаимодействие полезных сигналов х, и о,, с помехами й и а, поступают на вычислительное устройство ВУ. Все величины измеряются в дискретные моменты времени 1=0, 1,...,з, квантование по уровню отсутствует. Величины й, р, х, е, й считаются случайными и статистически независимыми, с известными априорными плотностями распределений. Задача состоит в том, чтобы вычислительное устройство ВУ, получив последовательность сигналов у, и г„ определило оценку ч, существенных параметров Х, удовлетворяющую выбранному критерию оптимальности. Критерием оптимальности в 1153~ служит риск )г,, — математическое ожидание функции потерь )р',(з, Л, у,), являющейся в общем случае произвольной функцией.
Оптимальная оценка находится из условия мицнм) ма функции риска )с.=М [1Г.(з, Л, у.)). (4.2.! ) В [70) показано, что правило решения„определяющее аптимальную оценку у, представляет собой б-фзнкцпю л д Тогда оптимальная оценка у,=у(у„г,) находи~ся из условна минимума следующей функции [153[: а,(у,,) =пи!и а,. (4.2.3) В случае марковского объекта изменение параметров р и Л описываются дискретными марковскими процессами с заданными плотностями вероятностей перехода р(р,+~/р;), р(Л;+~/Х;) и априорными плотностями р(ра), р(Л,) в момент времени 1=О.
В [153, 155[ формулы (4.2.1) и (4.2.3) обобщены применительно к марковским объектам и найдены оптимальные оценки при нерендомизированном правиле решения. В [154, 1551 получены оценки параметров объекта в случае. когда на ВУ поступает только последовательность а, выходных сигналов (см. рис. 4.2) и найдены также апостернорные плотности вероятностей вектора существенных параметров р,(Л) прн вычислениях по схемам рис. 4.1 и 4.2. для обычного [1541 и марковского объектов [155).
Используя эти формулы, можно найти оценки вектора параметров Л по методу максимума апостериорной вероятности. В этих же работах приведены примеры оценки параметров объектов по методу минимума риска. В качестве объекта выбрано безынерционное (усилительное) и апернодическое звено первого порядка.
Параметры определялнсь при различных исходных данных и по различным схемам. Остановимся на первом из примеров (154]. Объектом является безынерционное звено (рис. 4,3), описываемое уравнением (4.2.4) о, =Ахи Здесь параметр Х (коэффициент усиления) равномерно распределен в интервале (а, Ь]. Все остальные величины удовлетворяют ранее установленным общим требованиям. Задача конкретизируется следующими данными: р(х;) =- -==ехр( — хл/2о,э); 1 (4.2.5) пал а~ =а~+ си= а;+Хх;; (4.2.6) р(е,) = .
ехр ( — ел/2а'). 1 (4 2 7) о)~2н Оптимальная оценка й найдена при помощи метода макси мума апостериорной вероятности: Х = — 'Л вЂ” 3-- — — „ (4 26) зп з о.' Методы максимума правдоподобия использованы в (156, 157] для оптимизации управления в применении к системам автоматического регулирования с неполной информацией об управляемом объекте. Эти методы позволяют построить оптимальное управление как в обычных системах автоматического регулирования, так н в экстремальных системах. Основная идея оптимизации методами максимума правдоподобия состоит в следующем. На основании полученных к /-му моменту времени данных о реализациях входных н выходных величин объекта строится функция правдоподобия и определяется вектор А у, который доставляет максимум функции правдоподобия и является для ~'-го момента времени максимально правдоподобной оценкой вектора неизвестных параметров объекта.
Используя полученную оценку вектора неизвестных параметров, определяют вектор оптимального управления, оптимизирующий некоторую выбранную статистическую характеристику. Для нахождения оценок параметров методом наибольшего правдоподобия требуется, в отличие от методов минимума риска н максимума апостериорной вероятности, меньший объем априорной информации, При использовании обобщенного критерия максимума правдоподобия «1571 на основании наблюдений над управляемым ооъектом можно одновременно оценивать неизвестные параметры как собственно объекта, так н законов распределения приложенных к объекту возмущений. Таким образом, в последнем случае нет необходимости задавать какие-либо статистические характеристики объекта и возмущающих воздействий, требуется лишь некоторая априорная информация качественного характера.
Если параметры ооъекта изменяются во времени, то их оценка ищется по скорректированной функции правдоподооия [156~, которая строится следующим образом. В функцию правдоподобия искусственно вводится временная зависимость, которая, сохраняя основные свойства функции правдоподобия, снижает влияние замера, полученного в некоторый прошлый момент времени, на текущее значение функции правдоподобия так, что в пределе при большом промежутке времени между прошлым замером н вычислением функции правдоподобия в данный момент влияние устаревшей информации полностью устраняется.
Эта временная зависимость названа в 11551 функцией достоверности замеров и аналогична функции «веса» информации, введенной Р. Калменом [1581. Вопросы оценки параметров рассмотрены в задаче нахождения оптимального линейного предсказателя определенной структуры для данного множества выборок 11591. Оптимальным линейным предсказателем является такой, который минимизирует полохгительно определенную квадратичную форму от ошибок предсказания. При соответствующих ограничениях минимизация ошибки предсказания дает максимально правдоподобную оценку параметров предсказателя.