Лысенко Л.Н. Наведение и навигация баллистических ракет (2007) (1242426), страница 107
Текст из файла (страница 107)
е, изменению своих параметров и (или) структуры в зависимости от экспериментальных данных. Конечное множество таких данных называется обучающей выборкой. Таким образом, принципиальное отличие обучаемых классификаторов состоит в том, что границы между классами образов (разделяющие гиперповерхности) определяются не непосредственным вычислением соответствующих коэффициентов в разделяющих функциях, а итеративно. Типичными для данной категории классификаторов являются искусственные нейронные семи, для которых свойство обучаемости естественно и неотьемлемо. Одной из первых успешно работающих нейросетей был и есть ныне часто используемый персептрон — нейронная сеть, имеющая простейшую слоистую структуру.
584 Обучение подобной сети производится с помощью процедур, представляющих собой разновидность градиентного спуска, где минимизируемой функцией служит ошибка — разность между текущими и требуемыми значениями выходной сети. Ни один из рассмотренных подходов в отдельности не может претендовать на полное решение задач обнаружения и распознавания целей в СУИИ БР, даже в перспективе. Более эффективным является объединение различных методов, при разумном использовании преимушеств каждого из них с тем, чтобы они дополняли друг друга. Степень использования того или иного подхода зависит, как правило, от конкретной задачи и свойств рассматриваемых объектов.
К. Фу предложил следующую схему подобной комбинированной системы, включающей два уровня: на первом для распознавания элементов, наиболее чувствительных к искажениям, используют дискриминантные методы, на втором, когда синтаксический анализ облегчен тем, что подобразы ясно обозначены,— струхтурные. Оптимальным представляется внешнее комбинирование методов, когда каждый из них используется для достижения локально наилучшего результата в своей области.
Остается лишь правильно организовать взаимодействие на уровне методов, т. е. выбрать архитектуру системы и соответствующим образом распределить задачи между подсистемами, указав границы деятельности и функционал оптимизации, а после получения от подсистем промежуточных результатов — оценить достоверность и осуществить адекватное сочетание.
На основе сформулированных принципов и анализа свойств методов обработки информации проанализируем типовую структуру системы видеонаведения и укажем возможные пути решения с учетом особенностей данной системы. Прежде всего необходимо определиться с подходом при решении задач обнаружения. Небольшие видимые размеры и отсутствие составных частей (нерасчленимость) объектов в задачах видеонаведения БР крайне затрудняют использование структурных методов.
Следовательно, нужно выбирать только среди признаковых методов. Причем основным следует считать статистический метод, использующий распределения яркости изображения и нахождение пространственных неоднородностей. Такие неоднородности (перепады яркости) соответствуют, как правило, границам объектов. Процедуры поиска перепадов по своей природе локальны, а значит, не потребуют слишком много времени на реализацию. Среди анализируемых признаков наибольшее значение имеют яркостные (в том числе моментные) и геометрические признаки, характеризующие размер и форму объекта. На анализе текстуры (пространственно-статистических особенностей изображения) часто основана сегментация (выделение близких по своим характеристикам областей). Это помогает лучше узнать контекст изображения и получить дополнительную информацию о возможных положениях объектов. Например, осуществить обнаружение выделяющегося из своего окружения объекта или определить, что видеодатчик бортового координатора смотрит чне туда» (несовпадение текущих характеристик с заданными) и т.
п. Однако представляется целесообразным отказаться от этой ветви как ресурсоемкой (большой объем промежуточных данных и вычислений). К тому же наличие предварительных оценок местоположения объекта 585 (с использованием навигационной информации) позволяет решить ту же задачу менее затратными средствами без заметного ухудшения качества. Следующим важным процессом будет процедура сопровождения выделенной цели. Ввиду того что процедура сопровождения объектов имеет дело уже не с изображением, а с выделенными объектами, представленными векторами параметров небольшой размерности, ее доля в общих затратах времени невелика (при разумном числе обнаруженных объектов). Принципиальное значение имеют две позиции.
° Временная глубина обработки (т.е. число кадров, учитываемых при идентификации и формировании гиперобъектов) ограничивается исходя из допустимых вычислительных затрат, одним — двумя кадрами. Иными словами, в первом приближении наблюдаемый процесс можно считать марковским. ° Установление соответствия между объектами на разных кадрах осуществляется локально, т. е. поиск нового положения происходит в сравнительно небольшой области вокруг предыдущего положении.
Это может приводить, по сравнению с глобальными методами поиска, к возникновению ошибок идентификации. Однако вероятность таких ошибок, учитывая небольшое число наблюдаемых объектов, оценивается как чрезвычайно низкая. Поиск перепадов яркости на изображениях выполняется с использованием таких приемов, как пространственное дифференцирование, частотная фильтрация, обеспечивающая стабилизацию решения, релаксационная разметка на базе оператора Розенфельда, использование моментов распределения яркости в круглом окне, функциональная аппроксимация, в том числе с использованием алгоритма Хюккеля.
На практике, как правило, применяют комбинации перечисленных приемов. Обычно выделение границ предполагает проведение последовательного анализа набора элементарных областей, на которые разбивается анализируемое изображение. Это позволяет говорить о том, что подобные методы выделения границ являются апертурными. Другими словами, толщина выделенных границ зависит от размеров используемой апертуры — элементарной области.
Эффективность способов обнаружения обычно демонстрируется разработчиками на некотором изображении, которое трудно охарактеризовать как сложное. В итоге вопрос устойчивости работы рассмотренных способов обнаружения при сложных исходных данных все еще не решен. На основе накопленного опыта компьютерного моделирования и анализа доступных источников можно сделать следующие выводы: максимально допустимый размер апертуры фильтра — б х б пикселей (если больше — теряются детали объекта); следует использовать операторы Собеля илн Робертса (уточняется в процессе разработки) как наименее ресурсоемкие при достаточном качестве результатов; использование направленных операторов или многомасштабного анализа нецелесообразно; наиболее эффективный путь нахождения объекта — выделение прямолинейных участков границ с последующим их объединением; при использовании контрастной окраски объекта следует провести предварительную яркостную (пороговую) сегментацию изображения.
586 Как показывает анализ, в части идентификации и селекции цели принципы построения системы не должны существенно отличаться от аналогичных систем сопровождения объектов по видеоизображению. Кроме того, из-за незначительного потока данных (координаты и свойства структурных элементов объектов вместо изображения) временные затраты на выполнение операций с такими даннымн невелики и не могут повлиять на общее быстродействие системы. Поэтому вполне допустимо применение ранее опробованных методов и приемов, обеспечивающих требуемое качество идентификации и необходимую устойчивость системы.
Поскольку система предназначена для работы в реальном времени, для реализации алгоритмов обработки входных изображений требуется по предварительным расчетам до нескольких десятков миллисекунд (на современных универсальных процессорах) на один видеокадр, Применение специализированных процессоров не обеспечивает значительного ускорения. Таким образом, время обработки достигает, а в некоторых случаях и превышает период поступления видеоизображений (40 мс для системы РА).).
В таких условиях нерационально включать в контур обработки дополнительные алгоритмы, в частности, для подстройки параметров системы. Вместе с тем жесткая фиксация значений параметров на этапе проектирования приводит к неудовлетворительным результатам. Решить эту проблему позволяет исключительно лишь применение нейроподобных обучаемых алгоритмов. Для обучения нейроподобной системы необходима база данных (БД) обучающих примеров. Чем полнее БД и точнее примеры соответствуют рабочим режимам системы, тем точнее впоследствии система будет работать. Предполагается, что используемые методы обнаружения объектов инвариантны к раскраске и ракурсу объектов, масштабу изображения.
Однако следует помнить, что в реальной системе инвариантность ограничена, что должно учитываться при построении БД для обучения. Состав БД для обучения определяется набором используемых для выделения объектов, методов и признаков для их распознавания. Наиболее перспективной является БД, представляющая собой комбинацию в виде набора изображений объектов в различных ракурсах, зависимости признаков, используемых для выделения объектов, от условий наблюдения. При этом необязательно изображения, входящие в рассматриваемую БД, должны точно имитировать получаемые при реальной работе данные.
Исходя из необходимости получения рабочего варианта СВН в сжатые сроки (и учитывая высокую стоимость и сложность натурных испытаний) обычно применяется следующая схема формирования БД для обучения системы. На первом этапе в качестве обучающих примеров используют цифровые изобрюкения, полученные моделированием фоноцелевой обстановки или оцифровкой подходящих по сюжету фрагментов видеофильмов или телепередач. Изображения хранятся на жестком диске компьютера.