Анисимов Б.В., Курганов В.Д., Злобин В.К. - Распознование и цифровая обработка изображений (1033973), страница 2
Текст из файла (страница 2)
связаны со значительным развитием в последние годы методов машинной графики, позволяющих синтезировать машиностроительные чертежи, изучать поведение конструкций под нагрузкой и т. п. Получение снимков в заданных картографических проекциях сводится к геометрическим преобразованиям изображений, в процессе которых полутоновое содержимое последних не изменяется. При этом возникает необходимость в разработке эффективных методов оптимизации по затратам времени процессов переработки огромных массивов информации. Использование для синтеза мультфильмов ЭВМ дает возможность существенно сократить объем ручной работы по их рисованию, используя методы машинной интерполяции сюжетов.
П р н м е ч а и и е. Машинная интерполяция сюжетов — генерирование машиной промежуточных положений движущихся объектов на основе сведений об их начальных и конечных положениях. Автоматическое чтение текспш, дешифрование аэрокосмических снимков, диагностика заболеваний и и. д. — это примеры задач, относящихся к проблеме распознавания образов. Особый интерес, проявляемый к ее разработке в настоящее время, связан с открывающимися в связи с этим возможностями лучшего понимания процессов обработки информации в живых системах, создания более эффективных систем «человек — машина», а также автоматических систем, позволяющих быстрее, точнее, надежнее или экономичнее человека решать различные задачи обработки визуальной информации. Разделение последних на задачи обработки и задачи распознавания носит условный характер. В последние годы появились интересные работы, посвященные процессам обучения и принятия решения при распознавании образов, а также таким перспективным подходам к распознаванию, как детерминированный, статистический, детерминированно-статистический, непрерывно-групповой, структурно-лингвистический и др.
П р и и е ч а н н е. Дежерминированчмл подход к распознаванию предполагает, что в любой точке пространства признаков, используемых для распознавания, с ненулевой априорной вероятностью могут появляться реализации только одного класса. Статистический подход к распознаванию предполагает, что в одной точке пространства признаков с отличной от нуля априорной вероятностью могут отображаться реализации, относящиеся к различным классам. Непрерывно-групповой подход к распознаванию опирается на детерминированную модель последнего, согласно которой класс порождается в результате априори неизвестных топологических преобразований иад некоторой эталонной реализацией.
Структурно-лина«и«гни««скпв подход к распознаванию базируется иа описании геометрической структуры класса с помощью специального языка, алфавит которого составляют так называемые непроизводственные элементы структуры и операции их композиции, задаваемые грамматикой этого языка.
клад в теорию н практику обработки изображений образов внесли В. М. Глушков, Н. Г. Загоруйко, у ', А. Ковалевский, Ю. Е. Нестерихин, А. И. Петренко, А. А. Харке'фйнч, А. Гамба, Н. Нильсон, Ф. Розенблатт, А. Розенфельд, К. Фу. Приведенные задачи обработки изображений не исчерпывают свя- :ланной с ней проблематики. Она проникает почти во все области дея., тельности человека, где имеют дело с изображениями и есть возмож'. ность применить ЭВМ. По мнению многих ученых, развитие методов и -: средств обработки изображений привело к образованию новой отрасли , науки и техники, имеющей большую перспективу. П р и м е ч а и и е, В некоторых работах утверждается, что проблема рас -познавания образов с методологической, научной и практической точек зрения стала о днов из важнейших в широкой области научных дисциплин, объединяемых о ычио б понятием «кибернетика». Вместе с тем, несмотря иа иитенсив ос р, вот в области обработки изображений и значительность полученных р зу е льтатов, следует признать, что найдено решение всего лишь нескольких проблем, да и то .
Даже в такой, казалось бы, простой задаче распознавания, как автоматическое чтение текста, общих, исчерпывающих и экоиомичи х р частичное. ы ешеиий ие вай- д их пор. Формальная процедупа задания исходной системы признаков ' в распознавании образов отсутствует. Иесмотря на предпринятые попытк , построена пока что и общая теория распознавания. Известны работы, в ноторых - возможность разработки такой теории считается по меньшей мере преждевре- й, В связи с этим отмечается, что распознавание образов иа основе цифроиой техники прошло всего лишь путь «от рождения до отрочества, р д, меиио, в ,пава,все еще неуклюжего». Основная трудность в разработке обсуждаемой проблематики за ключается в том, что многие относящиеся к ней задачи с трудом подда.
ются формализации или пока что не формализованы вообще. До недавйего времени их решение было, как правило, исключительной прерогативой человека, использовавшего для этого весь арсенал своих умственных и физических возможностей. Поэтому вопросы автоматиза'ции обработки изображений в ряде случаев оказываются далеко нетривиальными и не могут быть легко и быстро разрешены на удовлетВорительном уровне. Следует указать и на исключительную специфичность и научную и техническую сложность любой сколько-нибудь серьезной задачи обработки н распознавания изображений.
Например, техника, изображения и методы их обработки, с которыми приходится сталкиваться при распознавании треков в ядерных исследованиях, имеют многие особенности, не встречающиеся в других задачах, При этом используют, нак правило, ускоритель заряженных частиц, канал их транспортировки, мишень илн поглотитель, регистрирующий детектор треков на базе пузырьковой или оптической разрядной камеры, просмотровые столы н ЭВМ для автономной обработки информации с устройствами ввода и отображения изображений. В детектореобычноустанавливается несколько объективов, что позволяет осуществить по полученным ,стереоизображениям пространственную реконструкцию событий.
Основная проблема здесь заключается в восстановлении непрерывности и прослеживании треков, изобразившихся на снимках, поскольку треки, как правило, представляют собой «рваные» линии, которые надо выявить в массе других треков, причем их оптическая контрастность 7 иногда низка и имеют место вариации фона, обусловленные «слепыми пятнамиз в оптике и примесями в камере. Все это пока что не позволяет полностью автоматизировать процесс обработки снимков, тем более что достоверность такой обработки должна быть исключительно высокой: новую частицу иногда удается обнаружить всего по одной фотографии.
Выше указывалось и на огромное число снимков, получаемых в каждом эксперименте. Поэтому на первый план при распознавании треков выдвигаются такие технические характеристики процесса обработки, как точность измерения параметров, достоверность результатов, производительность и, следовательно, стоимость. Перечисленные специфические особенности и трудности породили новое направление в теории и технике обработки и распознавания изображений. В частности, благодаря этим и другим направлениям сформировался упомянутый выше структурно-лингвистический подход к распознаванию образов.
Без применения ЭВМ трудно представить себе решение любой задачи обработки изображений. Важно иметь в виду и другое: рассматриваемый класс задач ставит сеРьезные проблемы и перед вычислительной техникой, стимулируя ее дальнейшее развитие, Даже в случае использования ЭВМ общего назначения, как правило, возникает необходимость в разработке Разнообразных устройств ввода — вывода и отображения видеоинформации, а также специального математического обеспечения, наиболее отвечающих той или иной задаче. Однако ласто для обработки изображений требуются вычислительные системы, полностью ориентированные на такую обработку.
Производительность этих систем составляет 100 — 1О 000 снимков/день, число элементов разложения изображений — 300 х 300 — 30 000 х 30 0000, полутоновая шкала — до 256 градаций, длина слова с данными об одном элементе — 8 бит, скорость обработки 10« — 10' бит(с. Система, как правило, включает в себя специализированную ЭВМ и устройства ввода — вывода (лазерный сканер, дисплей, накопитель на магнитных дисках (НМД), плоттер). Затраты на ее разработку распределяются следующим образом; ЭВМ вЂ” 16, периферийное оборудование — 42, программное обеспечение — 30, интеграция — 12«7«.
Последние цифры свидетельствуют о том внимании, которое должно быть уделено при проектировании таких систем разработке устройств ввода — вывода и математического обеспечения. Настоящее учебное пособие посвящено вопросам автоматизации обработки и распознавания изображений с помощью ЭВМ. Очевидно, однако, что рассмотреть эти вопросы для всех видов видеоинформации в рамках одной книги ограниченного объема не представляется возможным. Поэтому ограничимся наиболее распространенными на практике монохроматическими точечными изображениями объектов, крупномасштабными проекциями трехмерных тел, наблюдаемых в случайных ракурсах на практически однородном фоне, и, наконец, такими изобраи1ениями повышенной сложности, как аэрокосмические снимки земной поверхности.
С перечисленными изображениями приходится иметь дело при обработке астрономических наблюдений, проектировании роботов-манипуляторов, изучении земных ресурсов и во многих ' гих случаях, причем обработка более сложных изображений часто '"вана с обработкой видеоинформации, сопутствующей им или вы' яемой на их основе и относящейся к более простым классам. :"' Таким образом, исследование вопросов, определяющих проблема" ку настоящего пособия, имеет важное значение для автоматизации двнообразиых функций обработки и распознавания видеоинформа- и, выполняемых в недалеком прошлом человеком в весьма важных 'практических областях его деятельности. Чтобы представить себе перечень и взаимосвязь основных этапов, орые надо выполнить при идентификации или распознавании проанственных объектов по одиночным или стереопарным снимкам, расотрим схему распознавания пространственных объектов (рис.
В.1). Под идентификацией будем понимать классификацию объектов по интегральным признакам, характеризующим данный объект в це, ом (площадь изображения объекта, максимальный или минимальный Размер изображения, отношение этих величин, периметр внешнего ; лйюнтура изображения и т.д.). Идентифицировать можно отдельные объекты между собой. Под распознаванием будем понимать целевую классификацию объ','ектов по набору у них некоторой совокупности целевых признаков, ~.::характеризующих целевое назначение объекта и принадлежность его Ф' .',/;.т 'Чг тому или иному классу. Под классом будем понимать некоторое множество объектов, харак- ,'М~:теризуемое определенным набором целевых признаков, наличие кото,,':;Рых на объекте определяет его целевое назначение, например класс ","~";объектов — телевизоры, целевые признаки — экран, различные руч- ',,',~ки, рычаги и кнопки управления и др.