Основы ТАУ - Ч-3 Оптимальные, многосвязные и адаптивные системы - Воронов [1970] (1189551), страница 54
Текст из файла (страница 54)
Но по разным причинам (конструктивным, физическим и т. п.) построить рецептор, выдающий на своем выходе число, характеризующее однозначно тот или иной информативный признак, почти никогда не удается. (Когда это удается, вся специфика проблемы распознавания образа теряется и мы получаем обычный прибор автоматического контроля. К таким автоматам относятся, например, устройства для чтения печатного текста определенного шрифта и размера.) Информативный признак должен быть выработан на основании выходных координат рецепторов. Эта задача оказывается зачастую весьма нелегкой даже в тех случаях, когда мы можем точно описать информативный признак.
Пример — выделение из множества геометрических фигур кругов, треугольников, квадратов, полукругов и т. п., разного размера и расположенных произвольным образом. Человеческий глаз это делает мгновенно. Алгоритм же, основанный на точном описании фигур уравнениями или же счетом углов, криволинейных или прямолинейных участков, и т.
и., оказывается весьма трудно реализовать технически. Практически в таких случаях часто приходится отказаться от попыток использования наших исчерпывающих знаний описаний информативных признаков из-за их сложности и переходить к методу обучения показом. Распознавание образов на основе обучения показом основывается на преобразовании данных наблюдения объектов в совокупности чисел и на обработке этих чисел по специальным алгоритмам. Для преобразования данных о наблюдаемом объекте в совокупность чисел и последующей обработки этих данных весьма полезным оказывается понятие метрического пространства. Каждому признаку (не только информативному) объекта можно приписать некоторое число, такое, чтобы оно не совпадало с числами, приписанными другим прианакам.
Тогда всей совокупности Х признаков объекта будет соответствовать совокупность чисел, которые можно рассматривать как координаты некоторой точки в Л'-мерном пространстве признаков. Таким образом, каждый объект в данном пространстве отображается точкой, а образ— совокупностью точек, обладающих общими информативными признаками.
Если удалось выполнить отображение признаков в пространстве или, как говорят, построить пространство признаков так, что образам будут соответствовать непересекающиеся области, внутри которых точки расположены достаточно близко друг к другу, и между этими областями могут быть проведены разделяющие их гиперповерхности, то решение задачи распознавания образа облегчается. Гипотеза о том, что пространство признаков обладает упомянутыми свойствами (близостью точек и разделимостью областей) была выдвинута в [21) под названием «гипотезы компактностиэ.
290 Однако так как понятие компактности множества не совпадает с данным понятием (математическое понятие компактности оказывается весьма суровым и встречающиеся в практике ситуации обычно не удовлетворяют математическим условиям компактности), то мы будем избегать в дальнейшем этого термина и говорить о «гипотезе разделимости образов поверхностями». К сожалению, проблема построения пространств признаков, в котором гипотеза разделимости оказывается справедливой, не Рзс. Опт.
имеет общего решения. Пока удалось решить на основе этой гипотезы лишь ряд частных задач. Во многих же задачах области, соответствующие образам, взаимно проникают друг в друга, напоминая, по образному выражению М. Бонгарда 119), губку с водой, что делает практически невозможным построение автоматом поверхности, отделяющей губку от воды. Но, тем не менее, на основе гипотезы разделимости, удалось построить алгоритмы для опознавания цифр, некоторых топографических знаков на карте и некоторых других простейших образов. Ниже мы рассмотрим некоторые из алгоритмов распознавания.
Пандемо н и у м. Одной из первых машин для распознавания образов был «пандемониум», построенный О. Селфриджем в 1958 г. [2601. Название «пандемониум» навеяно известными рассуждениями Д. К. Максвелла о «демоне», который противодействует росту энтропии, открывая дверцу в разделяющей два закрытых 291 а) б) Ркс. 9л8. с помощью вычислительного устройства ВУ производится построение «спрямляющего пространства» Х, на которое отображается пространство признаков У. С атой целью вычислительные устройства вырабатывают некоторые функции состояния дат- чиков (9-84) х;=~,(им им ..., ил).
Функции ~, выбираются так, чтобы множество точек х,(:Х в пространстве Х, соответствующих одному образу, попало в область Е, (рис. 9-18, б), другому образу — в область Е„ и между областями Ед и Е, можно было бы провести множество разделяющих гиперплоскостей а = У, 'Х,.х,. + Хл е 1 = О. (9-85) Если такая гиперплоскость (в дальнейшем для краткости будем говорить о разделяющих поверхностях и плоскостях, опуская приставку «гиперз) существует н построена, то для любой точки области Е, линейная форма и будет иметь один знак (капример, +), а для области Е, — противоположный ( — ). Позтому по знаку о 292 сосуда перегородке перед быстролетящими молекулами газа, и закрывая ее перед медленнолетящими молекулами [248), в результате чего происходит повышение температуры газа в одном сосуде и понижение ее в другом.
Упрощенная схема пандемониума для выработки двух взаимно дополнительных понятий показана на рис. 9-17. Образ характеризуется совокупностью величин и == (ит, и, ..., ил) в пространстве признаков (7, воспринимаемых датчиками Д. Области, соответствующие двум образам, могут оказаться разделенными сложной поверхностью (рис. 9-18, а), что затрудняет построение алгоритма распознавания, поэтому предварительно можно судить, к какому из двух классов 1образов) принадлежит показанный объект. На схеме рис. 9-17 значения х; поступают на усилители с переменными коэффициентами усиления Л,. Функция о образуется путем суммирования выходов усилителей и величины Лпчч и поступает в решающий блок РБ, выявляющий знак о и выдающий в соответствии с этим знаком код образа.
Этапу распознавания предшествует этап обучения, который заключается в том, что оператор показывает пандемониуму серию объектов и контролирует правильность его ответов. Если пандемониум ошибся, то оператор подает сигнал на управляющее устройство УУ. Число Ркс. 9-19. ошибок за некоторый промежуток времени Т представляет собой некоторую функцию У (Ц, Лю ..., Лт). Предполагается, что эта функция имеет минимум в пространстве Л.
Управляющее устройство изменяет Л„Л„..., Лк так, чтобы минимизировать Р. Так как функция Г заранее неизвестна, УУ осуществляет поиск по методу наискорейшего спуска, т. е. действует как многоканальный оптимизатор. Пандемониум действует, исходя из того, что самая трудная задача — построение пространства прпзнаков У, в котором справедлива гипотеза о разделимости плоскостью для данных образов, уже выполнена.
На практике, однако, воспринимаемые рецептором входные величины, пе соответствуют информативным признакам образа, и не гарантируют выполнения гипотезы разделимости плоскостью. Примером попыток преодоления этой трудности является построение в 1858 г. Ф. Розенблатом классифицирующей машины, названной им «перцептрон» )153, 257 — 258). Перцеп трон. Перцептроп (от регсербоп — восприятие) был задуман как модель восприятия изобралсений системой зрения живого организма. Подобно тому, как зрительный образ воспринимается по элементам рецепторами сетчатки глаза, в перцептроне восприятие объекта осуществляотся группой элементов, называемых рецепторами (элементы группы Я на рис.
9-19). Каждый из рецепторов может находиться либо з возбужденном, либо в невозбужденном состоянии, но пространство рецепторов не удобно для построения разделяющих поверхностей и для его преобразования в перцептрон введена вторая группа — ассоциативные элементы (элементы группы А). Так как требуемый закон преобразования неизвестен, то связи между рецепторами и ассоциативными элементами также неизвестны. Розенблат предлагает перед началом работы перцептрона установить некоторую случайную структуру связей, которая в дальнейшем уже не изменяется (если только в надежде улучшить работу перцептрона испытатель не пожелает сделать попытку порейти к другой, также случайной структуре).
Каждый из рецепторов может быть подключен к данному А-элементу или со знаком плюс (возбуждакы щая связь) или со знаком минус (тормозящая связь), или вообще пе подключен. А-элемент работает как сумматор с порогом: он возбуждается, если сумма сигналов, поступающих к нему от рецептора, превысит некоторый порог. Выходы А-элементов череа усилители с переменными коэффициентами Л,.
передаются в сумматор Л. Значения Л; устанавливаются в процессе обучения. Разобьем все рецепторы на две группы — возбуждающую и тормозную, в зависимости от знака связи с А-элементом. Если в первой группе 1, а во второй и алементов, то в некоторый дискретный момент п имеем о[п]= ХЛ„[п]х,Л ] — Х Л.] ]х.[п[, (9-86) где индексами 1~ отмечены рецепторы первой, индексами 2)— второй групп. На выходе элемента Л вырабатываются два сиг- пала: [1, а[п]гь0; [О, о(0; р, [п] = 1 — р, [и].