Основы ТАУ - Ч-3 Оптимальные, многосвязные и адаптивные системы - Воронов [1970] (1189551), страница 56
Текст из файла (страница 56)
Если все К,. отличны от нуля, то, обозначив $ гч г Ф» 2ЭЭ где Нд —— зпр р (~„, ~рц). Таким обрааом, если обобщенные портреты образов существуют, то для того чтобы точка ~,. в пространстве Т принадлежала к образу Но необходимо, чтобы она находилась внутри сферы с центром в точке р„имеющей радиус Нп Нд называется порогом узнавания образа Н,. Попадание точки внутрь сферы является необходимым, но недостаточным условием дляопознавания образа,так какие непересекаемости образов еще не следует непересекаемость сфер и в пространстве Т могут быть области, принадлежащие нескольким сферам одновременно.
Точки, находящиеся внутри этих областей, не могут быть опознаны неравенствами (9-93) и, в соответствии с определением, не будут принадлежать образу. В !25) процесс распознавания предложено подразделять на две разновидности: различение и узнавание образов. Различение соответствует случаю, когда мы заведомо внаем, что изображение Х,принадлежит одному иэ образов (например, если мы опознаем женское лицо, то в случае показа человеческого лица нам необходимо лишь определить, к какому из двух образов оно относится). Если же мы заранее не знаем, что объект принадлежит к одному иэ образов, процесс распознавания называется узнаванием образа.
В случае различения выполнения неравенств (9-93) (т. е.попадания точки внутрь одной из сфер) достаточно, чтобы установить образ. В случае узнавания, кроме этого, надо установить, принадлежит ли данная точка вообще какой-либо иэ сфер и только ли ей. Вид пространства Т аависит от способа преобразования векторов Х в вектора ~.
В частности, если выбрать это преобразование так, что пространство Т будет представлять собою единичную сферу в гильбертовом пространстве, то неравенства (9-93) перейдут в неравенства для скалярных произведений: неравенства (9-94) перепишем в следующим виде: (~, г,) ) 1) (/;, г;) для всех ~ ~ ~', (9-95) откуда (9-99) Отсюда видно, что операция узнавания не заканчивается преодолением порога узнавания, а требует еще проверки выполнения условия (9-99).
Таким образом, для распознавания образа нужно сличить описание показанного объекта со всеми обобщенными портретами однородных систем, хранящимися в памяти; выдать сигнал о преодолении порога; в случае узнавания — проверить выполнение требования (9-99). Уравнение К Ч;)=Х; где вектор у, фиксирован, есть уравнение гиперплоскости, перпендикулярной вектору ф,. Это означает, что в евклидовом пространстве метод обобщенного портрета сводит задачу к разделению образов в пространстве гиперплоскостями. Заметим, что при практическом построении обобщенного портрета моя'но обойтись беэ точного отыскания преобразования пространства Х на единичную сферу.
Чтобы соблюдались условия (9-94), нужно стремиться к тому, чтобы скалярные произведения Д, ю) были тем больше, чем ближе число ~, выражаемое кодом объекта к числу у, выражаемому кодом обобщенного портрета ~р. Такомусвойствуудовлетворяют, например, бинарные коды объектов. Скалярное произведение двух бинарных кодов равно сумме попарных (поразрядных) произведений чисел этих кодов.
Произведение двух одинаковых кодов равно сумме единиц, входящих 300 Уо г,)) Уя э,). (9-96) Последнее неравенство можно принять за условие различения образов. Его удобно несколько преобразовать. Введем в рассмотрение пороговую функцию э(у, э;)1=у';, которая равна единице, если произведение Ц, ~р,) превышает порог К,, а (/, г,) ) $, т. е. если ~ принадлежит к образу Не и равна нулю, если (~, ~,) меньше этого порога: в(о=( ) (9.98) Верхний индекс при у указывает на индекс системы однородных образов, содержащих образ Н,. Условие узнавания образа Н, можно записать так: в этот код.
Если объект будет незначительно отличаться от портрета, что отразится на изменении одной из цифр кода, то скалярное произведение или сохранится (если один из нулей заменится единицей) или уменьшится (если единица заменится нулем). Таким образом, при удалении объекта от образа скалярное произведение их кодов убывает. Чтобы метод обобщенного портрета дал аффективные результаты, надо стремиться кодировать объекты так, чтобы при небольших их отличиях коды этих объектов также мало различались.
Процедуру классификации по методу обобщенного портрета можно разделить на три основные этапа: 1) кодирование признаков показываемых объектов; 2) построение обобщенного портрета по данным показа; 3) классификация объектов путем сличения их кодов с кодом обобщенного портрета. Второй этап (построение обобщенного портрета), как правило, требует использования для обработки полученных при показе объектов данных на вычислительной машине.
Первый и третий этап могут выполняться вручную. Это делает метод практически удобным для исполнителей, которые не имеют возможности при выполнении непосредственной классификации новых объектов пользоваться вычислительной техникой, например для врачей, ставящих диагноз вдали от крупных центров, для геолого-разведчиков, определяющих характер разведуемых пластов, для криминалистов и т. д.
Отправляясь на места, где надлежит выполнять распознавание классов объектов, они берут с собой обобщенный портрет, вычисленный в центре, который имеет вид таблицы. Рассмотрим все упомянутые этапы распоанавания. 1. Кодирование объектов в процессе показа. Для кодирования объектов в процессе их показа необходимо ааранее установить признаки, существенные для классификации объектов. Если какая-то часть информативных признаков известна, то эта часть кодируется. Но обычно информативные признаки неизвестны. Тогда на основании знания свойств объектов или же интуиции устанавливаются легко наблюдаемые, но не информативные признаки, о которых известно лишь то, что они с высокой степенью вероятности связаны со скрытыми от нашего наблюдения информативными признаками.
При этом мы, конечно, привносим элемент неопределенности, который в конечном итоге будет приводить к ошибкам в результате классификации. Далее, когда выбраны признаки для суждения об объекте, им приписываются тем или иным способом числа. Простейший способ кодирования, который обычно и используется, состоит в том, что мы приписываем единицу наличию признака и нуль его отсутствию, т. е. применяем двоичную систему кодирования. Так, например, мы поступаем, кодируя объекты типа рукописных букв, 301 На рис. 9-22 показан способ кодирования рукописной буквы б.
Область, в которой могут появиться элементы атой буквы, делится на квадраты (для простоты на рисунке не пронумерованы те части поля, в которые заведомо никакая часть буквы не попадет). Каждому квадрату приписывается номер, соответствующий разряду двоичного числа, изображающему код объекта. Порядок разрядов (т. е. порядок нумерации при этом) выбирается произвольно. Число разрядов обычно выбирается интуитивно.
Мон«но считать очевидным, что если число признаков (разрядов) выбрано слишком малым, то вероятность правильных ответов после окончания обучения будет весьма малой. Увеличение числа признаков сначала и будет улучшать качество работы обучаемой системы, но, по-видимому, увеличение их числа свыше какого-то «о «о порога становится практически бес- 46 полезным. По-видимому, это связано Ю и с тем, что при превышении некоторого ог »о предела мы уже начинаем вводить в ю рассмотрение больше ложных, несу- щественных признаков, чем существеноо о« 97 ных, т.
е. «засорять» информацию. Крои ме того, увеличение числа признаков, т. е. увеличение размерности задачи, приводит к усложнению процедуры вычислений. В случае кодирования буквы далее к«о:оооооооооооп«ооо«п мы можем поступать следующим обра- зом: если в квадрат с номером К не Рис. 9-22. попала часть изображения буквы (или же попавшая часть иаображения занимает менее половины квадрата), то в к-м разряде числа записывается нуль, в противном случае — единица. В тех случаях, когда признаки характеризуются непрерывными функциями, например кодируется тоновое изображение или, скажем, в геологоразведке используется такой признак, как электрическое сопротивление зонда, введенного в породу, прибегают к квантованию характеристики признака по уровню.
Так, если сопротивление превышает некоторый порог, то в к-м разряде записывается нуль, в противном случае — единица. Иногда приходится разбивать диапазон изменения сопротивления на несколько уровней и вводить соответственно несколько признаков для описания. В табл. 9-5 показаны примеры такого кодирования. Если физический параметр удовлетворяет неравенству (или другому условию), записанному в ааголовке столбца, то в соответствующей строке ставится единица; если не удовлетворяет — ставится нуль. 302 Таб.тица 9-б, а 1 Класс — вефтекоскые пласты 1 0 2 0 0 Таблица б-б,б 11 класс — водоносные пласты Коды М пласта 11 17 ) 18 ) !4 16 17 18 6 7 8 9 19 В результате описанной процедуры каждому из показанных объектов приписывается 77'-разрядное двоичное число, где 77'— число прианаков, т.