CBRR0915 (719125), страница 6
Текст из файла (страница 6)
Л Е К Ц И Я 2.2
Формулировка задач создания систем
распознавания и методы их решения
ЗАДАЧА № 1
Определение полного перечня признаков (параметров), характеризующих объекты или явления, для которых данная система разрабатывается.
В решении этой задачи - главное найти все признаки, характеризующие существо распознаваемых объектов (явлений). Любые ограничения, любая неполнота, как мы в последующем убедимся, приводят к ошибкам или полной невозможности правильной классификации объектов (явлений).
Можем себе представить такую неполноту в уже рассмотренной нами задаче распознавания самолетов как использование одного признака - потолок высоты полета самолетов. В результате - бомбардировщики не удастся отличать от истребителей ( при создании бомбардировщиков стремятся к обеспечению максимально возможной высоты полета, а при создании истребителей добиваются, чтобы они могли уничтожать бомбардировщики).
Реально даже целая группа признаков может оказаться неэффективной.
Поэтому для решения 1-ой задачи создания СР необходимо найти все возможные признаки, описывающие объекты распознавания, с тем, чтобы при оценке эффективности решений системы не возвращаться к этой задаче, обнаружив ограниченность выбранных признаков на последующих этапах разработки.
Но чтобы назначать признаки распознавания, необходимо, во-первых, понять, что не существует способов их автоматической генерации. На сегодня это под силу только человеку. Поэтому говорят, что выбор признаков - эвристическая операция. Во-вторых, выбор признаков можно осуществлять, имея представление об их общих свойствах. С этих позиций достаточно принять, что признаки могут подразделяться на:
-детерминированные;
-вероятностные;
-логические;
-структурные.
А. Детерминированные признаки - это такие характеристики объектов или явлений, которые имеют конкретные и постоянные числовые значения.
Примерами детерминированных признаков могут быть, например, ТТХ бомбардировщиков и истребителей США (таблицы № 1, 2).
Числовые значения признаков по каждому из самолетов можно интерпретировать как координаты точек, представляющих каждый самолет в 11-мерном пространстве признаков.
Необходимо иметь в виду, что в задачах распознавания с детерминированными признаками ошибки измерения этих признаков не играют никакой роли, если, например, точность измерений такого признака, как размах крыльев самолета значительно выше (например, 1 мм), чем различие этого признака у разных классов самолетов (например, 10 м).
Представить такую систему, где используются детерминированные признаки не так трудно:
-распознавание принадлежности самолета, данные которого получены разведкой или из открытой печати и не привязаны к классам (бомбардировщик- А1, истребитель-А2 и т.п.);
-распознавание на конвейере деталей по отличию геометрических характеристик, если ошибки измерений существенно меньше разметов этих деталей.
Распознавание осуществляется путем сравнения полученных размеров с имеющимися в базе данных характеристиками деталей.
Б. Вероятностные признаки - это характеристики объекта (явления), носящие случайный характер.
С такими признаками в основном и имеют дело в природе и технике.
Отличаются эти признаки тем, что в силу случайности соответствующей величины признак одного класса может принимать значения из области значений других классов, каждый из которых подлежит распознаванию в системе.
Таблица № 1
Характеристики | Т и п ы с а м о л е т о в | |||
В-1А | В-52 | В-57А | FB-111 | |
Экипаж (чел.) | 4 | 6 | 2 | 2 |
Vmax (км\ч) при H=15 км | 2330 | 1020 | 935 | 2330 |
Vmin (км\ч) при H=0.3 км | 1200 | 500 | 500 | 1350 |
Потолок (м) | 15240 | 15000 | 13750 | 20000 |
Бомб.нагрузка (т) | 22 | 34 | 14 | 16 |
Макс.взлетная масса (т) | 180 | 221 | 25 | 45 |
Размах крыльев (м) | 42 | 56 | 19 | 21 |
Длина самолета (м) | 44 | 48 | 20 | 22 |
Кол-во двигателей | 4 | 8 | 2 | 2 |
Тяга двигателей (т) | 13.6 | 7.7 | 3.3 | 9.2 |
Дальность полета (км | 11000 | 20000 | 4380 | 6600 |
Таблица ¹ 2
Характериcòèêè | Т и п ы с а м о л е т о в | ||||
F - 4 E Фантом | F - 105 E Тандер-чиф | F - 15 Игл | F - 100 D Супер-сейбр | Хантер | |
Экипаж (чел.) | 2 | 2 | 1 | 1 | 1 |
Vmax (км\ч) при H =15 км | 2330 | 2230 | 2655 | 1400 | 1000 |
Vmin (км\ч) при H =0.3 (км) | 1470 | 1400 | 1470 | 1220 | 1150 |
Потолок (м) | 19000 | 15000 | 21000 | 15000 | 17000 |
Бомб.нагр. (т) | 7.2 | 6.4 | - | 3.4 | 0.9 |
Макс.взлетн. масса (т) | 26 | 24 | 25 | 18 | 11 |
Размах крыльев (м) | 12 | 11 | 14 | 11 | 10 |
Длина самолета (м) | 18 | 21 | 19 | 12 | 13 |
Кол-во двигателей | 2 | 1 | 2 | 1 | 1 |
Тяга двигателей (т) | 5.4 | 12 | 10.9 | 5.3 | 4.5 |
Дальность полета (км) | 885 | 760 | 1100 | 860 | 560 |
Если признак не может принять значений в области соответствующих значений для других классов, то, следовательно, имеем дело не с вероятностным, а с тем же детерминированным признаком. Это как раз подчеркивает, почему вероятностные системы являются системами более общего порядка.
Для того, чтобы можно было в условиях случайности говорить о возможности распознавания, следует потребовать, чтобы вероятности наблюдения значений признака в своем классе были как можно больше, чем в чужих. В противном случае данный признак не позволит построить СР, использующую описание классов на его основе. Эффективность его недостаточна для достоверного решения и необходимо искать другие признаки, имеющие большую разделительную способность.
Вспомним из теории вероятностей, чем характеризуется случайная величина - законом распределения вероятностей. То есть, точно так же законом распределения должен характеризоваться каждый вероятностный признак.
Вспомним и то, что в качестве законов распределения вероятностей в теории вероятностей выступают интегральная функция F(x) - интегральный закон или плотность распределения вероятностей (ПРВ) - дифференциальный закон f(x). При этом связь между ними:
Вспомним, что самый распространенный в природе закон распределения - нормальный или Гауссов - имеет ПРВ
Если предположить, что какой-либо вероятностный признак (например, размах крыльев, измеренный каким-либо средством измерений с ошибками) распределен по нормальному закону, то для 3-х условных классов, отличающихся размахами крыльев, распределения этого параметра будут выглядеть, как показано на рис.2.1.
Из рис. 2.1 видно, что если для неизвестного самолета мы с помощью упомянутого средства измерений определили размах крыльев Lкр с естественной случайной ошибкой , то с определенной вероятностью это измерение может быть отнесено к каждому из классов. Однако, легко заметить, что если это значение лежит ближе к одному из центров рассеяния (например, Mx1), то вероятность отнесения его к соответствующему распределению, а значит и классу, максимальная.
f
(Lкр)