Комаров_942 (1231763), страница 3
Текст из файла (страница 3)
1.2.5 Лингвистические (структурные) методы
Лингвистические методы распознавания образов основаны на использовании специальных грамматик, порождающих языки, с помощью которых может описываться совокупность свойств распознаваемых объектов.
Для различных классов объектов выделяются непроизводные (атомарные) элементы (подобразы, признаки) и возможные отношения между ними. Грамматикой называют правила построения объектов из этих непроизводных элементов.
Таким образом, каждый объект представляет собой совокупность непроизводных элементов, «соединенных» между собой теми или иными способами или, другими словами, «предложением» некоторого «языка». Хотелось бы особо подчеркнуть очень значительную мировоззренческую ценность этой мысли.
Путем синтаксического анализа (грамматического разбора) «предложения» определяется его синтаксическая «правильность» или, что эквивалентно, может ли некоторая фиксированная грамматика, описывающая класс, породить имеющееся описание объекта.
Однако
Параметр length. Данный параметр ограничивает минимально допустимую длину границ в пикселях. Как правило, короткие рёбра не очень надёжны и могут быть результатом зашумления изображений. Целесообразно ограничить минимальную длину границ, как при обучении, так и при анализе. Данный параметр может принимать значения от 0 и до бесконечности. Параметр 0 означает, что минимальная длина границ неограниченна. По умолчанию используется значение 50.
Параметр length. Данный параметр ограничивает минимально допустимую длину границ в пикселях. Как правило, короткие рёбра не очень надёжны и могут быть результатом зашумления изображений. Целесообразно ограничить минимальную длину границ, как при обучении, так и при анализе. Данный параметр может принимать значения от 0 и до бесконечности. Параметр 0 означает, что минимальная длина границ неограниченна. По умолчанию используется значение 50.
1.2.6 Экстенсиональные методы
В методах данной группы, в отличие от интенсионального направления, каждому изучаемому объекту в большей или меньшей мере придается самостоятельное диагностическое значение. По своей сути эти методы близки к клиническому подходу, который рассматривает людей не как проранжированную по тому или иному показателю цепочку объектов, а как целостные системы, каждая из которых индивидуальна и имеет особенную диагностическую ценность. Такое бережное отношение к объектам исследования не позволяет исключать или утрачивать информацию о каждом отдельном объекте, что происходит при применении методов интенсионального направления, использующих объекты только для обнаружения и фиксации закономерностей поведения их атрибутов.
Основными операциями в распознавании образов с помощью обсуждаемых методов являются операции определения сходства и различия объектов. Объекты в указанной группе методов играют роль диагностических прецедентов. При этом в зависимости от условий конкретной задачи роль отдельного прецедента может меняться в самых широких пределах: от главной и определяющей и до весьма косвенного участия в процессе распознавания. В свою очередь условия задачи могут требовать для успешного решения участия различного количества диагностических прецедентов: от одного в каждом распознаваемом классе до полного объема выборки, а также разных способов вычисления мер сходства и различия
Параметр length. Данный параметр ограничивает минимально допустимую длину границ в пикселях. Как правило, короткие рёбра не очень надёжны и могут быть результатом зашумления изображений. Целесообразно ограничить минимальную длину границ, как при обучении, так и при анализе. Данный параметр может принимать значения от 0 и до бесконечности. Параметр 0 означает, что минимальная длина границ неограниченна. По умолчанию используется значение 50.
1.2.7 Метод сравнения с прототипом
Это наиболее простой экстен
Параметр length. Данный параметр ограничивает минимально допустимую длину границ в пикселях. Как правило, короткие рёбра не очень надёжны и могут быть результатом зашумления изображений. Целесообразно ограничить минимальную длину границ, как при обучении, так и при анализе. Данный параметр может принимать значения от 0 и до бесконечности. Параметр 0 означает, что минимальная длина границ неограниченна. По умолчанию используется значение 50.
Для классификации неизвестного объекта находится ближайший к нему прототип, и объект относится к тому же классу, что и этот прототип. Очевидно, никаких обобщенных образов классов в данном методе не формируется.
В качестве меры близости могут применяться различные типы расстояний. Часто для дихотомических признаков используется расстояние Хэмминга, которое в данном случае равно квадрату евклидова расстояния. При этом решающее правило классификации объектов эквивалентно линейной решающей функции.
Указанный факт следует особо отметить. Он наглядно демонстрирует связь прототипной и признаковой репрезентации информации о структуре данных. Пользуясь приведенным представлением, можно, например, любую традиционную измерительную шкалу, являющуюся линейной функцией от значений дихотомических признаков, рассматривать как гипотетический диагностический прототип. В свою очередь, если анализ пространственной структуры распознаваемых классов позволяет сделать вывод об их геометрической компактности, то каждый из этих классов достаточно заменить одним прототипом, который фактически эквивалентен линейной диагнос
Параметр length. Данный параметр ограничивает минимально допустимую длину границ в пикселях. Как правило, короткие рёбра не очень надёжны и могут быть результатом зашумления изображений. Целесообразно ограничить минимальную длину границ, как при обучении, так и при анализе. Данный параметр может принимать значения от 0 и до бесконечности. Параметр 0 означает, что минимальная длина границ неограниченна. По умолчанию используется значение 50.
На практике, безусловно, ситуация часто бывает отличной от описанного идеализированного п
Параметр length. Данный параметр ограничивает минимально допустимую длину границ в пикселях. Как правило, короткие рёбра не очень надёжны и могут быть результатом зашумления изображений. Целесообразно ограничить минимальную длину границ, как при обучении, так и при анализе. Данный параметр может принимать значения от 0 и до бесконечности. Параметр 0 означает, что минимальная длина границ неограниченна. По умолчанию используется значение 50.
Во-первых, это выбор меры близости (метрики), от которого может существенно измениться пространственная конфигурация распределения объектов. Во-вторых, самостоятельной проблемой является анализ многомерных структур экспериментальных данных. Обе эти проблемы особенно остро встают перед исследователем в условиях высокой размерности пространства признаков, характерной для реальных задач.
1.2.8 Метод k ближайших соседей
Метод k ближайших соседей для решения задач дискриминантного анализа был впервые предложен еще в 1952 году. Он заключается в следующем.
При классификации неизвестного объекта находится заданное число (k) геометрически ближайших к нему в пространстве признаков других объектов (ближайших соседей) с уже известной принадлежностью к распознаваемым классам. Решение об отнесении неизвестного объекта к тому или иному диагностическому классу принимается путем анализа информации об этой известной принадлежности его ближайших соседей, например, с помощью простого подсчета голосов.
Первоначально метод k ближайших соседей рассматривался как непараметрический метод оценивания отношения правдоподобия. Для этого мето
Параметр length. Данный параметр ограничивает минимально допустимую длину границ в пикселях. Как правило, короткие рёбра не очень надёжны и могут быть результатом зашумления изображений. Целесообразно ограничить минимальную длину границ, как при обучении, так и при анализе. Данный параметр может принимать значения от 0 и до бесконечности. Параметр 0 означает, что минимальная длина границ неограниченна. По умолчанию используется значение 50.
При использовании метода k ближайших соседей для распознавания образов исследователю приходится решать сложную проблему выбора метрики для определения близости диагностируемых объектов. Эта проблема в условиях высокой размерности п
Параметр length. Данный параметр ограничивает минимально допустимую длину границ в пикселях. Как правило, короткие рёбра не очень надёжны и могут быть результатом зашумления изображений. Целесообразно ограничить минимальную длину границ, как при обучении, так и при анализе. Данный параметр может принимать значения от 0 и до бесконечности. Параметр 0 означает, что минимальная длина границ неограниченна. По умолчанию используется значение 50.
Необходимость уменьшения числа объектов в обучающей выборке (диагностических прецедентов) является недостатком данного метода, так как уменьшает представительность обучающей выборки.
1.2.9 Алгоритмы вычисления оценок
Принцип действия алгоритмов вычисления оценок (АВО) состоит в вычислении приоритетов (оценок сходства), характеризующих «близость» распознаваемого и эталонных объектов по системе ансамблей признаков, представляющей собой систему подмножеств заданного множества признаков.
В
Параметр length. Данный параметр ограничивает минимально допустимую длину границ в пикселях. Как правило, короткие рёбра не очень надёжны и могут быть результатом зашумления изображений. Целесообразно ограничить минимальную длину границ, как при обучении, так и при анализе. Данный параметр может принимать значения от 0 и до бесконечности. Параметр 0 означает, что минимальная длина границ неограниченна. По умолчанию используется значение 50.
Используемые сочетания признаков (подпространства) авторы называют опорными множествами
Параметр length. Данный параметр ограничивает минимально допустимую длину границ в пикселях. Как правило, короткие рёбра не очень надёжны и могут быть результатом зашумления изображений. Целесообразно ограничить минимальную длину границ, как при обучении, так и при анализе. Данный параметр может принимать значения от 0 и до бесконечности. Параметр 0 означает, что минимальная длина границ неограниченна. По умолчанию используется значение 50.
Еще одним расширением АВО является то, что в данных алгоритмах задача определения сходства и различия объектов формулируется как параметрическая и выделен этап настройки АВО по обучающей выборке, на котором подбираются оптимальные значения введенных параметров. Критерием качества служит ошибка распознавания, а параметризуется буквально все:
- правила вычисления близости объектов по отдельным признакам;
- правила вычисления близости объектов в подпространствах признаков;
- степень важности того или иного эталонного объекта как диагностического прецедента;
- значимость вклада каждого опорного множества признаков в итоговую оценку сходства распознаваемого объекта с каким-либо диагностическим классом.
Параметры АВО задаются в виде значений порогов и (или) как веса указанных составляющих. Теоретические возможности АВО по крайней мере не ниже возможностей любого другого алгоритма распознавания образов, так как с помощью АВО могут быть реализованы все мыслимые операции с исследуемыми объектами.















