ММО3 (1185328)
Текст из файла
4.5 Методы, основанные на голосовании по системам логических закономерностей
Одним из эффективных подходов к решению задач прогнозирования и распознавания является использование коллективных решений по системам закономерностей. Под закономерностью понимается распознающий или прогностический алгоритм, определённый на некоторой подобласти признакового пространства или связанный с некоторым подмножеством признаков.
В качестве примера закономерностей могут быть приведены представительные наборы, являющиеся по сути подмножествами признаковых описаний, характерных для одного из распознаваемых классов. Аналогом представительный наборов в задач с вещественнозначной информацией являются логические закономерности классов. Под логической закономерностью класса понимается область признакового пространства, имеющая ф
орму гиперпараллелепипеда и содержащая только объекты из
..
Рис. На рисунке представлена логическая закономерность, содержащая объекты класса , обозначенные синим кружком, и не содержащая объектов обозначенных по другому классов
и
Математически логическая закономерность класса , которую мы будем обозначать
, описывается с помощью наборов предикатов вида
, (1)
где .
Напомним, что предикатом называется утверждение, принимающее значения «ИСТИНА» или «ЛОЖЬ» в зависимости от значений входящих в них переменных. Полностью логическая закономерность задаётся конъюнкцией предикатов вида (1):
(2)
Очевидно, что множество векторов , для которых, как раз представляет собой гиперпараллелепипед в многомерном пространстве признаков. Не все признаки являются на самом деле существенными для закономерности
. Для несущественного признака
отрезок
совпадает с отрезком, из которого принимает значения признак
.
На этапе обучения для каждого класса строится множество логических закономерностей
. Границы
подбираются таким образом, чтобы равенство
«ИСТИНА» выполнялось бы на максимально большом числе объектов обучающей выборки из класса
и равенство
«ЛОЖЬ» выполнялось бы на всех объектах обучающей выборки из класса
. Наряду с полными логическими закономерностями, удовлетворяющими последним условиям, используются также частичные логические закономерности, для которых допускается попадание в них небольшой доли объектов чужих классов. Методы построения логических закономерностей подробно излагаются в работе [11], а также книге [9].
Предположим, что нам требуется распознать новый объект . Для каждого класса
ищется число закономерностей в
, для которых
«ИСТИНА». В качестве оценки за класс
используется доля таких закономерностей в
. Классификация
производится с помощью стандартного решающего правила. То есть объект относится в тот класс, оценка за который максимальна.
4.6 Метод мультимодельных статистически взвешенных синдромов
Метод мультимодельных статистически взвешенных синдромов является методом распознавания, основанном на принятии коллективных решений по системам синдромов. Под "синдромом" понимается такая область признакового пространства, в которой содержание объектов одного из классов, отличается от содержания объектов этого класса в обучающей выборке или по крайней мере в одной из соседних областях. Синдромы ищутся для каждого из распознаваемых классов с помощью построения оптимальных разбиений интервалов допустимых значений единичных признаков или совместных двумерных областей допустимых значений пар признаков. Пример синдромов, характеризующих разделение двух классов , приведён на рисунке 2
Рис. 2 Внутри синдромов I (верхний слева) и II ( верхний справа) преобладают объекты класса , обозначенного
. Внутри синдрома IV преобладают объекты класса
. обозначенные +.
Поиск синдромов производится с использованием четырёх семейств разбиений, имеющих различный уровень сложности. Примеры разбиений для каждого из семейств приведены на рисунке 3. Семейство I включает всевозможные разбиения интервалов допустимых значений отдельных признаков на два интервала с помощью одной граничной точки. Семейство II включает всевозможные разбиения интервалов допустимых значений отдельных признаков на 3 интервала с помощью двух граничных точек. Семейство III включает всевозможные разбиения совместных
двумерных областей допустимых значений пар признаков на 4 подобласти с помощью двух граничных точек ( по одной точке для каждого из двух признаков).
Семейство IV включает всевозможные разбиения совместных двумерных областей допустимых значений пар признаков на 2 подобласти с помощью прямой граничной линии, произвольно ориентированной относительно координатных осей.
Рис 3. Примеры разбиений для каждого из четырёх семейств, используемых в методе СВС.
В ходе поиска выбирается разбиение с максимальным значением функционала качества. В различных вариантах метода используется два функционала качества, зависящих от обучающей выборки , распознаваемого класса
, и разбиения
:
- интегральный ;
- локальный .
Обозначим через элементы некоторого разбиения
. Пусть
является долей объектов класса
в обучающей выборке
.
- доля объектов
среди объектов, описания которых принадлежат элементу
,
- число объектов, описания которых принадлежат
. Интегральный функционал задаётся формулой
. В то время как локальный функционал задаётся формулой
Метод СВС, впервые предложенный в работе [13] был основан на использовании одномерных семейств разбиений. Позже была предложена модификация СВС –метод мультимодельные статистически взвешенных синдромов (МСВС) [25]. В методе МСВС наряду с одномерными семействами I и II используются также семейства III и IV. Синдромы, задаваемые некоторым оптимальным разбиением включаются в финальный набор, используемый в дальнейшем для распознавания новых объектов, если
удовлетворяет специальному критерию. В методе СВС для поиска синдромов используется интегральный функционал
. Для формирования финального набора используется простой критерий: все элементы оптимального разбиения
включаются в набор, если величина интегрального функционала
превышает задаваемый пользователем порог
. Опыт решения прикладных задач показывает, что эффективность распознавания достигается при значениях
, меняющихся от 2 до 10. Несколько более сложный критерий используется в методе МСВС. Для поиска синдромов используется локальный функционал
. Синдромы оптимального разбиения
включаются в финальный набор в случае выполнения неравенства
, где величина параметра
зависит от сложности используемой модели. Экперименты на прикладных задачах показали, что высокая эффективность достигается при
для простейших разбиений из семейства I и
для разбиений из семейства II-IV.
Предположим, что на этапе обучения для класса найдено множество синдромов
. Пусть описание
распознаваемого объекта
принадлежит синдромам
из множества
. Оценка
за класс
вычисляется по формуле
,
где - доля объектов класса
в синдроме
,
- вес синдрома при классификации объектов класса
, который вычисляется по формуле
, где
- число объектов обучающей выборки, попавших в синдром
. Данная формула была получена в работе [] через максимизацию специального функционала, сходного с функционалом правдоподобия.
4.7 Метод опорных векторов.
4.7.1 Линейная разделимость.
Принцип максимизации зазора. Метод опорных векторов является универсальным методом распознавания, позволяющим наряду с линейными реализовывать также нелинейные решающие правила. Исходный вариант метода был предложен для задач с двумя распознаваемыми классами и
. В случаях, когда объекты разных классов в обучающей выборке линейно разделимы, обычно существует целая совокупность линейных поверхностей, осуществляющих такое разделение. На рисунке 1 представлены двумерные данные, где объекты двух классов могут быть раделены с помощью прямых A, B, C, D. Однако наша интуиция, подсказывает что наилучшей обобщающей способностью должна обладать разделяющая прямая F, одинаково удалённая от групп объектов из разных классов. Однако наша интуиция, подсказывает что наилучшей обобщающее
й способностью должна обладать разделяющая прямая F, одинаково удалённая от групп объектов из разных классов.
Рис. 1 Иллюстрируются различные варианты разделения классов и
.с помощью линейных границ.
Интуитивные представления об оптимальной разделимости формализует проведение разделяющей гиперплоскости посередине между двумя параллельными гиперплоскостями, каждая из которых отделяет объекты одного из классов. При этом две плоскости строятся таким образом, чтобы «зазор» между ними был бы максимальным.
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.