_учебник_ Журавлев Ю.И. Распознавание. Математические методы. Программная система. Практические применения (2005) (_учебник_ Журавлев Ю.И. Распознавание. Математические методы. Программная система. Практические применения (2005).pdf), страница 3
Описание файла
PDF-файл из архива "_учебник_ Журавлев Ю.И. Распознавание. Математические методы. Программная система. Практические применения (2005).pdf", который расположен в категории "". Всё это находится в предмете "(ммо) методы машинного обучения" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 3 страницы из PDF
Метод к-ближайших соседей.Классический статистический метод. Распознаваемый объект относится в тот класс, изкоторого он имеет максимальное число «соседей». Оптимальное число соседей иаприорные вероятности классов оцениваются по обучающей выборке /19/.8. Нейросетевая модель распознавания с обратным распространениемСоздана модификация известного метода обучения нейронной сети распознаваниюобразов (метод обратного распространения ошибки). В качестве критерия качестватекущих параметров нейронной сети используется гибридный критерий, учитывающийкак сумму квадратов отклонений значений выходных сигналов от требуемых, так иколичество ошибочных классификаций на обучающей выборке /57/.9.
Метод опорных векторов.Метод построения нелинейной разделяющей поверхности с помощью опорных векторов.В новом признаковом пространстве (спрямляющем пространстве) строится оптимальнаяразделяющая гиперплоскость, представляющая собой нелинейную поверхность висходном признаковом пространстве. Построение данной поверхности сводится крешению задачи квадратичного программирования /62/.10. Алгоритмы решения задач распознавания коллективами различныхраспознающих алгоритмов.Задача распознавания решается в два этапа.
Сначала независимо применяются различныеалгоритмы Системы. Далее автоматически находится оптимальное коллективное решение10с помощью специальных методов-«корректоров». В качестве корректирующих методовиспользуются различные подходы /25, 26, 69, 84/.11. Методы кластерного анализа (автоматической классификации или обучения безучителя) /19/.Используются следующие известные подходы:- алгоритмы иерархической группировки;- кластеризация c критерием минимизации суммы квадратов отклонений;- метод к-средних.Возможно решение задачи классификации как при заданном, так и неизвестном числеклассов.12.
Алгоритм построения коллективных решений задачи кластеризации.Задача кластеризации решается в два этапа. Сначала находится набор различных решений(в виде покрытий или разбиений) при фиксированном числе кластеров с помощьюразличныхалгоритмовСистемы.Далеенаходитсяоптимальнаяколлективнаякластеризация в результате решения специальной дискретной оптимизационной задачи/50/.Поскольку для практического пользователя важнейшим моментом является оценкаточности распознавания алгоритмов при решении новых задач, разработаны программныесредства автоматического контроля качества распознавания и прогноза, а также оценкизнаний.
Система разработана для персональных компьютеров Pentium 200 и выше подуправлением операционных систем Windows 95 OSR2, Windows 2000, Windows XP.Система ориентирована на широкий круг пользователей различной квалификациидля поддержки принятия оптимальных прогнозных и диагностических решений вразличных областях производственной и социальной сферы:-обработка данных социологических опросов;-прогнозирование тенденций изменения макроэкономических показателей;-анализ финансовых данных и прогноз финансовых показателей;-оценка экономического состояния предприятий и перспектив их инвестирования;-проблемы прогнозирования экологических последствий по малым выборкампрецедентов;-широкий круг задач медицины, связанных с созданием систем поддержки принятиядиагностических решений, обработкой медицинской статистики, анализа эффективностилекарств и прогноза последствий лечения;-задачи геологического прогнозирования;11-задачиэкспериментальнойфизики,связанныесанализомнакопленногоэкспериментального материала на этапах выявления качественных взаимосвязей междуфизическими параметрами и созданием приближенных математических моделей;-задачи прогнозирования свойств новых органических соединений в химии на основеимеющегося банка исследованных органических соединений;-обработка и анализ данных в биологии, с целью оптимизации селекционных игенетических исследований;-обширный круг задач распознавания изображений.Основные отличительные признаки созданного продукта от имеющихся аналогов состоятв следующем:- разнообразие имеющихся методов и более широкие их практические возможности;- способность автоматической обработки больших массивов данных;- возможность решения задач прогноза и распознавания редких или уникальных событийи процессов (исследование непредставительных или мало репрезентативных выборок);- способность обработки разнотипных, частично-противоречивых и неполных данных;- использование оригинальных разработок авторов (алгоритмы вычисления оценок,модели частичной прецедентности, коллективные методы распознавания и кластеризации,и другие), отсутствующих в аналогах данного проекта;- способность автоматического анализа данных и выработки прогнозных решений.Настоящая система и ее предшественники (пакеты прикладных программ ПАРК/29/, ОБРАЗ /9/, диалоговая система ДИСАРО /23/, системы ЛОРЕГ /6/ и TaxonSearch /79/)использовались для решения и исследования многочисленных прикладных задач, многиеиз которых получили практическое внедрение.Приложения в области бизнеса и финансов:- оценка стоимости квартир по ее внутренним и внешним характеристикам (жилаяплощадь, строительный материал дома, местонахождение, этаж, удаленность от станцииметро, и др.;- оценка экономического состояния предприятий легкой промышленности по комплексуфинансовых показателей и структуре рабочего персонала;- подтверждение кредитных карточек;- оценка стоимости жилья в частном секторе г.Бостона;- распознавание типа движущихся объектов по комплексу акустических и сейсмическихпризнаков с целью создания автоматических охранных систем.Приложения в медицине и здравоохранении:- кластеризация возрастных распределений населения12- распознавание рака груди;- прогноз результатов лечения остеогенной саркомы;- прогноз динамики депрессивных синдромов;- диагностика инсульта;- прогноз результатов лечения рака мочевого пузыря;- прогноз состояния пациента через год после сердечного приступа по даннымэхокардиограмм;- диагностика сердечных сосудов;- прогноз летального исхода при гепатите;- прогноз диабета;- диагностика меланомы по комплексу геометрических и радиологических признаков;- оценка степени тяжести заболевания пневмонией.Задачи технической диагностики:- распознавание солеобразования в нефтедобывающем оборудовании;- контроль состояния технических устройств.Приложения в сельском хозяйстве:- прогноз урожайности пшеницы по состоянию посевов за 2 и за 4 недели до созревания;- распознавание преобладающих пород в лесных массивах по данным дистанционногозондирования.Приложения в химии, физике и биологии:- распознавание мест локализации протеина;- прогноз свойств твердых сплавов стали;- прогноз свойств новых неорганических соединений;- распознавание наличия особенностей в ионосфере по виду отраженного сигнала.Приложения в геологии:- распознавание месторождений редких металлов и нефти.Приложения в области обработки изображений:- распознавание рукописных цифр;- распознавание трехмерных объектов.Иллюстративные примеры практических применений системы РАСПОЗНАВАНИЕприведены в четвертой главе.НастоящаямонографиявыполненаприподдержкеРоссийскогофондафундаментальных исследований (проекты №02-01-08007 инно, 02-01-00558, 03-01-00580,02-07-90134,02-07-90137)иПрограммы№17«Параллельныемногопроцессорные вычислительные системы» Президиума РАН.вычисленияи13Часть книги написана молодыми исследователями Бирюковым А.С.
(глава 5),Ветровым Д.П. (разд. 1.4.4, 3.6, 3.8, 3.10, 3.11, 3.12), Кропотовым Д.А. (разд. 3.7, 3.8, 3.10,3.11, 3.13). В авторский коллектив программной системы входят также и другиеисследователи: Докукин А.А., Катериночкина Н.Н., Обухов А.С., Романов М.Ю., РязановИ.В., Челноков Ф.Б.Практическая реализация системы РАСПОЗНАВАНИЕ выполнена в ООО «Центртехнологий анализа и прогнозирования «РЕШЕНИЯ» при поддержке Фонда содействияразвитию малых форм предприятий в научно-технической сфере. В следующей версиисистемы РАСПОЗНАВАНИЕ предполагается расширить пакет методов распознавания икластерного анализа. Будут включены решающие деревья в задачах распознавания, новыеалгоритмы поиска логических закономерностей, алгоритм восстановления компонентсмесей нормальных выборок и проекционный метод кластерного анализа, алгоритмыгенерации новых информативных сложных признаков и минимизации признаковыхпространств, новые средства визуализации данных и знаний.
Система будет адаптированадля решения задач прогнозирования дискретных событий по выборкам многомерныхданных. Дополнительная информация о системе, новости по ее модификации, а такжесведения о возможности ее приобретения размещаются по адресу http://www.solutionscenter.ru.Авторынадеются,чтокнигаиприложеннаядемо-версиясистемыРАСПОЗНАВАНИЕ будут полезны широкому кругу исследователей, бизнесменов,инженеров, студентов и аспирантов, интересующимся современными компьютернымисредствами анализа информации и извлечения знаний, а программная системаРАСПОЗНАВАНИЕ окажется эффективным инструментом для решения многих научных,производственных, финансовых и социальных практических задач.14Глава1.
Математические методы распознавания (классификации сучителем) и прогноза.1.1. Задачи распознавания или классификации с учителем.Исходной информацией являются описания объектов (ситуаций, предметов,явлений или процессов) S в виде векторов значений признаков для рассматриваемыхобъектов S ( x1 ( S ), x2 ( S ),..., xn ( S )) и значений некоторого «основного свойства» y(S)объекта S. Свойство y(S) принимает конечное число значений.Значения признаковxi , i 1,2,..., n , характеризующих различные стороны-свойства объектов S , для некоторыхобъектовS1 , S 2 ,..., S mфункциональнаясвязьсчитаютсяизвестными.между признакамииПредполагается,основнымчтосвойствомсуществует(неизвестнаяпользователю). Задача распознавания (прогноза, идентификации, «классификации сучителем») состоит в определении значения свойства y(S)некоторого объекта S поинформации S1 , S 2 ,..., S m , y ( S1 ), y ( S 2 ),..., y ( S m ) (обучающей или эталонной выборке).Таким образом, задача распознавания может быть представлена как специальная задачаэкстраполяции функции, зависящей от конечного числа разнотипных переменных –признаков, и заданной в виде таблицы значений в конечном числе точек.