_учебник_ Журавлев Ю.И. Распознавание. Математические методы. Программная система. Практические применения (2005) (1185319), страница 24
Текст из файла (страница 24)
Для распознавания диабета использовалисьследующие восемь признаков: количество беременностей, концентрация глюкозы вплазме, диастолическое кровяное давление, толщина складки кожи в районе трицепса, 2-хчасовой тест на содержание инсулина в крови, индекс массы тела, наследственнаяфункция диабета, возраст.
Точность построенного алгоритма распознавания составляла77% правильных ответов. Логические закономерности достигали качества 20.5% (процент115пациентов, на которых они выполнялись). Подобным примером является следующаяконъюнкция: (x1 ≤ 9,5) & (154,5 ≤ x2 ≤ 197,5) & (69 ≤ x3 ≤ 105) & (x4 ≤ 42,5) & (x5 ≤ 479)(23,35 ≤ x6 ≤ 51,15) & (0,1365 ≤ x7 ≤ 1,263) & (21,5 ≤ x8 ≤ 57,5) .Примечание. Автор постановки задачи и данных Vincent Sigillito (vgs@aplcen.apl.jhu.edu), Research Center, RMI Group Leader, AppliedPhysics Laboratory, The Johns Hopkins University, Johns Hopkins Road, Laurel, MD 20707.4.2.7. Диагностика рака груди и распознавание меланомыЗадача диагностики рака груди рассматривалась по данным /72/.
Обучающаявыборка состояла из 344 эталонов, в том числе, 218 из класса « benign » и 126 из класса“malignant”. Для описания объектов использовались 9 признаков, принимающихцелочисленные значения от 1 до 10:1. Clump Thickness1 – 10;2. Uniformity of Cell Size1 – 10;3. Uniformity of Cell Shape 1 – 10;4. Marginal Adhesion1 – 10;5. Single Epithelial Cell Size 1 – 10;6. Bare Nuclei1 – 10;7. Bland Chromatin1 – 10;8. Normal Nucleoli1 – 10;9. Mitoses1 - 10.Контрольная выборка включала 355 объектов.
Результаты, приведенные втаблице 8, показывают как высокую точность методов коллективного распознавания, таки являются иллюстрацией решения «простой задачи» - когда классы хорошо разделимы,тогда точность всех алгоритмов является высокой и примерно равной.Методы распознаванияПроцентправильных ответов наконтрольной выборкеАлгоритмы вычисления оценок95.5Линейный дискриминант Фишера94.4Линейная машина94.9Логические закономерности94.9Многослойный персептрон93.2k – ближайших соседей95.2Метод опорных векторов95.2Статистически взвешенные синдромы94.4Тестовый алгоритм93.0116КОЛЛЕКТИВНЫЕ РЕШЕНИЯМетод Байеса94.6Области компетенции95.8Голосование по большинству95.8Выпуклый стабилизатор95.5Шаблоны принятия решений95.2Динамический метод Вудса94.6Таблица 1.
Результаты контрольных испытаний различных алгоритмов на задаче диагностики рака грудиРезультаты, приведенные в таблице 1 показывают как высокую точностьметодов коллективного распознавания, так и являются иллюстрацией решения «простойзадачи» - когда классы хорошо разделимы, тогда точность всех алгоритмов являетсявысокой и примерно равной.В таблице 2 приведены веса признаков, посчитанные с использованием метода«логическиезакономерности».Различиявихзначенияхнезначительны,чтосвидетельствует об информативности всех признаков.Анализ признаковВес признака №1 0.825Вес признака №2 0.907Вес признака №3 0.812Вес признака №4 0.799Вес признака №5 0.719Вес признака №6 0.600Вес признака №7 0.800Вес признака №8 0.916Вес признака №9 0.862Таблица 2.
Веса признаковНаилучшейлогическойзакономерностьювторогоклассаявляетсяпредикатP(x)=(2<=X3<=9)&(5<=X7), выполняющийся на 67% эталонов второго класса.В трудах 9-й Скандинавской конференции (Швеция, г. Уппсала, 6-9 июня 1995 г.)были приведены предварительные результаты решения задачи распознавания меланомыпо 32 признакам, первые 12 изкоторыхописываютгеометрическуюформуновообразования кожи, последние 21 признак - ее радиологические характеристики /65/.Исходную информацию составила выборка из числовых строк, каждая из которыхявляется 32-признаковым описанием либо злокачественной опухоли (класс 1) - malignantlesions, либо неопасного новообразования (класс 3) - benign lesions, либо “переходного,промежуточного состояния новообразования” (класс 2) - dysplastic pigmented skin lesions.Задача распознавания мелономы состояла в автоматическом отнесении некоторой строки117из 32 чисел, являющейся описанием новообразования кожи некоторого пациента, кодному из трех вышеуказанных классов.
Исходная информация была разбита на дветаблицы, включающей представителей всех классов: таблицу обучения (17 объектовпервого класса, 20 второго и 20 третьего) и таблицу контроля (12, 10 и 10 объектовсоответствующих классов). Таблицы обучения и контроля в точности соответствуютэкспериментам в /65/, там же приведены описания признаков.Точность распознавания с помощью комбинаторно-логических методов на контрольнойвыборке составила 71.9%, что соответствует максимально достигнутой при сравнении сдругими подходами. Следует отметить, что обучающая выборка объектов существеннонепредставительна. В данной ситуации точность статистических методов существеннониже(чтоподтверждаетсяипубликацией/65/).Приисключениииззадачипромежуточного второго класса, т.е.
ее сведения к ответу на вопрос «есть или нетзлокачественное новообразование», точность диагностики превышает 90%.4.2.8. Распознавание сужения сердечных сосудов.Рассматривалась задача определения наличия сердечных заболеваний у людей изгруппы риска, с жалобами на боли в груди. Выборка содержит данные обследования 270пациентов, у 120 из которых обнаружено более чем 50% сокращение диаметра крупныхсосудов. Результаты обследования пациента выражаются в виде 13 признаков, таких каквозраст, количество холестерина в сыворотке крови, кровяное давление, пульс, локацияболей и другие.
Точность распознавания в данной задаче с двумя классами составилаболее 83% в режиме скользящего контроля. Особенность информации – разнотипныепризнаки.Примечание. Авторы постановки задачи и данных 1. Hungarian Institute of Cardiology. Budapest: Andras Janosi, M.D.2. University Hospital, Zurich, Switzerland: William Steinbrunn, M.D.3. University Hospital, Basel, Switzerland: Matthias Pfisterer, M.D.4.
V.A. Medical Center, Long Beach and Cleveland Clinic Foundation:Robert Detrano, M.D., Ph.D.4.3. Приложения в области техники4.3.1. Диагностика состояний нефтепромыслового оборудования в отношениисолеобразованияВ процессе эксплуатации нефтепромыслового оборудования возникают негативныепроцессы, существенно осложняющие нефтедобычу.
Так, обводнение нефтяных скважин118в условиях интенсивной разработки месторождений во многих случаях приводит к образованию неорганических солей (обычно карбоната кальция). Последующее их отложение внефтепромысловом оборудовании (НПО) существенно усложняет эксплуатацию скважин,приводит к поломке погружных электроцентробежных насосов, значительно сокращаетмежремонтный период работы скважин.Эффективность борьбы с отложением солей в НПО находится в прямойзависимости от времени обнаружения процесса солеобразования, непосредственноенаблюдение которого практически недоступно в процессе эксплуатации скважин. Такимобразом, внедрение эффективной методики диагностики состояния скважин в отношениисолеобразования является необходимым условием успешной борьбы с солеотложением вНПО.Традиционные методы диагностики основаны на экспертной оценке приростадавления на буфере скважины, расчете моделей карбонатного равновесия по даннымхимического анализа попутно добываемых вод или гидродинамических расчетахдобываемой смеси нефть-вода в окрестности забоя скважины.
Точность их не высока. Длярешения данной задачи диагностики использовались модели распознавания, основанныена вычислении оценок.Для описания явления солеобразования использовались системы признаков,связанных, по мнению экспертов, с данным явлением и которые могут быть измерены впромышленныхусловиях:давление,температура,химическийсоставпопутнодобываемых вод, условия эксплуатации. Объектами распознавания являлись описанияскважин с помощью 15—20 признаков, замеренных в один и тот же момент времени дляфиксированной скважины.
Таблицы обучения формировались из выборок описанийскважин, на которых было зафиксировано отложение солей (и, следовательно, наличиесолеобразования)ивыборокописанийскважин,накоторыхсолеотложенийзафиксировано не было. Данные две группы описаний использовались для описаниякласса солеобразующих и класса соленеобразующих скважин.Численные расчеты проводились по данным месторождений п/о Юганскнефтегаз ип/о Нижневартовскнефтегаз с использованием различных систем признаков.