_учебник_ Журавлев Ю.И. Распознавание. Математические методы. Программная система. Практические применения (2005) (1185318), страница 21
Текст из файла (страница 21)
Для обучения была использована информация, содержащаяся в историях болезней 50 пациентов 1586 окружного военного клинического госпиталя. Использование методов распознавания позволило создать прогностический алгоритм, общая точность которого составила 86% правильных прогнозов /14/.
4.2.4. Диагностика инсульта
Инсульт является одним из тяжелейших заболеваний с очень высокой летальностью. Известны два наиболее распространенных типа этого заболевания (ишемический и геморрагический), которые значительно отличаются по течению и по методам лечения. Задача диагностики типа инсульта является достаточно сложной даже для опытного врача. Вместе с тем учет типа инсульта является принципиально важным для организации правильного и эффективного лечения. В связи с этим была поставлена задача создания компьютерного метода диагностики типа инсульта по широкой совокупности клинических параметров, доступных для быстрого измерения. Для создания такого алгоритма было предложено использовать средства распознавания образов. Построение алгоритма проводилось по информации, содержащейся в историях болезней 301 пациента. В результате был построен диагностический алгоритм, имеющий точность 88% при распознавании ишемического инсульта и 71% при распознавании геморрагического инсульта, что примерно соответствует точности диагностики, достигнутой в лучших клиниках неврологического профиля.
4.2.5. Задача прогноза результатов лечения рака мочевого пузыря
Одним из наиболее успешных примеров использования иммунологических методов для лечения онкологических заболеваний является лечение рака мочевого пузыря путем введения в организм больного противотуберкулезной вакцины БЦЖ. Использование такого лечения приводит к исчезновению или значительному уменьшению опухоли примерно в 65% случаев. Важным является выявление на ранних этапах лечения тех пациентов, для которых данный метод не является эффективным, с целью проведения для них стандартного курса, основанного на химиотерапии и оперативном вмешательстве. Была поставлена задача прогноза результатов лечения по совокупности биохимических параметров. В результате был создан алгоритм, имеющий точность 85%.
4.2.6. Прогноз диабета
Рассматривалась задача предсказания наличия у пациента диабета по косвенным признакам. Замеры были взяты у 768 женщин племени Пима (Аризона, США), 268 из которых оказались больны диабетом. Для распознавания диабета использовались следующие восемь признаков: количество беременностей, концентрация глюкозы в плазме, диастолическое кровяное давление, толщина складки кожи в районе трицепса, 2-х часовой тест на содержание инсулина в крови, индекс массы тела, наследственная функция диабета, возраст. Точность построенного алгоритма распознавания составляла 77% правильных ответов. Логические закономерности достигали качества 20.5% (процент пациентов, на которых они выполнялись). Подобным примером является следующая конъюнкция: (x1 ≤ 9,5) & (154,5 ≤ x2 ≤ 197,5) & (69 ≤ x3 ≤ 105) & (x4 ≤ 42,5) & (x5 ≤ 479) (23,35 ≤ x6 ≤ 51,15) & (0,1365 ≤ x7 ≤ 1,263) & (21,5 ≤ x8 ≤ 57,5) .
Примечание. Автор постановки задачи и данных -
Vincent Sigillito (vgs@aplcen.apl.jhu.edu), Research Center, RMI Group Leader, Applied Physics Laboratory, The Johns Hopkins University, Johns Hopkins Road, Laurel, MD 20707.
4.2.7. Диагностика рака груди и распознавание меланомы
Задача диагностики рака груди рассматривалась по данным /72/. Обучающая выборка состояла из 344 эталонов, в том числе, 218 из класса « benign » и 126 из класса “malignant”. Для описания объектов использовались 9 признаков, принимающих целочисленные значения от 1 до 10:
1. Clump Thickness 1 – 10;
2. Uniformity of Cell Size 1 – 10;
3. Uniformity of Cell Shape 1 – 10;
4. Marginal Adhesion 1 – 10;
5. Single Epithelial Cell Size 1 – 10;
6. Bare Nuclei 1 – 10;
7. Bland Chromatin 1 – 10;
8. Normal Nucleoli 1 – 10;
9. Mitoses 1 - 10.
Контрольная выборка включала 355 объектов. Результаты, приведенные в таблице 8, показывают как высокую точность методов коллективного распознавания, так и являются иллюстрацией решения «простой задачи» - когда классы хорошо разделимы, тогда точность всех алгоритмов является высокой и примерно равной.
Методы распознавания | Процент правильных ответов на контрольной выборке |
Алгоритмы вычисления оценок | 95.5 |
Линейный дискриминант Фишера | 94.4 |
Линейная машина | 94.9 |
Логические закономерности | 94.9 |
Многослойный персептрон | 93.2 |
k – ближайших соседей | 95.2 |
Метод опорных векторов | 95.2 |
Статистически взвешенные синдромы | 94.4 |
Тестовый алгоритм | 93.0 |
КОЛЛЕКТИВНЫЕ РЕШЕНИЯ | |
Метод Байеса | 94.6 |
Области компетенции | 95.8 |
Голосование по большинству | 95.8 |
Выпуклый стабилизатор | 95.5 |
Шаблоны принятия решений | 95.2 |
Динамический метод Вудса | 94.6 |
Таблица 1. Результаты контрольных испытаний различных алгоритмов на задаче диагностики рака груди
Результаты, приведенные в таблице 1 показывают как высокую точность методов коллективного распознавания, так и являются иллюстрацией решения «простой задачи» - когда классы хорошо разделимы, тогда точность всех алгоритмов является высокой и примерно равной.
В таблице 2 приведены веса признаков, посчитанные с использованием метода «логические закономерности». Различия в их значениях незначительны, что свидетельствует об информативности всех признаков.
Анализ признаков | |
Вес признака №1 | 0.825 |
Вес признака №2 | 0.907 |
Вес признака №3 | 0.812 |
Вес признака №4 | 0.799 |
Вес признака №5 | 0.719 |
Вес признака №6 | 0.600 |
Вес признака №7 | 0.800 |
Вес признака №8 | 0.916 |
Вес признака №9 | 0.862 |
Таблица 2. Веса признаков
Наилучшей логической закономерностью второго класса является предикат P(x)=(2<=X3<=9)&(5<=X7), выполняющийся на 67% эталонов второго класса.
В трудах 9-й Скандинавской конференции (Швеция, г. Уппсала, 6-9 июня 1995 г.) были приведены предварительные результаты решения задачи распознавания меланомы по 32 признакам, первые 12 из которых описывают геометрическую форму новообразования кожи, последние 21 признак - ее радиологические характеристики /65/. Исходную информацию составила выборка из числовых строк, каждая из которых является 32-признаковым описанием либо злокачественной опухоли (класс 1) - malignant lesions, либо неопасного новообразования (класс 3) - benign lesions, либо “переходного, промежуточного состояния новообразования” (класс 2) - dysplastic pigmented skin lesions. Задача распознавания мелономы состояла в автоматическом отнесении некоторой строки из 32 чисел, являющейся описанием новообразования кожи некоторого пациента, к одному из трех вышеуказанных классов. Исходная информация была разбита на две таблицы, включающей представителей всех классов: таблицу обучения (17 объектов первого класса, 20 второго и 20 третьего) и таблицу контроля (12, 10 и 10 объектов соответствующих классов). Таблицы обучения и контроля в точности соответствуют экспериментам в /65/, там же приведены описания признаков.
Точность распознавания с помощью комбинаторно-логических методов на контрольной выборке составила 71.9%, что соответствует максимально достигнутой при сравнении с другими подходами. Следует отметить, что обучающая выборка объектов существенно непредставительна. В данной ситуации точность статистических методов существенно ниже (что подтверждается и публикацией /65/). При исключении из задачи промежуточного второго класса, т.е. ее сведения к ответу на вопрос «есть или нет злокачественное новообразование», точность диагностики превышает 90%.
4.2.8. Распознавание сужения сердечных сосудов.
Рассматривалась задача определения наличия сердечных заболеваний у людей из группы риска, с жалобами на боли в груди. Выборка содержит данные обследования 270 пациентов, у 120 из которых обнаружено более чем 50% сокращение диаметра крупных сосудов. Результаты обследования пациента выражаются в виде 13 признаков, таких как возраст, количество холестерина в сыворотке крови, кровяное давление, пульс, локация болей и другие. Точность распознавания в данной задаче с двумя классами составила более 83% в режиме скользящего контроля. Особенность информации – разнотипные признаки.
Примечание. Авторы постановки задачи и данных -
1. Hungarian Institute of Cardiology. Budapest: Andras Janosi, M.D.
2. University Hospital, Zurich, Switzerland: William Steinbrunn, M.D.
3. University Hospital, Basel, Switzerland: Matthias Pfisterer, M.D.
4. V.A. Medical Center, Long Beach and Cleveland Clinic Foundation:
Robert Detrano, M.D., Ph.D.
4.3. Приложения в области техники
4.3.1. Диагностика состояний нефтепромыслового оборудования в отношении солеобразования
В процессе эксплуатации нефтепромыслового оборудования возникают негативные процессы, существенно осложняющие нефтедобычу. Так, обводнение нефтяных скважин в условиях интенсивной разработки месторождений во многих случаях приводит к образованию неорганических солей (обычно карбоната кальция). Последующее их отложение в нефтепромысловом оборудовании (НПО) существенно усложняет эксплуатацию скважин, приводит к поломке погружных электроцентробежных насосов, значительно сокращает межремонтный период работы скважин.
Эффективность борьбы с отложением солей в НПО находится в прямой зависимости от времени обнаружения процесса солеобразования, непосредственное наблюдение которого практически недоступно в процессе эксплуатации скважин. Таким образом, внедрение эффективной методики диагностики состояния скважин в отношении солеобразования является необходимым условием успешной борьбы с солеотложением в НПО.
Традиционные методы диагностики основаны на экспертной оценке прироста давления на буфере скважины, расчете моделей карбонатного равновесия по данным химического анализа попутно добываемых вод или гидродинамических расчетах добываемой смеси нефть-вода в окрестности забоя скважины. Точность их не высока. Для решения данной задачи диагностики использовались модели распознавания, основанные на вычислении оценок.
Для описания явления солеобразования использовались системы признаков, связанных, по мнению экспертов, с данным явлением и которые могут быть измерены в промышленных условиях: давление, температура, химический состав попутно добываемых вод, условия эксплуатации. Объектами распознавания являлись описания скважин с помощью 15—20 признаков, замеренных в один и тот же момент времени для фиксированной скважины. Таблицы обучения формировались из выборок описаний скважин, на которых было зафиксировано отложение солей (и, следовательно, наличие солеобразования) и выборок описаний скважин, на которых солеотложений зафиксировано не было. Данные две группы описаний использовались для описания класса солеобразующих и класса соленеобразующих скважин.