ВОПРОСЫ АВТОМАТИЗИРОВАННОЙ МЕДИКО-ТЕХНИЧЕСКОЙ ДИАГНОСТИКИ (1050259), страница 4
Текст из файла (страница 4)
На основе приведенных данных можно сделать вывод о том, что целесообразнее пользоваться вторым алгоритмом, т. к. его «чувствительность» выше.
Из этого примера ясно, что применение алгоритма ИСОМАД к набору данных умеренной сложности в принципе позволяет получить интересные результаты только после проведения обширных экспериментов.
Выявление структуры данных может быть, однако, существенно ускоренно благодаря эффективному использованию информации, получаемой после каждого цикла итерационного процесса.
Эту информацию можно использовать для коррекции параметров процесса кластеризации непосредственно при реализации алгоритма. Для требуется доработка процедуры ИСОМАД.
Рис. 10.3. Результат обработки данных с помощью процедуры К
Рис. 10.4. Результат обработки данных с помощью процедуры ИСОМАД
Требование нахождения однозначной - четкой кластеризации элементов исследуемой области характеристических признаков заболевания является достаточно грубым и жестким. Особенно плохо это требование работает при решении таких слабо структурируемых задач, как дифференциальная диагностика ранних стадий заболеваний. Методы нечеткой кластеризации, основанные на аппарате нечетких множеств, ослабляют это требование в результате введения нечетких кластеров и соответствующих им функций принадлежности.
10.3. Аппарат нечетких множеств и описание биологических объектов
Человек способен принимать практически полезные решения в условиях неполной и неопределенной (нечеткой) информации. Поэтому построение моделей, использующих рассуждения человека и применение их в компьютерных системах представляет собой одну из важнейших научно-технических проблем. При количественном описании и построении моделей биологических объектов и систем для решения конкретных прикладных задач целесообразно, а в ряде случаев – и необходимо, использовать указанную способность человеческого интеллекта с тем, чтобы адекватно учесть специфику биообъектов. Мощным инструментом совместного решения этих проблем является математический аппарат, основы которого были разработаны в 1965 г. Лотфи Заде (Lotfi A. Zadeh).
В работе Заде «Fuzzy sets» было введено понятие нечеткого множества и операций над нечеткими множествами. Были обобщены известные методы логического вывода. На основе понятия лингвистической переменной и допущения о том, что в качестве значений этой переменной выступают нечеткие множества, был создан аппарат для описания процессов интеллектуальной деятельности, учитывающий нечеткость и неопределенность выражений человеческих суждений и оценок.
Значениями переменных могут быть слова или предложения естественного или формального языка, тогда соответствующие переменные называют лингвистическими. Так, например, нечеткая переменная «температура» может принимать следующие значения: «холодно», «комфортно», «жарко», «очень жарко» (Рис.10.5).
Рис. 10.5. Пример лингвистической переменной «температура»
Лингвистическая переменная является переменной более высокого порядка, чем нечеткая переменная, в том смысле, что значениями лингвистической переменной являются нечеткие переменные. Лингвистические переменные предназначены для анализа сложных или плохо определенных явлений. Использование словесных описаний типа тех, которыми оперирует человек, делает возможным анализ систем настолько сложных, что они недоступны обычному математическому описанию.
Структура лингвистической переменной описывается набором (N, T, X, G, M), где N - название переменной; T - терм-множество N, т.е. совокупность лингвистических значений переменной (нечетких переменных); X - универсальное множество с базовой переменной x; G - синтаксическое правило, которое может быть задано в форме бесконтекстной грамматики, порождающей термы множества T; M - семантическое правило, которое каждому лингвистическому значению t ставит в соответствие его смысл М(t), причем М(t) обозначает нечеткое подмножество множества X.
Значениями лингвистической переменной являются нечеткие множества, символами которых являются слова и предложения в естественном или формальном языке, служащие, как правило, некоторой элементарной характеристикой явления.
Язык можно рассматривать как соответствие между множеством терминов Т и областью рассуждения Х. Это соответствие характеризуется нечетким называющим отношением N из Т в Х, которое связывает с каждым термином t в Т и каждым элементом х в Х степень применимости t к х. Такое соответствие называют функцией принадлежности.
Для фиксированного t функция принадлежности определяет нечеткое подмножество М(t) из Х, которое является смыслом или значением t. Таким образом, значение термина t есть нечеткое подмножество М(t) из Х, для которого t служит символом.
Термин может быть элементарным, например t = высокий, или составным, когда он является сочетанием элементарных терминов, например, t = очень высокий.
Более сложные понятия могут характеризоваться составной лингвистической переменной. Например, понятие "человек" может рассматриваться как название составной лингвистической переменной, компонентами которой являются лингвистические переменные Возраст, Рост, Вес, Внешность и т.п.
Для лингвистической переменной «Возраст» соответствующая базовая переменная является по своей природе числовой переменной.
С другой стороны, для лингвистической переменной «Внешность» не имеется четко определенной базовой переменной. В этом случае функцию принадлежности определяют не на множестве математически точно определенных объектов, а на множестве обозначенных некими символами впечатлений.
Следует отметить, что благодаря использованию принципа обобщения большая часть существующего математического аппарата, применяющегося для анализа систем, может быть адаптирована к нечетким и лингвистическим переменным с числовой базовой переменной. Во втором случае способ обращения с лингвистическими переменными носит более качественный характер.
Нечеткая логика является многозначной логикой, что позволяет определить промежуточные значения для таких общепринятых оценок, как да|нет, истинно|ложно, черное|белое. Выражения подобные таким, как слегка тепло или довольно холодно возможно формулировать математически и, что крайне важно, программировать и обрабатывать на компьютерах.
Эффективность систем нечеткой логики базируется на следующих результатах:
-
В 1992г. Ванг (Wang) доказал теорему: для каждой вещественной непрерывной функции G(x), заданной на компакте U и для произвольного >0, существует нечеткая экспертная система, формирующая выходную функцию F(x) такую, что
, где || . || - символ нормы. Иными словами, для каждой вещественной непрерывной функции G(x) можно построить нечеткий аппроксиматор с заданной ошибкой аппроксимации.
-
Согласно теореме FAT (Fuzzy Approximation Theorem), доказанной Б. Коско (B. Kosco) в 1993 г., любая математическая система может быть аппроксимированна системой, основанной на нечеткой логике.
Системы с нечеткой логикой целесообразно применять в следующих случаях:
-
Для сложных процессов (биопроцессы являются таковыми), не допускающих построение «обычных» прогностических динамических моделей.
-
В тех случаях, когда экспертные знания об объекте или о процессе можно сформулировать главным образом в вербальной форме. Именно такие применения особенно актуальны для биомедицинских информационных систем.
Различия между обычными (четкими) множествами и нечеткими множествами целесообразно рассмотреть на примерах.
Пусть E - четкое универсальное множество, x - элемент множества E. R - некоторое свойство подмножества A универсального множества E, элементы которого удовлетворяют свойству R, определяется как множество упорядоченных пар A = {mA (х)/х}, где отношение mA(х) – называется характеристической функцией. mA(х) принимает значение 1, если x удовлетворяет свойству R, и 0 - в противном случае.
Наример, имеется множество E всех чисел x от 0 до 10. Определим подмножество A множества E всех действительных чисел от 5 до 8: закрытый интервал A = [5,8]. Свойством R элементов подмножества A является выполнение условия . Характеристическая функция множества A ставит в соответствие число 1 или 0 каждому элементу в X, в зависимости от того принадлежит данный элемент подмножеству A или нет (Рис.10.6).
Рис. 10.6. Характеристическая функция обычного (четкого) множества.
Нечеткое подмножество отличается от обычного тем, что для элементов x из E нет однозначного ответа "да-нет" относительно выполнения свойства R. В связи с этим, нечеткое подмножество A универсального множества E определяется как множество упорядоченных пар
A = {mA(х)/х},
где mA(х) - характеристическая функция принадлежности (функция принадлежности), принимающая значения в некотором вполне упорядоченном множестве M (например, M = [0,1]). Функция принадлежности указывает степень (или уровень) принадлежности элемента x подмножеству A. Множество M называют множеством принадлежностей. Если M = {0,1}, то нечеткое подмножество A может рассматриваться как обычное или четкое множество.
Например, пусть B={множество молодых людей}. Нижний предел этого множества строго ноль, тогда как верхний предел, вообще говоря, точно определен быть не может, поскольку невозможно строгое (четкое) разделение на молодых и не молодых. Однако, можно задать некоторый диапазон возрастов по признаку «ещё не стар, но уже не молод». Например, разумно считать, что все люди моложе 20 лет – молодые, а старше 30 – не молодые. Тогда характеристическая функция, описывающая степень принадлежности человека с данным возрастом к множеству молодых людей B, может быть такой, как на Рис. 10.7. (здесь степень принадлежности множеству молодых людей для возрастов изменяется линейно).
Рис. 10.7 . Пример характеристической функции принадлежности нечеткого множества.
Для формализации субъективного смысла качественных показателей экспертам предлагают различные функции принадлежности.
Линейная функция (Рис. 10.8) принадлежности , задается посредством установления экспертом значений f2, f1
Рис. 10.8. Линейная функция принадлежности.
Экспоненциальная функция принадлежности (Рис. 10.9) , где b-параметр формы, f - значение функции f(x), соответствующее степени принадлежности ..