Диссертация (1174210), страница 21
Текст из файла (страница 21)
Далее по мере снижения степени различия объектов находятся такиецветовые характеристики объектов, как среднее значение параметров B и Gцветовой схемы RGB, максимальное значение параметра B и максимальноезначение параметра H цветовой схемы HSV.Как видно из данных, приведенных в таблице 13, интервалы значений уобъектов не кислотоустойчивых микобактерий шире, чем у кислотоустойчивыхмикобактерий,причеминтервалызначенийизучаемыхпараметровкислотоустойчивых микобактерий всегда входят в интервал значений данныхпараметров у иных объектов.Данное обстоятельство существенно затрудняет разделение объектов наклассы по изучаемым параметрам. Однако, полученные результаты оценки доли некислотоустойчивых микобактерий объектов не входящих в интервал значений уобъектов кислотоустойчивых микобактерий свидетельствует о возможности139использования предложенных параметров для идентификации объектов нацифровых изображениях микроскопических препаратов мокроты, окрашенной пометоду Циля-Нильсена.0%10%20%30%Попикельная площадь40%50%41,6%Среднее значение B26,8%Среднее значение G19,8%Максимальное значение B10,9%Максимальное значение H7,3%Размер по X6,0%Минимальное значение G5,7%Размер по Y5,4%Максимальное значение R5,3%Среднее значение S5,2%Минимальное значение S5,1%Среднее значение R5,0%Минимальное значение V2,4%Среднее значение V1,7%Минимальное значение Y1,1%Рисунок 46 – Результаты оценки различий групп объектов с использованиемминимальных и максимальных значений параметров объектовкислотоустойчивых микобактерийТаким образом, результаты данного этапа исследования свидетельствуют отом, что использование классических статистических подходов для оценкипараметров на предмет возможного разделения объектов, выделяемых нацифровых изображениях, на классы практически невозможно.
Это связано сбольшими объемами изучаемых выборок, причем которые потенциально могут140быть неограниченными, так как, как правило, набор и изучение цифровых объектовменее затруднительно, чем реальных.Таблица 13 – Минимальные и максимальные значения изучаемых параметровПоказательПопиксельнаяплощадьСреднее значение BСреднее значение GМаксимальноезначение BМаксимальноезначение HРазмер по XМинимальноезначение GРазмер по YМаксимальноезначение RСреднее значение SМинимальноезначение SСреднее значение RМинимальноезначение VСреднее значение VМинимальноезначение YИнтервалИнтервалзначенийзначенийуу иныхобъектовобъектовКУМДоля не КУМобъектоввходящих винтервалзначений уобъектов КУМДоля не КУМобъектов невходящих винтервалзначений уобъектов КУМ4-1620-123058,4 %41,6 %74-23373-2250-2400-25573,2 %80,2 %26,8 %19,8 %178-2550-25589,1 %10,9 %203-3590-35992,7 %7,3 %3-860-14894,0 %6,0 %25-2060-25594,3 %5,7 %1-830-11494,6 %5,4 %5-2550-25594,7 %5,3 %17-990-10094,8 %5,2 %1-980-10094,9 %5,1 %1-2400-24895,0 %5,0 %54-1000-10097,6 %2,4 %67-1000-10098,3 %1,7 %46-1506-25598,9 %1,1 %Используемый подход к оценке различий между цифровыми объектамиразных классов с оценкой доли объектов одного класса, которые не входят в141интервал между минимальным и максимальным значениями другого классапоказал, что он может быть использован как альтернатива классическимстатистическим методам для оценки степени различий больших выборок междусобой.Результаты изучения различий кислотоустойчивых микобактерий и иныхобъектов свидетельствуют о довольно существенных отличиях по основнымморфометрическим параметрам объектов, таким как попиксельная площадь иразмеры объектов по оси X и Y, а также по различным цветовым параметрамобъектов.
Существенных отличий изучаемых классов объектов по радиальнымразмерам объектов и их соотношениям не установлено, однако, различия поданным параметрам требуют дальнейшего изучения с использованием методовоценки информативности признаков.4.3. Отбор признаков на основе их информативностиВ данном разделе представлены результаты отбора признаков с применениемметодов оценки информативности. Применялись следующие методы оценкиинформативности: накопленных частот, Кульбака, Шеннона, Фишера и ранговыйметод.
В данном разделе приведены первые 15 признаков, имеющих наибольшуюинформативность, определяемую с применением указанных методов. Списокзначений информативности полного перчена параметров приведен в приложенииБ.На рисунке 47 представлен список из 15 признаков, имеющих наибольшуюинформативность по методу накопленных частот. Приведенные на рисунке 47данные свидетельствуют о том, что наибольшую информативность по данномуметоду имеют «Среднее значение B» и «Попиксельная площадь». Остальныепризнаки, описывающие радиальные размеры объектов и их отношения имеютпрактически одинаковую информативность.1420Информативность4000080000120000Среднее значение B122273Попикельная площадь106538Размер №1793095Размер №1693095Размер №2293095Размер №2193095Размер №2393095Размер №1893095Размер №1993095Размер №2093095Размер №1493095Размер №1393095Размер №1593095Отношение 5 и 23 размеров88009Отношение 3 и 21 размеров87955Рисунок 47 – Признаки, имеющие наибольшую информативность по методунакопленных частотНа рисунке 48 представлен список из 15 признаков, имеющих наибольшуюинформативность по методу Шеннона.
Приведенные на рисунке 48 данныесвидетельствуют о том, что наибольшую информативность по данному методуимеют цветовые признаки классифицируемых объектов и отношения размеровданных объектов. Необходимо отметить, что такой признак объектов, какминимальное значение составляющего H цветовой схемы HSV имеет значительнобольшую информативность по методу Шеннона по сравнению с остальнымипараметрами.14300,2Информативность0,40,60,8Минимальное значение H11,20,9634Среднее значение B0,7114Максимальное значение B0,6856Отношение 25 и 43 размеров0,6833Отношение 26 и 44 размеров0,6752Среднее значение S0,6715Отношение 61 и 7 размеров0,6556Отношение 62 и 8 размеров0,644Отношение размеров 29 и 650,6311Среднее значение R0,6283Отношение размеров 28 и 640,6157Максимальное значение R0,6143Максимальное значение H0,6083Максимальное значение Y0,5875Среднее значение G0,5812Рисунок 48 – Признаки, имеющие наибольшую информативность по методуШеннонаНа рисунке 49 представлен список из 15 признаков, имеющих наибольшуюинформативность по методу Кульбака.
Данные, приведенные на рисунке 49,указывают на то, что наибольшую информативность по данному методу имеютрадиальные размеры объектов и их отношения. Это существенно отличается отсписка признаков, имеющих наибольшую информативность по методамнакопленных частот и Шеннона. Данный факт объясняется тем, что методынакопленныхчастот,ШеннонаиКульбакапо-разномуопределяютинформативность. Так, метод Шеннона оперирует средневзвешенным количеством144информации, приходящимся на различные интервалы признаков, а метод Кульбакаоценивает расхождение между двумя классами.1,4Информативность1,451,51,551,6Размер №511,585Размер №491,577Размер №501,574Размер по X1,55Размер №591,541Размер №571,538Размер №581,538Отношение 36+72 и 54+18 размеров1,517Отношение 1+37 и 19+55 размеров1,517Отношение 35+71 и 53+17 размеров1,517Отношение 34+70 и 52+16 размеровОтношение 2+38 и 20+56 размеров1,4951,491Размер №231,477Размер №221,474Размер №211,474Рисунок 49 – Признаки, имеющие наибольшую информативность по методуКульбакаАнализ признаков, имеющих наибольшую информативность по методуКульбака, показывает, что среди них отсутствуют признаки с существеннобольшей информативностью по сравнению с остальными.На рисунке 50 представлен список из 15 признаков, имеющих наибольшуюинформативность по методу Фишера.
Наибольшую информативность по данномуметоду имеет среднее значение составляющего B цветовой схемы RGB. Причем145информативность данного признака, рассчитанная с применением метода Фишера,существенно превышает значения информативности других признаков.00,5Информативность11,52Среднее значение B32,534Размер №200,978Размер №170,9727Размер №180,9706Размер №190,9706Размер №160,9616Попикельная площадь2,50,9074Размер №150,8106Размер №520,8097Размер №140,8079Размер №550,8069Размер №530,8061Размер №540,8052Размер №130,8044Размер №560,8032Рисунок 50 – Признаки, имеющие наибольшую информативность по методуФишераНа рисунке 51 представлен список из 15 признаков, имеющих наибольшуюинформативность, рассчитанную с применением рангового метода. Наибольшуюинформативность по данному методу имеют цветовые характеристики объектов.Необходимо также отметить, что среди признаков, имеющих максимальнуюинформативность по ранговому методу отсутствуют признаки со значительнобольшей информативностью по сравнению с остальными.146Информативность500 000 0001 000 000 0000Минимальное значение S569 789 970Минимальное значение H568 041 117Среднее значение V552 157 851Минимальное значение Y538 273 546Среднее значение H508 464 299Среднее значение Y483 025 512Минимальное значение V475 141 242Максимальное значение Y469 476 602Максимальное значение R451 390 462Минимальное значение G436 277 018Отношение 25 и 43 размеров398 853 580Отношение 26 и 44 размеров398 765 553Отношение 27 и 45 размеров398 578 706Отношение 28 и 46 размеров397 803 244Отношение 29 и 47 размеров397 757 146Рисунок 51 – Признаки, имеющие наибольшую информативность по ранговомуметодуТаким образом, вычислительные эксперименты показали, что методы оценкиинформативности накопленных частот, Шеннона, Кульбака, Фишера и ранговыйметоду могут применяться для снижения признакового пространства припостроении и исследовании медицинских прогностических моделей и в частностиприклассификацииобъектов,выделенныхнацифровыхизображенияхмикроскопических препаратов мокроты, окрашенной по методу Циля-Нильсена.При этом, признаки, имеющие наибольшую информативность при примененииразличных методов оценки информативности существенно отличаются.
Этотребует дальнейшего анализа качества распознавания объектов с использованиемотобранных данными методами признаков.1474.4. Сравнение методов отбора признаков для идентификации объектов нацифровых изображениях микроскопических препаратовВ данном разделе произведено сравнение результатов классификацииобъектов с использованием признаков отобранных с помощью различных методовоценки информативности [118].
Использовались признаки, отобранные с помощьюметода «пересечений», метода оценки информативности накопленных частот,Шеннона, Кульбака, Фишера и рангового метода.Результаты классификации объектов с использованием логистическогорегрессионного анализа представлены на рисунке 52.9085Точность, %80757065605550123456789 10 11 12 13 14Шаг - число параметров в классификационной моделиМетод пересеченийМетод накопленных частотМетод КульбакаМетод ШеннонаМетод ФишераМетод ранговРисунок 52 – Результаты классификации с использованием логистическойрегрессии15148Как следует из данного рисунка худшие показатели точности классификациибыли получены с включением в модель параметров объектов, информативностькоторых определялась с применением рангового метода.