Диссертация (1174210), страница 23
Текст из файла (страница 23)
Однако во все уравнения всегда входили все признаки,входящие в группу цветовых признаков объектов, а признаки других групп лишьчастичнобылипредставленывполученныхуравнениях.Данныйфактсвидетельствует о том, что цветовые признаки можно отнести к группе признаков,позволяющих в наибольшей степени классифицировать объекты на цифровыхмикроскопических изображениях мокроты, окрашенной по методу Циля-Нильсена.При построении уравнений с использованием методов связанных с оценкойотношения правдоподобия существенно отличалось время, затрачиваемое напостроение уравнения.
На построение логистических уравнений с использованиемметодов связанных с оценкой отношения правдоподобия затрачивалось около 3недель, тогда как на построение уравнений с применением других методов отборапризнаков было затрачено менее одного часа.Таким образом, для классификации объектов на цифровых изображенияхмикроскопических препаратов мокроты, окрашенной по методу Циля-Нильсена,были построены 6 уравнений логистической регрессии с применением различныхметодов отбора признаков. Показатели чувствительности, специфичности,точности, а также доли ложноотрицательных и ложноположительных результатовбыли практически одинаковые у всех полученных уравнений.
Однако, наименьшеечисло признаков, включенных в уравнение, было получено при применении методас их прямым пошаговым включением на основе отношения правдоподобия. Вданное уравнение включено 34 признака классифицируемых объектов при157следующих классификационных характеристиках: чувствительность – 88,9%,специфичность – 88,2%, точность – 88,6%, доля ложноположительных результатов– 11,8% и доля ложноотрицательных результатов – 11,1%. Это свидетельствует овозможности использования данного уравнения для предварительного анализаизображений в системах поддержки принятия решений при проведениибактериоскопического исследования на предмет обнаружения кислотоустойчивыхмикобактерий.Для классификации объектов на цифровых микроскопических изображенияхмокроты, окрашенной по методу Циля-Нильсена, группа цветовых признаковобъектов имела наибольшее прогностическое значение, по сравнению с другимиизучаемыми признаками.5.2.
Использование деревьев классификации для распознавания объектов нацифровых микроскопических изображениях мокроты, окрашенной пометоду Циля-НильсенаКакпоказываютрезультатыпостроениядеревьевклассификации,приведенные в таблице 15, наибольшая доля истинно отрицательных результатовбыла получена при использовании дерева классификации построенного методомИсчерпывающий CHAID. При этом в данном дереве классификации использовано167 параметров объектов из 240, что значительно меньше, чем у деревьевклассификации построенных методами CRT и QUEST.Наибольшая доля истинно положительных результатов была получена прииспользовании дерева классификации построенного методом CRT.
Однако, уданногодереваотрицательныхклассификациирезультатов,поотмеченасравнениюболееснизкаядеревьямипостроенными методами CHAID и Исчерпывающий CHAID.доляистинноклассификации158Таблица 15 – Результаты построения деревьев классификацииМетодЧислоИПР,ИОР,ЛПР,ЛОР,построенияпараметровабс., %абс., %абс., %абс., %6306157252134334023,55%88,65%7,57%0,23%6286157806128794223,54%88,96%7,26%0,24%6316148595220903923,56%83,77%12,45%0,22%6191148151225345173,49%83,52%12,70%0,29%CHAID159ИсчерпывающийCHAID167CRT235QUEST231Примечание: ИПР – истинно положительные результаты, ИОР – истинноотрицательные результаты, ЛПР – ложно положительные результаты, ЛОР – ложноотрицательные результатыДляоценкидиагностическойценностипостроенныхдеревьевклассификации необходимо оценить показатели чувствительности, специфичностии точности (таблица 16).
При оценке данных показателей необходимо учитывать,что при решении задачи классификации объектов на цифровых микроскопическихизображениях мокроты, окрашенной по методу Циля-Нильсена наиболеезначимыми являются показатели точности и чувствительности. Это связано с тем,чточувствительностьотражаетспособностьмоделинедаватьложноотрицательные результаты классификации, что особенно важно прискрининговых обследованиях, для которых используется бактериоскопическийметод выявления туберкулеза с окраской мокроты по методу Циля-Нильсена. Такнаибольшим показателем точности обладает дерево классификации, построенноеметодом Исчерпывающий CHAID, но данное дерево имеет более низкийпоказательчувствительностипосравнениюсдеревомклассификации,построенным методом CHAID.
При этом последнее упомянутое дерево159классификации включает в себя меньшее количество параметров объектов,необходимых для классификации.Таблица16–Показателихарактеризующиедиагностическуюценностьполученных деревьев классификацииМетодЧувствительность, %Специфичность, %Точность, %построения[ДИ 95%][ДИ 95%][ДИ 95%]94,092,192,2[93,4; 94,6][92,0; 92,1][92,1; 92,3]93,792,592,5[93,1; 94,3][92,3; 92,6][92,4; 92,6]94,287,187,3[93,6; 94,7][86,9; 87,2][87,2; 87,4]92,386,887,0[91,6; 92,9][86,6; 87,0][86,9; 87,1]CHAIDИсчерпывающийCHAIDCRTQUESTТаким образом, построенные с использованием различных методов деревьяклассификации позволяют осуществлять автоматическое распознавание объектов,выделяемых на цифровых микроскопических изображениях мокроты, окрашеннойпометодуЦиля-Нильсена.Приэтомнаилучшимипоказателями,характеризующими диагностическую способность данных моделей, для решениятекущей задачи обладает дерево классификации построенное методом CHAID:чувствительность – 94,0 [93,4; 94,6]%, специфичность – 92,1 [92,0; 92,1]%, точность– 92,2 [92,1; 92,3]%.
Помимо этого, данное дерево классификации позволяетосуществлятьклассификациюобъектовсиспользованиемнаименьшегоколичества параметров объектов, что ускоряет скорость его работы. Построенныедеревья классификации могут быть использованы в системах автоматизированнойбактериоскопической диагностики туберкулеза, что позволит увеличить скоростьданного процесса.1605.3. Использование искусственных нейронных сетей для распознаванияобъектов на цифровых микроскопических изображениях мокроты,окрашенной по методу Циля-НильсенаИтерационное обучение 235 трехслойных искусственных нейронных сетей сразличным числом входных параметров модели заняло 6,5 месяца, а 235четырехслойных – 8,7 месяца.
Так, одна итерация обучения трехслойнойнейронной сети занимала от 8 до 30 часов, четырехслойной – от 20 до 32 часов. Этосвязано с тем, что для обучения искусственной нейронной сети использовалосьбольшое число входных параметров у большого числа объектов.
Это требуетиспользования для подобных, ставших уже стандартными в медицинскихисследованиях, исследовательских задач мощных вычислительных станций,использующих возможности графических процессоров, либо использованияметодов предварительного отбора наиболее важных для классификации признаковдля исключения последовательного итерационного поиска таких признаков,которые были представлены в предыдущей главе.Ошибка классификации трехслойной нейронной сетью на обучающей итестовой выборках на протяжении всех 235 итераций обучения представлена нарисунке 56. Как видно из результатов, представленных на данном рисунке ошибкаклассификации как на обучающей, так и на тестовой выборке на первой итерацииимеет довольно высокое значение по сравнению с ошибками классификации набольшинстве последующих итераций.
При последовательном уменьшении числавходных параметров путем исключения наименее важных ошибка классификациидоопределенногомоментаснижается,азатемповышается,достигнувмаксимального значения при одном входном параметре, имеющим на всехитерациях обучения искусственных нейронных сетей наибольшую важность. Наосновании проведенных вычислительных экспериментов установлено, чтонаименьшая ошибка выборках была получена на 92 итерации построенияискусственной нейронной сети при использовании 144 входных параметров.1611614Ошибка классификации, %12108640171319253137434955616773798591971031091151211271331391451511571631691751811871931992052112172232292352ИтерацияОшибка на обучающей выборкеОшибка на тестовой выборкеРисунок 56 – Ошибка классификации трехслойной нейронной сетью на обучающей и тестовой выборках162В таблице 17 приведена более детальная оценка качества классификациитрехслойными искусственными нейронными сетями, полученными на различныхитерациях обучения.Приведенные в таблице 17 результаты подтверждают снижение ошибок наобучающей и тестовой выборках с 1 по 92 итерацию.