Диссертация (1026108), страница 13
Текст из файла (страница 13)
,с.1530110,с. ,с. ,% ,% ,%0,72,510−32090,1790,1290,14100Сравнительноневысокиепоказателикачестваидентификацииартефактов ( = 90,17%, = 90,12%, = 90,14%) объясняютсятем, что определялся не сам факт наличия артефактов, а классифицировалсякаждый отсчёт сигнала как принадлежащий артефактому периоду или нет.Соответственно, при верном определении артефакта, но неточном совпаденииграниц артефактной области определённой алгоритмом и экспертом (Рис. 4.8),значения показателей качества снижается.Рис. 4.8. Определение артефактов на БРЛ сигнале экспертом (зелёная линия)и алгоритмом (красная линия)В дальнейшем анализе использовался объединённый сигнал = {1 , 1 , 2 , 2 ,...
},где — межартефактный период,а — артефактный период.Все заменялись нулевыми значениями, а каждый замещалсясоответствующиминтерваломтогоБРЛсигнала,которыйобладаетмаксимальной энергией в течение данного МАП.Перевёрнутые МАП (Рис. 4.5) устанавливались следующим образом.НаМАПопределялисьлокальныемаксимумы(пики)спомощьюфункции findpeak из Signal Processing Toolbox среды MATLAB. Затемопределялась ширина каждого пика на высоте 0,7 от амплитуды пика.После чего вычислялась медианная ширина пика для МАП.
Даннаяпроцедура повторялась и для инвертированного сигнала. МАП считался101инвертированным, если медианная ширина в перевёрнутом положениибыла меньше чем в прямом. Инвертированные МАП переворачивались,такимобразомточкиконцаинспираторнойфазыДЦоказываютсяориентированными вверх на протяжении всей записи.Нормализация МАП проводилась с помощью Z-нормализации.Пики ДЦ определялись с помощью функции findpeak, в которой можнозадать такие аргументы как минимальная высота пика ( ) и минимальноерасстояние между пиками ( ). Значения данных аргументов подбиралась сцелью увеличения точности определения ДЦ.
Лучшие результаты полученыс = 0 и = 2,2 с. Точность определения пиков ДЦ составила96,79%, а чувствительность 98,19%. Данная процедура поиска локальныхмаксимумов использовалась на инвертированном сигнале для поиска впадин.ДЦ описывался амплитудой, шириной, координатами пика и координатамивпадин. На Рис. 4.9 представлены результаты определения ДЦ алгоритмом.Рис. 4.9. Определение пиков и впадин ДЦ на БРЛ сигнале4.3Исследование пространства признаков и методов классификацииПервоначально,каждаяэпохаописываласьпризнаками,характеризующими паттерн дыхания (см. раздел 2.3.2), которые былиизвлечены из объединённого БРЛ сигнала .
Кроме того, посколькудвигательнаяактивностьвовремяснаявляетсяважныммаркером102бодрствования, эпоха описывалась следующими признаками двигательнойактивности (Рис. 4.10):– продолжительность движения в течение эпохи, определяемая как = − ,где — время окончания движения в анализируемую эпоху,а — время начала движения в анализируемой эпохе;– энергия сигнала во время движения, определяемая как∫︁ =2 (),где () — значение сигнала в момент времени .Рис.
4.10. Артефакт движения на БРЛ сигналеТаким образом, каждая эпоха описывалась 54 признаками. Списокпризнаков представлен в Таблице 17.Значения каждого признака нормализовалось для каждого испытуемогос помощью Z–нормализации с целью устранения межиндивидуальнойвариабельности параметров.103Таблица 17.Параметры алгоритма определения артефактовПризнакОписание1продолжительность движения2энергия сигнала во время движения3СО ширины ДЦ4средняя ширина ДЦ5нормализованная средняя ширина ДЦ6СО амплитуды ДЦ7средняя амплитуда ДЦ8нормализованная средняя амплитуда ДЦ9нормализованная медианная ширина ДЦ10нормализованная медианная амплитуда ДЦ11нормализованная медианная высота пиков ДЦ12нормализованная медианная высота впадин ДЦ13 среднее мультимасштабной энтропии перестановок14 СО мультимасштабной энтропии перестановок15нормализованная медиана МПИ16медиана МПИ17МКР МПИ18нормализованное среднее МПИ19среднее МПИ2021максимальный модуль разностей МПИ22медианная амплитуда ДЦ23МКР амплитуд ДЦ24медианная ширина ДЦ25МКР ширин ДЦСО МПИ104Продолжение таблицы 17ПризнакОписание26 27спектральная мощность волн LF28спектральная мощность волн HF29/20спектральная мощность на частоте дыхания31частота дыхания32медиана высоты пиков ДЦ33МКР высоты пиков ДЦ34медиана высоты впадин ДЦ35МКР высоты впадин ДЦ36медиана «дыхательного объёма» в инспираторнуюспектральная мощность волн VLFотношение спектральных мощностей волн LF/HFфазу ДЦ37медиана «дыхательного объёма» в экспираторнуюфазу ДЦ38 /отношение медиан «дыхательного объёма» винспираторную и экспираторную фазы ДЦ39 динамичная трансформация временной шкалы40 динамичная трансформация частотной шкалы41энтропия шаблонов42СО частоты дыхания в течение 11 эпох43нормализованная медиана высоты пиков ДЦв течение 25 эпох44нормализованная медиана высоты впадин ДЦв течение 25 эпох45энтропия шаблонов высот пиков ДЦ в течение 25 эпох46энтропия шаблонов высот впадин ДЦ в течение 25 эпох105Продолжение таблицы 17ПризнакОписание47медиана амплитуд в течение 25 эпох48медиана «дыхательного объёма»49медиана «дыхательного объёма» в инспираторнуюфазу в течение 25 эпох50медиана «дыхательного объёма» в экспираторнуюфазу в течение 25 эпох51 «скорость потока» в течение 25 эпох52 «скорость инспираторного потока» в течение 25 эпох53 «скорость экспираторного потока» в течение 25 эпох54 / отношение «скоростей инспираторного и экспираторногопотоков» в течение 25 эпохАнализ информативности признаков проводился на основе оценкиинформационного прироста (IG, information gain), поскольку данный методпозволяет оценить признаки независимо от метода классификации иранжировать их.
Результаты анализа представлены на Рис. 4.11.Как видно на Рис. 4.11, в задаче распознавания структуры сна,. В задаче определения ПБ наилучшиенаибольший IG дают , и результаты у , и . При определении ПС IG значительно вышеданного показателя для других признаков. В задаче определения ГС лучшиерезультаты у , и . При определении ФБС IG , и значительно превышает данный показатель для других признаков.
Такимобразом, наиболее информативными признаками являются , и , и .Рассмотрим изменение качества определения структуры сна припоследовательномувеличенииколичестваиспользуемыхпризнаков.106Рис. 4.11. Оценка информационного прироста для признаковИспользуем для этого классификатор XGBoost, который хорошо себязарекомендовал при решении задачи определения структуры сна (раздел 2.3),и скользящий контроль по 4 блокам для ускорения вычислений. На Рис.
4.12показаны результаты данного анализа, признаки были упорядочены согласнозначению IG для ПБ–ФБС–ПС–ГС. Как видно из Рис. 4.12 качествоопределения структуры сна резко растёт при увеличении количествапризнаков до 4, а затем приближается к асимптоте в 0,4 каппы Коэна.Рассмотримэффективностьпримененияразличныхметодовклассификации на наборах в 5 лучших признаков, 20 лучших признакови полном наборе признаков.
Тестирование будем проводить с помощьюскользящего контроля по 4 блокам для ускорения вычислений. Как видно изТаблицы 18 лучшие результат показал алгоритм XGBoost.107Рис. 4.12. Зависимость качества определения структуры сна от количествапризнаковТаблица 18.Эффективность методов классификации на различных подмножествахпризнаковkNNXGBoostNaive BayesLDANNetsvmLinearsvmRadialAdaBoostRandomForest520540,28180,36120,35630,25940,37130,22980,29460,34210,33890,30500,38100,34210,29260,37030,26480,37910,34310,37930,28400,39760,32710,34210,35480,29540,37960,32820,3790Упорядочим признаки согласно внутренней оценки их качестваалгоритмом XGBoost и посмотрим на изменение качества определенияструктуры сна при последовательном увеличении количества признаков сприменением скользящего контроля по отдельным испытуемым (Рис.
4.13).Как видно из Рис. 4.13 лучший результат в 0,4030 достигается прииспользовании набора в 23 следующих признаков:, , , , , , , , , , , , , , , , , , , , , , , . Данный результат увеличивается до 0,4167 посленастройки гиперпараметров алгоритма XGBoost. В Таблице 19 представлены108Рис.
4.13. Зависимость качества определения структуры сна от количествапризнаковрезультаты до и после оптимизации гиперпараметров для различных выборокиспытуемых.Таблица 19.Результаты оптимизации гиперпараметров XGBoost ()Испытуемые безинсомнии (N=28)До оптимизации0,4022После оптимизации 0,41564.4Испытуемые синсомнией (N=4)Всеиспытуемые(N=32)0,40610,42390,40300,4167Апробация методов учёта особенностей структуры снаРезультаты использования методов учёта особенностей сна, описанныев Главе 3, применительно к задаче определения структуры сна на основе БРЛмониторинга, представлены в Таблице 20.109Таблица 20.Изменение качества определения структуры сна по сравнению с базовымалгоритмом. Значения приведены в проц.пунктахИндекс эпохиАприорные вероятностиЭвристикиДвухступенчатая классификацияЦикличная модель оценки априорныхвероятностей (ошибка определенияокончания ФБС 5,11 ± 2,99 мин.)Испытуемыебезинсомнии(N=28)Испытуемые Всесиспытуемыеинсомнией (N=32)(N=4)1,881,313,746,355,990,090,012,204,114,541,621,133,556,085,80Априорные вероятности определялись на выборке описанной в Главе 3.Параметры и для двухступенчатой классификации подбирались с цельюмаксимизации определения качества структуры сна и составили = 6 и = 6.
Параметры эвристик , и подбирались с той же целью исоставили = 30, = 6, = 9. Цикличная модель применялась без учётагендерно-возрастных характеристик испытуемых, поскольку распределениевозрастов в выборке БРЛ мониторинга (44,22 ± 15,44(22,00 − 67,00))значительно отличается от такового в выборке, описанной в Главе 3 (60,77 ±11,51(39,00 − 90,00)).Как видно из представленной таблицы, использование индекса эпохи иаприорных вероятностей в течение всей ночи оказались неэффективными дляиспытуемых с инсомнией, поскольку распределение априорных вероятностейдля них отличается.
Тем не менее использование данных методов не ухудшаеткачество определения структуры сна для испытуемых с инсомнией, при этомувеличивая для испытуемых без инсомнии.Наибольший выигрыш даёт использование математической модели дляоценки априорных вероятностей на основе положения эпохи в цикле и110двухступенчатая классификация, которые оказались эффективными как дляиспытуемых с инсомнией, так и для испытуемых без инсомнией.4.5Исследование качества определения структуры сна и возможностидиагностики инсомнии на основе биорадиолокационного мониторингаНа Рис. 4.14 представлена блок-схема финальной версии алгоритма,в которой использован базовый алгоритм, описанный в разделе 4.3, икомпозиция из методов учёта особенностей структуры сна.
В Таблице 21представлены результаты определения структуры сна базовым и финальнымалгоритмами.Рис. 4.14. Блок-схема финальной версии алгоритма определения структурысна человека на основе БРЛ мониторингаТаблица 21.Сравнение качества определения структуры сна базовым и финальнымалгоритмамиИспытуемые безинсомнии (N=28)Базовый алгоритм0,4156Финальный алгоритм 0,5040Испытуемые сВсеинсомнией (N=4) испытуемые(N=32)0,42390,50780,41670,5045Разработанный алгоритм включает в себя следующие шаги:1. предобработка БРЛ сигналов;2. извлечение 23 признаков из БРЛ сигнала;1113. первичная классификация на основе признаков, извлечённых изБРЛ сигнала, и нормализованного индекса эпохи, с помощьюклассификатораXGBoost,которыйоцениваетвероятностипринадлежности эпох к классам;4.
вероятности, оценённые на предыдущем этапе, используются вкачестве признаков для вторичной классификации; на этом этапеиспользуется LDA для оценки вероятности принадлежности эпохи кстадиям;5. вероятности, оценённые на предыдущем этапе, используются вкачестве признаков совместно с признаками, извлечёнными изсигналов, и нормализованным индексом эпохи для бинарнойклассификации ФБС/ФБС c помощью XGBoost; окончание циклаопределяется на основе следующего правила: «Окончание цикла —это конец ФБС эпохи, если из 8 эпох слева от неё, не менее 5 являютсяФБС эпохами, а 10 эпох справа от неё не являются ФБС эпохами»;6.