Диссертация (1137259), страница 2
Текст из файла (страница 2)
Модели должны строиться за приемлемое время и иметь размер адекватный дляэкспертного анализа.В соответствии с целью исследования были поставлены следующие задачи:71. Предложить иерархическую модель процессов с состояниямисложной структуры, которую можно построить за приемлемоевремя, с целью дальнейшего экспертного анализа.2. Предложить адекватную, эффективно вычислимую меру качества элементарных моделей процессов с состояниями сложнойструктуры с целью уменьшения сложности иерархической модели таких процессов.3. Разработать комплекс программ для анализа процессов с состояниями сложной структуры на основе предложенной модели иапробировать его на данных о процессах госпитализации пациентов.Следующиеособенностинаучную новизну:работыопределяютеё1.
Предложен класс моделей на основе узорных структур для исследования процессов с состояниями сложной структуры.2. Подход к моделированию на основе решеток замкнутых описаний был обобщён на более широкий класс проекций описаний,имеющих высокую практическую значимость.
Это позволилоавтоматически строить модели введённого класса за меньшеевремя, чем при использовании альтернативных подходов.3. Впервые для измерения качества элементарных моделей былаэкспериментально проверена на широкой тестовой базе данныхвозможность применения меры качества по устойчивости.4. Были предложены две эффективные оценки устойчивости, которые имеют лучшие вычислительные характеристики и точность, чем существующие аналоги.5. Впервые создан комплекс программ, позволяющий разрабатывать модели на основе решеток замкнутых описаний, в рамкахкоторого была реализована модель процессов с состояниями8сложной структуры.
Эта модель была апробирована на процессе госпитализации пациентов.Теоретическая ценность данной работы состоит1. в расширении и уточнении аппарата узорных структур для моделирования процессов с состояниями сложной структуры;2. во введении и исследовании проекции минимальной длины иалфавитной проекции моделей процессов с состояниями сложной структуры;3. во введении и исследовании эффективных оценок устойчивости элементарных моделей на основе замкнутых описаний.Практическая ценность работы состоит1. в разработке класса моделей процессов с состояниями сложнойструктуры;2. в разработке быстрых алгоритмов вычисления мер качестваэлементарных моделей при создание иерархических моделейна основе аппарата узорных структур;3.
в получении значимых результатов исследования процессовгоспитализаций для оптимизации процессов лечения;4. в разработке эффективного программного комплекса, которыйпредоставляет возможность использования методов решетокзамкнутых описаний для построения моделей процессов с состояниями сложной структуры.Положения, выносимые на защиту:1. Предложен класс иерархических моделей процессов с состояниями сложной структуры и вычислительные методы автоматического построения таких моделей по логу процессов заприемлемое время с учетом специфики предметной области.92. Аппарат узорных структур и их проекций был расширен наболее широкий класс проекций.3.
Экспериментально обоснована возможность применения мерыкачества устойчивости для выделения важных элементарныхмоделей в задаче упрощения разработанной иерархической модели процессов с состояниями сложной структуры.4. Введены две эффективные оценки меры качества устойчивости и экспериментально обоснована возможность их успешного применения.5. Разработан комплекс программ для анализа процессов с состояниями сложной структуры на основе решеток замкнутых описаний (узорных структур), успешно апробированный в задаче анализа госпитализаций.
Разработанный комплекс программвключен в программную систему FCART.Достоверность полученных результатов опирается на строгость использованных математических моделей и на их экспериментальное подтверждение.Апробация работы. Основные результаты работы обсуждалисьи докладывались на следующих конференциях:1. Симпозиум BioIntelligence 2012, Софи-Антиполис, Франция;2. Первый международный семинар “Что АФП может сделать дляискусственного интеллекта?” (Workshop: What can FCA do forArtificial Intelligence?), 2012, Монпелье, Франция;3. Девятая международная конференция по решёткам понятий иих приложениям (The Ninth International Conference on ConceptLattices and Their Applications), 2012, Малага, Испания;4. Симпозиум BioIntelligence 2013, Софи-Антиполис, Франция;105.
Второй международный семинар “Что АФП может сделать дляискусственного интеллекта?” (Workshop: What can FCA do forArtificial Intelligence?), 2013, Пекин, Китай (два доклада);6. Семинар на ECML/PKDD 2013: языки для анализа данных имашинного обучения (ECML/PKDD 2013 Workshop: Languagesfor Data Mining and Machine Learning), 2013, Прага, Чехия7. Десятая международная конференция по решёткам понятий иих приложениям (The Tenth International Conference on ConceptLattices and Their Applications), 2013, Ла-Рошель, Франция;8. Вторая международная конференция по информационным технологиям и численному управления (The SecondInternational Conference on Information Technology andQuantitative Management), 2014, Москва, Россия.9.
Двенадцатая международная конференция по анализу формальных понятий (12th International Conference on Formal ConceptAnalysis), 2014, Клуж-Напока, Румыния;Публикации. Основные результаты по теме диссертации изложены в 8 научных работах, 2 из которых изданы в изданиях, рекомендованных ВАК, 6 — в рецензируемых трудах международныхконференций.Диссертация состоит из введения, 5 глав, заключения и спискалитературы.В главе 1 приводится обзор методов анализа структурных данных. Такие как плоские и иерархические модели анализа процессов,а также графовые методы обработки структурной информации.В главе 2 вводятся иерархическая модель процессов с состояниями сложной структуры и основные математические методы, используемые в этой модели.
Сначала приводятся базовые понятия теориирешёток, АФП, узорных структур, за которыми следует обобщённыйматематический аппарат проекций. Затем данный математический11аппарат применяется для анализа данных, представленных последовательностями со сложными элементы, которые моделируют процессс состояниями сложной структуры. Для моделирования таких процессов в конце этой главы вводятся специальные типы проекций.Глава 3 посвящена выделению важных элементарных моделей изиерархической, что позволяет сушественно уменьшить размер иерархической модели до адекватного уровня при экспертном анализе.
Вэтой главе обосновывается, что мера качества по устойчивости может быть эффективно применёна для решения такой задачи, а такжевводятся и исследуются два метода эффективной её оценки. Также вэтой главе обсуждаются вопросы численных методов расчёта устойчивости и её оценок.Далее в главе 4 описываются особенности расчёта данной моделив рамках комплекса программ, в рамках которого введённая модельможет эффективно рассчитываться и применяться. Также в этой главе описывается интеграция разработанной системы с программнымкомплексом FCART, являющимся одним из лучших комплексов дляисследования различных явлений с помощью анализа формальныхпонятий.Перед заключением в главе 5 приводятся результаты экспериментов, посвящённых использованию разработанной системы для анализа процесса госпитализации. В данной главе описывается, как разработанная модель может помочь эксперту ответить на его вопросыи рассматриваются некоторые элементарные модели, полученные изиерархиеской модели процесса.12Глава 1Возможные подходы к моделированиюпроцессов с состояниями сложнойструктурой1.1ВведениеВ этой главе мы задаемся вопросом какие подходы могут бытьиспользованы для анализа процессов с состояниями сложной структуры? Прежде всего необходимо определить какие процессы мы исследуем и затем посмотреть, какие существуют подходы к моделированию процессов как таковых.
К таким подходам следует отнестиплоские и иерархические модели. К плоским моделям относят сетиПетри, системы переходов и другие классы общих схем процессов,то есть таких схем, на которых показано общее поведение процесса, и по которым можно смоделировать большую часть реализацийпроцессов.Иерархические модели включают упорядоченное множество простых моделей. Это может быть как иерархия сетей Петри, так и упорядоченные множества закономерностей, называемых также элементарными моделями, получаемые методами анализа данных. В этомслучае, как правило, используются методы анализа последовательностей.
Количество найденных таким образом элементарных моделейможет быть существенно и необходима последующая фильтрациядля возможности экспертного анализа такой модели. Соответствен-13но меры качества элементарных моделей имеют важное значения длязначимых иерархических моделей.Однако, большинство таких моделей не всегда могут передатьсложную структуру состояний. Тогда естественным подходом к моделированию процессов с состояниям сложной структуры являетсяграфовое представление процесса, которое также будет рассмотрено.Таким образом, в этой главе мы сначала рассмотрим подробнеепроцесс с состояниями сложной структуры, а затем будут рассмотрены плоские и иерархические модели, за которым последует обсуждение подходов к обработке графов для анализа процессов с состояниями сложной структуры. В самом конце мы рассмотрим различныемеры качества элементарных моделей, позволяющие редуцироватьиерархические модели без потери качества.1.2Процессы с состояниями сложной структурыВ реальной жизни процессом называется некоторое скрытое явление, которое в реальной жизни проявляется как последовательностиоднотипных взаимосвязанных (предполагаемых взаимосвязанными)фактов.
Каждая такая последовательность взаимосвязанных фактовназывается реализацией этого процесса, а каждый факт называетсяего состоянием. Процесс порождает множество своих реализаций.Например, процесс госпитализации пациентов связан с многимискрытыми факторами, такими как реакции организма на патологии имедикаментозное лечение, различные поведенческие установки индивидуума, методология лечения и многое другое. Каждая реализация этого процесса представлена историей госпитализации отдельного пациента.
Состоянием этого процесса является одна госпитализация. Такие состояния в одной реализации процесса взаимосвязанычерез реакции организма конкретного пациента и методы его лечения.В данной работе мы говорим о процессах с состояниями сложной структуры, что означает, что о каждом состоянии нам известно14не только его название, такое как “госпитализация для прохожденияхимиотерапии” или “госпитализация для диагностики рака”, но идругая информация, отражающая взаимозависимости между состояниями.