Автореферат (1137258), страница 2
Текст из файла (страница 2)
в расширении и уточнении аппарата узорных структур для моделирования процессов с состояниями сложной структуры;2. во введении и исследовании проекции минимальной длины и алфавитной проекции моделей процессов с состояниями сложной структуры;3. во введении и исследовании эффективных оценок устойчивости элементарных моделей на основе замкнутых описаний.Практическая ценность работы состоит1. в разработке класса моделей процессов с состояниями сложной структуры;2. в разработке быстрых алгоритмов вычисления мер качества элементарных моделей при создание иерархических моделей на основе аппаратаузорных структур;3.
в получении значимых результатов исследования процессов госпитализаций для оптимизации процессов лечения;64. в разработке эффективного программного комплекса, который предоставляет возможность использования методов решеток замкнутых описаний для построения моделей процессов с состояниями сложной структуры.Положения, выносимые на защиту:1. Предложен класс иерархических моделей процессов с состояниямисложной структуры и вычислительные методы автоматического построения таких моделей по логу процессов за приемлемое время с учетомспецифики предметной области.2. Аппарат узорных структур и их проекций был расширен на более широкий класс проекций.3.
Экспериментально обоснована возможность применения меры качестваустойчивости для выделения важных элементарных моделей в задачеупрощения разработанной иерархической модели процессов с состояниями сложной структуры.4. Введены две эффективные оценки меры качества устойчивости и экспериментально обоснована возможность их успешного применения.5. Разработан комплекс программ для анализа процессов с состояниямисложной структуры на основе решеток замкнутых описаний (узорныхструктур), успешно апробированный в задаче анализа госпитализаций.Разработанный комплекс программ включен в программную системуFCART.Достоверность полученных результатов опирается на строгость использованных математических моделей и на их экспериментальное подтверждение.Апробация работы.
Основные результаты работы обсуждались и докладывались на следующих конференциях:1. Симпозиум BioIntelligence 2012, Софи-Антиполис, Франция;72. Первый международный семинар «Что АФП может сделать для искусственного интеллекта?» (Workshop: What can FCA do for ArtificialIntelligence?), 2012, Монпелье, Франция;3. Девятая международная конференция по решёткам понятий и их приложениям (The Ninth International Conference on Concept Lattices and TheirApplications), 2012, Малага, Испания;4. Симпозиум BioIntelligence 2013, Софи-Антиполис, Франция;5. Второй международный семинар «Что АФП может сделать для искусственного интеллекта?» (Workshop: What can FCA do for ArtificialIntelligence?), 2013, Пекин, Китай (два доклада);6.
Семинар на ECML/PKDD 2013: языки для анализа данных и машинногообучения (ECML/PKDD 2013 Workshop: Languages for Data Mining andMachine Learning), 2013, Прага, Чехия7. Десятая международная конференция по решёткам понятий и их приложениям (The Tenth International Conference on Concept Lattices and TheirApplications), 2013, Ла-Рошель, Франция;8. Вторая международная конференция по информационным технологиям и численному управления (The Second International Conference onInformation Technology and Quantitative Management), 2014, Москва, Россия.9.
Двенадцатая международная конференция по анализу формальных понятий (12th International Conference on Formal Concept Analysis), 2014,Клуж-Напока, Румыния;Публикации. Основные результаты по теме диссертации изложены в 8научных работах, 2 из которых изданы в изданиях, рекомендованных ВАК, 6— в рецензируемых трудах международных конференций.Структура и объем диссертации. Диссертация состоит из введения, пятиглав, заключения и списка литературы.
Общий объем работы — 154 страницы.Список литературы включает 140 названий.8Содержание работыВо введении обосновывается актуальность исследований, проводимых врамках данной диссертационной работы, формулируется цель, ставятся задачи работы, сформулированы научная новизна и практическая значимостьпредставляемой работы.Первая глава посвящена обзору подходов по моделированию объектов сосложной структурой, прежде всего процессов с состояниями сложной структуры.
В частности рассматриваются классические подходы анализа процессов, которые получают такие модели процессов как сети Петри и системыпереходов. Также рассматриваются некоторые иерархические модели, представленные иерархией простых моделей. В этой главе устанавливается, чтоиерархические модели могут быть получены методами анализа данных, какобъединение найденных закономерностей, или элементарных моделей, в однуиерархию.
К таким моделям относятся модели последовательностей и графовые модели. В главе показывается, что для обработки процессов с состояниями сложной структуры необходимо создание нового подхода для построениямоделей таких процессов. В первой главе также отмечается, что среди моделейпоследовательностей есть несколько подходов, которые могут быть применены к исследованию процессов с состояниями сложной структуры (M. Plantevitet al., 2010; E.
Egho et al., 2014). Графовые модели в работе рассматриваютсякак способ представление таких процессов, однако методы анализа графовойинформации требуют большого времени вычислений и потому не применимыдля анализа процессов с состояниями сложной структуры.Также в этой главе приводится обзор методов по выбору наиболее важныхэлементарных моделей для уменьшения размера общей иерархической модели.
В силу небольшого количества подходов к выбору элементарных моделей процессов, приводятся меры качества более простых закономерностей, таких как описываемых множествами признаков. В главе заключается, что мераустойчивости является оптимальным выбором и позволяет обрабатывать элементарные модели процессов. Также в главе предполагается необходимостьсравнения устойчивости с другими мерами качества при ранжировании закономерностей разного вида.9Во второй главе подробно разбираются основные понятия анализа формальных понятий и узорных структур, на которых основана предлагаемаяиерархическая модель процессов с состояниями сложной структуры. Затемвводится сама модель таких процессов.
Эта модель является трудновычислимой и поэтому её необходимо редуцировать. Далее вводится авторское расширение проекций узорных структур и описываются его свойства. В концеданной главы определяются специальные проекции для модели процессов ссостояниями сложной структуры, имеющие высокое практическое значение.Узорные структуры являются расширением анализа формальных понятийдля работы со структурными данными, такими как данные, описываемые численными значениями, множествами последовательностей или графов. Узорной структурой называется тройка (, (, ⊓), ), где – множество объектов, (, ⊓) – полная полурешётка всевозможных описаний, а : → –функция, сопоставляющая объекту из множества его описание из .Полурешёточная операция ⊓ соответствует операции сходства между двумя описаниями, определяемой для разных типов описаний в работах Г.К.
Финна, С.О. Кузнецова и др. Соответствие Галуа между множествами объектов имножеством описаний определяется следующим образом:◇ :=lдля ⊆ (),∈◇ := { ∈ | ⊑ ()}, для ∈ .Здесь ⊑ – это отношение поглощения, однозначно задающееся через полурешёточную операцию как: ⊑ ⇔ ⊓ = .Пример. Каждая реализация процесса госпитализации пациентов соответствует последовательности госпитализаций одного пациента. В этом случае – множество всех реализаций процесса доступных для анализа, соответствует множеству всех множеств последовательностей смены состояний,а результат полурешёточной операции между , ∈ на нём задаются как множество, последовательности которого являются более общими,чем последовательности множеств и .
Например, последовательность⟨, , ⟩ является менее общей, чем последовательность ⟨, ⟩, так как реже10встречается в реализациях процессов. Функция в этом случае задаётся каксоответствие между идентификаторами записей и реальным описаниемсоответствующим этим записям из .Узорным понятием узорной структуры (, (, ⊓), ) называется пара(, ), в которой ⊆ – подмножество множества объектов, ∈ – одно из описаний из полурешётки, такие что ◇ = и ◇ = ; называетсяобъёмом понятия, а – узорным содержанием.Для того, чтобы создать модель процессов с состояниями сложной структуры, нам потребуется определить узорную структуру на основе произвольного частичного порядка.
Такой частичный порядок соответствует отношениям «часть–целое», «подкласс–класс». Пусть дан некоторый частичный порядок (, ≤), тогда соответствующая ему решётка (, ⊓) задаётся как множество подмножеств таких, что если ∈ принадлежит элементу решётки ∈ , то все меньшие элементы также принадлежат этому элементу решётки, ∀ ∈ , @ ∈ , ≤ : ∈/ . При этом решёточной операцией являетсятеоретико-множественная операция пересечения. Нетрудно заметить, что результат такой операции между 1 , 2 ∈ даст некоторый элемент из . Стоитотметить, что на практике множество ∈ может иметь существенный размер и поэтому его эффективнее и осмысленнее представлять максимальнымиэлементами данного множества, ˜ = { ∈ | @ ∈ : > }.Теперь мы можем определить первую версию иерархической модели процесса с состояниями сложной структуры.
Эта модель основывается на последовательностях сложных элементов, для простоты называемые сложнымипоследовательностями.Определение 17. Пусть дана полурешётка (, ⊓), называемая алфавитом,тогда последовательностью элементов сложной структуры называется любой упорядоченный список элементов из . Такая последовательность обозначается как = ⟨1 , . . . , ⟩.Сложной такая последовательность называется потому, что алфавит такойпоследовательности является полурешёткой, в отличии от простого алфавита,в котором любые два элемента несравнимы, а также в отличии от алфавита11(℘( ), ∩), часто применяющегося в анализе данных, представленных последовательностями.
Далее необходимо исключить те последовательности, котоdрые содержат ⊥ в качестве элемента, где ⊥ =. Это делается по аналогии∈с анализом данных, представленных последовательностями, в котором исключаются все последовательности, включающие ∅.Определение 18. Последовательность = ⟨1 , . . . , ⟩ является допустимой,если для любого , ̸= ⊥.Определение 19. Последовательность = ⟨1 ; ...; ⟩ является подпоследовательностью для последовательности = ⟨1 ; ...; ⟩, что обозначается как ≤ , тогда и только тогда, когда ≤ и существуют 1 , .. такие, что1 ≤ 1 < 2 < ... < ≤ , а также для любого ∈ {1, 2, ..., }, ⊑ .Сложными последовательностями моделируются реализации процесса.Определение 19 задаёт частичный порядок на сложных последовательностях,и, таким образом, элемент полурешётки описаний на сложных последовательностей является множеством последовательностей. Такой подход задаёт решётку узорных понятий, которая получается по множеству реализаций. Однако, количество узорных понятий может быть большим.