Автореферат (1137258)
Текст из файла
На правах рукописиБУЗМАКОВАлексей ВладимировичМОДЕЛИРОВАНИЕ ПРОЦЕССОВ С СОСТОЯНИЯМИСЛОЖНОЙ СТРУКТУРЫ НА ОСНОВЕ РЕШЁТОКЗАМКНУТЫХ ОПИСАНИЙСпециальность 05.13.18 —Математическое моделирование, численные методы и комплексы программ(технические науки)АВТОРЕФЕРАТдиссертации на соискание учёной степеникандидата технических наукМосква – 2014Работа выполнена в федеральном государственном автономном образовательном учреждениивысшего профессионального образования «Национальный исследовательский университет«Высшая школа экономики»Научный руководитель:Кузнецов Сергей Олегович, доктор физикоматематических наук, заведующий кафедрой анализаданных и искусственного интелекта Национальногоисследовательского университета «Высшая школаэкономики»Официальные оппоненты:Вагин Вадим Николаевич, доктор техническихнаук, профессор кафедры прикладной математикиФГОБУ ВПО Национального исследовательскогоуниверситета Московский Энергетический ИнститутВиноградов Дмитрий Вячеславович, кандидатфизико-математических наук, старший научныйсотрудник отдела теоретических и прикладныхпроблем информатики ФГБУН Всероссийскогоинститута научной и технической информацииВедущая организация:ФГБУНИнститутим.
В.А. ТрапезниковапроблемуправленияЗащита состоится «16» февраля 2015 года в 13:00 на заседании диссертационного советаД 212.048.09, созданного в «Национальном исследовательском университете «Высшая школаэкономики» по адресу: 105187, г. Москва, ул. Кирпичная, д.33, ауд. – 503.С диссертацией можно ознакомиться в библиотеке Национального исследовательскогоуниверситета «Высшая школа экономики» по адресу: 101990, г. Москва, ул.
Мясницкая, д.20, и на сайте http://www.hse.ru/sci/diss/.Автореферат разослан « » октября 2014 г.Ученый секретарьдиссертационного советадоктор технических наук, профессорНазаров Станислав ВикторовичОбщая характеристика работыАктуальность темы. Многие явления окружающего мира могут бытьпредставлены процессами. Например, развитие болезни пациента характеризуется изменением состояния больного, происходящего в том числе под воздействием применяемого подхода к его лечению.
При моделировании процессов только некоторые особенности состояний могут быть зафиксированыи обработаны. Последовательности зафиксированных состояний называютсяреализациями процесса, а всё множество доступных реализаций процесса называется его логом. Таким образом, располагая логами процесса, можно построить его модель, которая может быть использована для решения различных задач, таких как экспертный анализ процесса, а также классификация икластеризация новых реализаций процесса. В этой работе мы фокусируемсяна задаче автоматического построения модели процесса для её последующегоанализа экспертом.
Например, для задачи анализа процесса госпитализацийпациентов одна реализация может состоять из состояний, каждое из которыхописывается рядом параметров, таких как, расположение больницы, применяемые медицинские процедуры, продолжительность госпитализации и др.Модель, построенная по логу процесса госпитализации, может быть использована экспертом для различных стоящих перед ним задач, таких как оптимизация процесса лечения по качеству или скорости, поиск систематическихошибок процесса.За последнее десятилетие было проведено много исследования моделейпроцессов и методов их построения с акцентом на события, такие как сетиПетри, Yawl и другие (W.
van der Aalst, 2011). В этих работах под событиями понимаются переходы из одного состояния в другое. Структура же самихсобытий в этих работах не рассматривается. В этой работе мы фокусируемся именно на состояниях процесса, в то время как переходы между нимирассматриваются просто как временные отношения следования. Более того, вэтой работе мы рассматриваем процессы с состояниями сложной структуры,что подчёркивает тот факт, что одно состояние описывается многими параметрами разной природы. В частности, для процесса госпитализации пациентоводно состояние описывается среди прочих параметров не просто именем боль-3ницы, но также и таксономией больниц по территориальному расположению– древовидной структурой, задающей отношение частное-общее, в которойтакже присутствуют больницы «обобщённого» вида, такие как «все больницыопределённого города».
Это позволяет включить в модель как можно болееполный лог процесса, что помогает строить модель процесса госпитализациис «обобщением» некоторых параметров, и, таким образом, предоставляет эксперту возможность более подробно исследовать процесс госпитализации.Для моделей таких процессов могут быть применены различные подходы(M. Plantevit et al., 2010; E.
Egho et al., 2014), которые ищут частые последовательности в логе процесса, при этом структура одного элемента последовательности может включать несколько компонент, для каждой из которыхзадана таксономия. К сожалению, в этих подходах нельзя передать такую важную информацию, как количество повторений определённой процедуры, например, химиотерапии. И, более того, эффективность этих подходов невысокая, при условии, что многие из порождаемых элементарных моделей имеютмалую пользу для эксперта. Другим возможным подходом к анализу такихданных является работа (S. Tsumoto, 2014), в которой авторы на основе статистических методов отображают данные, собранные в больницах. Однако данная работа не фокусируется на последовательных зависимостях, и в ней такиезависимости имеют очень грубое представление, привязанное к конкретнымвременам суток.Специфика процессов с состояниями сложной структуры требует специального типа моделей, способного представлять средства выражения сходстваи различия реализаций процесса с состояниям сложной структуры.
В качестве математического аппарата построения моделей процессов с состояниямисложной структуры используются решетки замкнутых описаний, представляемые так называемыми узорными структурами (B. Ganter & S.O. Kuznetsov,2001), дополненные средствами приближенного описания - проекциями описаний, позволяющим моделировать информацию о большом количестве реализаций процессов с помощью существующих эффективных алгоритмов. Этотматематический аппарат позволяет находить классы реализаций процессовсхожих между собой, с получением соответствующего сходства.
Найденныеклассы реализаций процессов упорядочены по включению соответствующих4множеств реализаций в каждом классе и формируют так называемую иерархическую модель процесса. Такая модель состоит из множества элементарныхмоделей процесса, каждая из которых описывает процесс на определённомуровне абстракции, учитывающем только часть информации доступную в логах процесса.Таким образом, объектом исследования являются различные процессы ссостояниями сложной структуры.
Предметом исследования являются математическая модель, алгоритмы её построения и комплекс программ анализапроцессов с состояниями сложной структуры с целью экспертного анализаэтого процесса для его оптимизации и поиска ошибок.Целью диссертационного исследования является разработка подходов кпостроению моделей процессов с состояниями сложной структуры на основе решёток замкнутых описаний. Модели должны строиться за приемлемоевремя и иметь размер адекватный для экспертного анализа.В соответствии с целью исследования были поставлены следующиезадачи:1. Предложить иерархическую модель процессов с состояниями сложнойструктуры, которую можно построить за приемлемое время, с цельюдальнейшего экспертного анализа.2. Предложить адекватную, эффективно вычислимую меру качества элементарных моделей процессов с состояниями сложной структуры с целью уменьшения сложности иерархической модели таких процессов.3.
Разработать комплекс программ для анализа процессов с состояниямисложной структуры на основе предложенной модели и апробировать егона данных о процессах госпитализации пациентов.Следующие особенности работы определяют её научную новизну:1. Предложен класс моделей на основе узорных структур для исследованияпроцессов с состояниями сложной структуры.2. Подход к моделированию на основе решеток замкнутых описаний былобобщён на более широкий класс проекций описаний, имеющих высокую практическую значимость. Это позволило автоматически строить5модели введённого класса за меньшее время, чем при использованииальтернативных подходов.3.
Впервые для измерения качества элементарных моделей была экспериментально проверена на широкой тестовой базе данных возможностьприменения меры качества по устойчивости.4. Были предложены две эффективные оценки устойчивости, которые имеют лучшие вычислительные характеристики и точность, чем существующие аналоги.5. Впервые создан комплекс программ, позволяющий разрабатывать модели на основе решеток замкнутых описаний, в рамках которого былареализована модель процессов с состояниями сложной структуры. Этамодель была апробирована на процессе госпитализации пациентов.Теоретическая ценность данной работы состоит1.
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.