Диссертация (Методы и алгоритмы обработки информации в информационно-аналитических системах для анализа развития событий кризисных ситуаций), страница 7
Описание файла
Файл "Диссертация" внутри архива находится в папке "Методы и алгоритмы обработки информации в информационно-аналитических системах для анализа развития событий кризисных ситуаций". PDF-файл из архива "Методы и алгоритмы обработки информации в информационно-аналитических системах для анализа развития событий кризисных ситуаций", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве РТУ МИРЭА. Не смотря на прямую связь этого архива с РТУ МИРЭА, его также можно найти и в других разделах. Архив можно найти в разделе "остальное", в предмете "диссертации и авторефераты" в общих файлах, а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст 7 страницы из PDF
Не структурированность текстов не позволяет применить алгоритмы Data Mining, но для решения данной задачи используют алгоритмы анализа неструктурированных данных Text Mining [78].Задача алгоритма Data Mining, это обработка полученных данных, например: вычисление базовых показателей, позволяющих отвечать на вопрос: «какое количество сообщений написано конкретным пользователем, за временнойпериод…». Далее выявляется статистическая закономерность: появление об-35суждений на интересующую тему после определенных событий в политическойи другой сфере [3, 25]. Для решения задачи прогноза применяют модели статистических и динамических процессов, для описания которых используют теорию графов [79, 80].Задачи мониторинга, анализа, прогнозирования и управления различаются в зависимости от того, кто является конечным пользователем информационно-аналитической системы.В настоящее время создаются системы с предельно автоматизированными ETL-процессами (extract, transfer, load – «извлечение, преобразование, загрузка»).
Значимой особенностью подобных систем является функция оперативного анализа данных, которая получает по запросу для выбора последующего направления исследования документа, в котором описаны события, объектыи субъекты (рис. 1.5).Рис. 1.5. Информационно-аналитическая система как объект анализа,прогнозирования и управления [30]36Представляет интерес одна из последних разработок, реализующая программный инструментарий для информационной поддержки повседневной деятельности оперативно-дипломатических сотрудников центрального аппаратаМИД России и российских загранучреждений – информационно-аналитическаясистема «Ангара» [30].
Эта система предназначена для повышения полноты иоперативности информационно-аналитического обслуживания пользователейпо заданной проблематике за счет автоматического формирования банка данных на основе информации из различных источников (сеть «Интернет», электронная почта, базы данных, электронные текстовые документы различныхформатов) и удобного поиска информации в банке данных. Кроме того, в системе «Ангара» на наш взгляд, удачно реализована возможность аналитическойобработки текстовой информации.В информационно-аналитической системе «Ангара», при анализе событий, существуют заданные роли:1.Действующее лицо в событии – человек (группа лиц), ассоцииро-ванный с интересующим событием, являющийся прямым или непосредственным участником.2.Автор высказывания о событии – человек, который публично, ис-пользуя информационную среду, электронный ресурс, высказывает свое мнение относительно какого-либо события.3.Аналитик – человек, использующий систему для информационногоанализа происходящих событий.4.Оператор – человек, отвечающий за работоспособность системы ипроизводящий требуемые корректировки.5.Система – комплекс технических средств анализа информационныхпотоков с целью выявления событий, закономерностей и связей (смысловых,временных, пространственных) между событиями, участниками событий и авторами высказываний.6.Аудитория – социум воспринимающий информацию.
На примереТвиттера такой аудиторией может быть граф последователей, т.е. людей, кото-37рые сознательно подписываются на информационный ресурс от конкретногоавтора.Поиск информации в базах данных и доступ к картотекам реализуется вследующих режимах:1) Поиск с получением результата в процессе ввода запроса;На рис. 1.6 показано как пользователь вводит текст в поле ввода запроса.Приостановка ввода текста приводит к выполнению поиска и выводу результата.Рис. 1.6.
Процесс ввода текста в информационно-аналитическойсистеме «Ангара» [30]2) Вывод коллекций отобранных документов;38Рис. 1.7. Просмотр сообщения в информационно-аналитическойсистеме «Ангара» [30]Рис. 1.8. Выполнение поиска в информационно-аналитическойсистеме «Ангара» [30]39На рис. 1.7 и 1.8 показано как пользователь может ввести текст в полеввода запроса. Приостановка ввода текста приводит к выполнению поиска ивыводу результата.Архитектура системы представляет модульную структуру, основнымикомпонентами которой являются:1.Коннектор к информационной среде. Коннектор осуществляет до-ступ к определенной информации, выделяет требуемую информацию из сообщения и преобразует ее в единый текстовый формат адаптированный для системы.2.Модуль идентификации событий.
Осуществляет первичную семан-тическую обработку сообщений: агрегирует и дедуплицирует семантическиблизкие сообщения и создает кластеры из таких сообщений.3.Семантический фильтр – выполняет фильтрацию сообщений, кото-рые не соответствуют запросам (интересам) аналитика.4.База знаний – агрегирует события, отвечающие постановке темати-ки. Накапливает информацию о действующих лицах, авторах, политиках и т.д.5.Аналитический блок / блок вывода – расширяемый блок, включаетнабор аналитических инструментов, которые осуществляют поиск зависимостимежду фактами в базе знаний. Осуществляется реконструкция событий, связеймежду событиями, действующими лицами.
Аналитический инструмент можетнепрерывно накапливать результаты анализа в базу знаний.6.Блок представления – включает набор инструментов для отображе-ния большого массива собираемых данных: графики, аналитические сводки,многомерные схемы, отчеты.Дополнение базовой модели выражается в процедурах всестороннегоанализа выбранных текстов на основе синтаксического анализа нужного сообщения. Анализатором служит гибридный алгоритм [28, 30], который имеет всвоей основе лингвистические понятия, представленные в виде правил и статистический анализ (рис. 1.9).40Рис.
1.9. Синтаксическая структура предложения «Истребитель МиГ-29,разработанный в интересах ВВС Индии, 4 февраля совершил первый полет»Принцип действия алгоритма построения модели событий, реализованный в информационно-аналитической системе можно рассмотреть на примеретекста в базе данных: «Истребитель МиГ-29, разработанный в интересах ВВСИндии, 4 февраля совершил первый полет». Тогда синтаксическая структурабудет иметь следующий вид, как показано на рис. 1.9.Применять синтаксическое дерево полностью для алгоритма кластеризации, не представляется возможным, так как связи в нем не сбалансированы.Поэтому используют другие представления синтаксической структуры.Усечение уровней синтаксической структуры, до верхних. То есть исходная поисковая фраза будет изменена и останутся только фактически ключевыеслова и словоформы.
В нашем примере это будет выглядеть так: «ИстребительМиГ-29 4 февраля совершил первый полет» (рис. 1.10).41Рис. 1.10. Базовая синтаксическая структура,используемая для кластеризации сообщений [30]Подведем итог, подходы и методы реализованные в программном инструментарии ИАС «Ангара» для информационной поддержки повседневнойдеятельности оперативно-дипломатических сотрудников центрального аппарата МИД России и российских загранучреждений, целесообразно использовать всоздаваемой СППР визуально-аналитического сопровождения процессов обработки структурированных данных с применением активного моделирования вусловиях интенсивного развития событий в кризисных ситуациях.
Основнойзадачей разрабатываемой СППР также будет являться оперативность информационно-аналитического обслуживания лица принимающего решение по заданной проблематике за счет автоматического формирования базы данных на основе данных информационно-аналитических систем. Также представляет интерес, реализация аналитической обработки текстовой информации.42Модульныекроссплатформенныеприложения3средствразработки,наиболее часто используются для реализации системы временных решений[81], где можно выделить технологию CLIPS (С Language Integrated ProductionSystem) [82].
Механизм расширения CLIPS позволяет встроить в интерпретаторTQL (Temporal Query Language) недостающие модули. При этом модуль системы временных решений (СВР) будет абстрагирован от тонкостей внутреннейорганизации модулей-решателей задачи согласования временных ограничений(ЗСВО) за счет стандартизированного интерфейса связи и протокола взаимодействия, работа которого основана на языке запросов СВР - TQL (TemporalQuery Language) [81, 83].Таким образом, модуль интеграции с базой данных информационноаналитических систем даст возможность использовать в программах на CLIPSпреимущества одновременного применения механизма обработки временнойинформации и продукционной системы, в отличие от технологии OLAP [78].Для разработки системы временных решений, исходя из выше изложенногоанализа активных сред разработки предложено [81, 82] использовать платформу интегрированной среды разработки ECLIPSE, широко используемого открытого источника JAVA.1.5.
Постановка задачи исследованияРезультат проведенного критического анализа выбранной предметнойобласти, позволил уточнить и дополнить сформулированные основные задачидиссертации:1.Проводя анализ развития событий кризисных ситуаций, необходи-мо как минимум определить иерархию важнейших проблем, формирующих ситуацию, иерархию актов и их требований, а также иерархию перспектив развития обстановки (вероятных сценариев). При этом, необходимо определить ка3Куриленко И.Е. Исследование и разработка методов и программных средств временного (темпорального) вывода в интеллектуальных системах поддержки принятия решений: диссертация к.т.н. ГОУ ВПО Московскийэнергетический институт (технический университет) кафедра прикладной математики, Москва, 2008.43кие варианты действий могут способствовать решению конкретной проблемы,и какие данные из других сфер научного знания необходимо привлечь дляоценки возможного развития событий.