Антиплагиат (1220030), страница 5
Текст из файла (страница 5)
С помощ ью реляц ионной БД, необходимоопределить структуру перед добавлением каких-либо записей.Изменение структуры или добавления новых полей в таблиц у реляц ионной БД, когда БД запущ ена на сервере вызывает множ ествотрудностей [22].Структура данных в NoSQL базах в отличие от реляц ионных, не регламентирована. Отдельному объекту мож но добавить произвольныйатрибут. При э том не требуется предварительного декларативного изменения структуры всей таблиц ы, что характерно для SQL. Какследствие отсутствия схемы – эффективность работы с разреженными данными. Если в одном документе есть поле A, а во втором– нет, значит никакого пустого поля A для второго создано не будет.
Однако в силу отсутствия схемы, колонки не объявляютсядекларативно и могут меняться/добавляться во время пользовательской сессии работы с базой [23].В 2000[43]году Эрик Брюэ р публикует статью с идеей фундаментального компромисса меж ду согласованностью данных, доступностью иустойчивости к разделению. Позж е идея стала широко известна как САР теорема, которая широко обсуж дается и по сей день.Согласованность означает данные во всех узлах кластера не противоречат друг другу.
Пользователь мож ет получить те ж е данныезапрашивая любой узел в кластере. Доступность означает, что любой запрос к распределённой системе завершается корректнымоткликом. Устойчивость к разделению свойство системы гарантирующ ее, что расщ епление распределённой системы на несколькоизолированных секц ий не приводит к некорректности отклика от каж дой из секц ий.Согласованность является свойством, в котором сравниваемые технологии различны.
NoSQL базы являются менее согласованными из-заденормализац ии данных. Для того чтобы увеличить согласованность, количество узлов долж но быть увеличено. Но увеличение количестваузлов такж е уменьшает устойчивость БД. Согласно теореме САР [24], система мож ет иметь только два из трех свойств, таких каксогласованность, доступность и устойчивость к разделению. Как показано на рисунке 1.3, только два из трех аспектов могут бытьдостигнуты в любой момент времени. Для реляц ионных баз данных э то свойства доступности и согласованности БД, поскольку данныехранятся на одной машине.Большинство баз данных NoSQL как правило, теряют согласованность для достиж ения лучшей доступности и устойчивости к разделениюдля решения проблемы масштабируемости.
Архитектура БД выбирается в соответствии с потребностями бизнес-требований.Например, в Amazon ynamo акц ент сделана высокуюдоступность и устойчивость к разделению, потому что Amazon является сервис-ориентированной компанией и обеспечивает непрерывноеобслуж ивание своих клиентов, что ж изненно важ ное для выж ивания компании [24].Рисунок 1.3 – САР теоремаhttp://dvgups.antiplagiat.ru/ReportPage.aspx?docId=427.24085263&repNumb=110/2227.04.2016АнтиплагиатРеляц ионные БД решают проблему избыточности данных и возникновения аномалий в реляц ионной схеме за счет использованиянормализац ии [24]. Применив нормализац ию, БД обеспечивает ц елостность данных и позволяет избеж ать избыточных данных.
Когдаданные распределены, производительность реляц ионной БД сущ ественно сниж ается, и они становятся не э ффективны. Что частоупоминается разработчиами. В распределенной системе, самый слож ный запрос операц ия «JOIN». Производительность реляц ионной БДочень мала, когда необходимо отображ ение реляц ионных данных из слож ных программируемых структур, где программируемая модельсостоит из комплекса данные или иерархических данные, такие как Extensible Markup Language (XML).Таблиц а 1.1 – Свойства реляц ионных баз данных и NoSQLРеляц ионные БДБД NoSQLслож ные взаимоотношения данныхпростые взаимоотношениясхемац ентричностьструктурированные данныепроизвольная схеманеструктурированные данныевертикальная масштабируемостьраспределённая обработкастатическая памятьпамять масштабируется вместе свычислительными ресурсамиуниверсальные свойства и функц иисистема ориентирована наприлож ение и разработчикастрогая согласованность данныхчастичная согласованность данныхдлительность получениярезультатовбыстрое получение результатовэ ффективность при работе с таблиц амивозмож ность работы с неструктурированными даннымистабильность, э фективность в задачах с неизменным проц ессом и набором объектовгибкость, возмож ность хранения данных любых типовРезультаты испытаний показывают, что обработка запросов на чтение и запись на в рамках одного компьютера происходит медленнеечем в SQL, однако значительно возрастает в многокомпьютерных кластерных системах [25].Важ нейшим преимущ еством в условиях роста объёма данных, является тот факт, что при превышении объема 200-300 ГБ, SQL сервер неспособен обрабатывать данные, однако, для технологии NoSQL нет подобных ограничений.
Таким образом система не только обладаетмасштабируемостью, но такж е показывает себя значительно э ффективнее при расширении системы, БД NoSQL является наиболееподходящ ей для задач, в которых хранилищ е данных распределено по разным серверам и где согласованность не является приоритетнойзадачей. Несмотря на то что NoSQL используется уж е несколько лет ещ е сущ ествует проблема визуализац ии состояния объекта БД.Визуализац ии состояния объектовВизуализац ия информац ии – использование созданных с помощ ью компьютера интерактивных, визуальных представлений абстрактныхданных для лучшего восприятия.Вопросам анализа и визуализац ии больших объемов данных (igata) посвящ ено множ ество работ отечественных [1-8,26] и зарубеж ных[9,10] авторов.Ключевая задача визуализац ии информац ии заключается в создании понятного пользователю графического отображ ения набораданных, а такж е в использовании интерактивных технологий, которые бы упростили работу с данными и позволили пользователю изучатьих интуитивно [3].Визуализац ия информац ии основывается на знаниях таких областей как компьютерная графика, человеко-машинное взаимодействие,графический дизайн, когнитивная психология, статистика, картография и изобразительное искусство.Продвиж ение визуализац ии информац ии в значительной степени было обусловлено исследованием поиска информац ии.
Основнаяпроблема поиска информац ии – э то повысить его э ффективность и результативность.Визуализац ия информац ии – проц есс анализа и преобразования абстрактных данных в визуальную форму для того, чтобы улучшить нашевосприятие больших объемов данных.Визуализац ия множ ества объектов с различных точек зрения позволяет составить более полное представление и получить большеинформац ии об отображ аемых объектах, что позволяет более э ффективно исследовать полученную информац ию, а такж е повышаяосведомленность пользователя об объектах.Качественная визуализац ия позволяет:– Предоставить возмож ность охватить огромные объемы данных.– Снизить затраты времени на поиск.– Обеспечить более глубокое понимание слож ного набора данных.– Отображ ать отношения меж ду данными.– Рассматривать набор данных с различных точек зрения[5].Принц ипы человеческого восприятия используются для э ффективного визуализац ии данных.
Методы визуализац ии преобразовать данныев полезную информац ию в графическом виде.Визуализац ия полезна для понимания закономерностей в данных и для восприятия отклонений, которые могут присутствовать. Она мож етпомочь принять решение и анализировать данные в контексте. Визуализац ия полезно при анализе данных в ц елом и мож ет поддерж иватьрассуж дения, основываясь на информац ии. И, наконец , визуализац ия помогает подчеркнуть важ ные аспекты данных.В настоящ ее время все чащ е возникает необходимость использовать методы визуализац ии навигац ии и представления данных для болееэ ффективного управления информац ией. Применение методов и средств визуализац ии информац ионными системами, открывает новыевозмож ности для восприятия их содерж имого и значительно повышает информативность и э ффективность информац ионных систем.Интерактивная компьютерная графика (ИКГ) – э то одно из наиболее бурно развивающ ихся направлений новых информац ионныхтехнологий, которые позволяют активизировать свойственную человеку способность мыслить слож ными пространственными образами.Когнитивная функц ия ИКГ состоит в том, чтобы с помощ ью некоего ИКГ-изображ ения получить новое, ещ е не сущ ествующ ее дляспец иалиста знание или, по крайней мере, способствовать интеллектуальному проц ессу получения э того знания [6].
Наиболееактуальными на сегодняшний день являются исследования возмож ности использования когнитивной компьютерной графики при анализебольших объемов данных.Когнитивный подход научное направление в области решения задач анализа, моделирования, идентификац ии, оц енки, прогнозированияразвития, управления развитием слабоструктурированных объектов, систем, ситуац ий для которых проц есс решения практических задачрассматривается как познавательная деятельность, в которой применение формальных моделей и методов является лишь частью, э тапомрешения, наряду с не менее важ ным э тапом формализац ии представлений о слабоструктурированных системах и ситуац иях, а такж е оц елях, интересах и мотивац иях субъектов, вовлеченных в проц есс решения задач.Для повышения э ффективности решений практических задач управления при разработкетеоретических моделей, методов икомпьютерных средств важ ная роль отводится учету человеческого фактора, знаний, накопленных и развиваемых в когнитивной наукеhttp://dvgups.antiplagiat.ru/ReportPage.aspx?docId=427.24085263&repNumb=111/2227.04.2016Антиплагиат[7].Реальные технические системы, использующ ие технологию когнитивной графики, сущ ествуют и разрабатываются в ИПС РАН, ИСА РАН,МЭИ.
В медиц ине – для мониторинга состояния больных, в технике – для обслуж ивания запуска ракет, стыковки космических аппаратов,контроля состояния реакторов АЭС и др. прилож ениях. При э том «объект управления» и его отображ ение в когнитивный графическийобраз определен и понятен для оператора. Например, для визуальной оц енки состояния э нергоблока АЭС на э кран выводятсядинамический образ сканируемых э лементов, ц вет которых отраж ает близость параметров к критическим порогам [8].Развитие семантических сетевых моделей позволяет перейти к новому уровню исследования визуализированных данных. Картинаисследования и принятия решения будет более полной если рассматривать не только атрибуты объекта, как э то было представлено вреляц ионных базах данных, но и в контексте связей с другими объектами.
В условиях динамических изменений реального мира выводы обобъекте мож но сформулировать на основе связей его с другими объектами так, как круж ение объекта говорит о многом. Этот принц ипмож но описать проц итировав Еврипида: «скаж и мне кто твой друг, и я скаж у кто ты».1.4 Выводы по главе. Постановка задачи исследованияС ростом объема данных появилась необходимость в развитии нового типа баз данных, который мож ет хранить и управлять слож нымиданными. Одной из наиболее важ ных и ресурсоемких задач проц есса контроля состояния и динамики изменения объектовгосударственного управления является периодический поиск и анализ большого объема информац ии, содерж авшейся в различных формахпредставления, необходимой для принятия решений.Значительный объем исходных данных и многообразие их типов и форм представления с одной стороны и необходимость разностороннегоописанияобъектовуправлениясучетомихвзаимосвязейиособенностейфункц ионированиясдругой,породилипроблемуавтоматизированного анализа открытых данных с ц елью выявления закономерностей, получения новых знаний об объекте управления,восполнения недостающ их данных, прогнозирования поведения объекта управления и т.д.Эволюц ия алгоритмов обработки данных в сторону интеллектуализац ии, все ближ е приближ ается к задачам интеллектуальнойдеятельности человека в соответствии с э тим необходим новый тип баз способный предоставить возмож ности хранения и обработкипервичной информац ии.Перспективным направлением развития информац ионных систем в рамках решения задач прогнозирование является возмож ность сбора иобработки первичной информац ии для последующ его предоставленя э ксперту, что приводит к необходимости построенияграфического образа, пригодного для использования в системах анализа больших объемов данных.На основании выше излож енной проблематики в данной ВКР были поставлены следующ ие задачи.–исследовать возмож ности современных NoSQL систем, и выявить их преимущ ества перед SQL в рамках конц епц ии ig ata;– создать кластер способный обеспечить работу NoSQL хранилищ а, и разработать первичную структуру объектов, для возмож ности ихвизуализац ии;– сформулировать подход к формированию графического образа, пригодного для использования в системах анализа больших объемовданных, в рамках конц епц ии семантических сетевых моделей;– разработать схему визуализац ии состояния объектов;– реализовать веб прилож ения реализующ ие полож ения данных конц епц ий;–сформулировать направления дальнейшего развития разрабатываемой информац ионной системы.2 КОНЦЕПЦИЯ ВИЗУАЛИЗАЦИИ2.1 Конц епц ия описания состояния объектовВотличие от реляционной модели, которая сохраняет логическую бизнес-сущность приложения в различные физические таблицы,в целях нормализации NoSQL хранилища оперируют с этими сущностями как с целостными объектами.Объекты–э топредметыинтереса,которыеваж новизуализировать.Объектхарактеризуется[43]набороматрибутов,которыеподразделяться на статические, неизменяемые в течение времени; и динамические наборы параметров, описывающ ие состояния объектав определенные моменты времени.















