Антиплагиат (1220030), страница 6
Текст из файла (страница 6)
Атрибутом является свойство объекта, которое не мож ет сущ ествовать независимо от него.Рисунок 2. 1– Структура обработки «больших данных».На э тапе начальной обработки данных, загруж енные данные подвергаются систематизац ии и начальному анализу с ц елью помещ ения вхранилищ е данных. Основной реж им функц ионирования состоит из следующ их последовательности событий:1) происходит предобработка данных которая мож ет заключатся в фильтрац ии, агрегац ии, трансформац ии и других операц ия надданными, исходя из ц ели визуализац ии;2) синтез модели графического образа на основе загруж енных данных и параметров коррекц ии;3) формирование графического образа;4) вывод изображ ения на средства отображ ения информац ии;5) взаимодействие с оператором с ц елью уточнения данных, изменения точки обзора графического образа и т.д.;6) коррекц ия графического образа в соответствии с данными, полученными в результате взаимодействия с оператором.Проц есс визуального отображ ения – начальная точка для создания визуализац ии.
Чем разнообразнее информац ия, которую нам нуж новизуализировать, тем в большем количестве методов создания визуальных представлений мы нуж даемся. В ходе анализа исследований[2,27] составлена классификац ия. Наиболее актуальные способы визуализац ии данных мож но представить в нескольких группах:– табличное представление;– графики, диаграммы и карты;– история изменений объекта;– семантические сети и когнитивные карты;– облако тегов.Подробнее каж дая группа представлений описана ниж е.Табличное представлении является очень удобным при поиске справочной информац ии, а такж е при сравнении текстовых полей.
Врамках данной группы мож но такж е выделить календари и расписания.Использование графиков и диаграмм позволяет сущ ественно повысить уровень восприятия и когнитивные возмож ности пользователя.Выборграфикаили диаграммы в значительной степени обусловлен визуализац ии. При выбореподходящ егографикамож норуководствоваться таблиц ей 2.1, составленной на основе [27].Таблиц а 2.1 – Распределение диаграммЦельвизулизац ии/Тип данныхОтношения в данныхРаспределение данныхСравнениеданныхКомпозиц ия данныхНепрерывныечисловыеточечнаядиаграммаграфикдиаграмма с областями накопленияhttp://dvgups.antiplagiat.ru/ReportPage.aspx?docId=427.24085263&repNumb=112/2227.04.2016Антиплагиатпузырьковая диаграмматочечнаядиаграммапузырьковаядиаграммаграфикдиаграммас областями накопленияДиаграмма радарграфик с накоплениемНепрерывныевременныеточечнаядиаграммаграфикдиаграмма с областями накопленияпузырьковая диаграмматаймлайндиаграмма Гантакаскадная схемадиаграмма Гантаграфик с накоплениемДискретныегистограммточечнаяпузырьковаягистограммасекторнаядиаграммакольц еваядиаграммагистограммаснакоплениемсекторнаядиаграммакольц еваядиаграммаКартыкартаграфикдиаграмма с областяминакоплениякартаточечнаядиаграммакартагистограммаЛогическиедереводревовидная картаИстория изменений объектов.
В работе [2] использован термин «Исторический поток», который позволет просматривать всю историюредактирования документа. В предлагаемой конц епц ии сущ ествует возмож ность визуализац ии истории изменения объекта, используясохранённые в Couch версии, данная возмож ность сущ ествует благодаря механизму репликац ии, который более подробно рассмотрен вразделе 3.2.Семантические сети представляют собой модель предметной области, представленную в виде графа, вершины которого представляютобъекты, а ребра отображ ают смысловые связи меж ду ними.
Подробнее данная модель описана в разделе 2.3.Облако тегов (рисунок 2.2). Каж дый э лемент в облаке тегов отображ ается в соответствии с конц епц ией визуального веса и имеет весовойкоэ ффиц иент. Весовой коэ ффиц иент зависит от важ ности э лемента, и других факторов, определяемых э кспертами. Чем выше э тоткоэ ффиц иент, тем больше визуальный вес э лемента. Это позволяет человеку выявить из всей информац ии ключевые моменты.Рисунок 2.2 – Облако теговВаж ным шагом при разработке методов визуализац ии информац ионных данных является их структуризац ия. Структура обеспечиваетвысокий уровень организац ии набора данных и часто является решающ ей в выборе метода для создания подходящ ей визуализац ии.Более подробно структурное представление визуализируемой информац ии описано в разделе 3.2.Анализ визуальных данных – э то проц есс осмысления образов, позволяющ ий обрабатывать и интерпретировать смысл информац ии.
В ходеисследования Томас Саноки и Ноа Сулман [28] установили, что способность усваивать и запоминать информац ию, увеличивается привосприятии изображ ений с контрастной, но гармоничной ц ветовой гаммой, предпочтительно с сочетанием трех и менее ц ветов.Для поиска критических значений и акц ентировании внимания оператора удобно использовать выделение объектов, либо критическихзначений атрибутов. Для описания свойства э лемента характеризующ егося способностью «притягивает взгляд наблюдателя» в вебдизайне используют понятие «визуального веса»Размер э лемента влияет на его восприятие, так крупные э лементы обладают большим визуальным весом, чем мелкие.Исследования показывают, что теплые тона обычно каж утся «тяж елее» холодных, которые визуально уходят на задний план. При э томсамым «тяж елым» ц ветом считается красный, а самым «легким» – ж елтый.
Поэ тому красный ц вет наиболее подходит для выделениякритических состояний. Темные э лементы обладают большим визуальным весом, чем светлые.Элементы, располож енные в верхней части композиц ии, каж утся «тяж елее», чем те, что находятся снизу. Объекты, располож енные напереднем плане, имеют больше «веса», чем э лементы заднего плана.Объекты правильной формы каж утся «тяж елее» э лементов неправильной формы, т.
к. последние подсознательно воспринимаются какправильные, но лишенные части своей массы.Вертикальные объекты каж утся «тяж елее» тех, что располож ены горизонтально. Элементы, располож енные по диагонали, имеютнаибольший «вес».При разработке системы визуализац ии для навигац ии пользователя важ но соблюдать правило «7±2», которое говорит о том, чтооперативная память человека, способна удерж ивать от 5 до 9 объектов единовременно, чтобы достичь данного результата необходимоиспользовать инструменты фильтрац ии и композиц ии.http://dvgups.antiplagiat.ru/ReportPage.aspx?docId=427.24085263&repNumb=113/2227.04.2016Антиплагиат2.2 Методы предподготовки визуализируемых данныхПри обработке больших объемов данных необходимо использовать механизм фильтрац ии. Фильтр – э то любая операц ия над данными,изменяющ ая их количество. Параллельная фильтрац ии данных – э то интерактивный проц есс над распределенными данными, где накаж дом шаге применяется параллельный фильтр, происходит передача отфильтрованных данных и их визуализац ия, имеющ аявлож енный ц икл стандартного(непосредственного) взаимодействия.Фильтрац ия данных предполагает в результате получение необходимой (интересующ ей) информац ии за минимальное время.
Возмож надругая минимаксная постановка задачи, при которой ц елью фильтрац ии данных является получение максимума полезной информац ии сминимальными затратами (например, затратами времени на вычисления, взаимодействия, интерпретац ии и т.п.). Данные большого объемаопределяются, как данные, которые невозмож но отобразить как, в полном объеме, так и за приемлемое время. Следовательно, важ нымвопросом задачи обработки данных является вопрос о метриках оц енки э ффективности.Общ епринятый визуальный подход закрашивание («brushing») [23] интерактивно выделяет подмнож ества данных, чащ е всего ц ветом.
Онподдерж ивает визуальное связывание разнородных объектов и поэ тому направлен на проблему визуальной фрагментац ии. В отличие отфильтрац ии, которая удаляет данные с дисплея, закрашивание дает добавочную информац ию, накладывая уточненное изображ ение насущ ествующ уюструктуру. Однакозакрашиваниетребуетсобственнойкодирующ ейвеличины, тоестьграфическийатрибут,используемый для выделения выступающ их точек, долж ен быть сохранен, будь то ц вет, форма или текстура. Эти графические атрибутыуж е стандартно применяются в визуализац ии со многими параметрами (множ ественной визуализац ии).
В частности, ц вет удобен длякатегоризац ии. Таким образом, брашинг – э то категоризац ия или выделение ц ветом. Он не приводит к сокращ ению объема данных, атолько уточняет структуру данных.Кластеризац ия – э то тематическая категоризац ия или классификац ия. Данные принадлеж ат тому кластеру, расстояние до которогоминимальное. При кластеризац ии такж е возмож но сж атие данных - в кластере оставляют э лемент с наибольшей мощ ностью. Одно изклише кластеризац ии – разделяй и властвуй.
В связи с развитием интернет-технологий направление вектора формализац ии сместилось отметодов линейного программирования в сторону нечетких множ еств, с точки зрения программиста являющ имися ассоц иативнымимассивами. В данном случае фундаментом кластеризац ии является алгоритм MapReduce принц ип работы которого, представлен нарисунке 2.3.Рисунок 2.3 – Принц ип работы MapReduceРабота алгоритмаMapReduce состоит из двух шагов: Мар и Reduce. На Мар-шаге происходит предварительная обработка входных данных. Для этогоодин из компьютеров получает входные данные задачи, разделяет их на части и передает другим компьютерам дляпредварительной обработки. Название данный шаг получил от одноименной функции высшего порядка.На Reduce-шаге происходит[40]свёртка [47]предварительноузлов и на их основе формирует результат –2.3[40]решениеобработанных данных.
Главный узел получает ответы от рабочихзадачи, которая изначально формулировалась [29].[47]Модель представления объектов с использованием графовМодель базы данныхсостоит из совокупности объектов и множества связей между ними. Объектами могут быть регионы, организации.
Под связямипонимаются не только коммуникационные взаимодействия между объектами, но и связи по обмену различными ресурсами идеятельностью,[24]такж е мож но выделить ассоц иативные связи. Сматематической точки зрения модель представляет собой граф G = (V, Е), где V – множество вершин, представляющих собоймножество объектов, Е – множество ребер, отображающих связи между вершинами.Одним из современных подходов визуализации графов является использование основанных на аналогии пружин и электрическихсил. Вершины графа представляются заряженными частицами, которые отталкиваются друг от друга, а ребра – пружинами,которые притягивают смежные вершины графа, когда они удалены друг от друга, и отталкивают, когда они находятся слишкомблизко.















