ПЗ_Забарин (1220033), страница 5
Текст из файла (страница 5)
– графики, диаграммы и карты;
– история изменений объекта;
– семантические сети и когнитивные карты;
– облако тегов.
Подробнее каждая группа представлений описана ниже.
Табличное представлении является очень удобным при поиске справочной информации, а также при сравнении текстовых полей. В рамках данной группы можно также выделить календари и расписания.
Использование графиков и диаграмм позволяет существенно повысить уровень восприятия и когнитивные возможности пользователя. Выбор графика или диаграммы в значительной степени обусловлен визуализации. При выборе подходящего графика можно руководствоваться таблицей 2.1, составленной на основе [27].
Таблица 2.1 – Распределение диаграмм
| Цель визулизации/ Тип данных | Отношения в данных | Распределение данных | Сравнение данных | Композиция данных |
| Непрерывные числовые | точечная диаграмма график диаграмма с областями накопления пузырьковая диаграмма | точечная диаграмма пузырьковая диаграмма | график диаграмма с областями накопления Диаграмма радар | график с накоплением |
| Непрерывные временные | точечная диаграмма график диаграмма с областями накопления пузырьковая диаграмма | таймлайн диаграмма Ганта каскадная схема | диаграмма Ганта график с накоплением | |
| Дискретные | гистограмм точечная пузырьковая | гистограмма секторная диаграмма кольцевая диаграмма | гистограмма с накоплением секторная диаграмма кольцевая диаграмма | |
| Карты | карта график диаграмма с областями накопления | карта точечная диаграмма | карта гистограмма | |
| Логические | дерево | древовидная карта | ||
История изменений объектов. В работе [2] использован термин «Исторический поток», который позволет просматривать всю историю редактирования документа. В предлагаемой концепции существует возможность визуализации истории изменения объекта, используя сохранённые в CouchDB версии, данная возможность существует благодаря механизму репликации, который более подробно рассмотрен в разделе 3.2.
Семантические сети представляют собой модель предметной области, представленную в виде графа, вершины которого представляют объекты, а ребра отображают смысловые связи между ними. Подробнее данная модель описана в разделе 2.3.
Облако тегов (рисунок 2.2). Каждый элемент в облаке тегов отображается в соответствии с концепцией визуального веса и имеет весовой коэффициент. Весовой коэффициент зависит от важности элемента, и других факторов, определяемых экспертами. Чем выше этот коэффициент, тем больше визуальный вес элемента. Это позволяет человеку выявить из всей информации ключевые моменты.
Рисунок 2.2 – Облако тегов
Важным шагом при разработке методов визуализации информационных данных является их структуризация. Структура обеспечивает высокий уровень организации набора данных и часто является решающей в выборе метода для создания подходящей визуализации. Более подробно структурное представление визуализируемой информации описано в разделе 3.2.
Анализ визуальных данных – это процесс осмысления образов, позволяющий обрабатывать и интерпретировать смысл информации. В ходе исследования Томас Саноки и Ноа Сулман [28] установили, что способность усваивать и запоминать информацию, увеличивается при восприятии изображений с контрастной, но гармоничной цветовой гаммой, предпочтительно с сочетанием трех и менее цветов.
Для поиска критических значений и акцентировании внимания оператора удобно использовать выделение объектов, либо критических значений атрибутов. Для описания свойства элемента характеризующегося способностью «притягивает взгляд наблюдателя» в веб-дизайне используют понятие «визуального веса»
Размер элемента влияет на его восприятие, так крупные элементы обладают большим визуальным весом, чем мелкие.
Исследования показывают, что теплые тона обычно кажутся «тяжелее» холодных, которые визуально уходят на задний план. При этом самым «тяжелым» цветом считается красный, а самым «легким» – желтый. Поэтому красный цвет наиболее подходит для выделения критических состояний. Темные элементы обладают большим визуальным весом, чем светлые.
Элементы, расположенные в верхней части композиции, кажутся «тяжелее», чем те, что находятся снизу. Объекты, расположенные на переднем плане, имеют больше «веса», чем элементы заднего плана.
Объекты правильной формы кажутся «тяжелее» элементов неправильной формы, т. к. последние подсознательно воспринимаются как правильные, но лишенные части своей массы.
Вертикальные объекты кажутся «тяжелее» тех, что расположены горизонтально. Элементы, расположенные по диагонали, имеют наибольший «вес».
При разработке системы визуализации для навигации пользователя важно соблюдать правило «7±2», которое говорит о том, что оперативная память человека, способна удерживать от 5 до 9 объектов единовременно, чтобы достичь данного результата необходимо использовать инструменты фильтрации и композиции.
2.2 Методы предподготовки визуализируемых данных
При обработке больших объемов данных необходимо использовать механизм фильтрации. Фильтр – это любая операция над данными, изменяющая их количество. Параллельная фильтрации данных – это интерактивный процесс над распределенными данными, где на каждом шаге применяется параллельный фильтр, происходит передача отфильтрованных данных и их визуализация, имеющая вложенный цикл стандартного(непосредственного) взаимодействия.
Фильтрация данных предполагает в результате получение необходимой (интересующей) информации за минимальное время. Возможна другая минимаксная постановка задачи, при которой целью фильтрации данных является получение максимума полезной информации с минимальными затратами (например, затратами времени на вычисления, взаимодействия, интерпретации и т.п.). Данные большого объема определяются, как данные, которые невозможно отобразить как, в полном объеме, так и за приемлемое время. Следовательно, важным вопросом задачи обработки данных является вопрос о метриках оценки эффективности.
Общепринятый визуальный подход закрашивание («brushing») [23] интерактивно выделяет подмножества данных, чаще всего цветом. Он поддерживает визуальное связывание разнородных объектов и поэтому направлен на проблему визуальной фрагментации. В отличие от фильтрации, которая удаляет данные с дисплея, закрашивание дает добавочную информацию, накладывая уточненное изображение на существующую структуру. Однако закрашивание требует собственной кодирующей величины, то есть графический атрибут, используемый для выделения выступающих точек, должен быть сохранен, будь то цвет, форма или текстура. Эти графические атрибуты уже стандартно применяются в визуализации со многими параметрами (множественной визуализации). В частности, цвет удобен для категоризации. Таким образом, брашинг – это категоризация или выделение цветом. Он не приводит к сокращению объема данных, а только уточняет структуру данных.
Кластеризация – это тематическая категоризация или классификация. Данные принадлежат тому кластеру, расстояние до которого минимальное. При кластеризации также возможно сжатие данных - в кластере оставляют элемент с наибольшей мощностью. Одно из клише кластеризации – разделяй и властвуй. В связи с развитием интернет-технологий направление вектора формализации сместилось от методов линейного программирования в сторону нечетких множеств, с точки зрения программиста являющимися ассоциативными массивами. В данном случае фундаментом кластеризации является алгоритм MapReduce принцип работы которого, представлен на рисунке 2.3.
Рисунок 2.3 – Принцип работы MapReduce
Работа алгоритма MapReduce состоит из двух шагов: Map и Reduce. На Map-шаге происходит предварительная обработка входных данных. Для этого один из компьютеров получает входные данные задачи, разделяет их на части и передает другим компьютерам для предварительной обработки. Название данный шаг получил от одноименной функции высшего порядка.
На Reduce-шаге происходит свёртка предварительно обработанных данных. Главный узел получает ответы от рабочих узлов и на их основе формирует результат – решение задачи, которая изначально формулировалась [29].
2.3 Модель представления объектов с использованием графов
Модель базы данных состоит из совокупности объектов и множества связей между ними. Объектами могут быть регионы, организации. Под связями понимаются не только коммуникационные взаимодействия между объектами, но и связи по обмену различными ресурсами и деятельностью, также можно выделить ассоциативные связи. С математической точки зрения модель представляет собой граф
, где
– множество вершин, представляющих собой множество объектов,
– множество ребер, отображающих связи между вершинами.
Одним из современных подходов визуализации графов является использование основанных на аналогии пружин и электрических сил. Вершины графа представляются заряженными частицами, которые отталкиваются друг от друга, а ребра – пружинами, которые притягивают смежные вершины графа, когда они удалены друг от друга, и отталкивают, когда они находятся слишком близко. Поэтому такие алгоритмы называются алгоритмами пружинной укладки графа. Эти методы предназначены в основном для визуализации неориентированных графов, однако существует ряд алгоритмов, которые могут быть использованы для визуализации ориентированных и иерархических графов.
В простейшей реализации метода сила, действующая на вершину
, определяется по формуле:
где
расстояние между вершинами
и
;
сила притяжения и
сила отталкивания. Функции
и
основаны на законе Гука и электрическом отталкивании частиц и определяются по формулам:















