Методические указания к выполнению ЛР8 - Разработка (анализ) данных (1033965), страница 4
Текст из файла (страница 4)
- изменение силы связи (ползунком),
- выбор атрибута и его значения.
Вкладка Cluster Profiles показывает содержимое кластеров (значения атрибутов объектов, попавших в кластер):
Какая характеристика имела основное влияние при кластеризации?
Вкладка Cluster Characteristics показывает вероятность попадания в кластер объекта с определенным значением атрибута:
Продемонстрировать работу с моделью.
Вкладка Cluster Dicrimination позволяет сравнить два кластера:
Продемонстрировать работу с моделью.
Ассоциативные правила
Построение и развертывание модели Ассоциативных правил
-
Создать модель ассоциативных правил на основе сведений о человеке.
-
Исходные атрибуты: ФИО, образование, количество детей, семейный статус, количество автомобилей, пол, возраст и т.д.
-
Для созданной ранее модели выбрать вкладку Mining Models
-
В контекстном меню выбрать – Новая модель
Указать название модели и алгоритм – Правила взаимосвязей и нажать ОК:
Будет создана модель:
Развернуть модель (аналогично рассмотренному выше).
Просмотр модели
-
Просмотреть и интерпретировать полученную модель. Дать пояснения по результатам. Продемонстрировать работу с результатами модели.
-
Вкладка Rules показывает полученные правила и их вероятность:
Продемонстрировать работу с моделью.
-
Вкладка ItemSets показывает частые наборы (которые часто встречаются у исходных объектов) и их поддержку (количество):
-
Продемонстрировать работу с моделью.
-
Вкладка Dependency Network показывает правила и их вероятность в графическом виде:
Продемонстрировать работу с моделью.
Пример задания
Задание 1. Построение аналитической модели и интерпретация результатов
Создать BI проект и указать его параметры
Запустить среду SQL Server Server Business Intelligence Development Studio (или MS Visual Studio). Выполнить следующие пункты:
-
Создать новый проект типа Business Intelligence project -> Analysis Service project.
-
Подключиться к источнику данных (сервер = localhost, БД = AdwentureWorksDW, тип авторизации = use the service account).
ВНИМАНИЕ: если такой БД на сервере нет, то нужно скачать БД примеров и установить их.
-
Создать Представление данных (data Source View).
Создание модели классификации – Дерево решений
-
Создать модель Дерево решений для определения покупателей велосипедов.
ВНИМАНИЕ: при построении модели необходимо сменить тип regular на discrete для поля Покупатель велосипеда и всех полей, имеющих тип long (age и др.).
-
Выполнить развертывание модели.
-
Продемонстрировать результаты построения модели.
-
Интерпретировать результаты.
-
Пользуясь теоретическим или детальным пособием, дать пояснения по результатам построенной модели (кто покупает велосипеды) по вкладкам.
Задание 2. Построение аналитической модели и интерпретация результатов
Создание модели кластеризации
-
Создать модель Кластеризации для выделения групп покупателей.
-
Выполнить развертывание модели.
-
Продемонстрировать результаты построения модели.
-
Интерпретировать результаты.
-
Пользуясь теоретическим или детальным пособием, дать пояснения по результатам построенной модели по вкладкам.
Задание 3. Построение аналитической модели и интерпретация результатов
Создание модели Ассоциативные правила
-
Создать модель Ассоциативные правила для выявления зависимостей между сведениями о человеке и покупкой велосипеда.
-
Выполнить развертывание модели.
-
Продемонстрировать результаты построения модели.
-
Интерпретировать результаты.
-
Пользуясь теоретическим или детальным пособием, дать пояснения по результатам построенной модели по вкладкам.
Вопросы для самопроверки:
-
Какие модели Data Mining существуют и как создать каждую из них?
-
Что такое задача классификации?
-
Что такое задача кластеризации?
-
Что такое ассоциативные правила?
-
Как просмотреть и интерпретировать резуьтаты моделирования Data Mining?
-
Как строятся различные модели Data Mining?
-
Алгоритм кластеризации.
-
Дерево решения, его назначение.
-
Как интерпретировать результаты кластеризации?
-
Как интерпретировать дерево решений?
-
Как интерпретировать ассоциативные правила?
Список литературы
-
Барсегян А. А. и др. Анализ данных и процессов. - СПб: БХВ-Петербург. - 2009 г.
-
Материалы сайта Microsoft - http://msdn.microsoft.com/ru-ru/library/cc645779.aspx
-
Кубы (службы Analysis Services http://msdn.microsoft.com/ru-ru/library/ms175680(v=sql.90).aspx
-
Использование MS SQL Server Analysis Services 2008 для построения хранилищ данных http://www.intuit.ru/department/database/mssqlsas2008/class/free/status/