Ответы к зачёту 1-24: КМ-2. Data Mining. Тестирование
Описание
Документ содержит материал с легким поиском по словам
Задача классификации решается с помощью следующих методов:
| линейная регрессия |
| генетические алгоритмы |
| деревья решений |
| метод деления пополам |
| байесовские методы |
Метод деревьев решений является методом решения:
| задачи классификации |
| задачи прогнозирования |
| задач классификации и кластеризации |
| задачи кластеризации |
| задач классификации и прогнозирования |
Основными этапами процесса Data Mining являются:
| построение модели |
| выбор модели |
| подготовка данных |
| применение модели |
| анализ предметной области |
Характеристиками кластера являются:
| внешняя изолированность |
| разнородность объектов в кластере |
| внутренняя изолированность |
| внешняя однородность |
| внутренняя однородность |
Метод деревьев решений работает:
| с числовыми и категориальными данными |
| с числовыми данными |
| с категориальными данными |
| с числовыми и символьными данными |
| с символьными данными |
Точность моделей, созданных при помощи деревьев решений, сопоставима с:
| методами кластеризации |
| байесовской классификацией |
| нейронными сетями |
| методом опорных векторов |
| статистическими методами |
Характеристиками оценивания метода классификации являются:
| скорость |
| надежность |
| объем исходных данных |
| масштабируемость |
| интерпретируемость |
Этап очистки данных процесса Data Mining включает:
| преобразования данных |
| противоток данных |
| подтверждение данных |
| определение необходимого количества данных |
| анализ данных |
Алгоритм, который строит отдельные ветви дерева решений для каждого класса, это:
| алгоритм покрытия |
| алгоритм классификации |
| алгоритм ID3 |
| алгоритм перебором |
| масштабируемый алгоритм |
Классификация, которая производится по внешнему признаку и служит для придания множеству предметов нужного порядка, является:
| искусственной |
| сложной |
| простой |
| одномерной |
| естественной |
Различие задач классификации и кластеризации состоит:
| при классификации имеется один класс данных, который затем разбивается на подклассы |
| при кластеризации имеется один кластер данных, который затем разбивается на более мелкие кластеры |
| при классификации классы изучаемого набора данных заранее не предопределены |
| при кластеризации классы изучаемого набора данных заранее не предопределены |
| при кластеризации классы изучаемого набора данных заранее предопределены |
Основными этапами алгоритма конструирования деревьев решений являются:
| обходы дерева |
| сокращение дерева |
| тестирование дерева |
| анализ дерева |
| построение дерева |
Основными этапами процесса классификации являются:
| анализ модели |
| верификация модели |
| тестирование модели |
| использование модели |
| конструирование модели |
Признаками, характеризующими качество классификационной модели, построенной при помощи дерева решений, являются:
| количество правильно классифицированных объектов |
| общее количество классифицированных объектов |
| точность распознавания |
| время распознавания |
| ошибка |
Этап подготовки данных процесса Data Mining включает:
| анализ требований к данным |
| очистка данных |
| определение необходимого количества данных |
| предварительная обработка данных |
| сбор данных |
При решении задачи классификации применяются методы:
| деревья решений |
| метод опорных векторов |
| метод ближайшего соседа |
| линейная регрессия |
| байесовская классификация |
«Грязными» данными являются:
| шумы |
| пропущенные значения |
| выбросы |
| нулевые значения |
| дубликаты |
Основным отличием задачи кластеризации от задачи классификация является:
| при кластеризации классы изучаемого набора данных заранее не предопределены |
| при кластеризации классы изучаемого набора данных заранее предопределены |
| при классификации классы изучаемого набора данных заранее не предопределены |
Классификация, которая производится по существенным признакам, характеризующим внутреннюю общность предметов и явлений, называется:
| искусственной |
| простой |
| естественной |
| многомерной |
| сложной |
Качество данных является критерием, который определяет:
| полноту данных |
| возможность интерпретации данных |
| своевременность данных |
| ошибки в данных |
| точность данных |
При использовании деревьев решений конструкция вида «если : то : » называется:
| разветвлением |
| правилом |
| узлом разветвления |
| условием |
| условным выражением |
Алгоритмами, реализующими деревья решений, являются:
| CART |
| ID4 |
| C3.5 |
| C4.5 |
| ID3 |
Методами решения проблемы остановки разбиения дерева решений являются:
| задание оптимального количества примеров в конечных узлах дерева |
| ограничение глубины дерева |
| ранняя остановка |
| задание минимального количества примеров в конечных узлах дерева |
| задание максимального количества примеров в конечных узлах дерева |
Основными этапами процесса классификации являются:
| тестирование модели |
| оценка модели |
| использование модели |
| анализ предметной области |
| конструирование модели |
Характеристики ответов (шпаргалок) к зачёту
Список файлов

Комментарии
