Для студентов ИДДО НИУ «МЭИ» по предмету Интеллектуальные информационные системы (ИИС)КМ-4. Методы машинного обучения. ТестированиеКМ-4. Методы машинного обучения. Тестирование
5,0052
2024-12-192025-05-20СтудИзба
Ответы к зачёту: КМ-4. Методы машинного обучения. Тестирование
-15%
Описание
Документ с ответами на тест на оценку 5 с удобным поиском по вопросам.
Изучение и компьютерное моделирование процесса обучения является предметом исследования в области искусственного интеллекта, называемой машинным обучением (Machine Learning). Как правило, система машинного обучения пользуется не единичными наблюдениями, а целыми (конечными) множествами наблюдений сразу. Такое множество называется: тестовым множеством обучающим множеством или обучающей выборкой приближённым множеством мягким множеством Множество, которое используется для обучения в алгоритмах машинного обучения (Machine Learning)., содержит конечное число примеров счётное число примеров бесконечное число примеров бесконечное, но обязательно счётное число примеров Обучение на основе примеров является типичным случаем индуктивного обучения и широко используется в системах искусственного интеллекта. На основе предъявленных примеров (и, возможно, контрпримеров) интеллектуальная система должна сформировать общее понятие, охватывающее примеры и исключающее контрпримеры. Как представляются примеры - объекты в системах машинного обучения? в виде ориентированного графа логическими выражениями упорядоченным набором признаков упорядоченным набором линейных функций Какие значения могут иметь признаки, которые используются при описании объектов обучающей выборки в алгоритмах машинного обучения: целочисленные значения вещественные числа логические значения наборы символов изображения В системах машинного обучения под обобщением понимается переход от рассмотрения множества объектов к рассмотрению обобщенного понятия, описывающего класс таких объектов. Таким образом, решив задачу машинного обучения мы получим: Обучающую выборку. Количество классов, к которым относятся объекты. Количество объектов в каждом классе. Критерии отнесения объектов классам. Центры классов. Интеллектуальные системы Data Mining (добыча данных) и Knowledge Discovery in Databases (обнаружение знаний в базах данных) решают задачи поиска скрытых закономерностей с использованием реальных таблиц Баз данных. При этом в качестве обучающей выборки выступает реальная таблица, хранящиеся в распределенной БД фрагмент реальной таблицы, хранящейся в распределённой БД фрагмент реальной таблицы, хранящейся в распределённой БД, где один из атрибутов выбран в качестве решающего атрибута Обучающая выборка задана таблицей, где каждая строка таблицы – это один объект, или пример понятия, заданный набором свойств (значений атрибутов). Один из множества атрибутов является решающим – определяет класс, к которому относится каждый объект. Какое утверждение является правильным: Решающий атрибут обязательно будет бинарным. Решающий атрибут может иметь произвольное числовое значение. Решающий атрибут может иметь произвольное число символьных значений. Решающий атрибут имеет ограниченное количество значений (числовых или символьных) либо является бинарным. В интеллектуальных системах Data Mining (добыча данных) и Knowledge Discovery in Databases (обнаружение знаний в базах данных) обучающая выборка – это некоторый фрагмент таблицы, хранящейся в распределённой БД. Известно, что такие таблицы могут содержать очень много атрибутов различного типа. Как определяется решающий атрибут для формирования обобщенных понятий? Решающий атрибут указывает эксперт. Решающий атрибут находится на основе оценки информативности. Решающий атрибут определяется на основе эвристических критериев. Выберите правильный ответ. Алгоритмы машинного обучения используют в качестве входных данных обучающую выборку. Результатом является классификатор, или упорядоченная система проверок, которая позволит отнести объект классу. Алгоритмы машинного обучения могут реализовать процедуру обучения «с учителем» или обучения «без учителя». Эти два типа алгоритмов различаются тем, что: Обучающая выборка при обучении «с учителем» существенно больше обучающей выборки при обучении «без учителя». При обучении «с учителем» объекты обучающей выборки снабжены атрибутом, указывающим класс каждого объекта; при обучении «без учителя» такой атрибут отсутствует. При обучении «с учителем» объекты обучающей выборки имеют атрибуты точно одного типа; при обучении «без учителя» объекты обучающей выборки описываются атрибутами разного типа (числовые, символьные, логические). Какие из перечисленных ниже алгоритмов относятся к алгоритмам обучения «с учителем»? Пороговый алгоритм. Алгоритм MAXMIN. Алгоритм «K средних». Алгоритм построения линейной разделяющей функции. Алгоритм построения нелинейной разделяющей функции. Формирование понятий по сути является процессом выделения закономерностей, свойственных множествам объектов. Такие множества объектов образуют обучающие выборки. Выберите правильное определение обучающей выборки. Обучающая выборка, которая используется в алгоритме обучения «с учителем»: это конечное множество объектов, принадлежащих точно одному классу это конечное множество объектов – примеров нескольких классов это бесконечное (счётное) множество объектов, принадлежащих точно двум классам Какие из перечисленных ниже алгоритмов относятся к алгоритмам обучения «без учителя»: Пороговый алгоритм. Алгоритм MAXMIN. Алгоритм «K средних». Алгоритм построения линейной разделяющей функции. Алгоритм построения дерева решений ID3. Наиболее простой способ оценить, насколько хорошо построенная решающая функция (такая, как система решающих правил, или дерево решений) работает это проверить её на тестовом множестве (экзамен). Какое из утверждений верно? В качестве экзаменационного множества при этом используется: … Обучающая выборка полностью. Часть обучающей выборки (например, половина). Обучающая выборка, к которой добавлены несколько новых примеров. Множество примеров, ни один из которых не входил в исходную обучающую выборку. Обучающая выборка, из которой удалены те примеры, для которых классификация была ошибочна. После того, как решающее правило на обучающей выборке построено, проводится экзамен – с помощью решающего правила надо разделить объекты новой, экзаменационной выборки на примеры и контрпримеры. Если решающее правило правильно проводит такое разделение, обучение заканчивается. Если результат экзамена неудовлетворителен: … Какая из предложенных стратегий верна? Необходимо провести экзамен повторно на новой тестовой выборке, отличной от первоначальной. Необходимо удалить из тестовой выборки те примеры, на которых классификатор дал неверные ответы, и повторить процедуру экзамена. Необходимо провести обучение заново. В качестве обучающего множества будем использовать экзаменационную (тестовую) выборку. Затем повторяем процедуру экзамена. Необходимо провести обучение заново. При этом к исходной обучающей выборке добавляем те примеры из тестового множества, на которых классификатор дал неверные ответы. Затем повторяем процедуру экзамена. Какое из четырёх утверждений неверно? Решающее правило, сформированное алгоритмом обобщения «с учителем», может быть представлено в следующем виде: Набор продукционных правил. Двудольный граф. Дерево решений. Логическая функция, использующая операции И ИЛИ НЕ. Алгоритм АМХ построения дерева решений, основанный на метрике Хемминга, строит бинарное дерево решений. Какие из приведенных ниже утверждений являются верными? Все конечные вершины бинарного дерева (листья) взвешены именами более, чем двух классов. Атрибут, размещённый в корне дерева, может использоваться повторно при движении от корневой вершины к листу дерева. Выбор очередного атрибута для размещения в узле дерева делается на основе метрики Хемминга. В алгоритме AMX построения бинарного дерева решений для каждого атрибута в таблице, задающей обучающую выборку, строится бинарный вектор. Какое расстояние D(X, Y) будет между ,бинарными векторами X и Y, если Х = <0 1 0 0 1 1> Y = < 0 1 1 1 0 1>? Расстояние D(X, Y) равно 3 Расстояние D(X, Y) равно 4 Расстояние D(X, Y) равно 5 В алгоритме AMX построения бинарного дерева решений для каждого атрибута в таблице, задающей обучающую выборку, строится бинарный вектор. Были получены три бинарных вектора X, Y, Z: Х = <0 1 0 1 1 1> Y = < 0 1 1 1 0 1> Z = <0 0 0 1 1 1 > Какой из двух векторов: X или Y ближе к вектору Z? Расстояние D(X, Z) меньше D(Y, Z) Расстояние D(X, Z) больше D(Y, Z) Расстояния одинаковы Дана обучающая выборка, в которой все примеры относятся к одному классу. Можно ли на такой выборке построить дерево решений одним из алгоритмов построения дерева решений? Да Нет 1. Дерево решений - это дерево, внутренние узлы которого представляют собой проверки для входных примеров из обучающего множества, а вершины-листы взвешены именами классов (решений). 2. Дерево решений каждому входному примеру ставит в соответствие номер класса путем фильтрации этого примера через промежуточные узлы дерева сверху вниз. Результаты каждой проверки являются взаимоисключающими и исчерпывающими. 3. Проверки для каждого входного примера начинаются с корня дерева. Проверка заканчивается, когда достигнут лист дерева. 4. Каждая проверка – это проверка значения одного из признаков (атрибутов), описывающих входной пример. Проверки могут приводить к двум результатам, или более, чем к двум. Какие из приведённых утверждений ошибочны, если речь идёт о дереве решений? Утверждение 1 неверно. Утверждение 2 неверно. Все утверждения верны. Утверждение 3 неверно. Утверждение 4 неверно. Каким из перечисленных ниже свойств не обладает бинарное дерево решений: Все конечные вершины бинарного дерева (листья) взвешены именами точно двух классов. Все промежуточные вершины дерева, а также корневая вершина, имеют точно двух потомков. Корневая вершина дерева имеет точно двух потомков. В каждом узле дерева, который не является листом, выполняется проверка значений нескольких атрибутов. Алгоритм ID3 Куинлана строит дерево решений на основе обучающей выборки. Какое из четырёх ниже приведённых утверждений неверно? Дерево решений, построенное алгоритмом ID3: Дерево решений, построенное алгоритмом ID3: Обязательно будет бинарным. В корне дерева находится наиболее информативный признак. Конечные вершины дерева (листья) могут быть взвешены именами двух и более классов. Каждый путь от корня дерева к листу не содержит повторных проверок уже использованных атрибутов. Алгоритм, основанный на использовании метрики Хэмминга, строит дерево решений, используя обучающую выборку. Какое из четырёх утверждений верны? Это дерево решений: Обязательно будет бинарным. В корне дерева находится наиболее близкий к решающему атрибуту признак. Конечные вершины дерева (листья) могут быть взвешены именами более чем двух классов. Каждый путь от корня дерева к листу не содержит повторных проверок уже использованных атрибутов. Дерево решений построено алгоритмом ID3. Дерево решений используется: для классификации примеров обучающей выборки. для классификации новых примеров, ранее не входящих в обучающую выборку. для модификации дерева решений и получения нового, улучшенного варианта дерева решений. Дерево решений построено алгоритмом ID3 на основе конкретной обучающей выборки. Выберите неверное утверждение. Результат работы алгоритма считается успешным, если: дерево решений правильно классифицирует все примеры обучающей выборки. дерево решений правильно классифицирует новые примеры, аналогичные примерам обучающей выборки, но ранее не входящие в обучающую выборку. дерево решений может быть преобразовано в набор продукционных правил. дерево решений правильно классифицирует примеры из любых наборов данных, в которых объекты отличаются от объектов обучающей выборки и имеют другие атрибуты. Выберите утверждения, верные для алгоритмов обучения «без учителя». В интеллектуальных системах машинным обучением называется процесс создания и оптимизации алгоритма, который разделяет предъявленные объекты на классы. Для обучения используется определенный набор объектов, называемый обучающим множеством или обучающей выборкой. В алгоритмах обучения: … все объекты обучающей выборки описываются наборами числовых признаков всем объектам обучающей выборки приписаны имена классов все объекты обучающей выборки первоначально не отнесены к конкретным классам классы объектов формируются по признаку сходства объектов между собой критерием сходства объектов является мера близости, определяющая расстояние между объектами. Выберите верные для алгоритмов обучения «с учителем» утверждения. В интеллектуальных системах машинным обучением называется процесс создания и оптимизации классификационного правила, которое разделяет предъявленные объекты на классы. В алгоритмах обучения «с учителем» такой классификатор представляет: … набор логических функций множество продукционных правил дерево решений границы между классами, заданные в виде функций Алгоритмы обучения «без учителя» - пороговый алгоритм и алгоритм MAXMIN формируют классы объектов по критерию близости объектов в пространстве признаков. Ниже приведены свойства, которыми могут обладать эти алгоритмы: 1 Число полученных классов заранее неизвестно и может быть больше двух. 2 Пороговое расстояние, определяющее границу между классами, меняется во время работы алгоритма. 3 Алгоритм выполняет несколько итераций для построения классов объектов. Для алгоритмов MAXMIN и для порогового алгоритма: все три свойства верны. только свойство 1 верно для этих двух алгоритмов. 1 и 2 свойства верны для двух алгоритмов. 1 и 3 свойства верны для двух алгоритмов. все три свойства верны только для MAXMIN и не верны для порогового алгоритма. Алгоритмы обучения «без учителя» - алгоритм MAXMIN и алгоритм К -средних формируют классы объектов по критерию близости объектов в пространстве признаков. Ниже приведены свойства, которыми могут обладать эти алгоритмы: 1. Число полученных классов заранее известно. 2. Алгоритм выполняет несколько итераций для построения классов объектов. 3. Критерием завершения работы алгоритма является стабильность полученного разбиения обучающей выборки на классы. Для алгоритмов MAXMIN и для алгоритма К-средних: все три свойства верны. только свойства 2 и 3 верны для этих двух алгоритмов. все три свойства верны только для алгоритма К-средних и не верны для алгоритма MAXMIN. Обучающая выборка разбита на классы с помощью одного из алгоритмов обучения «без учителя». Какие объекты называются объектами -прототипами классов? Объект – прототип класса - это точка, наиболее удалённая от всех объектов, принадлежащих другим классам. Объект – прототип класса – это наиболее характерная точка класса (возможно, его геометрический центр). Объект – прототип класса – это точка, принадлежащая классу и максимально близкая к границе, разделяющей классы. Объекты обучающей выборки заданы наборами числовых параметров и принадлежат нескольким классам. Как принять решение – к какому классу отнести новый объект, не встречавшийся ранее в обучающей выборке? Возможны стратегии: 1 Объект будет включен в один из классов, если известны центры классов и расстояние от объекта до центра этого конкретного класса минимально по сравнению с расстояниями до центров других классов. 2 Объект будет отнесён к определённому классу, если существует граница, разделяющая классы, например, гиперплоскость, для которой есть аналитическое описание (функция). Надо проверить, как расположен объект относительно этой границы. Выберите правильную стратегию. Стратегия 1 правильная. Стратегия 2 правильная. Обе стратегии допустимы. Объекты обучающей выборки заданы наборами числовых параметров и могут принадлежать нескольким классам. Существует метод построения решающей функции как получение уравнения границ, разделяющих классы. Для случая двух классов задача сводится к построению только одной решающей функции; такая функция должна принимать положительные значения для объектов одного класса и отрицательные – для другого класса. Существует алгоритм построения линейной решающей функции для случая двух классов, исходными данными для которого является обучающая выборка, содержащая примеры объектов этих двух классов. Какое утверждение верно? Алгоритм построения линейной решающей функции является: алгоритмом обучения «с учителем» алгоритмом обучения «без учителя» Объекты обучающей выборки заданы наборами числовых параметров и могут принадлежать нескольким классам. Существует метод построения решающей функции как получение уравнения границ, разделяющих классы. Для случая двух классов задача сводится к построению только одной решающей функции. Существует алгоритм построения линейной решающей функции для случая двух классов. Какие из этих утверждений верны? Такой алгоритм построения линейной решающей функции: (1) (2) (3) Существует метод построения решающей функции как получение уравнения границ, разделяющих классы. Для случая двух классов возможно построить линейную решающую функцию, используя алгоритм построения такой функции. Если точки двух классов расположены так, что их нельзя разделить одной линейной гиперплоскостью, возможны действия: … Какие стратегии правильные? Для разделения классов возможно использовать алгоритм построения нелинейной решающей функции (метод потенциалов). Возможно применить совместно оба алгоритма одновременно. Возможно несколько раз применить алгоритм построения линейной решающей функции и построить кусочно-линейную функцию, разделяющую объекты двух классов и состоящую из нескольких линейных отрезков. Примером интеллектуальной системы является экспертная система. Экспертная система (ЭС) - это интеллектуальная программа, которая моделирует рассуждения человека-эксперта в некоторой определенной области и использует для этого базу знаний, содержащую факты и правила о действиях в этой области, а также специальные средства логического вывода. База знаний экспертной системы может хранить информацию в следующем виде: 1 Множество дизъюнктов Хорна. 2 Наборы продукционных правил. 3 Онтология. 4 Таблицы реляционных баз данных. Какой вариант неверен: первый второй третий четвёртый все варианты верны Для представления знаний в экспертной системе на основе семантических сетей, онтологий, используются отношения: … Какие из перечисленных отношений обеспечивают наследование свойств объектами разных уровней? Иерархия «класс – подкласс» (ISA иерархия) Отношение «объект – часть объекта» Отношение «класс – пример класса» Отношение «объект – свойство объекта» Логические отношения Какие свойства объектов, хранящихся в реальных базах данных, затрудняет их использование для машинного обучения в системах Data mining и в экспертных системах: 1) Базы данных создаются из расчета требований конкретных приложений, а не специально для машинного обучения. 2) Информация, содержащаяся в базах данных, как правило, неполна. Свойства объектов, необходимые для корректной классификации, не обязательно представлены в базе данных. 3) Отдельные значения могут содержать ошибки или вовсе отсутствовать. 4) Базы данных очень велики. 5) Базы данных изменяются со временем. Варианты ответов Все, кроме 1) Все, кроме 2) Все, кроме 3) Все, кроме 4) Все, кроме 5) Все пять свойств При использовании реальной базы данных (БД) для машинного обучения в системах Data mining и в экспертных системах возникают следующие проблемы: 1) Базы данных создаются из расчета требований конкретных приложений, а не специально для машинного обучения. 2) Информация, содержащаяся в базах данных, как правило, неполна. Свойства объектов, необходимые для корректной классификации, не обязательно представлены в базе данных. 3) Отдельные значения могут содержать ошибки или вовсе отсутствовать. 4) Базы данных очень велики. 5) Базы данных изменяются со временем. Какие из этих проблем могут быть решены с помощью человека-эксперта? все проблемы с 1) по 5) проблемы 1) 4) и 5) проблемы 2) и 3) все эти проблемы не решаются с помощью человека – эксперта В системе Data Mining возможна работа с обучающими выборками, которые обладают таким свойством: в обучающей выборке присутствуют объекты, идентичные по всем атрибутам (признакам), но отнесённые к разным классам. Какое определение правильно? Такие обучающие множества содержат неточную информацию содержат неполную информацию содержат противоречивую информацию содержат неопределённую информацию Выберите правильный вариант. В системе Data Mining возможна работа с обучающими выборками, которые содержат противоречивую информацию. Это значит, что в обучающей выборке присутствуют объекты, идентичные по всем атрибутам (признакам), но отнесённые к разным классам. Обучающие множества, содержащие противоречия, могут быть обработаны с помощью алгоритма: ID3 MaxMin алгоритм RS1 построения приближённого множества алгоритм построения дерева решений, использующий метрику Хемминг
Изучение и компьютерное моделирование процесса обучения является предметом исследования в области искусственного интеллекта, называемой машинным обучением (Machine Learning). Как правило, система машинного обучения пользуется не единичными наблюдениями, а целыми (конечными) множествами наблюдений сразу. Такое множество называется: тестовым множеством обучающим множеством или обучающей выборкой приближённым множеством мягким множеством Множество, которое используется для обучения в алгоритмах машинного обучения (Machine Learning)., содержит конечное число примеров счётное число примеров бесконечное число примеров бесконечное, но обязательно счётное число примеров Обучение на основе примеров является типичным случаем индуктивного обучения и широко используется в системах искусственного интеллекта. На основе предъявленных примеров (и, возможно, контрпримеров) интеллектуальная система должна сформировать общее понятие, охватывающее примеры и исключающее контрпримеры. Как представляются примеры - объекты в системах машинного обучения? в виде ориентированного графа логическими выражениями упорядоченным набором признаков упорядоченным набором линейных функций Какие значения могут иметь признаки, которые используются при описании объектов обучающей выборки в алгоритмах машинного обучения: целочисленные значения вещественные числа логические значения наборы символов изображения В системах машинного обучения под обобщением понимается переход от рассмотрения множества объектов к рассмотрению обобщенного понятия, описывающего класс таких объектов. Таким образом, решив задачу машинного обучения мы получим: Обучающую выборку. Количество классов, к которым относятся объекты. Количество объектов в каждом классе. Критерии отнесения объектов классам. Центры классов. Интеллектуальные системы Data Mining (добыча данных) и Knowledge Discovery in Databases (обнаружение знаний в базах данных) решают задачи поиска скрытых закономерностей с использованием реальных таблиц Баз данных. При этом в качестве обучающей выборки выступает реальная таблица, хранящиеся в распределенной БД фрагмент реальной таблицы, хранящейся в распределённой БД фрагмент реальной таблицы, хранящейся в распределённой БД, где один из атрибутов выбран в качестве решающего атрибута Обучающая выборка задана таблицей, где каждая строка таблицы – это один объект, или пример понятия, заданный набором свойств (значений атрибутов). Один из множества атрибутов является решающим – определяет класс, к которому относится каждый объект. Какое утверждение является правильным: Решающий атрибут обязательно будет бинарным. Решающий атрибут может иметь произвольное числовое значение. Решающий атрибут может иметь произвольное число символьных значений. Решающий атрибут имеет ограниченное количество значений (числовых или символьных) либо является бинарным. В интеллектуальных системах Data Mining (добыча данных) и Knowledge Discovery in Databases (обнаружение знаний в базах данных) обучающая выборка – это некоторый фрагмент таблицы, хранящейся в распределённой БД. Известно, что такие таблицы могут содержать очень много атрибутов различного типа. Как определяется решающий атрибут для формирования обобщенных понятий? Решающий атрибут указывает эксперт. Решающий атрибут находится на основе оценки информативности. Решающий атрибут определяется на основе эвристических критериев. Выберите правильный ответ. Алгоритмы машинного обучения используют в качестве входных данных обучающую выборку. Результатом является классификатор, или упорядоченная система проверок, которая позволит отнести объект классу. Алгоритмы машинного обучения могут реализовать процедуру обучения «с учителем» или обучения «без учителя». Эти два типа алгоритмов различаются тем, что: Обучающая выборка при обучении «с учителем» существенно больше обучающей выборки при обучении «без учителя». При обучении «с учителем» объекты обучающей выборки снабжены атрибутом, указывающим класс каждого объекта; при обучении «без учителя» такой атрибут отсутствует. При обучении «с учителем» объекты обучающей выборки имеют атрибуты точно одного типа; при обучении «без учителя» объекты обучающей выборки описываются атрибутами разного типа (числовые, символьные, логические). Какие из перечисленных ниже алгоритмов относятся к алгоритмам обучения «с учителем»? Пороговый алгоритм. Алгоритм MAXMIN. Алгоритм «K средних». Алгоритм построения линейной разделяющей функции. Алгоритм построения нелинейной разделяющей функции. Формирование понятий по сути является процессом выделения закономерностей, свойственных множествам объектов. Такие множества объектов образуют обучающие выборки. Выберите правильное определение обучающей выборки. Обучающая выборка, которая используется в алгоритме обучения «с учителем»: это конечное множество объектов, принадлежащих точно одному классу это конечное множество объектов – примеров нескольких классов это бесконечное (счётное) множество объектов, принадлежащих точно двум классам Какие из перечисленных ниже алгоритмов относятся к алгоритмам обучения «без учителя»: Пороговый алгоритм. Алгоритм MAXMIN. Алгоритм «K средних». Алгоритм построения линейной разделяющей функции. Алгоритм построения дерева решений ID3. Наиболее простой способ оценить, насколько хорошо построенная решающая функция (такая, как система решающих правил, или дерево решений) работает это проверить её на тестовом множестве (экзамен). Какое из утверждений верно? В качестве экзаменационного множества при этом используется: … Обучающая выборка полностью. Часть обучающей выборки (например, половина). Обучающая выборка, к которой добавлены несколько новых примеров. Множество примеров, ни один из которых не входил в исходную обучающую выборку. Обучающая выборка, из которой удалены те примеры, для которых классификация была ошибочна. После того, как решающее правило на обучающей выборке построено, проводится экзамен – с помощью решающего правила надо разделить объекты новой, экзаменационной выборки на примеры и контрпримеры. Если решающее правило правильно проводит такое разделение, обучение заканчивается. Если результат экзамена неудовлетворителен: … Какая из предложенных стратегий верна? Необходимо провести экзамен повторно на новой тестовой выборке, отличной от первоначальной. Необходимо удалить из тестовой выборки те примеры, на которых классификатор дал неверные ответы, и повторить процедуру экзамена. Необходимо провести обучение заново. В качестве обучающего множества будем использовать экзаменационную (тестовую) выборку. Затем повторяем процедуру экзамена. Необходимо провести обучение заново. При этом к исходной обучающей выборке добавляем те примеры из тестового множества, на которых классификатор дал неверные ответы. Затем повторяем процедуру экзамена. Какое из четырёх утверждений неверно? Решающее правило, сформированное алгоритмом обобщения «с учителем», может быть представлено в следующем виде: Набор продукционных правил. Двудольный граф. Дерево решений. Логическая функция, использующая операции И ИЛИ НЕ. Алгоритм АМХ построения дерева решений, основанный на метрике Хемминга, строит бинарное дерево решений. Какие из приведенных ниже утверждений являются верными? Все конечные вершины бинарного дерева (листья) взвешены именами более, чем двух классов. Атрибут, размещённый в корне дерева, может использоваться повторно при движении от корневой вершины к листу дерева. Выбор очередного атрибута для размещения в узле дерева делается на основе метрики Хемминга. В алгоритме AMX построения бинарного дерева решений для каждого атрибута в таблице, задающей обучающую выборку, строится бинарный вектор. Какое расстояние D(X, Y) будет между ,бинарными векторами X и Y, если Х = <0 1 0 0 1 1> Y = < 0 1 1 1 0 1>? Расстояние D(X, Y) равно 3 Расстояние D(X, Y) равно 4 Расстояние D(X, Y) равно 5 В алгоритме AMX построения бинарного дерева решений для каждого атрибута в таблице, задающей обучающую выборку, строится бинарный вектор. Были получены три бинарных вектора X, Y, Z: Х = <0 1 0 1 1 1> Y = < 0 1 1 1 0 1> Z = <0 0 0 1 1 1 > Какой из двух векторов: X или Y ближе к вектору Z? Расстояние D(X, Z) меньше D(Y, Z) Расстояние D(X, Z) больше D(Y, Z) Расстояния одинаковы Дана обучающая выборка, в которой все примеры относятся к одному классу. Можно ли на такой выборке построить дерево решений одним из алгоритмов построения дерева решений? Да Нет 1. Дерево решений - это дерево, внутренние узлы которого представляют собой проверки для входных примеров из обучающего множества, а вершины-листы взвешены именами классов (решений). 2. Дерево решений каждому входному примеру ставит в соответствие номер класса путем фильтрации этого примера через промежуточные узлы дерева сверху вниз. Результаты каждой проверки являются взаимоисключающими и исчерпывающими. 3. Проверки для каждого входного примера начинаются с корня дерева. Проверка заканчивается, когда достигнут лист дерева. 4. Каждая проверка – это проверка значения одного из признаков (атрибутов), описывающих входной пример. Проверки могут приводить к двум результатам, или более, чем к двум. Какие из приведённых утверждений ошибочны, если речь идёт о дереве решений? Утверждение 1 неверно. Утверждение 2 неверно. Все утверждения верны. Утверждение 3 неверно. Утверждение 4 неверно. Каким из перечисленных ниже свойств не обладает бинарное дерево решений: Все конечные вершины бинарного дерева (листья) взвешены именами точно двух классов. Все промежуточные вершины дерева, а также корневая вершина, имеют точно двух потомков. Корневая вершина дерева имеет точно двух потомков. В каждом узле дерева, который не является листом, выполняется проверка значений нескольких атрибутов. Алгоритм ID3 Куинлана строит дерево решений на основе обучающей выборки. Какое из четырёх ниже приведённых утверждений неверно? Дерево решений, построенное алгоритмом ID3: Дерево решений, построенное алгоритмом ID3: Обязательно будет бинарным. В корне дерева находится наиболее информативный признак. Конечные вершины дерева (листья) могут быть взвешены именами двух и более классов. Каждый путь от корня дерева к листу не содержит повторных проверок уже использованных атрибутов. Алгоритм, основанный на использовании метрики Хэмминга, строит дерево решений, используя обучающую выборку. Какое из четырёх утверждений верны? Это дерево решений: Обязательно будет бинарным. В корне дерева находится наиболее близкий к решающему атрибуту признак. Конечные вершины дерева (листья) могут быть взвешены именами более чем двух классов. Каждый путь от корня дерева к листу не содержит повторных проверок уже использованных атрибутов. Дерево решений построено алгоритмом ID3. Дерево решений используется: для классификации примеров обучающей выборки. для классификации новых примеров, ранее не входящих в обучающую выборку. для модификации дерева решений и получения нового, улучшенного варианта дерева решений. Дерево решений построено алгоритмом ID3 на основе конкретной обучающей выборки. Выберите неверное утверждение. Результат работы алгоритма считается успешным, если: дерево решений правильно классифицирует все примеры обучающей выборки. дерево решений правильно классифицирует новые примеры, аналогичные примерам обучающей выборки, но ранее не входящие в обучающую выборку. дерево решений может быть преобразовано в набор продукционных правил. дерево решений правильно классифицирует примеры из любых наборов данных, в которых объекты отличаются от объектов обучающей выборки и имеют другие атрибуты. Выберите утверждения, верные для алгоритмов обучения «без учителя». В интеллектуальных системах машинным обучением называется процесс создания и оптимизации алгоритма, который разделяет предъявленные объекты на классы. Для обучения используется определенный набор объектов, называемый обучающим множеством или обучающей выборкой. В алгоритмах обучения: … все объекты обучающей выборки описываются наборами числовых признаков всем объектам обучающей выборки приписаны имена классов все объекты обучающей выборки первоначально не отнесены к конкретным классам классы объектов формируются по признаку сходства объектов между собой критерием сходства объектов является мера близости, определяющая расстояние между объектами. Выберите верные для алгоритмов обучения «с учителем» утверждения. В интеллектуальных системах машинным обучением называется процесс создания и оптимизации классификационного правила, которое разделяет предъявленные объекты на классы. В алгоритмах обучения «с учителем» такой классификатор представляет: … набор логических функций множество продукционных правил дерево решений границы между классами, заданные в виде функций Алгоритмы обучения «без учителя» - пороговый алгоритм и алгоритм MAXMIN формируют классы объектов по критерию близости объектов в пространстве признаков. Ниже приведены свойства, которыми могут обладать эти алгоритмы: 1 Число полученных классов заранее неизвестно и может быть больше двух. 2 Пороговое расстояние, определяющее границу между классами, меняется во время работы алгоритма. 3 Алгоритм выполняет несколько итераций для построения классов объектов. Для алгоритмов MAXMIN и для порогового алгоритма: все три свойства верны. только свойство 1 верно для этих двух алгоритмов. 1 и 2 свойства верны для двух алгоритмов. 1 и 3 свойства верны для двух алгоритмов. все три свойства верны только для MAXMIN и не верны для порогового алгоритма. Алгоритмы обучения «без учителя» - алгоритм MAXMIN и алгоритм К -средних формируют классы объектов по критерию близости объектов в пространстве признаков. Ниже приведены свойства, которыми могут обладать эти алгоритмы: 1. Число полученных классов заранее известно. 2. Алгоритм выполняет несколько итераций для построения классов объектов. 3. Критерием завершения работы алгоритма является стабильность полученного разбиения обучающей выборки на классы. Для алгоритмов MAXMIN и для алгоритма К-средних: все три свойства верны. только свойства 2 и 3 верны для этих двух алгоритмов. все три свойства верны только для алгоритма К-средних и не верны для алгоритма MAXMIN. Обучающая выборка разбита на классы с помощью одного из алгоритмов обучения «без учителя». Какие объекты называются объектами -прототипами классов? Объект – прототип класса - это точка, наиболее удалённая от всех объектов, принадлежащих другим классам. Объект – прототип класса – это наиболее характерная точка класса (возможно, его геометрический центр). Объект – прототип класса – это точка, принадлежащая классу и максимально близкая к границе, разделяющей классы. Объекты обучающей выборки заданы наборами числовых параметров и принадлежат нескольким классам. Как принять решение – к какому классу отнести новый объект, не встречавшийся ранее в обучающей выборке? Возможны стратегии: 1 Объект будет включен в один из классов, если известны центры классов и расстояние от объекта до центра этого конкретного класса минимально по сравнению с расстояниями до центров других классов. 2 Объект будет отнесён к определённому классу, если существует граница, разделяющая классы, например, гиперплоскость, для которой есть аналитическое описание (функция). Надо проверить, как расположен объект относительно этой границы. Выберите правильную стратегию. Стратегия 1 правильная. Стратегия 2 правильная. Обе стратегии допустимы. Объекты обучающей выборки заданы наборами числовых параметров и могут принадлежать нескольким классам. Существует метод построения решающей функции как получение уравнения границ, разделяющих классы. Для случая двух классов задача сводится к построению только одной решающей функции; такая функция должна принимать положительные значения для объектов одного класса и отрицательные – для другого класса. Существует алгоритм построения линейной решающей функции для случая двух классов, исходными данными для которого является обучающая выборка, содержащая примеры объектов этих двух классов. Какое утверждение верно? Алгоритм построения линейной решающей функции является: алгоритмом обучения «с учителем» алгоритмом обучения «без учителя» Объекты обучающей выборки заданы наборами числовых параметров и могут принадлежать нескольким классам. Существует метод построения решающей функции как получение уравнения границ, разделяющих классы. Для случая двух классов задача сводится к построению только одной решающей функции. Существует алгоритм построения линейной решающей функции для случая двух классов. Какие из этих утверждений верны? Такой алгоритм построения линейной решающей функции: (1) (2) (3) Существует метод построения решающей функции как получение уравнения границ, разделяющих классы. Для случая двух классов возможно построить линейную решающую функцию, используя алгоритм построения такой функции. Если точки двух классов расположены так, что их нельзя разделить одной линейной гиперплоскостью, возможны действия: … Какие стратегии правильные? Для разделения классов возможно использовать алгоритм построения нелинейной решающей функции (метод потенциалов). Возможно применить совместно оба алгоритма одновременно. Возможно несколько раз применить алгоритм построения линейной решающей функции и построить кусочно-линейную функцию, разделяющую объекты двух классов и состоящую из нескольких линейных отрезков. Примером интеллектуальной системы является экспертная система. Экспертная система (ЭС) - это интеллектуальная программа, которая моделирует рассуждения человека-эксперта в некоторой определенной области и использует для этого базу знаний, содержащую факты и правила о действиях в этой области, а также специальные средства логического вывода. База знаний экспертной системы может хранить информацию в следующем виде: 1 Множество дизъюнктов Хорна. 2 Наборы продукционных правил. 3 Онтология. 4 Таблицы реляционных баз данных. Какой вариант неверен: первый второй третий четвёртый все варианты верны Для представления знаний в экспертной системе на основе семантических сетей, онтологий, используются отношения: … Какие из перечисленных отношений обеспечивают наследование свойств объектами разных уровней? Иерархия «класс – подкласс» (ISA иерархия) Отношение «объект – часть объекта» Отношение «класс – пример класса» Отношение «объект – свойство объекта» Логические отношения Какие свойства объектов, хранящихся в реальных базах данных, затрудняет их использование для машинного обучения в системах Data mining и в экспертных системах: 1) Базы данных создаются из расчета требований конкретных приложений, а не специально для машинного обучения. 2) Информация, содержащаяся в базах данных, как правило, неполна. Свойства объектов, необходимые для корректной классификации, не обязательно представлены в базе данных. 3) Отдельные значения могут содержать ошибки или вовсе отсутствовать. 4) Базы данных очень велики. 5) Базы данных изменяются со временем. Варианты ответов Все, кроме 1) Все, кроме 2) Все, кроме 3) Все, кроме 4) Все, кроме 5) Все пять свойств При использовании реальной базы данных (БД) для машинного обучения в системах Data mining и в экспертных системах возникают следующие проблемы: 1) Базы данных создаются из расчета требований конкретных приложений, а не специально для машинного обучения. 2) Информация, содержащаяся в базах данных, как правило, неполна. Свойства объектов, необходимые для корректной классификации, не обязательно представлены в базе данных. 3) Отдельные значения могут содержать ошибки или вовсе отсутствовать. 4) Базы данных очень велики. 5) Базы данных изменяются со временем. Какие из этих проблем могут быть решены с помощью человека-эксперта? все проблемы с 1) по 5) проблемы 1) 4) и 5) проблемы 2) и 3) все эти проблемы не решаются с помощью человека – эксперта В системе Data Mining возможна работа с обучающими выборками, которые обладают таким свойством: в обучающей выборке присутствуют объекты, идентичные по всем атрибутам (признакам), но отнесённые к разным классам. Какое определение правильно? Такие обучающие множества содержат неточную информацию содержат неполную информацию содержат противоречивую информацию содержат неопределённую информацию Выберите правильный вариант. В системе Data Mining возможна работа с обучающими выборками, которые содержат противоречивую информацию. Это значит, что в обучающей выборке присутствуют объекты, идентичные по всем атрибутам (признакам), но отнесённые к разным классам. Обучающие множества, содержащие противоречия, могут быть обработаны с помощью алгоритма: ID3 MaxMin алгоритм RS1 построения приближённого множества алгоритм построения дерева решений, использующий метрику Хемминг
Характеристики ответов (шпаргалок) к зачёту
Учебное заведение
Программы
Просмотров
25
Качество
Идеальное компьютерное
Размер
304,07 Kb
Список файлов
КМ_4_Методы_машинного_обучения_Тестирование.pdf

Сотрудничество с нами обеспечивает вам высочайшее качество работ по невероятно низкой цене. Обладая эксклюзивными знаниями, полученными в престижных университетах, и обширным практическим опытом, мы гарантируем уникальность и качество в каждой задаче.