Для студентов НИУ ИТМО по предмету Интеллектуальный анализ данных и машинное обучениеЛР №6 Решить задачу классификации, применив в качестве модели kNN, NBS и логистическую регрессиюЛР №6 Решить задачу классификации, применив в качестве модели kNN, NBS и логистическую регрессию
2021-10-062021-10-06СтудИзба
Лабораторная работа: ЛР №6 Решить задачу классификации, применив в качестве модели kNN, NBS и логистическую регрессию вариант 2
Описание
Задание:
1. Для задачи классификации найти набор данных.
2. Сформулировать цель анализа датасета
3. Решить задачу классификации, применив в качестве модели kNN, NBC и
логистическую регрессию
4. Оценить качество моделей, сравнить accuracy, precision, recall, F-меру
1. Описание данных
Датасет: “White wine quality”. Modeling wine preferences by data mining from
physicochemical properties. ( Ссылка на датасет )
Количество объектов: 4898
Количество признаков: 12
Признаки:
fixed acidity - нелетучие кислоты
volatile acidity - содержание летучих кислот
citric acid - лимонная кислота
residual sugar - остаточный сахар
chlorides - хлориды
free sulfur dioxide - свободный диоксид серы
total sulfur dioxide - общий диоксид серы
density - плотность
pH - водородный показатель
sulphates - сульфаты
alcohol - содержание алкоголя
quality (score between 0 and 10) - оценка качества вина (по шкале от 0 до 10)
Классы можно определить самостоятельно. Определим следующие три класса в
зависимости от оценки качества:
- хорошее вино (оценка больше 7)
- нормальное вино (оценка больше 5, но меньше 8)
- плохое вино (оценка меньше 6)
Цель анализа - научиться по заданным признакам определять класс качества вина.
Код написан на языке программирования R.
Лабораторная работа выполнена в 2017 году в Университете ИТМО на факультете Инфокоммуникационных Технологий, кафедра Интеллектуальных Технологий в Гуманитарной Среде. Преподаватель Хлопотов М.В.
1. Для задачи классификации найти набор данных.
2. Сформулировать цель анализа датасета
3. Решить задачу классификации, применив в качестве модели kNN, NBC и
логистическую регрессию
4. Оценить качество моделей, сравнить accuracy, precision, recall, F-меру
1. Описание данных
Датасет: “White wine quality”. Modeling wine preferences by data mining from
physicochemical properties. ( Ссылка на датасет )
Количество объектов: 4898
Количество признаков: 12
Признаки:
fixed acidity - нелетучие кислоты
volatile acidity - содержание летучих кислот
citric acid - лимонная кислота
residual sugar - остаточный сахар
chlorides - хлориды
free sulfur dioxide - свободный диоксид серы
total sulfur dioxide - общий диоксид серы
density - плотность
pH - водородный показатель
sulphates - сульфаты
alcohol - содержание алкоголя
quality (score between 0 and 10) - оценка качества вина (по шкале от 0 до 10)
Классы можно определить самостоятельно. Определим следующие три класса в
зависимости от оценки качества:
- хорошее вино (оценка больше 7)
- нормальное вино (оценка больше 5, но меньше 8)
- плохое вино (оценка меньше 6)
Цель анализа - научиться по заданным признакам определять класс качества вина.
Код написан на языке программирования R.
Лабораторная работа выполнена в 2017 году в Университете ИТМО на факультете Инфокоммуникационных Технологий, кафедра Интеллектуальных Технологий в Гуманитарной Среде. Преподаватель Хлопотов М.В.
Характеристики лабораторной работы
Учебное заведение
Семестр
Вариант
Теги
Просмотров
2
Качество
Идеальное компьютерное
Размер
211,78 Kb
Список файлов
lab 6 Решить задачу классификации_ применив в качестве модели knn_ nbs и логистическую регрессию.pdf