Для студентов НИУ ИТМО по предмету Интеллектуальный анализ данных и машинное обучениеЛР №6 Решить задачу классификации, применив в качестве модели kNN, NBS и логистическую регрессиюЛР №6 Решить задачу классификации, применив в качестве модели kNN, NBS и логистическую регрессию
2021-10-062021-10-06СтудИзба
Лабораторная работа: ЛР №6 Решить задачу классификации, применив в качестве модели kNN, NBS и логистическую регрессию вариант 1
Описание
1. Цель работы
Для задачи классификации найти набор данных. Есть ограничение – не менее 1000 объектов, не менее 5 признаков в описании.
Сформулировать цель анализа датасета.
Решить задачу классификации, применив в качестве модели kNN, NBS и логистическую регрессию.
Оценить качество моделей, сравнить:
• Accuracy
• Precision
• Recall
• F – мера
В зависимости от количества классов один из двух методов:
• Confusion Matrix (много классов)
• ROC – кривая и AUC (бинарная классификация)
2. Датасет и его описание.
Датасет «Abalone» используется для предсказания возраста морских ушек по измерениям их физических характеристик. Возраст морского ушка определяют путем разрезания ракушки через конус, окрашивая ее, и подсчетом количества колец при помощи микроскопа – достаточно трудоемкая задача. Для предсказания же возраста используются другие физические характеристики, которые легче получить (атрибуты датасета).
Атрибуты датасета:
1. Length (mm)
2. Diameter (mm) - перпендикулярно длине;
3. Height (mm) – с мясом в ракушке;
4. Whole weight (grams) – целое морское ушко;
5. Shucked weight (grams) – вес мяса;
6. Viscera weight (grams) – вес после кровопускания;
7. Shell weight (grams) – вес после высушивания;
8. Rings (years)
Код написан на языке программирования R.
Лабораторная работа выполнена в 2017 году в Университете ИТМО на факультете Инфокоммуникационных Технологий, кафедра Интеллектуальных Технологий в Гуманитарной Среде. Преподаватель Хлопотов М.В.
Для задачи классификации найти набор данных. Есть ограничение – не менее 1000 объектов, не менее 5 признаков в описании.
Сформулировать цель анализа датасета.
Решить задачу классификации, применив в качестве модели kNN, NBS и логистическую регрессию.
Оценить качество моделей, сравнить:
• Accuracy
• Precision
• Recall
• F – мера
В зависимости от количества классов один из двух методов:
• Confusion Matrix (много классов)
• ROC – кривая и AUC (бинарная классификация)
2. Датасет и его описание.
Датасет «Abalone» используется для предсказания возраста морских ушек по измерениям их физических характеристик. Возраст морского ушка определяют путем разрезания ракушки через конус, окрашивая ее, и подсчетом количества колец при помощи микроскопа – достаточно трудоемкая задача. Для предсказания же возраста используются другие физические характеристики, которые легче получить (атрибуты датасета).
Атрибуты датасета:
1. Length (mm)
2. Diameter (mm) - перпендикулярно длине;
3. Height (mm) – с мясом в ракушке;
4. Whole weight (grams) – целое морское ушко;
5. Shucked weight (grams) – вес мяса;
6. Viscera weight (grams) – вес после кровопускания;
7. Shell weight (grams) – вес после высушивания;
8. Rings (years)
Код написан на языке программирования R.
Лабораторная работа выполнена в 2017 году в Университете ИТМО на факультете Инфокоммуникационных Технологий, кафедра Интеллектуальных Технологий в Гуманитарной Среде. Преподаватель Хлопотов М.В.
Характеристики лабораторной работы
Учебное заведение
Семестр
Вариант
Теги
Просмотров
6
Качество
Идеальное компьютерное
Размер
580,06 Kb
Список файлов
lab6 dmml Решить задачу классификации_ применив в качестве модели knn_ nbs и логистическую регрессию.pdf