Для студентов НИУ ИТМО по предмету Интеллектуальный анализ данных и машинное обучениеЛР №6 Решить задачу классификации, применив в качестве модели kNN, NBS и логистическую регрессиюЛР №6 Решить задачу классификации, применив в качестве модели kNN, NBS и логистическую регрессию
2021-10-062021-10-06СтудИзба
Лабораторная работа: ЛР №6 Решить задачу классификации, применив в качестве модели kNN, NBS и логистическую регрессию вариант 4
Описание
1. Цель работы
Для задачи классификации найти набор данных. Есть ограничение – не менее 1000 объектов, не менее 5 признаков в описании.
Сформулировать цель анализа датасета.
Решить задачу классификации, применив в качестве модели kNN, NBC и логистическую регрессию.
Оценить качество моделей, сравнить:
Accuracy
Precision
Recall
F-мера
В зависимости от количества классов один из двух методов:
Confusion matrix (много классов) ROC-кривая и AUC (бинарная классификация) 2. Датасет и его описание
Датасет для данной работы был скачен с репозитория для машинного обучения.
Информация о датасете:
Этот набор данных является результатом анкетирования в Индонезии в 1987 году. Опрошенные – замужние не беременные женщины. Цель – предсказать текущий метод контрацепции (не применяет, долгосрочный метод, краткосрочный метод) женщины на основе ее демографических и социально-экономических характеристик. Информация об атрибутах:
1. Wife_age – возраст жены (число)
2. Wife_education – уровень образования жены (в виде категорий) 1=низкий, 2, 3, 4=высокий
3. Husband_education – уровень образования мужа (в виде категорий) 1=низкий, 2, 3, 4=высокий
4. Num_of_children – количество рожденных детей (число)
5. Wife_religion – религия жены (бинарный признак) 0=Не Ислам, 1=Ислам
6. Wife_working – работает ли жена (бинарный признак) 0=Да, 1=Нет
3
7. Husband_occupation – профессия мужа (в виде категорий) 1, 2, 3, 4
8. Index – индекс уровня жизни (в виде категорий) 1=низкий, 2, 3, 4=высокий
9. Media_exposure - воздействие средств информации (бинарный признак) 0=Хорошее, 1=Не хорошее
10. Contraceptive_method – метод контрацепции (классификация) 1=не применяет, 2=долгосрочный метод, 3=краткосрочный метод.
Код написан на языке программирования R.
Лабораторная работа выполнена в 2017 году в Университете ИТМО на факультете Инфокоммуникационных Технологий, кафедра Интеллектуальных Технологий в Гуманитарной Среде. Преподаватель Хлопотов М.В.
Для задачи классификации найти набор данных. Есть ограничение – не менее 1000 объектов, не менее 5 признаков в описании.
Сформулировать цель анализа датасета.
Решить задачу классификации, применив в качестве модели kNN, NBC и логистическую регрессию.
Оценить качество моделей, сравнить:
Accuracy
Precision
Recall
F-мера
В зависимости от количества классов один из двух методов:
Confusion matrix (много классов) ROC-кривая и AUC (бинарная классификация) 2. Датасет и его описание
Датасет для данной работы был скачен с репозитория для машинного обучения.
Информация о датасете:
Этот набор данных является результатом анкетирования в Индонезии в 1987 году. Опрошенные – замужние не беременные женщины. Цель – предсказать текущий метод контрацепции (не применяет, долгосрочный метод, краткосрочный метод) женщины на основе ее демографических и социально-экономических характеристик. Информация об атрибутах:
1. Wife_age – возраст жены (число)
2. Wife_education – уровень образования жены (в виде категорий) 1=низкий, 2, 3, 4=высокий
3. Husband_education – уровень образования мужа (в виде категорий) 1=низкий, 2, 3, 4=высокий
4. Num_of_children – количество рожденных детей (число)
5. Wife_religion – религия жены (бинарный признак) 0=Не Ислам, 1=Ислам
6. Wife_working – работает ли жена (бинарный признак) 0=Да, 1=Нет
3
7. Husband_occupation – профессия мужа (в виде категорий) 1, 2, 3, 4
8. Index – индекс уровня жизни (в виде категорий) 1=низкий, 2, 3, 4=высокий
9. Media_exposure - воздействие средств информации (бинарный признак) 0=Хорошее, 1=Не хорошее
10. Contraceptive_method – метод контрацепции (классификация) 1=не применяет, 2=долгосрочный метод, 3=краткосрочный метод.
Код написан на языке программирования R.
Лабораторная работа выполнена в 2017 году в Университете ИТМО на факультете Инфокоммуникационных Технологий, кафедра Интеллектуальных Технологий в Гуманитарной Среде. Преподаватель Хлопотов М.В.
Характеристики лабораторной работы
Учебное заведение
Семестр
Вариант
Теги
Просмотров
2
Качество
Идеальное компьютерное
Размер
265,97 Kb
Список файлов
otchet6_Решить задачу классификации_ применив в качестве модели knn_ nbs и логистическую регрессию.pdf