ВКР: Метод классификации данных на основе алгоритма KNN для обработки Iris Flowers данных
Описание
РЕФЕРАТ
Расчётно - пояснительная записка к выпускной квалификационной работе содержит _страниц, _рисунков, _таблиц, _источников: язык программирования C#, информационной системы, моделирования, проектирования.В представленной работе приведены результаты разработки программы классификации данных на основе алгоритма KNN( К - Nearest Neighbors ) для обработки «Iris Flowers» данных.
Целью данной работы является исследование процесса и методов классификации и прогнозирования объектов, разработка программы классификации данных на основе алгоритма KNN( К - Nearest Neighbors ) для обработки «Iris Flowers» данных.
В процессе исследования результатов работы разработанного программного обеспечения (ПО), в ходе тестирования программы KNN Iris Flowers, приведены оценка точности обучения при выполнения процесса классификации данных и оценка выполнения точности процесса классификации «Iris-Flowers» данных.Данные о прикладных возможностях программы (в задачах использования) приведены в разделе «Практическая ценность» работы.
СОДЕРЖАНИЕ
РЕФЕРАТ.....................................................................................................................2
ВВЕДЕНИЕ..................................................................................................................4
1. АНАЛИТИЧЕСКИЙ РАЗДЕЛ...............................................................................8
1.1 Актуальность темы................................................................................................8
1.2 Постановка цели и задач.......................................................................................9
1.3 Практическая ценность.......................................................................................14
1.4 Анализ предметной области и аналитической модели....................................15
1.5 Классификатор.....................................................................................................22
1.6 Работа алгоритма KNN.......................................................................................24
1.7 Преимущества и ограничения............................................................................27
2. КОНСТРУКТОРСКИЙ РАЗДЕЛ.........................................................................28
2.1 Набор данных.......................................................................................................28
2.2 Технология классификации данных с использованием алгоритма KNN......39
2.3 Выбор среды и языка реализации программы..................................................46
2.4 Структура программы.........................................................................................49
2.5 Настройка параметров с перекрёстной проверкой...........................................50
2.6 Описание графического и пользовательского интерфейса.............................52
3. ТЕХНОЛОГИЧЕСКИЙ РАЗДЕЛ.........................................................................56
3.1 Определение структуры и состава программы.................................................56
3.2 Тестирование....................................................................................58
3.3 Руководство пользователя..................................................................................60
3.4 Подготовка программы к работе и условия её применения............................61
4. ИССЛЕДОВАТЕЛЬСКИЙ РАЗДЕЛ....................................................................62
4.1 Этапы проектирования ПО.................................................................................62
4.2 Результат отладки ПО. Направления развития программы............................63
ЗАКЛЮЧЕНИЕ.........................................................................................................65
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ................................................67
Приложение А...........................................................................................................69
ВВЕДЕНИЕ
В настоящее время методы и алгоритмы интеллектуального анализа данных(ИАД) применяются для разработки разнообразных классификаторов данных, имеющих важное практическое значение для автоматизации процессов обработки больших массивов данных.Интеллектуальный анализ данных(англ. Data Mining) представляет собой направление информационных технологий, охватывающее значительную область проблем, связанных с извлечением знаний из массивов данных, обеспечивающие выявлений скрытых закономерностей или взаимосвязей между переменными в больших массивах необработанных данных. Термин Data Mining был введён Григорием Пятицким-Шапиро в 1985 году.
К задачам, решаемым алгоритмическими средствами ИАД, относятся, прежде всего:
-задачи классификации;
-задачи кластеризации;
-задачи прогнозирования.
Классификация, являющееся одной из важнейших задач ИАД, обеспечивает отнесение входного вектора
Характеристики ВКР
Учебное заведение
Семестр
Просмотров
1
Размер
3,36 Mb
Список файлов
Метод классификации данных на основе алгоритма KNN для обработки Iris Flowers данных.docx
Комментарии
Нет комментариев
Стань первым, кто что-нибудь напишет!
МГУ им. Ломоносова
Tortuga











