Курсовая работа: Методы решения задачи регрессии
Описание
Содержание
1
Введение
Машинное обучение одна из самых бурно развивающихся отраслей прикладной математики в последнее десятилетие. Все крупные компании имеют свои собственные отделы по анализу данных, что позволяет оптимизи-ровать производство. В связи с этим появился огромный спрос на квалифи-цированных специалистов в области машинного обучения. Одним из способов обмена опытом и получения новых навыков в этой отрасли являются сорев-нования по машинному обучению.
Данная исследование основано на работе с базой данных о сыгранных партиях в популярную многопользовательскую видеоигру PlayerUnknown’s Battlegrounds. На сайте kaggle.com с октября 2018 г. по январь 2019 г. про-водилось соревнование по машинному обучению по предсказанию места, за-нятого игроком в рамках одной партии в PlayerUnknown’s Battlegrounds.
Эта база данных обладает своими особенностями, поэтому она интересна для анализа и разнообразных экспериментов.
Работа состоит из 7 глав и введения. В 1 главе определяются цели рабо-ты, и приводится постановка задачи. Глава 2 содержит описание необходимых преобразований данных. В 3 главе кратко описываются используемые алго-ритмы машинного обучения. Глава 4 содержит описание процесса обучения моделей. В 5 главе сравниваются результаты полученных моделей. Глава 6 содержит краткий анализ одной из построенных моделей. В 7 главе описаны итоги работы.
| 1 | Постановка задачи | 3 | |
| 1.1 | Целиработы ............................. | 3 | |
| 1.2 | Правила игры PlayerUnknown’s Battlegrounds . . . . . . . . . . . | 4 | |
| 1.3 | Описаниебазыданных........................ | 6 | |
| 2 | Предобработка данных | 9 | |
| 2.1 | Exploratory data analysis . . . . . . . . . . . . . . . . . . . . . . . | 9 | |
| 2.2 | Feature engineering . . . . . . . . . . . . . . . . . . . . . . . . . . | 13 | |
| 2.3 | Сжатиепамяти............................ | 15 | |
| 3 | Алгоритмы машинного обучения | 16 | |
| 3.1 | Задачарегрессии........................... | 16 | |
| 3.2 | Нейронныесети............................ | 17 | |
| 3.3 | Random forest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | 18 | |
| 3.4 | Gradient boosting machine . . . . . . . . . . . . . . . . . . . . . . | 19 | |
| 3.5 | Обзор используемых технологий . . . . . . . . . . . . . . . . . . | 20 | |
| 4 | Оптимизация гиперпараметров | 21 | |
| 4.1 | Описание алгоритма GridSearch . . . . . . . . . . . . . . . . . . | 21 | |
| 4.2 | Сэмплирование............................ | 22 | |
| 4.3 | Поиск гиперпараметров для нейронной сети . . . . . . . . . . . | 22 | |
| 4.4 | Поиск гиперпараметров для случайного леса . . . . . . . . . . . | 23 | |
| 4.5 | Поиск гиперпараметров для градиентного бустинга . . . . . . . | 23 | |
| 5 | Результаты работы | 25 | |
| 5.1 | Калибровкамодели ......................... | 25 | |
| 5.2 | Результатыработымоделей. . . . . . . . . . . . . . . . . . . . . | 25 | |
| 6 | Анализ модели градиентного бустинга | 27 | |
| 7 | Заключение | 29 | |
1
Введение
Машинное обучение одна из самых бурно развивающихся отраслей прикладной математики в последнее десятилетие. Все крупные компании имеют свои собственные отделы по анализу данных, что позволяет оптимизи-ровать производство. В связи с этим появился огромный спрос на квалифи-цированных специалистов в области машинного обучения. Одним из способов обмена опытом и получения новых навыков в этой отрасли являются сорев-нования по машинному обучению.
Данная исследование основано на работе с базой данных о сыгранных партиях в популярную многопользовательскую видеоигру PlayerUnknown’s Battlegrounds. На сайте kaggle.com с октября 2018 г. по январь 2019 г. про-водилось соревнование по машинному обучению по предсказанию места, за-нятого игроком в рамках одной партии в PlayerUnknown’s Battlegrounds.
Эта база данных обладает своими особенностями, поэтому она интересна для анализа и разнообразных экспериментов.
Работа состоит из 7 глав и введения. В 1 главе определяются цели рабо-ты, и приводится постановка задачи. Глава 2 содержит описание необходимых преобразований данных. В 3 главе кратко описываются используемые алго-ритмы машинного обучения. Глава 4 содержит описание процесса обучения моделей. В 5 главе сравниваются результаты полученных моделей. Глава 6 содержит краткий анализ одной из построенных моделей. В 7 главе описаны итоги работы.
Характеристики курсовой работы
Учебное заведение
Семестр
Просмотров
1
Размер
958,5 Kb
Список файлов
Методы решения задачи регрессии.doc
Комментарии
Нет комментариев
Стань первым, кто что-нибудь напишет!
МГИМО
Tortuga











