Главная » Учебные материалы » Автоматизация » Выпускные квалификационные работы (ВКР) » МГТУ им. Н.Э.Баумана » 6 семестр » Автоматическое выявление полезной обратной связи из комментариев к обучающим материалам платформы "JetBrains Academy"
Для студентов МГТУ им. Н.Э.Баумана по предмету АвтоматизацияАвтоматическое выявление полезной обратной связи из комментариев к обучающим материалам платформы "JetBrains Academy"Автоматическое выявление полезной обратной связи из комментариев к обучающим материалам платформы "JetBrains Academy"
2024-05-25СтудИзба

ВКР: Автоматическое выявление полезной обратной связи из комментариев к обучающим материалам платформы "JetBrains Academy"

Описание

Аннотация

  • работе исследуются методы классификации текстов, совмещающих в себе естественный язык и части кода на языке программирования Python. В практической части рассматривается реализация программы для автоматической сортировки комментариев студентов обучающей платформы

"JetBrains Academy". Алгоритм возвращает только полезную обратную связь

  • обучающим материалам на сайте компании, на основе которых можно внести улучшения в теорию и практические задания. В программе использует один из четырех методов машинного обучения с учителем, описанных в теоретической главе, в сочетании с дополнительной проверкой на наличие в текстах определенных n-грамм, указывающих на релевантность комментария. Также в работе подробно описывается очистка исходного размеченного датасета, предобработка комментариев в нем и векторизация текстовых данных.


Ключевые слова: Python, естественный язык, датасет, машинное обучение с учителем, классификация, векторизация, n-граммы, регулярные выражения


The paper investigates the text classification methods that combine natural language and code blocks written in Python programming language. The study focuses on a Python program which automatically sorts feedback comments from students of the online educational platform "JetBrains Academy". The algorithm returns only the insightful feedback on the educational content published on the company website, which can later be used to improve the theoretical section as well as practical assignments. The program utilizes one the the four supervised machine learning methods described in the theoretical chapter, along with an additional check for the presence of certain n-grams in the texts, indicating the relevance of the comment. The paper also contains the detailed description of the

2

tagged dataset cleaning, the preprocessing of comments in it, and the vectorization of textual data.


Keywords: Python, natural language, dataset, supervised learning, classification, vectorization, n-gramms, regular expressions




























































3

Оглавление

Введение........................................................................................... 5

Глава 1. Обработка естественного языка........................................ 7

1.1 Язык как данные................................................................................. 7

1.2 Машинное обучение как метод обработки данных............................. 14

1.3 Классификация в текстовом анализе.................................................. 18

1.4 Обзор классификаторов на основе машинного обучения.................... 24

1.4.1 Логистическая регрессия............................................................. 24

1.4.2 Метод k-ближайших соседей....................................................... 30

1.4.3 Обучение на основе деревьев решений......................................... 34

1.4.4 XGBoost...................................................................................... 40

Глава 2. Программа для классификации комментариев на.......... 44

платформе "JetBrains Academy".................................................... 44

Комментарии на платформе "JetBrains Academy"..................................... 44

Предварительная обработка текстовых комментариев............................. 45

Векторизация текстовых комментариев................................................... 49

Решеточный поиск................................................................................. 51

Оценка работы моделей.......................................................................... 52

Словарь n-грамм.................................................................................... 55

Окончательный вариант алгоритма......................................................... 56

Заключение.................................................................................... 59

Список источников........................................................................ 61

Приложение 1.................................................................................. 65

Приложение 2.................................................................................. 66

Приложение 3.................................................................................. 66

Приложение 4.................................................................................. 67

Приложение 5.................................................................................. 67

Приложение 6.................................................................................. 68









4

Введение

  • современном деловом мире одной из важных задач является получение обратной связи от потребителя. Если таких комментариев получается слишком много, возникает задача их автоматической сортировки.

  • данной работе по заказу компании "JetBrains Academy" предпринята попытка автоматического выявления полезных комментариев к обучающим материалам по программированию.

Просматривать сообщения, оставленные пользователями необходимо,

так как на их основе можно сделать вывод о качестве теоретического материала или понятности практических заданий. Проделывать эту операцию вручную затратно по ресурсам, поэтому и появляется необходимость автоматическим образом осуществить сортировку комментариев так, чтобы с высокой точностью отбрасывать тексты, не несущие полезной информации для создателей обучающего контента, и сохранять большую часть актуальной обратной связи, которая поможет усовершенствовать качество подаваемого материала.

Целью данной выпускной квалификационной работы является разработка алгоритма для автоматического выявления полезной обратной связи из комментариев к обучающим материалам платформы "JetBrains Academy".

Для достижения поставленной цели необходимо решить следующие задачи:

  • Изучить современные алгоритмы машинного обучения,

выполняющие классификацию данных.

2. Выполнить предобработку корпуса комментариев, предоставленного компанией.

  • Преобразовать комментарии в векторный формат.

Характеристики ВКР

Учебное заведение
Семестр
Просмотров
1
Размер
2,38 Mb

Список файлов

Автоматическое выявление полезной обратной связи из комментариев к обучающим материалам платформы %22JetBrains Academy%22.doc
Обратите внимание, что данная работа уже сдавалась в МГТУ им. Н.Э.Баумана, а также её могли покупать другие студенты, поэтому её уникальность может быть нулевой. Для получения уникальной работы воспользуйтесь услугами.

Комментарии

Поделитесь ссылкой:
Цена: 1 500 руб.
Расширенная гарантия +3 недели гарантии, +10% цены
Рейтинг ждёт первых оценок
0 из 5
Оставьте первую оценку и отзыв!
Поделитесь ссылкой:
Сопутствующие материалы
Вы можете использовать ВКР для примера, а также можете ссылаться на неё в своей работе. Авторство принадлежит автору работы, поэтому запрещено копировать текст из этой работы для любой публикации, в том числе в свою выпускную квалификационную работу в учебном заведении, без правильно оформленной ссылки. Читайте как правильно публиковать ссылки в своей работе.
Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6310
Авторов
на СтудИзбе
312
Средний доход
с одного платного файла
Обучение Подробнее