Для студентов СПбПУ Петра Великого по предмету (МИИ) Методы искусственного интеллектаКлассификация музыкальных композиций по жанрам с помощью нейронных сетейКлассификация музыкальных композиций по жанрам с помощью нейронных сетей
2023-12-202023-12-20СтудИзба
Курсовая работа: Классификация музыкальных композиций по жанрам с помощью нейронных сетей
Описание
Цель работы – решение задачи классификации музыкальных композиций по жанрам.
Классификация проведена на наборе данных GTZAN. Набор включает 10 жанров, каждый из которых содержит 100 музыкальных композиций длительностью 30 секунд каждая. Все композиции представляют собой одноканальные записи с частотой дискретизации 20050 Гц и глубиной 16 бит.
Предварительное преобразование исходных данных заключалось в получении Мел-частотных кепстральных коэффициентов (Mel-frequency cepstral coefficients, MFCCs) из временного представления. При этом каждая композиция дополнительно разбивается на фиксированное количество сегментов.
Преобразованные данные разделены на обучающую, контрольную и валидационную выборки в соотношении 55, 25 и 20 %. Классификатор построен на сверточной нейронной сети, включающей 12 слоев и 45514 параметра. В качестве функции ошибки взята перекрестная энтропия. Описание слоев и значения параметров приведены в таблице 1
Обучение нейронной сети происходило с помощью алгоритма оптимизации Adam на протяжении 20 эпох. Графики ошибки и точности обучения после каждой эпохи показаны на рисунке 1 В результате классификации достижимая точность на контрольной выборке составила 71,9 % при ошибке 0,97.
Классификация проведена на наборе данных GTZAN. Набор включает 10 жанров, каждый из которых содержит 100 музыкальных композиций длительностью 30 секунд каждая. Все композиции представляют собой одноканальные записи с частотой дискретизации 20050 Гц и глубиной 16 бит.
Предварительное преобразование исходных данных заключалось в получении Мел-частотных кепстральных коэффициентов (Mel-frequency cepstral coefficients, MFCCs) из временного представления. При этом каждая композиция дополнительно разбивается на фиксированное количество сегментов.
Преобразованные данные разделены на обучающую, контрольную и валидационную выборки в соотношении 55, 25 и 20 %. Классификатор построен на сверточной нейронной сети, включающей 12 слоев и 45514 параметра. В качестве функции ошибки взята перекрестная энтропия. Описание слоев и значения параметров приведены в таблице 1
Обучение нейронной сети происходило с помощью алгоритма оптимизации Adam на протяжении 20 эпох. Графики ошибки и точности обучения после каждой эпохи показаны на рисунке 1 В результате классификации достижимая точность на контрольной выборке составила 71,9 % при ошибке 0,97.
Характеристики курсовой работы
Учебное заведение
Просмотров
1
Покупок
0
Качество
Идеальное компьютерное
Размер
84,54 Kb
Список файлов
Все деньги, вырученные с продажи, идут исключительно на шаурму