Отзыв оппонента 2 (Методы, алгоритмы и устройства распознавания речи в ассоциативной осцилляторной среде)
Описание файла
Файл "Отзыв оппонента 2" внутри архива находится в папке "Методы, алгоритмы и устройства распознавания речи в ассоциативной осцилляторной среде". PDF-файл из архива "Методы, алгоритмы и устройства распознавания речи в ассоциативной осцилляторной среде", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ «МЭИ» . Не смотря на прямую связь этого архива с НИУ «МЭИ» , его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст из PDF
Отзыв официального оппонента на диссертационную работу Парамонова Павла Александровича «Методы, алгоритмы и устройства распознавания речи в ассоциативной осцилляторной среде», представленную на соискание ученой степени кандидата технических наук по специальности 05.13.05 — Элементы и устройства вычислительной техники и систем управления Актуальность темы диссертации На сегодняшний день речевые средства ввода информации и управления приобретают все большую популярность. Внедрение голосового управления в системы как гражданского, так и военного назначения, позволяет существенно повысить эффективность управления сложными комплексами боевого и гражданского назначения. Однако, реализация таких систем распознавания речи является сложной научно-технической задачей из-за существенных ограничений, накладываемых на их аппаратное обеспечение. Эти ограничения связаны с тем, что распознавание необходимо выполнять только с использованием имеющихся вычислительных средств.
При этом существующие методы и алгоритмы распознавания речи имеют высокую вычислительную сложность, что не позволяет применить их в условиях ограниченных вычислительных ресурсов. Таким образом, необходима разработка и исследование специализированных методов и устройств распознавания речи. Учитывая вышесказанное, тема диссертационного исследования Парамонова П.А. посвящена решению актуальной научно-технической задачи, имеющей большое научное и практическое значение.
Содержание и структура работы Диссертационная работа состоит из введения, пяти глав, заключения, списка литературы, трех приложений, изложена на 147 страницах, содержит 64 рисунка, 10 таблиц. Список литературы включает 81 наименование литературных источников по теме исследования. Во введении автором сформулированы актуальность выбранной темы, цели и задачи исследования, указаны научная новизна и практическая значимость результатов, основные положения, выносимые на защиту, дана структура работы, приведены данные о публикациях и апробации результатов исследования.
Первая глава является обзорной. В ней автор дает описание общей структуры системы распознавания речи и существующих методов и моделей, которые применяются при разработке каждого компонента этой системы — блока выделения признаков и блока распознавания. Также приводится обзор ассоциативных сред хранения и обработки информации. На основе составленных обзоров диссертант выбирает метод выделения признаков речи, исходные методы распознавания, а также тип ассоциативной среды, в которой будет осуществляться обработка информации.
Вторая глава посвящена методам предварительной обработки и выделению признаков речевого сигнала. Рассматривается разработанный метод выделения участков входного сигнала, содержащих речь, а также выбранной процедуры выделения признаков. В третьей главе автор приводит краткое описание выбранной модели речи— скрытой Марковской модели, и ее применение в распознавании речи. Детально описывается реализация аппарата скрытых Марковских моделей на элементах ассоциативной осцилляторной среды.
На основе исследования разработанной реализации автор предлагает модификацию алгоритма прямого хода и новый метод распознавания, опускающий порядок следования звуков в произнесении, а также их реализации в ассоциативной осцилляторной среде. Разработанные методы существенно снижают вычислительную сложность распознавания. В четвертой главе приводятся данные по экспериментальной проверке предложенных методов распознавания речи и их реализаций в ассоциативной осцилляторной среде на задаче распознавания русских слов.
Дается описание составленной речевой базы и программного комплекса. В пятой главе автор описывает разработанную аппаратную реализацию элементов ассоциативной осцилляторной среды для распознавания речи без учета порядка следования звуков. В заключении приводятся результаты, полученные в ходе диссертационного исследования.
Приложения содержат словарь разработанной системы распознавания русских слов, программные реализации предложенных методов распознавания, УНИ.-описания разработанных цифровых узлов. Обоснованность и достоверность научных положений Обоснованность и достоверность научных положений и выводов, сформулированных диссертантом, подтверждается корректностью формулировок, использованием методов исследований, базирующихся на теории логических и арифметических основ вычислительной техники. Экспериментальная проверка полученных результатов проводилась с использованием имитационного моделирования. Научная новизна Автором предложены и исследованы: ° новый метод выделения участков сигнала, содержащих речь; ° реализация на элементах ассоциативной осцилляторной среды аппарата скрытых Марковских моделей; е модификация алгоритма прямого хода, упрощающая вычисление вероятности прямого распространения, а также ее реализация в ассоциативной осцилляторной среде; ° новый метод распознавания, заключающийся в нахождении вероятности порождения скрытой Марковской моделью набора наблюдаемых значений без учета их порядка.
Научная и практическая значимость диссертационной работы Разработанные в диссертационной работе методы и аппаратные средства распознавания речи в ассоциативной осцилляторной среде вносят существенный вклад в развитие архитектурных решений, не базирующихся на архитектуре фон Неймана, и их приложений. Автором предложен и исследован метод выполнения арифметических операций в ассоциативной осцилляторной среде, основанный на представлении дробных чисел как псевдослучайных бинарных последовательностей с заданной интенсивностью.
Этот подход значительно упрощает аппаратную реализацию базовых арифметических операций ЭВМ— сложения и умножения. Эта идея была успешно использована автором для реализации в ассоциативной осцилляторной среде алгоритма прямого хода— основного алгоритма скрытых Марковских моделей. В ходе работы был расширен набор клеточных ансамблей среды. Кроме того, автором были предложены модификация алгоритма прямого и новый метод распознавания на скрытых Марковских моделях, основанный на исключении из рассмотрения порядка следования звуков речи. Оба подхода позволяют одновременно повысить скорость распознавания и уменьшить аппаратные затраты при аппаратной реализации.
В ходе исследования автором были получены важные результаты, касающиеся точности предложенных методов распознавания, а также возможностей их практического применения для построения системы распознавания голосовых команд. Для проведения экспериментов была составлена речевая база из 100 наиболее часто встречающихся русских слов общим объемом в 4000 произнесений, сама по себе несущая значительную ценность, т.к. может быть использована для обучения и тестирования систем голосового управления. 4 Замечания по диссертационной работе: 1. Присутствуют недостатки в оформлении, например, обозначение осей и описание графика на рис. 21, стр. 49 выглядят несогласованно и запутанно. Комментарий, несколько поясняющий их смысл, расположен уже после рисунка.
2. В работе не рассмотрены способы расширения словаря разработанной системы распознавания русских слов. Несмотря на указанные недостатки, ценность, научная новизна и обоснованность результатов исследования не вызывают сомнений. Доцент кафедры Электроники„ Телекоммуникаций и Компьютерных технологий Федерального Государственного Бюджетного Образовательного Учреждения Высшего Профессионального Образования «Липецкий Государственный Педагогический Университет», к.т.н.
Газин Алексей Иванович 398020, г. Липецк, ул. Ленина, д. 42 Тел.: 8(4742)328388 е-гпа11: уеагп®ЬЕ.гп ФГБОУ ВПО «Липецкий Государственный Педаг Газин А.И. 'Ф ,1 ,ф' Лолаксь.,„-' огический Унф~ На%6в:к Уко 4гК6 йй0 "Ягг Заключение Диссертация Парамонова П.А. является законченной научноисследовательской работой, выполненной самостоятельно и на высоком уровне. Тема и содержание диссертации соответствует специальности 05.13.05. Автореферат полностью соответствует содержанию диссертации. Основные результаты исследования полно отражены в публикациях автора. Считаю, что диссертация Парамонова Павла Александровича «Методы, алгоритмы и устройства распознавания речи в ассоциативной осцилляторной среде» полностью удовлетворяет требованиям п.
9 «Положения о присуждении ученых степеней», утвержденного постановлением Правительства Российской Федерации от 24 сентября 2013 г. Х 842, а ее автор Парамонов П.А. заслуживает присуждения ученой степени кандидата технических наук по специальности 05,13.05 — Элементы и устройства вычислительной техники и систем управления. .