Автореферат (Методы, алгоритмы и устройства распознавания речи в ассоциативной осцилляторной среде), страница 3
Описание файла
Файл "Автореферат" внутри архива находится в папке "Методы, алгоритмы и устройства распознавания речи в ассоциативной осцилляторной среде". PDF-файл из архива "Методы, алгоритмы и устройства распознавания речи в ассоциативной осцилляторной среде", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ «МЭИ» . Не смотря на прямую связь этого архива с НИУ «МЭИ» , его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст 3 страницы из PDF
Анализинформационных процессов в разработанном методе распознавания без учетапорядка звуков в осцилляторной среде показал, что для каждой СММнеобходимо составить модуль вычисления вероятности. Всемодулиработают параллельно, за одинаковое количество тактов выдаютрезультат на клеточный ансамбль дифференциал, который выбирает поток снаибольшей интенсивностью (рис. 7). Для получения аргумента максимумаиспользуется шифратор.ДифференциалШифраторРис. 7. Структура блока распознавания.В структуре модуляможно выделить три блока (рис 8):1.накопитель размеромдля хранения потоков спайков длиной ,отображающих вероятностинаблюдения символа;2.арифметический блок с памятью, выполняющий накопление потокаспайков, отображающего искомую вероятность;3.блок управления, контролирующий подачу данных из накопителя варифметический блок.БлокНакопительУправленияАрифметическийблокРис.
8. Структура модуля, выполняющего вычисление14для СММ.На рисунке 9 приведен синтезированный в Quartus II схемный символарифметического блока модуля. Полученный компонент может бытьпараметризован по длине цепочки спайков (параметр spikes_flow_length). Егоинтерфейс включает следующие входы и выходы: CLK – синхровход, DI –входная шина данных, serial_out – выход для последовательного чтения данныхсо сдвигом, SRD – установка режима последовательного чтения со сдвигом,CNT – установка режима логического суммирования данных на DI ссодержимым регистра, RST – сброс. Все изменения состояния разработанногокомпонента – сложение с сохранением, сброс, чтение со сдвигом, происходяттолько по фронту синхросигнала CLK.
На временной диаграмме (рис. 10)продемонстрированы режим сложения с сохранением, а затем за 4 тактапоследовательное считывание цепочки спайков. После этого демонстрируетсясброс с помощью RST.Рис. 9. Арифметический блок модуля.Рис. 10. Временная диаграмма работы арифметического блока модуля.На рисунке 11 приведен модуль «Дифференциал». Входы Q и Sсоответствуют информационным входам дифференциала, на которые подаютсяпотоки спайков. Получение нового выходного значения происходит по фронтуCLK. При этом, чтобы изменить состояние дифференциала, его необходимовыбрать, установив на входе EN высокий уровень.
Анализируя входные потоки,дифференциал переходит в стационарное состояние, когда один из егозамкнутых осцилляторов насыщается, а другой – полностью останавливается(т.е. его интенсивность становится равно нулю). Для того, чтобы повторноиспользовать дифференциал, был предусмотрен синхронный вход RST,сбрасывающий заряды осцилляторов в нулевое значение. Наконец, в15разработанномVHDL-описаниипредусмотренапараметризациядифференциала по емкости замкнутых осцилляторов (параметр charge_size, нарис. 11 равный 4)..
Временная диаграмма его работы приведена на рис. 12.Рис. 11. Блок «Дифференциал» в Quartus II.Рис. 12. Временная диаграмма работы блока «Дифференциал».На рисунке 13 представлена схема блока распознавания с двумямодулями. Таким образом, для работы с разработанной аппаратнойреализацией блока распознавания необходимо предусмотреть наличие внешнихустройств, осуществляющих обучение системы, загрузку полученных приобучении цепочек спайков в модулиблока распознавания и управлениережимами его работы.В заключении приведены основные результаты работы, которыесостоят в следующем:1.Проведен анализ задачи распознавания речи, рассмотрены основныекомпоненты систем автоматического распознавания речи.2.Рассмотрены методы предварительной обработки и выделения признаковречевого сигнала, среди которых выбран подход, основанный на нахождениимел-кепстральных коэффициентов.3.Рассмотрены методы распознавания речи и выбран аппарат скрытыхМарковских моделей.1617Рис.
13. Схема блока распознавания с двумя модулями4.Разработан и исследован метод выделения речи, основанный на анализераспределения локальных экстремумов входного сигнала. Написана егопрограммная реализация.5.Разработан метод реализации алгоритма прямого хода в ассоциативнойосцилляторной среде, основанный на представлении вероятности с помощьюинтенсивности потока спайков. Предложена реализация на элементахассоциативной осцилляторной среды.6.Разработана модификация алгоритма прямого хода, в которой упрощеновычисление логарифма вероятности прямого хода.
Предложена реализация наэлементах ассоциативной осцилляторной среды.7.Разработан метод распознавания речи, не учитывающий порядокследования звуков речи. Предложена его реализация на элементахассоциативной осцилляторной среды.8.Разработан программный комплекс, позволяющий создавать речевыебазы и включающий программные модели предложенных реализацийраспознавания речи в осцилляторной среде.9.Сформирована речевая база русских слов, которая была использована дляобучения и тестирования разработанной системы распознавания.10.
На созданной речевой базе были исследованы предложенные реализациираспознавания в осцилляторной среде. Была оценена точность распознавания, атакже получены зависимости точности от различных параметров: выбраннойдлины последовательности спайков, количества распознаваемых различныхслов (классов).11. Разработана аппаратная реализация блока распознавания речи вассоциативной осцилляторной среде на ПЛИС с использованием САПРQUARTUS II 13.1 Web Edition и ISE 14.7 Web Pack.СПИСОК ОПУБЛИКОВАННЫХ РАБОТ:1.Огнев И.В., Огнев А.И., Парамонов П.А., Метод выделения речи наоснове анализа распределения локальных экстремумов сигнала в системахавтоматического распознавания // Информационные технологии впроектировании и производстве, науч.-техн. журн. // ФГУП “ВИМИ”–2014.
– № 2. – с. 35-40.2.Огнев И.В., Парамонов П.А., Распознавание речи методами скрытыхмарковских моделей в ассоциативной осцилляторной среде. // Известиявысших учебных заведений. Поволжский регион. Технические науки –2013. – Вып. 3. – с. 115-126.3.Paramonov P., Sutula N., Simplified scoring methods for HMM-based speechrecognition // Soft Computing, 2015, DOI: 10.1007/s00500-015-1831-1.4.Огнев И.В., Огнев А.И., Парамонов П.А., Классификация речевыхобразов на основе анализа распределений их локальных экстремумов, труды18XXI международной научно-технической конференции "Информационныесредства и технологии". - М.: МЭИ, 2013 - с.
53-57.5.I.V. Ognev, A.I. Ognev, P.A. Paramonov, N.A. Sutula, The use of extremadistribution as a feature vector for speech patterns recognition, The 11th InternationalConference "Pattern Recognition and Image Analysis: New InformationTechnologies", Vol. 1, 2013. – Pp. 114-117.6.Огнев И. В., Парамонов П.А. Исследование способов представлениячисла для реализации арифметических операций в ассоциативной среде скомандным управлением // Информационные средства и технологии: трудыМеждународной научно-технической конференции (19 – 21 октября 2010 г.): в3 т.
– М.: МЭИ, 2010. – 1 т. – с. 54-60.7.Огнев И. В., Парамонов П.А. Реализация арифметических операций вассоциативной среде с командным управлением // Информационные средства итехнологии: труды Международной научно-технической конференции (19 – 21октября 2010 г.) : в 3-ч т. – М.: МЭИ, 2010. – 1 т. – с. 61-68.8.Огнев И.
В., Парамонов П.А. Предварительная обработка речевогосигнала для построения базы произношений одиночных слов //Информационные средства и технологии: труды Международной научнотехнической конференции (20 – 22 октября 2012 г.) : в 3 т. – М.: МЭИ, 2012. – 1т. – с. 53-58.19.