Диссертация (Методы, алгоритмы и устройства распознавания речи в ассоциативной осцилляторной среде), страница 17
Описание файла
Файл "Диссертация" внутри архива находится в папке "Методы, алгоритмы и устройства распознавания речи в ассоциативной осцилляторной среде". PDF-файл из архива "Методы, алгоритмы и устройства распознавания речи в ассоциативной осцилляторной среде", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ «МЭИ» . Не смотря на прямую связь этого архива с НИУ «МЭИ» , его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст 17 страницы из PDF
Предварительная обработка речевогосигнала для построения базы произношений одиночных слов //Информационные средства и технологии: труды Международнойнаучно-технической конференции (20 – 22 октября 2012 г.) : в 3 т. – М.:МЭИ, 2012. – 1 т. – с. 53-58.62. Lori F. Lamel, Lawrence R. Rabiner, Aaron E. Rosenberg, Jay G. Wilpon,An Improved Endpoint Detector for Isolated Word Recognition // IEEETransactions on Acoustics, Speech, and Signal Processing, vol.
29, no. 4,1981. - pp. 777-785.63. Шелепов В.Ю., Ниценко А.В., Структурная классификация словрусского языка. Новые алгоритмы сегментации речевого сигнала ираспознавания некоторых классов фонем, Искусственный интеллект,2007, № 1. Стр. 139-147.64. Дорохин О.А., Старушко Д.Г, Федоров Е. Е., Сегментация речевогосигнала, Искусственный интеллект, 2000, № 3. Стр. 450-458.65. Sunil Kumar R.K., Lajish V.L. Phoneme recognition using zerocrossinginterval distribution of speech patterns and ANN // International Journal ofSpeech Technology, 2013. – Vol. 16, No. 1.
– Pp. 125-131.66. Огнев И.В., Огнев А.И., Парамонов П.А., Метод выделения речи наоснове анализа распределения локальных экстремумов сигнала в134системахавтоматическогораспознавания//Информационныетехнологии в проектировании и производстве, 2014. – № 2. – с. 35-40.67. S. Kumar, M. Rao, Design Of An Automatic Speaker Recognition SystemUsing MFCC, Vector Quantization And LBG Algorithm // InternationalJournal on Computer Science and Engineering, 2011. Vol. 3, No.
8. – Pp.2942-2954.68. Огнев И.В., Парамонов П.А., Распознавание речи методами скрытыхмарковских моделей в ассоциативной осцилляторной среде. // Известиявысших учебных заведений. Поволжский регион. Технические науки –2013. – Вып. 3. – С. 115 - 126.69 Гнеденко Б.В., Курс теории вероятностей: Учебник, – 6-е изд., – М.:Наука, 1988. – 448 с.70 Гмурман В.Е., Теория вероятностей и математическая статистика.
– 9-еизд., – М.: Высшая школа, 2003. – 479 с.71. Bertsekas D., Tsitsiklis J., Introduction to probability, 2nd edn. – AthenaScientific, Belmont, 2008, – 544 p.72. Борисов В. В., Полячков А.В. Реализация многокоординатнойассоциативной среды на основе программируемых логических схем //Математическая морфология. Электронный математический и медикобиологический журнал. – Т.
9. – Вып. 4. – 2010.73. Борисов В.В., Полячков А.В., Тихонова Е.А. Модели ассоциативнойсреды для распределенного представления и анализа информации //Информационные средства и технологии.: Тр. межд.науч.-практ.конф.,в 3-х т. – М.: Издательский дом МЭИ. – 2009.74. Кривнова О. Ф., Захаров Л.
М., Строкин Г. С., Речевые корпусы (опытразработкиииспользование)[Электронныйресурс]//ТрудыМеждународного семинара Диалог'2001 по компьютерной лингвистикеи ее приложениям, Т. 2, 2001, режим доступа: http://www.dialog21.ru/digest/archive/2001/?year=2001&vol=22725&id=6928.13575. Газин А. И., Методики формирования баз голосовых образов дляоценки стойкости систем голосовой аутентификации личности.Диссертация на соискание учѐной степени кандидата технических наук.– Пенза: ПГУ, 2011.
– 184 с.76. Murphy K.P., Machine learning: a probabilistic perspective. – The MITPress, 2012. – 1104 p.77. Бибило П.Н., Основы языка VHDL, – М.: СОЛОН-Р, 2002. – 224 с.78. Поляков А. К., Языки VHDL и Verilog в проектировании цифровойаппаратуры. – М.: СОЛОН-Пресс, 2003.
– 320 с.79. СидороваН.А. Распознавание изображенийвассоциативнойосцилляторной среде. Диссертация на соискание учѐной степеникандидата технических наук. – М.: МЭИ(ТУ), 2010. – 188 с.80. Максфилд К., Проектирование на ПЛИС. Курс молодого бойца. – М.:Издательский дом «Додэка-XXI», 2007. – 408 с.81. Стешенко В. Б., ПЛИС фирмы Altera: проектирование устройствобработки сигналов. – М.: ДОДЭКА, 2000.
– 128 с.136Приложение 1. Словарь разработанной системы распознаванияречиСловарь разработанной системы распознавания речи:№1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.27.28.29.30.31.32.33.34.35.36.37.38.Словопослевсегдаибытьпотомупередмеждубольшойслучайребенокгородобщийденьделатьвосемьконецкаждыйглазлицоотецпервыйпятьдлясилачетыредругидтиземлярукаиметьонголоватутдомкакчеловекеслив137Обозначение в САРРAFTERALWAYSANDBEBECAUSEBEFOREBETWEENBIGCASECHILDCITYCOMMONDAYDOEIGHTENDEVERYEYEFACEFATHERFIRSTFIVEFORFORCEFOURFRIENDGOGROUNDHANDHAVEHEHEADHEREHOMEHOWHUMANIFIN39.40.41.42.43.44.45.46.47.48.49.50.51.52.53.54.55.56.57.58.59.60.61.62.63.64.65.66.67.68.69.70.71.72.73.74.75.76.77.78.79.80.81.знатьпоследнийжизньжитьмашинаяденьгидолженмойновыйдевятьнесейчасконечнонаразодинтолькоилинашчастьмирместовопросрусскийсказатьвидетьсемьонасторонапростосидетьшестьсистемавзятьпотомонидуматьэтотривремятожечерезKNOWLASTLIFELIVEMACHINEMEMONEYMUSTMYNEWNINENOTNOWOFCOURSEONONCEONEONLYOROURPARTPEACEPLACEQUESTIONRUSSIANSAYSEESEVENSHESIDESIMPLYSITSIXSYSTEMTAKETHENTHEYTHINKTHISTHREETIMETOOTROUGH13882.83.84.85.86.87.88.89.90.91.92.93.94.95.96.97.98.99.100.дваподоченьвидхотетьводачтокогдагдекоторыйктосженщинасловоработагоддатынольTWOUNDERVERYVIEWWANTWATERWHATWHENWHEREWHICHWHOWITHWOMANWORDWORKYEARYESYOUZERO139Приложение 2.
Исходный код разработанного программногокомплексаРеализация в Matlab исходного алгоритма прямого хода:function [al, S] = hmm_alpha_prob(A_matr, p_vect, B_matr,O_vect, Time)al = zeros(Time, length(A_matr(1, : )));al(1, : ) = p_vect'.*B_matr(:,O_vect(1))';S = zeros(Time, 1);S(1) = 1/sum(al(1, : ));al(1, : ) = al(1, : ).*S(1);for t=1:Time-1al(t+1, : ) = (al(t, : )*A_matr).*B_matr(:,O_vect(t+1))';S(t+1) = 1/sum(al(t+1, : ));al(t+1, : ) = al(t+1, : ).*S(t+1);endendРеализация в Matlab модифицированного алгоритма прямого хода супрощенным вычислением логарифма суммы:function [log_prob_t_j] = hmm_alpha_prob_log_approx(A_matr,p_vect, B_matr, O_vect, Time)log_prob_t_j = zeros(Time, length(A_matr(1, : )));log_prob_t_j(1, : ) = log(p_vect') +log(B_matr(:,O_vect(1))');for t=1:Time-1for j=1:length(A_matr(1, : ))log_prob_t_j(t+1, j ) = log(B_matr(j, O_vect(t+1))')+ max(log(A_matr( : , j)') + log_prob_t_j(t, : ));endendendРеализация в Matlab разработанного метода распознавания без учетапорядка следования звуков:function [ log_score ] = hmm_markov_assumption_scores( A_matr,B_matr, O_vect, Time )STATES = length(A_matr(1, : ));SYMBOLS = length(B_matr(1, : ));140% Вероятность нахождения в j-м состоянии найдем из СЛАУ:A = zeros(STATES + 1, STATES);A(STATES + 1, : ) = ones(1, STATES);A(1:STATES, : ) = A_matr( : , : )';for i=1:STATESA(i, i) = A(i, i) - 1;endB = zeros(STATES + 1, 1);B(STATES+1) = 1;P_assumption = linsolve(A, B);B_assumption = zeros(SYMBOLS, 1);for k = 1:SYMBOLSB_assumption(k) = P_assumption' * B_matr( : , k, 1);endlog_score = 0;for t=1:Timelog_score = log_score + log(B_assumption(O_vect(t)));endendРеализация в Matlab функции-генератора потоков спайков для СММ = , , :function [ A_spikes, B_spikes, p_spikes ] =aom_create_spike_flows( A_matr, B_matr, p_vect,spikes_flow_length )%Генерая последовательстей спайков - носителей вероятностей A,B, p%--------------------------------------------------------------------------% ИНИЦИАЛИЗАЦИЯ% Генерация последовательностей спайков для моделированияA_i_j, p_i и B_j_k:STATES = length(A_matr( : , 1));CODEBOOK_SIZE = length(B_matr(1, : ));A_spikes = false(STATES, STATES, spikes_flow_lengthB_spikes = false(STATES, CODEBOOK_SIZE, spikes_flow_length);p_spikes = false(STATES, spikes_flow_length);for i=1:STATESif isnan(p_vect(i)) || isinf(p_vect(i))% maximal intensity for Inf:p_spikes(i, : ) = logical(binornd(1, 1, [1spikes_flow_length]));elsep_spikes(i, : ) = logical(binornd(1, p_vect(i), [1spikes_flow_length]));endfor j=1:STATESif isnan(A_matr(i, j)) || isinf(A_matr(i, j))141A_spikes(i, j, : ) = logical(binornd(1, 1, [1spikes_flow_length]));elseA_spikes(i, j, : ) = logical(binornd(1,A_matr(i, j), [1 spikes_flow_length]));endendfor k=1:CODEBOOK_SIZEB_spikes(i, k, : ) = logical(binornd(1, B_matr(i,k), [1 spikes_flow_length]));endendendРеализация в Matlab функции-генератора потоков спайков для массива = log , – вероятность испускания символа данной СММ:function [ B_assumption_spikes, B_assumption_log_spikes ] =aom_create_markov_assumption_vectors( A_spikes, B_spikes,A_i_j, B_j_k, spikes_flow_length )STATES = length(A_spikes( : , 1, 1));SYMBOLS = length(B_spikes(1, : , 1));% Вероятность нахождения в j-м состоянии найдем из СЛАУ:A = zeros(STATES + 1, STATES);for i=1:STATESfor j=1:STATESA(i, j ) = A_i_j( i , j);endendA(1:STATES, : ) = A(1:STATES, : )';A(STATES + 1, : ) = ones(1, STATES);for i=1:STATESA(i, i) = A(i, i) - 1;endB = zeros(STATES + 1, 1);B(STATES+1) = 1;P_assumption = linsolve(A, B);B_assumption = zeros(SYMBOLS, 1);for k = 1:SYMBOLSB_assumption(k) = P_assumption' * B_j_k( : , k);endB_assumption_spikes = false(1, SYMBOLS, spikes_flow_length);B_assumption_log_spikes = zeros(1, SYMBOLS, spikes_flow_length);correct = 10;142for k=1:SYMBOLSB_assumption_spikes(1, k, : ) = logical(binornd(1,B_assumption(k), [1 spikes_flow_length]));B_assumption_log_spikes(1, k, : ) = logical(binornd(1,correct*abs(log(B_assumption(k))/spikes_flow_length), [1spikes_flow_length]));endendРеализация в Matlab разработанного метода распознавания без учетапорядка следования звуков на программной модели АОС:function [ score_intensity ] = aom_markov_assumption_scores_log(B_assumption_log, O_vect, Time, spikes_flow_length )score_flow = false(1, 1, spikes_flow_length);correct = 10;for t=1:Timescore_flow(1, 1, : ) = score_flow(1, 1, : ) |(B_assumption_log(1, O_vect(t), : ));endscore_intensity = (spikes_flow_length/correct)*aom_intensity(score_flow(1, 1, : ));end143Приложение 3.