Главная » Просмотр файлов » Лекции по ЧМВ-дополнительные

Лекции по ЧМВ-дополнительные (1022759), страница 12

Файл №1022759 Лекции по ЧМВ-дополнительные (Лекции в электронном виде) 12 страницаЛекции по ЧМВ-дополнительные (1022759) страница 122017-07-10СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 12)

При этом система "Горыныч" осуществляет автоматический контроль правописания: в текстах, введенных с ее помощью, исключены орфографические ошибки, что практически недостижимо при использовании клавиатурного ввода. Во время работы Вы по-прежнему можете пользоваться клавиатурой и мышкой. Чем чаще Вы диктуете, тем больше система "привыкает" к Вашему голосу.

После окончания работы с программой она всегда предлагает Вам сохранить библиотеку произношения пользователя. Отличительной особенностью системы является работа с несколькими библиотеками произношений - их количество может достигать восьми на одном рабочем месте.

Диктовка осуществляется строго по словам, т. е. после каждого слова нужно делать паузу. Длительность паузы может быть совсем небольшой, так что при достаточном опыте скорость ввода с голоса получается довольно высокая. Слова лучше произносить отчетливо, но "как произносится", а не "как пишется" (не будем забывать, что "Горыныч" - надстройка над английской системой, а для английского иной подход просто немыслим). Пожалуй, серьезнее всего задерживает ввод необходимость дожидаться, пока слово появится на экране, - задержка, разумеется, тем заметнее, чем слабее машина.

В новой версии программы с названием "Комбат" декларируется значительное улучшение качества распознавания, переработанный интерфейс, добавление возможности диктовки на английском языке, а также возможность перевода слов (как с русского на английский, так и с английского на русский) перед выводом на экран. Программа использует оригинальное ядро, полностью основанное на российских разработках. Тестирование программы показало посредственное качество распознавания при диктовке - 30% (даже если говорить идеально, с расстановкой слов).

10.4. Подача голосовых команд компьютеру

Резкое увеличение популярности компьютерной телефонии, наблюдаемое в последние годы, в первую очередь связано с технической революцией в этой области - появлением гибких модульных систем на базе открытых стандартов. Это сопровождалось весьма существенным удешевлением аппаратуры и программного обеспечения для этой технологии. В современном понимании, компьютерная телефония - это технология, основанная на интеграции телефона и компьютера в единую телекоммуникационную среду, при этом, с одной стороны, компьютер используется для интеллектуальной коммутации телефонных вызовов, а с другой, телефон превращается в средство удаленного доступа к компьютерным ресурсам при использовании голосового интерфейса с пользователем. К этой же области относятся и другие прикладные компьютерные системы, связанные с поддержкой передачи информации по телефонным линиям, такие как голосовая почта, факсимильная почта, факс-серверы и так далее.

В этой области подача голосовых команд компьютеру становится одним из основных средств управления системой. Человек, имеющий в руках телефонный аппарат, может управлять удаленным компьютером либо набирая определенные комбинации цифр, либо подавая голосовые команды. Первый способ более прост в реализации и, фактически, на сегодняшний день является наиболее распространенным. Однако его возможности существенно ограничены. Попытайтесь, например, представить себе, как может быть устроена подобная информационная система с железнодорожным расписанием. Как вводить станцию назначения? Второй способ потенциально существенно более гибок, позволяет использовать куда больший "ассортимент" команд и избавляет абонента от необходимости вводить длинные комбинации цифр. Впрочем, все эти преимущества носят, так сказать, количественный характер. А вот и качественное. Все стандартные аппаратные средства компьютерной телефонии рассчитаны на работу с тоновым набором телефонного номера. Между тем, примерно 85% телефонных аппаратов в мире осуществляют импульсную кодировку набранных цифр. По ряду технических причин, на которых мы за недостатком места останавливаться здесь не будем, наиболее удобной альтернативой импульсному набору является именно использование голосовых команд. В условиях России, в частности, это может оказаться единственной возможностью создать полномасштабную прикладную систему компьютерной телефонии.

Каков же арсенал компьютерно-телефонных средств распознавания голоса? Здесь мы имеем в виду только средства модульных систем компьютерной телефонии на базе плат расширения для компьютера, о которых говорилось выше. В них используются специализированные процессоры для цифровой обработки сигналов - DSP, в оперативную память которых в момент включения компьютера загружается программное обеспечение, поддерживающее выполнение всех необходимых функций. Именно это программное обеспечение и отвечает за выполнение всех необходимых операций нижнего уровня; прикладное программное обеспечение определяет только общую логическую структуру приложений. Такое решение дает возможность устанавливать системы компьютерной телефонии даже на относительно слабых персональных компьютерах.

Общая схема распознавания речи такова: поступающий по телефонным линиям голосовой сигнал сначала оцифровывается, а затем по внутренней шине передается на плату расширения для распознавания речи. Собственно распознаванием занимается специальное программное обеспечение, загруженное во внутреннюю оперативную память платы. Существуют и чисто программные средства для распознавания речи. Таковым, в частности, является программа для распознавания речи в компьютерной телефонии VRSoft, представленная компанией Voice Control Systems (VCS). Работа с такой программой позволяет, с одной стороны, избежать расходов на приобретение дополнительного оборудования, а с другой, существенно повышает требования к используемому компьютеру и уменьшает число каналов одновременного распознавания. Например, стандартная плата распознавания речи VR/160, выпускаемая Dialogic, может "обслужить" до 16 каналов одновременно, а возможности VRSoft ограничены четырьмя каналами. Помимо простых плат для распознавания речи, Dialogic выпускает и куда более мощное аппаратное обеспечение - семейство плат Antares, специально предназначенных для разработки продвинутых голосовых приложений. Antares представляет собой четырехпроцессорную плату расширения с большим объемом оперативной памяти. Программируя эту плату, можно создавать любые телефонно-компьютерные приложения на одной плате - Antares объединяет в себе возможности всех плат семейства Dialogic. Важным свойством Antares является наличие открытой платформы для разработки загружаемого программного обеспечения, что позволяет программисту выйти за рамки разработки собственно приложений и писать программы непосредственно для DSP-платы.

В компьютерной телефонии применяются все три режима распознавания речи. Распознавание речи с настройкой на голос используется в различных системах, имеющих конкретного хозяина. Например, можно отдавать голосовые команды набора номера при работе с мобильным телефоном - едет человек в машине, включает телефон и произносит: "позвонить в офис" или "позвонить такому-то", а потом система автоматически набирает нужный номер. Для того, чтобы выполнить такую задачу, телефон должен быть включен в соответствующую систему, работающую с распознаванием голоса. Далее - пользователь может диктовать по телефону необходимые для отправки сообщения и указывать (также голосом), по какому адресу их следует направлять. Защитные голосовые системы, в которых интонационный рисунок речи используется как пароль, применяются для защиты от несанкционированного доступа к данным.

Распознавание речи без настройки на голос особенно важно для российских пользователей - о причинах этого уже говорилось выше. Как всегда, основой для распознавания речи здесь служат словари распознавания. Всего существует три типа словарей для компьютерной телефонии. Во-первых, это цифровой словарь, требующий раздельного произнесения слов. С его помощью можно распознавать цифры от нуля до девяти, а также простейшие команды типа "да", "нет", "стоп" и так далее. Такие словари созданы для очень многих языков, в том числе и для русского. Второй вид словаря - алфавитно-цифровой, где помимо цифр и простых команд присутствуют наименования всех букв алфавита. Используя такой словарь, можно построить систему, где любое слово можно продиктовать по буквам (например, в справочной системе или системе заказа билетов - наименование станции назначения). Эти словари построены также для многих языков - от английского (с разными акцентами) до иврита и японского, однако с русским языком работать в таком режиме пока нельзя. Третий вид словарей - словари для распознавания слитной речи. Здесь набор слов еще меньше, чем в цифровом словаре - цифры и слова "да" и "нет" - однако допускается их слитное произнесение. Словари для распознавания слитной речи имеются только для небольшого количества языков - английского, французского, немецкого, испанского, корейского и еще нескольких.

Российских пользователей, бесспорно, более всего может заинтересовать вопрос, насколько качественно осуществляется распознавание цифр в условиях нашей телефонной сети. Московская компания CompTek International, занимающаяся адаптацией аппаратных и программных средств компьютерной телефонии к работе в российских условиях, провела тестирование распознавания наименований цифр. От цифры к цифре результаты несколько разнятся, но в целом частота правильного распознавания составляет 75-80 процентов, что позволяет говорить о достаточно устойчивой работе системы. Появились и первые российские приложения технологии распознавания телефонной речи. Так, компания "Империя" недавно представила свой продукт, где распознавание речи применяется для поддержки голосового набора номера на мобильном телефоне. Это слегка напоминает способ, когда вы отдаете команды телефону, о чем говорилось чуть выше, только здесь пользователь должен по одной перечислить все цифры номера. Прежде всего, такая система очень удобна для тех, кому часто приходится звонить по телефону, сидя за рулем автомобиля. Другой пример системы, работающей с распознаванием речи на русском языке - система подбора кадров, продукт компании Артикс. При работе с этой системой абоненту задается ряд вопросов, ответы на которые предлагается дать, назвав номер подходящего варианта (варианты ответа также озвучиваются системой). Произнесенный номер распознается системой и заносится в базу данных.

10.5. Преобразование текст-речь

Обратная операция по отношению к распознаванию речи - преобразование текст-речь. Так называется технология, позволяющая генерировать речь по тексту. Основная область применения - различные автоматические системы, предусматривающие голосовую передачу информации: справочные системы или программы автоматического чтения по телефону. Чуть ниже мы несколько подробнее расскажем об этих применениях.

Простейшая разновидность преобразования текст-речь - "сборка" сообщений из отдельных речевых фрагментов. Пример - информатор железнодорожной справочной, где в заранее заготовленное сообщение надо подставить наименование станции назначения, время отправления и (или) стоимость билета. Для этого надо заготовить речевые фрагменты с числительными и некоторыми дополнительными словами, чтобы сообщение звучало более естественно (например, надо учесть, что по-русски говорят "двадцать один рубль" и "двадцать два рубля", но "двадцать пять рублей"). Кроме того, необходимо, чтобы вставляемые речевые фрагменты правильно вписывались в общий интонационный рисунок фразы. Добиться этого не так просто, однако вполне возможно. Аналогичные системы, озвучивающие суммы остатка средств на счете и другую информацию (banking by phone), уже используются целым рядом российских банков.

В качестве аппаратной базы для реализации подобных систем можно применять любую компьютерную аппаратуру для воспроизведения оцифрованной речи. В частности, для этого подойдет и Sound Blaster. Для телефонных же приложений (которые, с нашей точки зрения, наиболее интересны - какой смысл озвучивать информацию человеку, который стоит рядом с компьютерным монитором) применяются голосовые платы, способные воспроизводить оцифрованную речь по телефонным линиям. Такие платы выпускаются многими компаниями. Подчеркнем, что сама генерация сообщений осуществляется в рамках прикладной программы, голосовая же плата используется просто для воспроизведения речи.

Характеристики

Тип файла
Документ
Размер
1,62 Mb
Тип материала
Предмет
Высшее учебное заведение

Список файлов лекций

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6353
Авторов
на СтудИзбе
311
Средний доход
с одного платного файла
Обучение Подробнее