part 1 (694716), страница 7

Файл №694716 part 1 (Машины, которые говорят и слушают) 7 страницаpart 1 (694716) страница 72016-07-312016-07-31СтудИзба

Машины, которые говорят и слушают

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 7)

Если система не в состоянии сформировать правильную гипотезу о фразе или если исчерпаны ресурсы, то считается,что система не смогла интерпретировать высказывание. При расширении гипотезы блок управления вызывает синтаксическую компоненту, которая дает возможность оценить гипотезу и предсказать новые слова. Синтаксическая компонента помечает каждое слово словесной решетки, которое можно использовать для расширения гипотезь', и устанавливает, какие еще слова требуются для подтверждения этой гипотезы ("подсказка" сверху). В связи с последним могут быть произведены дополнительные сравнения с эталонами для проверки, нет ли в текущей реализации высказывания необходимых слов.

После того, как синтаксическая компонента ("прагматическая грамматика") сделала свои предположения слов слева направо, она вызывает процедуру лексического поиска для проверки новых гипотез о словах. Оценки слов, оценки гипотез об отрезках фразы и оценки фраз ("событий", как их называют разработчики Wi'iu ) влияют на общую стратегию интерпретации высказывания. Событиям присваиваются очки, приблизительно равные сумме очков слов подтвержденной гипотезы и слов, требуемых для расширения этой гипотезы,

Попробуем рассмотреть пример, из которого станет ясно, как работает механизм анализа предположения, основанный на так называемой "островковой стратегии". Пусть на вход системы поступила фраза:

"What Is the total budget figure ?"(Какова общая сумма бюджета?). При просмотре фразы справа налево процедура лексического поиска формирует таблицу:

17 17

22 11

182

178 174

-38

-10

-R

-d

-R

1. FIGURE

2. FIGURE

3. TOTAL

4. FIGURE1723169-535. YEAR2023107-23б. УСУ2022100-317. IS3596-318. ABOVE10149409. BUDGET111781-1610. IT6880-1611. IS2576-3112, ТО7973-4613^ WOULD0372-3114. -34572015, FIGURE172169-38Слева направо16. TOTAL - ED71?1971017. FIGURE1724182018. WHAT03178019. PIOURE1722178-3820. TOTAL711174-1021, FIGURE1723169-5322. HJDGET1117154-1623. VKAH2023107-2324. YOU2022100-3125. IS3596-3126. FIGURE - ED172389-3827. FIGURE172883028. BUDGET111781-1629. IT6880-1630. HIS2576-31

Список представляет 30 возможных слов при сканировании справа и слева, позиции правой и левой конечных сегментов слова, очков, которые получило данное слово при сравнении эталонов с участками входной реализации на местах между начальной и конечной точками гипотезируемого слова, логарифма вероятности произнесения данного слова. Список может описывать некие специфические свойства, связанные с произношением (здесь всюду пропуски - -), а также показывать, справа или слева производилось сравнение с эталоном (здесь показатели R и L).

Анализ списка гипотезируемых слов показывает, что больше всего очков набрало слово totaled (при сканировании слева направо). Бто слово занимает в словесной решетке позицию от сегмента 7 до сегмента 12 и имеет вес 197. Для этого слова соа-

дается однословная гипотеза, которую должна расширить синтаксическая процедура. Но прагматическая грамматика не позволяет формировать фразу с этим словом в прошедшем времени. Следовательно, никакого предсказания о возможном контексте с этим словом сделано Сыть не может. Следует перейти к следующему (по оцен. не в очках) слову figure . Отметим, что существует семь различных сравнений с этим словом примерно в гом же месте высказывания, немного отличающихся очками.(Это объясняется различными фонологическими эффектами на концах слова, возможностями различной сегментации в сегментной решетке и различными возможными произнесениями этого слова, отраженными в эталонном фонетическом графе; в кашем случае все связано с неопределенностями сегментации этого слова в конце.) Вообще говоря, то, что одно слово встречается в списке вероятных кандидатов несколько раз, является хорошим признаком того, что это слово действительно присутствует в высказывании,

Чтобы избежать избыточной обработки, авторы вводят понятие "нечеткого словесного сравнения", которое обобщает сравнение с эталоном одного и того же слова, появившегося примерно в том же месте. Всегда, когда слово-кандидат подобно figure встречалось несколько раз, при расширении гипотезы используются нечеткие границы. Итак, для слова figure предлагается расширить гипотезу.

При обработке предложенного слова (с примерно известными границами) процедура Syntax подбирает слово виос-зт, заканчивающееся позицией 17. В прагматической грамматике hwim слово budget может использоваться лишь в словосочетании budget figure и, так как это словосочетание находится в конце предложения, никаких слов справа больше не будет. Блок управления использует далее найденное словосочетание в качестве расширенного "островка надежности" для поиска слов от позиции II до начала высказывания.

Обращаясь к синтаксической процедуре, блок управления обнаруживает, что прагматическая грамматика допускает еще несколько слов, кроме слов из списка, рассмотренного ранее, для расширения этой гипотезы. 9то связано с тем, что служебные слова,которые могут стоять перед словосочетанием budget. figure , имеют слишком небольшой вес (очки). В результате сравнения сегментов, расположенных слева от слова budget , и эталонов слов, допускаемых прагматической грамматикой, получают новый список, расширяющий предыдущий (в списке остаются лишь слова, оценки которых превышают

33. OF 10 11 4 , - 16 - - Н

34. А 10 11 4 - 16 - - R

35. THE 911 -105 - 16 - - R

36. THE 9 11 -105 - 16 - - R

37. OUR 10 11 -123 - 31 - - R 3°. THE 9 11 -135 - 16 - - R

39. - S 10 11 -140 0 - - R

40. ANO 9 11 -163 - 26 - - R

41. OUR 911 -169 - 46 - - R

42. ME 9 11 -189 - 46 - - R

Каждое из этих слов может расширить гипотезу budget figure слева. Посмотрим, что выберет блок управления. Наиболее подходящим (см. позиции 3 и ЯО) оказывается слово total ,которое используется лишь с определенным артиклем THE. Таким образом, -удалось объединить уже четыре слова THE TOTAL budget figure, для которых синтаксическая процедура в словесной решетке отмечает слова "is" и " s ", найденные при первоначальном сканировании ( - s- укороченный глагол-связка, допускаемый правилами произношения). Синтаксис также предлагает и некоторые другие слова, но их оценки (очки) меньше 100, тогда как is имеет вео 96 (см. позицию 7). Поэтому переходим к новой гипотезе IS the total budget figure и пытаемся ее расширить. При расширении гипотезы синтаксическая процедура "подсказывает" слова what и но'.'? ыасн. Процедура лексического поиска выбирает для начального участка высказывания слово v/hat с оценкой 176 очков и формирует окончательную гипотезу what IS the total budget figure. Процедура "синтаксис" производит в заключение полный грамматический разбор этой фразы.

Описанная "островковая" стратегия интерпретации высказывания одна из нескольких, реализованных в системе hwim . Другие стратегии используют словесную верификацию на параметрическом Уровне, предсказание слов на уровне диалога, просодическую информацию и т.д.

Испытание системы hwim производилось на двух словарях: из 409 и 1097 словоформ, 124 предложения произносили трое дикторов" "ужчин. Точность интерпретации высказывания составила 52% в первом случае и 44% во втором. Процент высказываний, близких к пра-видьным, составил 23 и 20% соответственно.

Основное отличие системы VDMS (Voioe-Controlled Date Manage-roent Sis.) от ранее рассмотренных СПР Speeohlis.HWIM и Неаг-^-И заключается в тим, что в ее основе лежит синтаксис спон-

Зак.480

тайного английского диалога [182] ; это позволяет использовать при общении с системой сильно "усеченные" эллиптические выражения СПР. Система vdms использует проблемно-ориентированный язщ доступа к информационно-поисковой системе данных о подводном фаоте США, Великобритании и СССР. Общий словарь языка составлял 450 слое. Система имела возможность запонинать информацию о ранее произнесенных фразах и декодировать текущие, имея результаты рас познавания предыдущих высказываний. В системе vdms при интерпретации предложений наиболее полно использована идеология искусственного интеллекта.

Общая структура vdms включает три основь-ле компоненты:

1) акустико-фонетический процессор, в результате работы которого формируется массив данных, содержащих информацию о фонетическом строении высказывания (А-матрица);

2) процедуру лексического сравнения, которая производит сравнения предсказываемых слов, опираясь на слоговой уровень и используя акустико-фонологические правила;

3) лингвистический процессор, который содержит блок грамматического разбора (парсер) и управляющий блок диалогового уровня (discourse level controller )> вктоочающий модель пользова-теяя и семантическую память.

Эксперименты с vdms показали, что речевой сигнал ограничивается по полосе на частоте 9 кГц и поступает на 12-разрядный аналого-цифровой преобразователь, где квантуется с частотой 30 кГц. Затеи оцифрованная речь проходит через ЦАП и результирую щая аналоговая речь поступает на три полосовых фильтра, имеющих полосы пропускания I&0 - 190, 990 - 2200 и 8000 - 5000 Гц. Через интервалы в 10 мс с фильтров снимались два параметра - максимальная амплитуда и число нулевых пересечений. Полученные шесть параметров использовались для грубой акустической маркировки каждого десятимиллисекувдного отрезка.

Как только слово поступает в систему, формируется и хранится в памяти информахцж о нем, в частности, отмечается, сколько высказываний тому назад это слово было произнесено и былс ли оно использовано, насколько вероятно, что это слово повторится еще раз. В системе учтено, что различные контекстные слова предсказанные тематической памятью, "стареют" от высказывания ч высказывании и вероятности их использования уменьшаются. Вел* вероятность предсказанного слова Падает ниже заданного нaпepe^ порога, то это слово какое-то время не рассматривается.Все эт' в vdms выполняет блок диалогового уровня Discourse , являющийся наиболее оригинальным блоком системы. Процедуры, которые

реализует Discourse, основаны на изучении,диаюга между двумя людьми, совместно выполняющими некоторую работу. Ьыло найдено и Досмаяизовано влияние контекста на характер диалога,причем рассматриваются два вида контекстного влияния. Глобальный контекст обеспечивает один вид ограничений при интерпретации высказывания. Эти ограничения используются при идентификации группы существительных. Второй вид ограничений связан с текущим контекстом соседних высказываний. Они используются при интерпретации сокращенных, эллиптических выражений и, в частности, добавляют дополнительные фрагменты к сокращенному высказыванию. В качестве примера высказывания, которое может воспринять система VDl'iS , ыож" но привести такое: "Напечатайте типы подводных лодок, на которых больше семи ракет".

СПР vdms - spi построена на базе проблемно-ориентированного языка,доступного информационно-поисковой системе данных о подводном флоте США, Великобритании и СССР. Общий словарь системы составляет 450 слов [ 182] , Система использует синтаксис спонтанного английского диалога, что позволяет запоминать информацию о ранее произнесенных фразах и декодировать текущие, используя предыдущие высказывания. Система vdms-sri наиболее полно использует идеологию искусственного интеллекта при интерпретации устных высказываний, которые могут быть сильно "усеченными".

Для испытания системы была проделана серия опытов, которые должны были определять наилучшую структуру СПР подобного типа. Было испытано 16 экспериментальных систем, которые дали точность интерпретации высказываний от 46,7 до 73,3%, причем если итерировать несущественные оаибки распознавания, то точность (для наилучшей конфигурации системы) возрастает до 81,7%. В [1в2~\ отмечается, что наиболее эффективной помощью при реализации речевого диалога оказались использование и проверка контекста.

Начиная с 1976 г. начали появляться работы о построении СПР в Западной Европе (Франция, Италия, ФРГ), Японии и СССР.Уровень исследований по СПР в этих странах (объем словаря,сложность языка) пока ниже, чем работ, выполненных в США по проекту arpa. Сяедует, впрочем, отметить, что разработка "малых" СПР производится в соответствии с тенденцией [145] , которая заклта-в»оя в том, чтобы "заполнить пропасть" между практическими сис-^мами распознавания слов и относительно громоздкими СПР, выполнившимися по проекту arpa.

В С142]приведена таблица, которая, по мнению автора, характеризует действительное состояние и будущее развитие коммерческих систем распознавания/ понимания речи до 3000 г.:

431982 - БИС для системы распознавания речи.

1985 - Высокоточные системы распознавания изолированных слов с большими словарями.

1990 - Системы автоматической диктовки с ограниченным словарем, управляемые синтаксисом языка.

I&95 - Системы понимания речи с неограниченным словарем, но с ограничениями на синтаксис.

2000 - Системы распознавания слитной речи с неограниченным словарем и без ограничений на синтаксис.

§ 1.4. Системы автоматического речевого ответа

1.4.1. Коммерческие системы автоматического синтеза речи. В системах автоматического речевого общения "человек-ЭВМ" важную роль играет автоматический речевой вывод, позволяющий человеку получать необходимую ему информацию в привычной форме речевого сигнала. Проблема автоматического речевого вывода считается более простой, чем автоматическое распознавание речи (в первом случае речь воспринимает человеческий мозг, -; а во втором - автомат). Поэтому работы по построению систем автоматического речевого ответа (САРО) промышленность получила раньше, чем работы по автоматическому распознаванию/ пониманию речи. Синтезаторы речи,являющиеся главными узлами таких систем, уже изготовляются промышленностью США, Японии и некоторых других стран [30, 46, 51, 52, 100, 142] . В саязи с появлением микропроцессоров и специализированных БИС, а также в связи с тем, что пользователи потребовали, чтобы информационные, управляющие и другие подобные системы, основанные .на использовании ЭВМ, "говорили", фирмы, выпускающие ЭВМ или отдельные узлы ЭВМ, начали выпуск оборудования дея систем речевого ответа. Построены первые промышленные системы, который обеспечивают одновременное автоматическое распознавание (автоматический речеэой запрос" с использованием ограниченного лексикона) и речевой ответ. Первое применение такие системы нашли в "интеллектуальных" терминалах больших ЭВМ (или сетей ЭВМ), в некоторых системах военного назначения, в приборах бытовой электроники [52, 60, I40t .

Характеристики

Тип файла

Документ

Размер

418,5 Kb

Материал

Машины, которые говорят и слушают

Тип материала

Реферат

Предмет

Кибернетика

Учебное заведение

Неизвестно

Список файлов реферата

mashiny-kotorye-govoryat-i-slushayut-1469996591-62000.zip

part 1.doc

part 2.doc

part 3.doc

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.