Автореферат (Синтез визуальных объектов по естественно-языковому описанию на базе интегрированной онтологии), страница 3
Описание файла
Файл "Автореферат" внутри архива находится в папке "Синтез визуальных объектов по естественно-языковому описанию на базе интегрированной онтологии". PDF-файл из архива "Синтез визуальных объектов по естественно-языковому описанию на базе интегрированной онтологии", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст 3 страницы из PDF
Деловой прозе свойственны10жесткие средства выражения, однозначность передаваемойинформации,экономность языковых средств, четкость функции каждого сообщения.Креолизованный текст характеризуется сочетанием вербализованных иневербализованных (иконических) компонентов, что наблюдается в научных иособенно научно-технических текстах. К иконическим элементам в этих текстахотносятся таблицы, символические изображения, формулы и т.п. С учетом такойспецифики лингвистический анализ предложений креолизованного текстареализуется полным морфологическим анализатором и редуцированным иконтекстно-ориентированным семантическим анализатором, который по меренеобходимости вызывает синтаксический анализ.Морфологический анализатор осуществляет морфологический разборсловоформ предложения на основу и флексию, поиск основы в словаре и понайденной словарной статье приписывание словоформам соответствующихграмматических признаков.Синтаксический и семантический анализ основан на общеязыковых ипроблемно-ориентированных контекстах, которые представляются в видесоответствующих моделей.Синтаксическая модель (=синтаксическая онтология) образует некоторый«синтаксический» гиперграф, в котором присутствуют слова, знаки препинания, ихобобщения и контексты, определяющие правила синтаксической сочетаемости.Синтаксическая информация представляется в виде контекстов иликонтекстных правил.
Контексты образуют иерархическую структуру, котораязадается рекурсивно некоторым множеством гиперграфов различных уровней ссистемой выбранных синтаксических отношений (согласование, управление,следование и т.д.). Контекстные правила могут задаваться на любом уровнеобобщения своих элементов. На уровне словоформ, основ, лексем, всевозможныхклассов и т.д. Синтаксические контексты могут представлять собой шаблоны длявыделения в предложениях дат, чисел, имен файлов, географических названий,фамилий и т.п.Семантическая модель естественного языка представляется общей прикладнойонтологией, включающей описания ситуаций, заданные ЕЯ-текстом.Схема с такой настраиваемой последовательностью лингвистическойобработки может быть представлена следующим образом.
На входлингвистического анализатора поступает ЕЯ-текст. Первое выделенное из текстапредложение проходит полный морфологический анализ. Далее выбирается первоеслово с его морфологическими признаками и запускается процесс интерпретацииэтого слова. Если слово имеет единственную семантическую интерпретацию (т.е.однозначный «перевод» слова в концепт прикладной онтологии), то осуществляетсяпереход к другому слову.
В противном случае выбирается первое контекстноеправило из упорядоченного множества синтаксических правил, заданного всинтаксической онтологии. Выбранное правило сопоставляется с морфологическойструктурой предложения.На основе результатов сопоставленияосуществляется интерпретациясловосочетания предложения либо переход к другому контекстному правилу. Этот11процесс итеративно продолжается до тех пор, пока не будут проинтерпретированывсе семантически значимые слова и словосочетания предложения.Для лингвистического анализа креолизованных текстов нет необходимостипроводить полный и последовательный синтаксический разбор предложения.Поэтому выбрана семантически-ориентированная архитектура лингвистическогоанализа, которая подключает соответствующий синтаксический компонент взависимости от неопределенности и сложности самого текста.Примеромтекстанапредметно-ориентированномкреолизованноместественном языке может быть следующее описание (взято из среды «Космическаяверфь»):Арматура типа B с числом блоков 5.
В точке 0 арматуры присоединенацистерна Tank_B через точку 0. К цистерне прикреплена солнечная панель типа C,точки сцепления 1 и 0. В точке 1 арматуры присоединена вторая цистернаTank_B через точку 0. Через точку 16 с арматурой сцеплен стыковочный элементтипа B, точка сцепки 0.
Переходник типа B соединен с арматурой, точки сцепки 8и 0, соответственно. Через точки 1 и 0 к переходнику подцеплена арматура типаB с числом блоков 2. На эту арматуру подцеплены три стыковочных элементатипа Б, точки сцепки 2:0,3:0 и 6:0 соответственно.Другим примером креолизованного текста может быть формулировкапланиметрической задачи:Дан треугольник ABC, причем AB=AC и ∠ A=80°. Внутри треугольника ABCвзята точка M такая, что ∠ MBC=30°, а ∠ MCB=10°.. Найти ∠ АMC.В рамках описанной схемы реализован морфологический анализатор на основесловаря Зализняка. Инструментальный язык реализации – СИ. Для синтаксическойи семантической модели использован контекстно-ориентированный подход сакцентом на семантический (содержательный) анализ.В пятой главе описаны результаты экспериментальных исследований и данаих обобщенная оценка.
Использование GRASP для визуализации жестов языкаглухонемых в экспериментальном варианте позволило наметить переход от текста канимации, позволяющей имитировать сурдопереводчика.Визуализацияконструкций в целостной системе, включающей трансляцию описания конструкциина предметно-ориентированном естественном языке в онтологическое описание,генерацию текста на GRASP и вызов интерпретатора, синтезирующего изображениеописана выше и отражена на рис 2.На этом рисунке отражена визуализация конструкции в статике, динамическаявизуализация обеспечивает анимацию конструкции и изменение масштабирования.Предметно-ориентированное описание этой конструкции приведено выше.Отметим, что наличие в этом описании только элементов, необходимых длявизуализации, дано только для простоты.
В общем случае описание может включатьпредложения, не относящиеся к визуализации, но важных для предметнойонтологии. Примеры таких предложений:12Арматура сделана из стали марки 35ХМЛ Стоимость цистерны – 55000 рублейСтыковочный элемент поставляется фирмой FF-XXX.В онтологии такие предложения представлены соответствующими объектами,отношениями и свойствами (типа <сделано из>, <материал>, <входит в поставку> ит.д). Эти элементы могут быть важны при поиске аналогов, оценки экономичностии т.п., но должны быть элиминированы при визуализации.
Разумеется, интегральноепринятие решения выполняется экспертом с учетом всех характеристикконструкции.Эксперимент по верификации включал синтез изображения для онтологическойструктуры понятия <Кораблик>. В этом эксперименте генерируется множествоизображений этого концепта путем варьирования значений различных параметровструктуры. Наглядное представление позволяет быстро выявить неточности заданияпараметров в онтологическом описании. На рис.3 приведен пример физическинекорректного изображения, формируемого GRASP по семантически ошибочномуописанию.
В среде “Космическая верфь” такую конструкцию сформировать неудастся, ибо среда отслеживает корректность сцепки.Рис. 3 Пример физически не вполне корректной конструкции.Эксперименты по применению системы для верификации онтологииопределены существованием в разрабатываемом интегральном комплексе (см. рис.1.) системы распознавания, основанного на знании, и необходимостьюавтоматизации процесса пополнения и модификации онтологии с использованиемпроцедуры синтеза изображений.В первом случае использование системы концептуального синтезаизображений позволяет автоматизировать процесс построения обучающих выборокдля системы распознавания и проверки самого процесса распознавания (чтоповышает уровень доверия разработчика к распознающей системе).
Во второмслучае такая необходимость возникает из-за того, что описания в онтологию могутвводиться разработчиком непосредственно на языке семантических гиперграфовили пользователем на проблемно-ориентированном ЕЯ. Во всех этих случаяхтребуется привлечение системы синтеза изображений для верификации процессов13обучения, пополнения и модификации онтологии.Ниже приведен результат синтеза для онтологической структуры,представленной на рис. 4.
(понятие Кораблик). Планировщик в этом случаегенерирует множество изображений этого концепта, варьируя значениямиразличных параметров структуры. По рис. 4. видно, что для получения корректногоописания понятия Кораблик необходимо задавать определенные диапазоныизменения этих параметров.Отрезок прямойвх._в_стр-руКорабликПараллелограммвх._в_стр-руРавнобоч.трапециякасается_в_серединевх._в_стр-ру Равнобоч.трапецияим_структурувх._в_стр-ру Большее основаниеим_длинуl1перпендикулярноим_длинуl2Отрезок прямойпересекаетТрапецияим_длинувх._в_стр-рувх._в_стр-руl3l4Основание аим_длинуОснование bРис.
4. Пример онтологического описания понятия КорабликРис. 5. Множество синтезируемых образов по онтологической структуре понятияКорабликПодобные эксперименты были проведены и для других концептов (Домик,Ромашка, Окружность, вписанная в треугольник и др.).Оценка и выводы:Тестирование автономной работы синтезатора в интегрированной среде"Космическая верфь" в интерактивном режиме показало работоспособность иэффективность интерпретатора языка GRASP;Тестирование разработанных средств лингвистической трансляции, генерации14текста на GRASP и визуализации показало работоспособность цепочки:“лингвистическая трансляция предметно-ориентированного описания конструкциина естественном языке – онтологическое представление конструкции – генерациядля конструкции программы на GRASP – визуализация конструкции”;Эксперименты по расширению языка GRASP новыми базовымиконструкциями доказали корректность логики интерпретатора при обработкерасширений;Эксперименты по верификации онтологических структур показалиперспективность использования возможностей визуализации для отладки,пополнения и модификации онтологии.15Основные выводы и результаты по диссертационной работе в целом:1.
Сформулированы теоретические принципы компонента целостной системы,обеспечивающего синтез трехмерного изображения по описанию на предметноориентированном естественном языке.2. Предложен расширяемый язык описания графических объектов GRASP,ориентированный на организацию визуализации в терминах объектов, отношений иих свойств.3. Выполнена реализация предложенного языка GRASP в видеинтерпретирующей системы, использующей для эффективной визуализацииспецификации OpenGL.4. Разработана технология визуализации объектов, базирующаяся налингвистическоманализепредметно-ориентированногоописанияскрелизованными элементами текста, погружении его в онтологию, трансляциионтологического описания в язык GRASP и генерации изображения с помощьюсредств OpenGL.5.