Главная » Все файлы » Просмотр файлов из архивов » PDF-файлы » М.Г. Мальковский, Т.Ю. Грацианова, И.Н. Полякова - Прикладное программное обеспечение - системы автоматической обработки текстов

М.Г. Мальковский, Т.Ю. Грацианова, И.Н. Полякова - Прикладное программное обеспечение - системы автоматической обработки текстов, страница 10

Описание файла

PDF-файл из архива "М.Г. Мальковский, Т.Ю. Грацианова, И.Н. Полякова - Прикладное программное обеспечение - системы автоматической обработки текстов", который расположен в категории "книги и методические указания". Всё это находится в предмете "искусственный интеллект" из седьмого семестра, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .

Просмотр PDF-файла онлайн

Текст 10 страницы из PDF

Предполагается, что каждая пара"аббревиатура - расшифровка" в перечне представлена одной строкой. В процессе обработкиперечня заполняется список замечаний. Пример работы программы:ОБРАБАТЫВАЕТСЯ ПЕРЕЧЕНЬ АББРЕВИАТУР:БНК - бортовой нейрокомпьютерБНФ - бекусовская нормальная формаКПД - канал прямого доступаОЗУМПК - микропрограммируемый контроллерОРЗ - общий регистр записиПНП - перейти в неустойчивое положениеСВП - субкомплекс внешней памятиСПТ - субкомплекс рабочего таймераЗАМЕЧАНИЯ:4 : ОЗУ * НЕТ РАСШИФРОВКИ5 : МПК * НАРУШЕНИЕ АЛФ. ПОРЯДКА7 : ПНП * РАСШИФРОВКА НЕ ЯВЛЯЕТСЯ ГРУППОЙ СУЩЕСТВИТЕЛЬНОГО9 : СПТ * НЕСООТВ: АББР.-РАСШ.3.2.3.3.

Стилистический контрольПрограммыданногоблокафиксируютвнешниехарактеристикифраз,свидетельствующие о сложности их структуры, а следовательно, и о сложности восприятиясмысла. Имеются, например, программы, контролирующие длину фраз, количество запятых,количество придаточных предложений, наличие во фразах текста длинных цепочек слов вродительном падеже ( например, значений аргументов программы пользователя ) илицепочек однокоренных слов (пользователь может воспользоваться, транслятортранслирует ).

Есть программы контроля стилистической окраски слов. Внаучно-технической литературе нежелательно употребление устаревших слов иканцеляризмов (ибо, вышепоменованный ), жаргонизмов (виндуза ), разговорных оборотов(этот алгоритм, уж поверьте, . . . ). При обнаружении таких слов в тексте ихрекомендуется убрать или заменить более нейтральными синонимами.

Особый класссоставляют слова, явно характеризующие специфику темы (предметной области),раскрывать которую иногда нежелательно. Например, в документе для внутреннегопользования можно употребить термин военно-космический , а в тексте сообщения,передаваемого по открытым каналам связи его целесообразно заменить (соответствующаяпрограмма предлагает слово-замену специальный ).3.2.3.4.

Контроль структуры текстаДанные программы контролируют правильность оформления отдельных структурныхчастей текстового документа с точки зрения соответствующих нормативных требований(например, требований ГОСТа 7.32-81, регламентирующего правила оформлениянаучно-технического отчета). Проверяется оформление титульного листа, спискаисполнителей, реферата и других разделов документа.3.2.3.5.

Синтаксический контрольПрограмма СИНТ1Программа СИНТ1 находит в указанной области именные словосочетания вида‹прилагательное› + ‹существительное› и ‹существительное› +‹существительное в форме родит. падежа› и др. Программа может оказаться полезнойпри анализе лексического состава текста и при поиске терминологических словосочетаний,особенно в тех случаях, когда различные фрагменты текста написаны разными авторами(возможно, использующими близкие, но не совпадающие термины). Найденные программойсловосочетания группируются вокруг "ключевого слова" - существительного, играющегороль синтаксической вершины словосочетания.

Ряд программ синтаксического контроляобнаруживает нарушения обычного (нейтрального) порядка слов и взаимного расположениягрупп слов. Такие нарушения могут затруднить восприятие текста.Например : "Раздел второй посвящен описанию новых алгоритмов".

или "Используетэтот алгоритм всего две вспомогательные переменные ."Отметим, что иногда нарушение нейтрального порядка слов может намеренноиспользоваться автором текста с целью изменения логического ударения, усиления("Алгоритм этот очень эффективен!" ).Программа СИНТ2Программа СИНТ2 осуществляет контроль придаточных предложений с союзнымсловом который , а именно, проверяет однозначность установления связи между союзнымсловом и его словом-хозяином из главного предложения. В случае, когда таких слов-хозяевне обнаружено или их более одного, выдается соответствующая диагностика. Пример работыпрограммы:Рассмотрим структурупамяти вычислительной машины, в которой хранятся команды.СЛОВО которой ИМЕЕТ БОЛЕЕ ОДНОГО СЛОВА-ХОЗЯИНА ВГЛАВНОМ ПРЕДЛОЖЕНИИ: машины, памяти, структуруКаждому каналу соответствует свое устройство, которые в свою очередь связаны сглавной ЭВМ.СЛОВО которые НЕ ИМЕЕТ СЛОВА-ХОЗЯИНА В ГЛАВНОМ ПРЕДЛОЖЕНИИМощь языка Си - результат выявления его авторамипотребностейпрограммистов,которые возникают при программировании на языке ассемблера.СЛОВО которые ИМЕЕТ БОЛЕЕ ОДНОГО СЛОВА-ХОЗЯИНА В ГЛАВНОМПРЕДЛОЖЕНИИ: программистов, потребностей, авторами3.2.3.6.

Пунктуационный контрольПунктуационные ошибки в реальных предложениях русского языка встречаютсядовольно часто. Разделим их условно на две группы. Ошибки одной группы связаны суровнем пунктуационной грамотности и появляются в основном в тех типах текстоврусского языка, которые не проходят этап профессионального редактирования (например, врепликах в диалоге пользователя с ЭВМ).Причиной ошибок другого рода является несовершенное владение навыкамиклавиатурного набора. Такие ошибки принято называть «типографскими».Блок пунктуационного контроля системы ЛИНАР разработан на основе весьма полнойпунктуационной модели русского языка. Полнота и корректность базовых знаний являетсяосновой достижения устойчивости и эффективности программных средств, реализованныхна основе данной модели.В то же время блок пунктуационного контроля является «открытым», т.е.

построентаким образом, чтобы обеспечить возможность работы средств адаптации и, принеобходимости, введения новых правил пунктуации. Адаптация позволяет автоматическилибо модифицировать правила анализа (чтобы новый вариант был применим квстретившейся ситуации), либо обнаружить и исправить пунктуационную ошибку врассматриваемом предложении.

Открытость блока - одна из предпосылок его устойчивости кпоявлению случайных и мотивированных пунктуационных ошибок, вариативных форм.Система ЛИНАР готова к возможности появления в тексте незнакомых пунктуационныхситуаций и к соответствующей адаптации своих лингвистических знаний (изменениюмодели) или к исправлению ошибки (изменению текста).При проверке пунктуации можно использовать любое количество программ контроля,выбирая их при этом по различным признакам. Например, можно осуществлять проверкутолько тех правил, которые выявляют лишние знаки препинания, можно только тех, которыевыявляют пропущенные знаки препинания и т.д. При подобной настройке может менятьсясовокупность пунктуационных правил, степень жесткости требований по соблюдениюкаких-либо условий и т.

д., что позволяет оценивать качество текста с точки зренияразличных категорий пользователей. Набор желаемых для данного сеанса работы модулейформируется в начале работы пользователем.Пример работы программ пунктуационного контроля:В ПРЕДЛОЖЕНИИ:Только и развлечений , что кино раз в неделюЗАМЕЧЕНА ПУНКТУАЦИОННАЯ ОШИБКА.В выделенном месте не должно быть данного знака препинания. В рассматриваемомслучае запятая перед что не ставится .Необходимо пояснение ошибки? (Д/Н)ДВ безглагольном предложении перед союзом что в выражении только и ...

что , закоторым следует имя существительное или местоимение, запятая не ставится.Необходимы примеры правильного применения данного правила? (Д/Н)ДТолько и денег что пятак в кармане.Только и разговоров что о них двоих.3.2.3.7. Семантический контрольПрограмма СЕМ1Программа обнаруживает несовпадение ожидаемых семантических признаков актантов(подлежащее, дополнения) глагола и признаков слов (групп слов), реально занимающихсоответствующие позиции.

Такое несовпадение мешает завершить анализ фразы, посколькусинтаксически допустимая связь не может быть установлена из-за семантическихпротиворечий. Проверяя употребление в тексте глаголов, программа обращает вниманиепользователя на "подозрительные" актантные конструкции.Пример работы программы:Все рассматриваемые программы написаны на ассемблере .НЕСОВПАДЕНИЕ СЕМАНТИЧЕСКИХ КЛАССОВ!В ОПИСАНИИ ГЛАГОЛА "написать" СЕМ.-КЛАСС АКТАНТА:=язык_программирования=РЕАЛЬНЫЙ АКТАНТ ассемблере ИМЕЕТ СЕМ.-КЛАСС: =транслятор=Схема прерываний подключается к магистрали.НЕСОВПАДЕНИЕ СЕМАНТИЧЕСКИХ КЛАССОВ!В ОПИСАНИИ ГЛАГОЛА "подключаться" СЕМ.-КЛАСС АКТАНТА:=устройство=РЕАЛЬНЫЙ АКТАНТ схема прерываний ИМЕЕТ СЕМ.-КЛАСС:=структура2=Программа СЕМ2Программа проводит полный синтактико-семантический анализ фраз указаннойобласти текста.

При этом фиксируются случаи, когда фраза имеет (в контексте предметнойобласти, к которой относится текст) более одной интерпретации, т.е. допускаетнеоднозначное толкование.Пример работы программы:Снижение напряжения вызвало отключение принтера.НЕОДНОЗНАЧНАЯ ИНТЕРПРЕТАЦИЯ!1 трактовка:=причина= : снижение напряжения=следствие= : отключение принтера2 трактовка:=причина= : отключение принтера=следствие= : снижение напряженияПрограмма СЕМ3Программа СЕМ3 проверяет однозначность установления связи между личнымместоимением и его антецедентом (словом, на которое ссылается данное местоимение). Вслучаях, когда такой антецедент не найден или их найдено более одного, выдаетсясоответствующая диагностика.Пример работы программы:Каждому каналу сопоставлено определенное устройство.

Они , в свою очередь,связаны с главной ЭВМ.ДЛЯ МЕСТОИМЕНИЯ они В ПРЕДШЕСТВУЮЩЕЙ ФРАЗЕ НЕ НАЙДЕНО СЛОВ,НА КОТОРЫЕ ЭТО МЕСТОИМЕНИЕ ССЫЛАЕТСЯРассмотрим структурупамятиЭВМ. Она состоит из двух основных частей.ДЛЯ МЕСТОИМЕНИЯ она В ПРЕДШЕСТВУЮЩЕЙ ФРАЗЕ НАЙДЕНО БОЛЕЕОДНОГО СЛОВА,НА КОТОРОЕ ССЫЛАЕТСЯ ЭТО МЕСТОИМЕНИЕ: ЭВМ, памяти, структуруПрограмма СЕМ4Программа проверяет, принадлежат ли значения количественно оцениваемых свойствописываемых в тексте объектов заданному диапазону. В случае, если значение свойствавыходит за границы диапазона, процедура выдает соответствующую диагностику.Пример работы программы:Информация передается в сопроцессор АК-34 по 16 каналу .ОБ'ЕКТ: сопроцессор АК-34ГРУППА: 16 каналуВЫХОД ЗНАЧЕНИЯ ЗА ВЕРХНЮЮ ГРАНИЦУ ДИАПАЗОНА(СОПРОЦЕССОР АК-34 ИМЕЕТ КАНАЛЫ: 0,1,2, ... 15)4.

Информационно-поисковые системыПоиск информации является одной из основных составляющих человеческойдеятельности, с ним мы сталкиваемся ежедневно: изучая театральную афишу, чтобы выбратьинтересный спектакль, подбирая в расписании поездов удобную электричку, листаятелефонную книгу. Человеку, в силу своей профессии или увлечений частосталкивающемуся с подбором и поиском какой-либо тематической информации, рано илипоздно (с возрастанием ее объема) приходится применять некоторые принципысистематизации и классификации имеющихся данных, обеспечивающие более удобный иэффективный поиск.

Так, в библиотеках составляют картотеку: сведения о книге поопределенной схеме записываются на карточку, туда же помещается шифр - несколько букви цифр, по которым можно определить местоположение книги (хранилище, стеллаж, полку);карточки расставляются в алфавитном или тематическом порядке. Применение ЭВМ даетболее широкие возможности для работы с большими массивами информации.4.1. Основные определенияИнформационно-поисковая система (ИПС) - программная система для хранения,поиска и выдачи интересующей пользователя (абонента) информации.

Свежие статьи
Популярно сейчас