Методичка по первой части ModernLib.Ru (pdf) (1157206), страница 9
Текст из файла (страница 9)
Для исправления текста следует либо заменить обнаруженные словасинонимами, либо расширить словарь системы. Возможно, что некоторые из обнаруженныхслов являются известными системе словами, введенными с ошибками.Программа ЛЕКС5Программа осуществляет поиск каждой из обнаруживаемых в тексте (области)аббревиатур последовательно в трех списках: N 3 - списке аббревиатур, вводимыхнепосредственно в тексте (этот список формируется динамически самой программойЛЕКС5);N 2 - формируемом в начале работы с текстом на основе перечня используемыхсокращений;N 1 - словаре общепринятых сокращений.В списке N 1 поиск ведется в последнюю очередь так как он, во-первых, самыйбольшой, и во-вторых, если, например, в списках N 3 и N 1 присутствует одно и то жесокращение, но с различными расшифровками, то приоритет имеет сокращение из списка N3. Результатом работы является список используемых в тексте аббревиатур с указанием ихлокализации в тексте и типа аббревиатуры.Программа ЛЕКС6Программа осуществляет контроль за переопределением известных системеаббревиатур.
Если, например, в разделе 1.2. встретилась аббревиатура СВП (с расшифровкойв тексте - "схема внешних прерываний"), а в списке N 2 аббревиатура СВП сопоставленатермину "субкомплекс внешней памяти", фиксируется ошибка: недопустимоепереопределение аббревиатуры из перечня.Программа ЛЕКС7Программа проверяет правильность расшифровки, то есть тот факт, что аббревиатурачитается в расшифровке по началам слов, причем некоторые слова расшифровки могут неучаствовать в образовании аббревиатуры. Пример работы программы:Эта организация - центр переводов (ВЦП).НЕСООТВЕТСТВИЕ АББРЕВИАТУРЫ И РАСШИФРОВКИ:ВЦП - центр переводовПрограмма ЛЕКС8Программа ЛЕКС8 (без параметров) проверяет правильность оформления спискаиспользуемых в тексте аббревиатур (для отчета по НИР - это "Перечень условныхобозначений, символов, единиц и терминов").
Предполагается, что каждая пара"аббревиатура - расшифровка" в перечне представлена одной строкой. В процессе обработкиперечня заполняется список замечаний. Пример работы программы:ОБРАБАТЫВАЕТСЯ ПЕРЕЧЕНЬ АББРЕВИАТУР:БНК - бортовой нейрокомпьютерБНФ - бекусовская нормальная формаКПД - канал прямого доступаОЗУМПК - микропрограммируемый контроллерОРЗ - общий регистр записиПНП - перейти в неустойчивое положениеСВП - субкомплекс внешней памятиСПТ - субкомплекс рабочего таймераЗАМЕЧАНИЯ:4 : ОЗУ * НЕТ РАСШИФРОВКИ5 : МПК * НАРУШЕНИЕ АЛФ.
ПОРЯДКА7 : ПНП * РАСШИФРОВКА НЕ ЯВЛЯЕТСЯ ГРУППОЙ СУЩЕСТВИТЕЛЬНОГО9 : СПТ * НЕСООТВ: АББР.-РАСШ.3.2.3.3. Стилистический контрольПрограммыданногоблокафиксируютвнешниехарактеристикифраз,свидетельствующие о сложности их структуры, а следовательно, и о сложности восприятиясмысла. Имеются, например, программы, контролирующие длину фраз, количество запятых,количество придаточных предложений, наличие во фразах текста длинных цепочек слов вродительном падеже ( например, значений аргументов программы пользователя ) илицепочек однокоренных слов (пользователь может воспользоваться, транслятортранслирует ).
Есть программы контроля стилистической окраски слов. Внаучно-технической литературе нежелательно употребление устаревших слов иканцеляризмов (ибо, вышепоменованный ), жаргонизмов (виндуза ), разговорных оборотов(этот алгоритм, уж поверьте, . . . ). При обнаружении таких слов в тексте ихрекомендуется убрать или заменить более нейтральными синонимами. Особый класссоставляют слова, явно характеризующие специфику темы (предметной области),раскрывать которую иногда нежелательно. Например, в документе для внутреннегопользования можно употребить термин военно-космический , а в тексте сообщения,передаваемого по открытым каналам связи его целесообразно заменить (соответствующаяпрограмма предлагает слово-замену специальный ).3.2.3.4.
Контроль структуры текстаДанные программы контролируют правильность оформления отдельных структурныхчастей текстового документа с точки зрения соответствующих нормативных требований(например, требований ГОСТа 7.32-81, регламентирующего правила оформлениянаучно-технического отчета). Проверяется оформление титульного листа, спискаисполнителей, реферата и других разделов документа.3.2.3.5. Синтаксический контрольПрограмма СИНТ1Программа СИНТ1 находит в указанной области именные словосочетания вида‹прилагательное› + ‹существительное› и ‹существительное› +‹существительное в форме родит.
падежа› и др. Программа может оказаться полезнойпри анализе лексического состава текста и при поиске терминологических словосочетаний,особенно в тех случаях, когда различные фрагменты текста написаны разными авторами(возможно, использующими близкие, но не совпадающие термины). Найденные программойсловосочетания группируются вокруг "ключевого слова" - существительного, играющегороль синтаксической вершины словосочетания.
Ряд программ синтаксического контроляобнаруживает нарушения обычного (нейтрального) порядка слов и взаимного расположениягрупп слов. Такие нарушения могут затруднить восприятие текста.Например : "Раздел второй посвящен описанию новых алгоритмов". или "Используетэтот алгоритм всего две вспомогательные переменные ."Отметим, что иногда нарушение нейтрального порядка слов может намеренноиспользоваться автором текста с целью изменения логического ударения, усиления("Алгоритм этот очень эффективен!" ).Программа СИНТ2Программа СИНТ2 осуществляет контроль придаточных предложений с союзнымсловом который , а именно, проверяет однозначность установления связи между союзнымсловом и его словом-хозяином из главного предложения.
В случае, когда таких слов-хозяевне обнаружено или их более одного, выдается соответствующая диагностика. Пример работыпрограммы:Рассмотрим структурупамятивычислительной машины, в которой хранятся команды.СЛОВО которой ИМЕЕТ БОЛЕЕ ОДНОГО СЛОВА-ХОЗЯИНА ВГЛАВНОМ ПРЕДЛОЖЕНИИ: машины, памяти, структуруКаждому каналу соответствует свое устройство, которые в свою очередь связаны сглавной ЭВМ.СЛОВО которые НЕ ИМЕЕТ СЛОВА-ХОЗЯИНА В ГЛАВНОМ ПРЕДЛОЖЕНИИМощь языка Си - результат выявления его авторамипотребностейпрограммистов,которые возникают при программировании на языке ассемблера.СЛОВО которые ИМЕЕТ БОЛЕЕ ОДНОГО СЛОВА-ХОЗЯИНА В ГЛАВНОМПРЕДЛОЖЕНИИ: программистов, потребностей, авторами3.2.3.6.
Пунктуационный контрольПунктуационные ошибки в реальных предложениях русского языка встречаютсядовольно часто. Разделим их условно на две группы. Ошибки одной группы связаны суровнем пунктуационной грамотности и появляются в основном в тех типах текстоврусского языка, которые не проходят этап профессионального редактирования (например, врепликах в диалоге пользователя с ЭВМ).Причиной ошибок другого рода является несовершенное владение навыкамиклавиатурного набора. Такие ошибки принято называть «типографскими».Блок пунктуационного контроля системы ЛИНАР разработан на основе весьма полнойпунктуационной модели русского языка. Полнота и корректность базовых знаний являетсяосновой достижения устойчивости и эффективности программных средств, реализованныхна основе данной модели.В то же время блок пунктуационного контроля является «открытым», т.е.
построентаким образом, чтобы обеспечить возможность работы средств адаптации и, принеобходимости, введения новых правил пунктуации. Адаптация позволяет автоматическилибо модифицировать правила анализа (чтобы новый вариант был применим квстретившейся ситуации), либо обнаружить и исправить пунктуационную ошибку врассматриваемом предложении. Открытость блока - одна из предпосылок его устойчивости кпоявлению случайных и мотивированных пунктуационных ошибок, вариативных форм.Система ЛИНАР готова к возможности появления в тексте незнакомых пунктуационныхситуаций и к соответствующей адаптации своих лингвистических знаний (изменениюмодели) или к исправлению ошибки (изменению текста).При проверке пунктуации можно использовать любое количество программ контроля,выбирая их при этом по различным признакам. Например, можно осуществлять проверкутолько тех правил, которые выявляют лишние знаки препинания, можно только тех, которыевыявляют пропущенные знаки препинания и т.д.
При подобной настройке может менятьсясовокупность пунктуационных правил, степень жесткости требований по соблюдениюкаких-либо условий и т. д., что позволяет оценивать качество текста с точки зренияразличных категорий пользователей. Набор желаемых для данного сеанса работы модулейформируется в начале работы пользователем.Пример работы программ пунктуационного контроля:В ПРЕДЛОЖЕНИИ:Только и развлечений , что кино раз в неделюЗАМЕЧЕНА ПУНКТУАЦИОННАЯ ОШИБКА.В выделенном месте не должно быть данного знака препинания. В рассматриваемомслучае запятая перед чтоне ставится .Необходимо пояснение ошибки? (Д/Н)ДВ безглагольном предложении перед союзом чтов выражении только и ... что , закоторым следует имя существительное или местоимение, запятая не ставится.Необходимы примеры правильного применения данного правила? (Д/Н)ДТолько и денег что пятак в кармане.Только и разговоров что о них двоих.3.2.3.7.
Семантический контрольПрограмма СЕМ1Программа обнаруживает несовпадение ожидаемых семантических признаков актантов(подлежащее, дополнения) глагола и признаков слов (групп слов), реально занимающихсоответствующие позиции. Такое несовпадение мешает завершить анализ фразы, посколькусинтаксически допустимая связь не может быть установлена из-за семантическихпротиворечий. Проверяя употребление в тексте глаголов, программа обращает вниманиепользователя на "подозрительные" актантные конструкции.Пример работы программы:Все рассматриваемые программы написаны на ассемблере .НЕСОВПАДЕНИЕ СЕМАНТИЧЕСКИХ КЛАССОВ!В ОПИСАНИИ ГЛАГОЛА "написать" СЕМ.-КЛАСС АКТАНТА:=язык_программирования=РЕАЛЬНЫЙ АКТАНТ ассемблере ИМЕЕТ СЕМ.-КЛАСС: =транслятор=Схема прерываний подключается к магистрали.НЕСОВПАДЕНИЕ СЕМАНТИЧЕСКИХ КЛАССОВ!В ОПИСАНИИ ГЛАГОЛА "подключаться" СЕМ.-КЛАСС АКТАНТА:=устройство=РЕАЛЬНЫЙ АКТАНТ схема прерываний ИМЕЕТ СЕМ.-КЛАСС:=структура2=Программа СЕМ2Программа проводит полный синтактико-семантический анализ фраз указаннойобласти текста.
При этом фиксируются случаи, когда фраза имеет (в контексте предметнойобласти, к которой относится текст) более одной интерпретации, т.е. допускаетнеоднозначное толкование.Пример работы программы:Снижение напряжения вызвало отключение принтера.НЕОДНОЗНАЧНАЯ ИНТЕРПРЕТАЦИЯ!1 трактовка:=причина= : снижение напряжения=следствие= : отключение принтера2 трактовка:=причина= : отключение принтера=следствие= : снижение напряженияПрограмма СЕМ3Программа СЕМ3 проверяет однозначность установления связи между личнымместоимением и его антецедентом (словом, на которое ссылается данное местоимение).