Методичка по первой части ModernLib.Ru (pdf) (1157206), страница 6
Текст из файла (страница 6)
ПРИЗНАК КОНЦА - //.ВНУТРИ КОЛБЫ РАСПОЛАГАЕТСЯ СТЕРЖЕНЬ, ВЫПОЛНЕННЫЙ ИЗСТЕКЛА. ЧЕРЕЗ СТЕРЖЕНЬ ... //ВЫБЕРИТЕ РЕЖИМ РАБОТЫ, УКАЗАВ НОМЕР РЕЖИМА:1 - ЗАПИСЬ СЛОВАРНЫХ СТАТЕЙ В БУФЕР БЕЗ ВЫДАЧИ ИНФОРМАЦИИ2 - ЗАПИСЬ СЛОВАРНЫХ СТАТЕЙ В БУФЕР С ВЫДАЧЕЙ ИНФОРМАЦИИ3 - ФОРМИРОВАНИЕ СЛОВАРНЫХ СТАТЕЙ С ПОМОЩЬЮ ПОЛЬЗОВАТЕЛЯ3ПЕРВАЯ ФРАЗА: НЕЗНАКОМЫЕ СЛОВА: КОЛБЫ, СТЕРЖЕНЬ, СТЕКЛАСЛОВО 'КОЛБЫ' - СУЩЕСТВИТЕЛЬНОЕ? (Д/Н)ДК КАКОМУ РОДУ ОТНОСИТСЯ СУЩЕСТВИТЕЛЬНОЕ 'КОЛБЫ'? (М/Ж/С)ЖЯВЛЯЕТСЯ ЛИ ОНО ОДУШЕВЛЕННЫМ? (Д/Н)НК КАКОМУ РОДУ ОТНОСИТСЯ СУЩЕСТВИТЕЛЬНОЕ 'СТЕРЖЕНЬ'? (М/Ж/С)МЯВЛЯЕТСЯ ЛИ ОНО ОДУШЕВЛЕННЫМ? (Д/Н)НСЛОВО 'СТЕКЛА' - ГЛАГОЛЬНАЯ ФОРМА? (Д/Н)НК КАКОМУ РОДУ ОТНОСИТСЯ СУЩЕСТВИТЕЛЬНОЕ 'СТЕКЛА'? (М/Ж/С)ССФОРМИРОВАНЫ СЛОВАРНЫЕ СТАТЬИ С ОСНОВАМИ:КОЛБ-, СТЕРЖН-, СТЕКЛ-.ВТОРАЯ ФРАЗА: ......Морфологический синтез форм слова.
Программа ФОРМ1По словарной статье (знакомого слова) и набору значенийсоответствующая словоформа.Примеры:ЛЕВ (животное), творит.падеж, ед.число (7 0 0 1 5) ? ЛЬВОМЛЕВ (ден.единица), творит.падеж, ед.число (7 0 0 1 5) ? ЛЕВОМГПстроитсяМорфологический синтез парадигмы. Программа ФОРМ2По словарной статье (знакомого слова) строится массив всех форм этого слова.Порядок элементов массива определяется номером М-класса.Примеры:синтез всех форм знакомого существительного КАССИРШАКАССИРША КАССИРШИ - им.падеж, ед. и мн.числоКАССИРШИ КАССИРШ - род.падеж, ед. и мн.числоКАССИРШЕ КАССИРШАМ - дат.падеж, ед. и мн.числоКАССИРШУ КАССИРШ - вин.падеж, ед. и мн.числоКАССИРШЕЙ КАССИРШАМИ - твор.падеж, ед. и мн.числоКАССИРШЕ КАССИРШАХ - предл.падеж,ед.
и мн.числосинтез всех форм знакомого глагола ВОРОШИТЬВОРОШИТЬ - начальная формаВОРОШИ ВОРОШИТЕ - формы повелит. наклоненияВОРОШУ (БУДУ ВОРОШИТЬ) - 1 лицо,ед.ч,наст.и буд.вр.ВОРОШИШЬ (БУДЕШЬ ВОРОШИТЬ) - 2 лицо,ед.ч,наст.и буд.вр.ВОРОШИТ (БУДЕТ ВОРОШИТЬ) - 3 лицо,ед.ч,наст.и буд.вр.ВОРОШИМ (БУДЕМ ВОРОШИТЬ) - 1 лицо,мн.ч,наст.и буд.вр.ВОРОШИТЕ (БУДЕТЕ ВОРОШИТЬ) - 2 лицо,мн.ч,наст.и буд.вр.ВОРОШАТ (БУДУТ ВОРОШИТЬ) - 3 лицо,мн.ч,наст.и буд.вр.ВОРОШИЛ ВОРОШИЛА ВОРОШИЛО ВОРОШИЛИ - формы прош.времениВОРОША ВОРОШИВ - деепричастияРассмотрим примеры, показывающие возможность комбинирования отдельныхпрограмм библиотеки "Русская морфология".
Пусть написана управляющая программа,получающая на входе некоторую словоформу, обращающаяся к программе МОРФ1 (и - еслислова нет в словаре - к МОРФ2) и генерирующая все формы (программа ФОРМ2) длякаждого варианта анализа. Среди этих форм обязательно должна быть входная словоформа.Примеры:обработка незнакомого слова ХРЮШАВАРИАНТ 1склонение по образцу слова НОЖ/БОГАЧ* значение ГП "одушевленность" неизвестно *ХРЮШ ХРЮШИХРЮША ХРЮШЕЙХРЮШУ ХРЮШАМХРЮША / ХРЮШ ХРЮШЕЙ / ХРЮШИХРЮШОМ ХРЮШАМИХРЮШЕ ХРЮШАХВАРИАНТ 2склонение по образцу слова МАРШ* значение ГП "одушевленность" неизвестно *ХРЮШ ХРЮШИХРЮША ХРЮШЕЙХРЮШУ ХРЮШАМХРЮША / ХРЮШ ХРЮШЕЙ / ХРЮШИХРЮШЕМ ХРЮШАМИХРЮШЕ ХРЮШАХВАРИАНТ 3склонение по образцу слова ТУЧА/КАССИРША* значение ГП "одушевленность" неизвестно *ХРЮША ХРЮШИХРЮШИ ХРЮШХРЮШЕ ХРЮШАМХРЮШУ ХРЮШ / ХРЮШИХРЮШЕЙ ХРЮШАМИХРЮШЕ ХРЮШАХВАРИАНТ 4склонение по образцу слова СВЕЖИЙПОХРЮШЕЕ ХРЮШЕЕХРЮШ ХРЮША ХРЮШЕ ХРЮШИХРЮШИЙ ХРЮШАЯ ХРЮШЕЕ ХРЮШИЕХРЮШЕГО ХРЮШЕЙ ХРЮШЕГО ХРЮШИХХРЮШЕМУ ЖРЮШЕЙ ХРЮШЕМУ ХРЮШИМХРЮШЕГО amp; ХРЮШИЙ ХРЮШУЮ ХРЮШЕЕ ХРЮШИХ amp; ХРЮШИЕХРЮШИМ ХРЮШЕЙ ХРЮШИМ ХРЮШИМИХРЮШЕМ ХРЮШЕЙ ХРЮШЕМ ХРЮШИХВАРИАНТ 5спряжение по образцу слова ТОЧИТЬ/СЛЫШАТЬХРЮШИТЬХРЮШИ ХРЮШИТЕХРЮШУ (БУДУ ХРЮШИТЬ)ХРЮШИШЬ (БУДЕШЬ ХРЮШИТЬ)ХРЮШИТ (БУДЕТ ХРЮШИТЬ)ХРЮШИМ (БУДЕМ ХРЮШИТЬ)ХРЮШИТЕ (БУДЕТЕ ХРЮШИТЬ)ХРЮШАТ (БУДУТ ХРЮШИТЬ)ХРЮШИЛ ХРЮШИЛА ХРЮШИЛО ХРЮШИЛИХРЮША ХРЮШИВВАРИАНТ 6неизменяемое слово типа АНТРАШАХРЮШАЗаметим, что если бы слово хрюша анализировалось с предсказаниями, результат былбы более точен.
Так, при предсказании «существительное женского рода» был бы выдантолько третий вариант, при предсказании «форма глагола» - только пятый.обработка незнакомого слова КРОВАТЬВАРИАНТ 1спряжение по образцу слова ПИРОВАТЬ* значение ГП "вид" неизвестно *(выбран несовершенный вид)КРОВАТЬКРУЙ КРУЙТЕКРУЮ (БУДУ КРОВАТЬ)КРУЕШЬ (БУДЕШЬ КРОВАТЬ)КРУЕТ (БУДЕТ КРОВАТЬ)КРУЕМ (БУДЕМ КРОВАТЬ)КРУЕТЕ (БУДЕТЕ КРОВАТЬ)КРУЮТ (БУДУТ КРОВАТЬ)КРОВАЛ КРОВАЛА КРОВАЛО КРОВАЛИКРУЯ КРОВАВВАРИАНТ 2склонение по образцу слова ПЕЧАТЬ* значение ГП "одушевленность" неизвестно *КРОВАТЬ КРОВАТИКРОВАТИ КРОВАТЕЙКРОВАТИ КРОВАТЯМКРОВАТЬ КРОВАТЕЙ / КРОВАТИКРОВАТЬЮ КРОВАТЯМИКРОВАТИ КРОВАТЯХВАРИАНТ 3неизменяемое слово типа ДЕСКАТЬКРОВАТЬStart to type here3. Исправление ошибок в русскоязычных текстах3.1. Проблема речевых ошибокИспользование естественного языка в качестве средства общения (речеваядеятельность человека) неизбежно сопровождается теми или иными нарушениямиязыковых правил.
Такие нарушения - вне зависимости от того, обусловлены они неполнотойзнаний человека о языке или же случайными сенсомоторными "сбоями" (описки, опечатки,оговорки) - мы будем называть речевыми ошибками .В идеале обработка речевой ошибки предполагает соотнесение ошибочной речевойединицы с полным описанием языка и с контекстом рассматриваемого коммуникативногопроцесса. Лингвист (или другой специалист), занимающийся исследованием каких-либотеоретических аспектов проблемы речевых ошибок, например, их классификацией, ирасполагающий источниками, в которых содержится исчерпывающее описание единиц иправил того или иного естественного языка (словари, своды правил), находится в ситуации,достаточно близкой к такому идеалу.В случае же повседневной речевой практики - непосредственного (диалог) илиопосредованного (чтение текста) речевого взаимодействия рядовых носителей языка ситуация иная.
Лингвистические знания рядового носителя языка неполны, воспользоватьсясправочной литературой он может далеко не всегда, а сам факт ошибки никаким явнымобразом в анализируемом тексте не указан.Обнаружить речевую ошибку в этой ситуации непросто. Действительно, дляполучателя сообщения (реципиента) внешним признаком речевой ошибки служит появлениев тексте какой-либо незнакомой ему речевой единицы.
Однако такая "подозреваемая"речевая единица может оказаться и правильной конструкцией или формой (например,просторечным вариантом или термином), не знакомой реципиенту.С другой стороны, абсолютно правильная на первый взгляд единица может бытьошибкой, обнаружить которую удается лишь на "высших" этапах анализа. Так, впредложении "Пуск ракеты осуществляется нажатием краск ой кнопки" все словаизвестны, синтаксические связи правильны; опечатка обнаруживается только насемантическом/ смысловом уровне.Если одним из участников общения является компьютерная система, положениестановится еще более сложным. И лингвистические знания, и интеллектуальные способности(в том числе - в плане работы с языком) такого "собеседника" пока весьма скромны.
Однако,как мы уже знаем из материала 1-й главы, достаточно широко и успешно применяютсясистемы обнаружения и исправления ошибок.Отметим еще одно обстоятельство. Как бы ни разнились характер использования иназначение АОТ-систем (системы машинного перевода, автоматического реферирования илииндексирования, работающие в пакетном режиме; системы обеспечения диалога с машинойна естественном языке), оснащение их средствами обнаружения и исправления речевыхошибок повышает устойчивость и эффективность функционирования таких систем,облегчает (в случае диалоговых систем) процесс общения человека с ЭВМ.Классификация речевых ошибокПервый критерий классификации речевых ошибок, в соответствии с которым ошибкиподразделяются на мотивированные и случайные, связан с понятием индивидуальнойязыковой модели.
Индивидуальная языковая модель (ИЯМ) - это то подмножествоязыковых единиц и правил, которое усвоил и использует в своей речевой практикеконкретный носитель некоторого естественного языка. Субъективное преломление языка(как знаковой системы социального уровня) в процессе его усвоения приводит к тому, что вИЯМ не попадают (или попадают в искаженном варианте) некоторые языковые единицы иправила языка.Поэтому в речи конкретных носителей языка начинают проявляться некоторыеиндивидуальные особенности, либо вступающие в противоречие с языковыми нормами, либонет.В первом случае мы имеем дело с мотивированными речевыми ошибками - точнее, сошибками, мотивированными особенностями ИЯМ конкретного носителя языка (автораанализируемого АОТ-системой текста). К ошибкам такого рода относятся, например,ошибки в словоизменении (контейнер? - в форме именительного падежа множественногочисла), орфографические ошибки в основах (еде ница ), некоторые пунктуационные ошибки,смешение слов-паронимов (представить - предоставить ), нарушение лексическойсочетаемости (делать горе ), искажение фразеологизмов (не так страшен черт, как егомалютки ).Ошибки, обусловленные внешними по отношению к ИЯМ факторами: сбой речевогоаппарата человека, несвоевременное переключение регистра клавиатуры, нажатие соседнейклавиши, сбой на линии связи с ЭВМ - мы будем называть случайными.Как правило, мотивированные речевые ошибки регулярно повторяются в речи носителяязыка, а случайные ошибки могут как повторяться (например, при западании клавиши), так ине повторяться.Отметим, что иногда отличить случайную ошибку от мотивированной сложно.
Так,употребление слова представить вместо предоставить в контексте представлено правоможет быть или результатом случайной ошибки (пропуск буквы), или результатоммотивированной ошибки (смешения паронимов).Мотивированные речевые ошибки могут различаться степенью серьезности(грамматичности). Помимо серьезных, абсолютно недопустимых грамматических ошибок типа орфографических ошибок в основах или смешения слов - рассматриваются и ошибки, врезультате которых появляются "полуграмматичные" формы (контейнер? , сидевши ),которые имеют в словарях стилистические пометы: просторечное, устарелое, разговорное,областное и др.Следующий критерий классификации ошибок (мотивированных и случайных) связан сязыковыми уровнями, нормы (правила) которых оказываются нарушенными в результатеречевых ошибок.
В соответствии с этим критерием речевые ошибки можноклассифицировать следующим образом:1) орфографические ошибки: пропуск одной буквы, замена одной буквы, перестановкадвух рядом стоящих букв, одна лишняя буква (отдельно может рассматриваться случайудвоения буквы), замена буквы русского алфавита буквой латиницы и др.;2) морфологические (словоизменительный уровень) ошибки: ошибки в окончаниях(флексиях) при склонении и спряжении слов (рассматриваются различные подклассы такихошибок), употребление отсутствующих в языке форм слов, несоблюдение правилчередования в основе, употребление незнакомых АОТ-системе вариантов слов,испытывающих колебания в роде, одушевленности;3) синтаксические ошибки: ошибки в моделях управления слов-предикатов,пунктуационные ошибки, нарушение нормативного порядка слов (в том числе - вустойчивых словосочетаниях), вставка пробела внутрь слова, пропуск пробела (отдельномогут рассматриваются случаи слитного и раздельного написания частиц не и ни );4) лексико-семантические ошибки: употребление слов в ненормативном значении,нарушение лексической сочетаемости, семантические противоречия.Диагностика речевых ошибокМетоды обнаружения и исправления орфографических и морфологических ошибок втекстах широкой тематики базируются на представлении о тексте как о цепочке независимопоявляющихся словоформ.