187014 (596734), страница 7

Файл №596734 187014 (Искусственный интеллект) 7 страница187014 (596734) страница 72016-07-30СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 7)

В автономном режиме работает только контекстный анализ. Его работа начинается после того, как все слова текста обработаны предшествующими алгоритмами и на вход поступает текст, в котором каждое машинное слово, отличное от знака препинания, снабжено двухбуквенным кодом, первая из которых – код класса, вторая – код подкласса. Коды грамматических омонимов содержат в себе информацию о возможных грамматических значениях данной словоформы, например,

Р – существительное/предлог (путем),

D – существительное/глагол (начала, суть),

Ы- союз/частица/наречие (только) и т.д.)

Основная часть алгоритмов несловарного морфологического анализа сосредоточена в третьей подсистеме, которая должна единицы текста в терминах грамматических классов на основе списка квазифлексий.. Ограниченность лексической системы используемого подъязыка и типа текстов и делает возможным применения принципа определения грамматической информации по квазифлексиям в качестве основного инструмента МИ и отказ вообще от словаря основ как главной базы МА. На вход данного алгоритма после работы подсистем 1,2 поступает 93,54 % текстовых единиц.

Автоматическое построение списка квазифлексий для морфологической идентификации словоформ в тексте предполагает:

Ручное построение обучающей выборки на фрагменте введенного в ЭВМ текста. Для ручной частеречной кодировки принята детализированная система классов слов:

существительное--И

полное прилагательное --Я

полное причаcтие--Е

глагол--Г

наречие--Н

краткое прилагательное --Ю

краткое причаcтие--У

нераспознанные по алгоритму слова, и т.п.

Омонимичные словоформы типа для ее обработки и стобы ее обработать разграничиваются.

Автоматическое построение инверсионного словаря и автоматический вывод списка квазифлексий

Ручную проверку и уточнение результатов автоматической морфологической идентификации словоформ в новом тексте

Автоматическое пополнение инверсионного словаря словоформ обучающей выборки автоматическую перестройку списка квазифлексий.

При контекстном анализе КА, разработанных для снятия грамматической омонимии отдельных слов по окружению, наибольшей диагностицирующей силой обладают грамматические контексты, представленные предлогами, контекстами, краткими причастиями и прилагательными, существительными, подчинительными союзами и местоимениями и наречиями-союзных слов, а также знаки препинания. Все названные элементы текста используются во всех без исключения алгоритмах КА, в качестве опорных точек ОТ. При этом дизъюнкция класса/подкласса может сниматься по пересечению содержащейся в нем информации с грамматической информацией ОТ, образующей левую или правую, а также обе границы (снятие омонимии падежа существительного по предлогу слева, снятие омонимии классов Z (полное прилагательное/наречие); Y (краткое прилагательное/наречие) по расположенному справа глаголу; анализ дизъюнктивных кодов словоформ, принадлежащих к адъективным классам).

Алгоритм включает разные ситуации, как-то именная ситуация(SIT NOUN), глагольная(SIT VERB), предложная (SIT PREP), ситуацию аббревиатуры (SIT U) и прочие. Опорные точки могут образовывать ситуацию в сочетании с нектороми грамматическими классами, например ситуация POINT определяется тире + частица ЭТО, запятая + наречие когда, где. Анализ производится слева направа, начиная с первого элемента текста, и состоит из двух частей: входа, формирующего ситуацию и собственно контектного анализа, при этом ищутся опорные точки, формируется ситуация и по правилам КА снимаются дизъюнктивные классы.

Анализ результатов машинных экспериментов работы описаннойй системы МА на рефератах по кибернетике и системам связи показал высокую степень эффективности сочетания флективного и контекстного анализа при автоматическом МА, ориентированном на подъязык научно-реферативных текстов широкой тематики. Неразграниченные омонимы грамматических классов составляют всего 3,93 % текста. Количество словоформ с неснятой омонимией подклассов равно 10,34 %. Это объясняется, прежде всего, необходимостью привлечения анализа целого предложения (краткое прилагательное в роле подлежащего) и анализа контекстных связей, выходящих за пределы предложения (анализ эллиптических конструкций, снятие омонимии местоименных классов). Ниже приводится пример машинной кодировки, полученной после флективного и контекстных анализов. При идентификации грамматического стутуса каждого класса и подкласса слов в алгоритме МА используется различное количество правил и разные типы правил. В основу системы правил МА положена языковая и текстовая информация разного типа, в том числе:

графемная структура словоформ.

Позиционные закономерности употребления словоформ в тексте.

Дистрибуция словоформ и их соположение в тексте.

Дистрибуция словоформ, учитывающая их грамматические связи.

Лексическая информация.

АВТОКОРРЕЛЯЦИОННАЯ(ЯЖ) СТРУКТУРА(КИ) ГЕНЕРАТОРА(ЙР) СЛУЧАЙНЫХ(КЕ) ЧИСЕЛ(ЛЕ) 1>ТАУСВОРТА(ЙР).

ОСНОВЫВАЯСЬ(Д) НА(ПП) ЗНАНИИ(ЛП) АВТОКОРРЕЛЯЦИОННЫХ(ЯЕ) ФУНКЦИЙ(КЕ) ДЛЯ(ПР) ЛЮБЫХ(ОЕ) ПОВТОРЯЮЩИХСЯ(АЕ) ЧЛЕНОВ(ЙЕ) ПОСЛЕДОВАТЕЛЬНОСТИ(КР) , АВТОРОМ(ЙТ) ДАН(УМ) АЛГОРИТМ(ЙИ), ДЛЯ(ПР) ОПРЕДЕЛЕНИЯ(ЛР) АВТОКОРРЕЛЯЦИОННОЙ(ЯЗ) СТРУКТУРЫ(КР) НОВОЙ(ЯЗ) ПОСЛЕДОВАТЕЛЬНОСТИ(КР).

МОРФОЛОГИЯ

В исследованиях по морфологии естественных языков, проведенных в последние годы отечественными лингвистами, можно выделить несколько

крупных направлений:

— теоретические исследования по различным вопросам морфологии;

— типологические исследования по морфологии;

— прикладные аспекты морфологических исследований.

Теоретические исследования по морфологии

По сравнению с другими областями языкознания морфология по праву

считается наиболее исследованной областью. Поэтому в завершающее десяти-

летие нашего века закономерно появление целого ряда фундаментальных публикаций итогового характера, вышедших из-под пера известных ученых,

посвященных основополагающим понятиям, своего рода principia morphologia.

К ним относится:

— системное описание всех основных разделов морфологии: морфемики, изучающей морфемную членимость слова, принципы вычленения

и разграничения морфем, их функционирование в языке; словообразования,

изучающего соотношения между морфемными структурами; словопроизводства

— образования новых слов путем использования морфемных возможностей язы-

ка [Земская, Немченко, Панов, Тимофеев, Тихонов];

— системное описание диахронической морфологии индоевропейских

языков [Журавлев] и древненовгородского диалекта русского языка [Зализняк];

— итоговое описание системы морфологии русского языка ХХ века:

морфемной модели и количественных данных о русских морфемах [Кузнецова],

активных процессов в словоизменении, словообразовании и словопроизводстве

(суффиксации, префиксации, аббревиации, производстве сложных слов, типич-

ных особенностях окказиональных и потенциальных слов) [Земская, 92, 95,

Русский язык в его функционировании, Русский язык конца ХХ века], морфологических словарей русского языка [Кузнецова, Тихонов];

— морфологическая типология слова в разноструктурных языках, преж-

де всего в славянских [Широкова];

— структурное моделирование морфологии естественных языков в тесной

связи с достижениями структурализма в других областях языкознания, прежде

всего в фонологии и синтаксисе [Бондарко, Демьянков].

В теории морфологии традиционно большое место занимают исследова-

ния по аспектологии русского глагола: анализ совершенного вида в отрицатель-

ных предложениях [Акимова], фактическое и общефактическое значение вида,

семантика и прагматика несовершенного вида императива, таксономические

категории глаголов imperfectiva tantum [Падучева], видовая парность русских

глаголов [Черткова], проблема инварианта в семантике вида [Шатуновский],

употребление глаголов вторичной имперфективизации [Русский язык в его

функционировании].

Среди других теоретических работ следует отметить :

— исследования по аффиксации: изучение словообразовательного потенциала суффиксальных типов русских существительных [Каде], суффиксальной универбации и усечения в русском словообразовании

[Осипова Л.И.], возникновения новых аффиксов [Мамрак], сочетаемости пре-

фиксов в русском слове [Кузнецова], парадигматики и синтагматики русских

глагольных префиксов [Волохина и др.], суффиксоидов в современном английском языке [Бартков], словаря словообразовательных аффиксов в русском языке [Улуханов, 93];

— исследования словообразовательной мотивированности и ее связи с

производностью [Улуханов,92], мотивационного отношения “имя-глагол”

[Осипова М.А.], типов полисемии в производном слове и границ словообразова-

тельного гнезда [Ширшов, 96] ;

— работы по различным типам окказиональных способов словообразо- вания [Улуханов, 92];

— исследования по связи морфологического уровня с другими уровнями

языка: фонемным (морфемный или фонемный принцип русской орфографии)

[Моисеев,95], синтаксическим (синтаксическая деривация как проявление изоморфизма между словообразованием и синтаксисом) [ ], лексическим

(лексический состав русского языка со словообразовательной точки зрения

[Моисеев, 91], семантическим (границы словообразовательной семантики) [Улуханов,91], стилистическим (стилистические аспекты русского словообразования ) [Vinogradova];

— работы по диахронической морфологии русского словообразования [Улуханов, 92], диахронии словоизменения и словообразования русских существительных [Русский язык в его функционировании], развития категории

одушевленности в русском языке [Крысько].

Как и в каждой области знания, в морфологии немало интересных и спор-

ных проблем. Поскольку “словообразование постоянно балансирует в языке между системностью и беспорядком” [Пиотровский, 95], в литературе живо обсуждаются правомерность использования понятия усечения морфем [Добродомов], сложные случаи морфемики и словообразования [Шанский], пограничные случаи между словоизменением и словообразованием [Муравьева], лексикой и словообразованием [Глухих], морфемика в ее отношении к формообразованию [Герд, 94], проблемы трактовки групповой флексии [Плун-

гян,94].

С точки зрения историографии морфологии безусловный интерес представ-

ляет переписка Н.С.Трубецкого и Р.О.Якобсона о повелительном наклонении

русского глагола [Храковский, 94].

Типологические исследования по морфологии

Естественными и традиционными представляются работы по сопостави-

тельной морфологии русского языка с другими языками и прежде всего со сла-

вянскими, балканскими и балтийскими. Из огромного количества подобных

работ прежде всего следует отметить доклады российской делегации на X I Меж-

дународном съезде славистов в Братиславе (1993г.) [Земская и др., Нещименко,

], материалы научных конференций

и сборников, в которых среди прочих обсуждаются проблемы:

— сопоставительной славянской аспектологии [Смирнов];

— образно-экспрессивного употребления грамматических категорий [Ши-

рокова];

— словообразовательной интерференции в славянских языках [Джамбазов];

— морфологической типологии слова в разноструктурных языках, в том

числе в русском, английском, французском и испанском [Широкова,92];

— типологии грамматических категорий — в частности, категории лишитель-

ности в славянских и балканских языках [Иванов и др.], категории наклонения

в разных языках [Сабанеева];

— морфологические характеристики слов в “старославянском словаре” [Кры-

сько].

Как всегда, весьма разнообразны сопоставительные морфологические исследования по другим языкам: английскому [Биренбаум], малагасийскому [Коршунов], тагальскому [Шкарбан], чешскому [Стешковская], эвенскому

[Роббек], лезгинскому [Керимов], эскимосскому [Вахтин], вепсскому [Иткин],

догон [Плунгян, Plungian], дари [Островский].

Прикладные исследования по морфологии

Прикладная морфология, являясь составной частью компьютерной линг-

вистики, традиционно считается в ней наиболее исследованной областью,

в задачу которой входит:

— разработка морфологических процессоров — систем автоматического

морфологического анализа и синтеза слов, а также систем лемматизации — сведе-

ния словоформ к словарным словам;

— автоматизация морфологических исследований, предусматривающая про-

ведение ряда лингвистических работ с помощью ЭВМ для решения основной за-

дачи — разработки морфологических процессоров: использование СУБД для

составления морфологических словарей, проведения типологических исследо-ваний, моделирования морфологических явлений и т.д.

Следует отметить, что в настоящее время используются самые разнообраз-

ные автоматизированные системы обработки речи и текста, применяющие мор-

фологические процессоры: системы машинного перевода, коррекции и редакти-

рования текста, анализа и синтеза речи, информационного поиска (в особенности

полнотекстовые системы), автоматического реферирования, автоматические словари, экспертные системы и обучающие лингвистические автоматы. В указанных системах морфологические процессоры являются наиболее надеж-

ными и хорошо отработанными компонентами. В последних промышленных и коммерческих разработках хорошо зарекомендовали себя морфологические процессоры процедурного типа, работающие на базе словаря основ, — ср. сис-

темы автоматического морфологического анализа в СМП АСПЕРА [Королев,

Характеристики

Тип файла
Документ
Размер
864,26 Kb
Учебное заведение
Неизвестно

Список файлов ВКР

Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6384
Авторов
на СтудИзбе
307
Средний доход
с одного платного файла
Обучение Подробнее