Главная » Все файлы » Просмотр файлов из архивов » PDF-файлы » Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014)

Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014) (Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014).pdf), страница 4

PDF-файл Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014) (Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014).pdf), страница 4 Анализ текстовых данных и информационный поиск (63257): Книга - 10 семестр (2 семестр магистратуры)Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014) (Авт. обработка текстов на естественном языке и комп. лингвистика.2020-08-25СтудИзба

Описание файла

PDF-файл из архива "Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014).pdf", который расположен в категории "". Всё это находится в предмете "анализ текстовых данных и информационный поиск" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .

Просмотр PDF-файла онлайн

Текст 4 страницы из PDF

С другой стороны, этосвязано с неоднородностью самих предметных областей. Во множестве научныхязыков сосуществует множество языков, различающихся именно в соответствии спредметной областью: языки математики, физики, техники, лингвистики, философиии т.д.Специфика языков публицистического стиля складывается из взаимодействияинформативной функции и функции воздействия. Соответственно, множество текстов11публицистического стиля неоднородно, и эта неоднородность в большей степенисвязана с их функциональностью, а не тематикой (предметной областью). Например,язык новостных лент и язык политической публицистики (напр., интервью и дажеаналитики) существенно различаются в отношении частоты встречаемости языковыхединиц и их сочетаемостных предпочтений.

На основной шкале – шкале степениинформационной насыщенности – тексты публицистического стиля будут заниматьпромежуточное положение между художественными текстами и научными текстами.Более того, в дальнейшем вместо традиционного наименования «публицистические»тексты мы будем использовать наименование «новостные» тексты, подчеркивая темсамым общую для этих текстов задачу коммуникативных ситуаций: задачусообщения новостей.

При этом тексты новостных лент будут находиться напредлагаемой шкале ближе к научным (информационно более насыщенным) текстам,а собственно публицистические (активно реализующие функцию воздействия) – кхудожественным. В этом же ключе, но гораздо подробнее этот вопросрассматривается в главе 2 (и в некоторых наших работах [159 – 161] и т.д.).Продолжая идею функциональности языка, мы сможем выделить большоеколичество языков (в рамках одного национального языка): устный или письменный;язык художественной прозы, язык новостной ленты, научный язык, деловой язык ит.д.

и т.п. «Носитель языка», обладающий высокой коммуникативной компетенцией,таким образом оказывается полилингвом (даже полиполилингвом). Невозможнопредставить себе человека, владеющего всеми языками (коммуникативнымизнаниями и умениями). Например, знание научного языка не сможетраспространиться на все многообразие языков науки.Для человека полилингвальность является несомненным достижением, т.к.один и тот же человек – особенно публичный человек – оказывается включенным вразные коммуникативные ситуации, требующие своего языка. Но в каждойконкретной ситуации носитель языка «выбирает» – из всего многообразия – повозможности единственный язык. Для автомата (системы автоматической обработкитекста), напротив, специализация является законным правом и преимуществомавтоматической обработки текста. Ведь в случае с автоматом мы можем (и должны)«заточить» его под определенные задачи: коммуникативные ситуации и языки.§ 1.3.Лингвистика и лингвистики.

Принцип моделирования. Цели,методы, задачиПриведем цитату лингвиста-теоретика, высоко ценящего принципмоделирования. «Всякая теоретическая дисциплина имеет перед собой задачупостроения модели того объекта, который она изучает. Модель — это тоже объект, носпециально построенный исследователем4 с целью познания того или иногофрагмента действительности, т. е.

объекта-оригинала. Правильная, адекватная модельсоздается тогда, когда два эти объекта — модель и оригинал — обладаютструктурным и/или функциональным подобием. Наличие структурного подобияозначает, что объект-оригинал и модель имеют одинаковую структуру, в такихслучаях говорят, что они изоморфны друг другу.

Наличие функционального подобияЕсли не учитывать естественных моделей, которые «стихийно» создаются мозгом, психикой человека приотображении внешней действительности.412говорит о том, что модель способна выполнять те же функции, что и объекторигинал» [109: 26]. Сложно не согласиться с этим утверждением. Более того, на нашвзгляд, построение модели объекта свойственно и большинству прикладных задач. Вданном параграфе зададимся двумя вопросами:o в чем принципиальное отличие между теоретическим и практическим подходом;o в чем сходство и различие отношения к принципу моделирования у лингвистов ипредставителей технических областей.И попутно решим проблемы, связанные с ролью носителя языка как «субъекта»такого моделирования«При узколингвистическом характере моделирования основным критериемадекватности модели является адекватность текста <…>, т.

е. результатафункционирования этой модели. Однако один и тот же текст может быть порожден(иногда и интерпретирован) разными способами. Поэтому собственнолингвистическая модель может оказаться не изоморфной внутренней системеносителей языка, т. е. языку в психолингвистическом смысле, точно так же структурафункционирования модели может не воспроизводить структуру деятельностичеловека.При психолингвистическом характере моделирования следует добиватьсяименно такой изоморфности, используя для этого все доступные наблюдению фактыречевого поведения, ставя специальные психолингвистические эксперименты» [109:28].В современном понимании часто говорят скорее об антропоморфной – а непсихолингвистической – адекватности модели, хотя по сути имеется в виду ровно то,о чем говорит В.Б. Касевич: носитель языка выступает в роли идеального субъекта,воплощающего в ходе своей коммуникативной деятельности функциональныевозможности языковой системы.Действительно ли носитель языка выступает в роли идеального субъектакоммуникации? На этот вопрос нельзя ответить точно раз и навсегда, к этому вопросумы будем возвращаться во второй, третьей и четвертой главах.

Для меня ответ на этотвопрос будет «скорее положительным» или даже «безусловно положительным» (взависимости от решаемой задачи) в силу того экспериментального направления,которое я представляю. Более или менее очевидный плюс такого подходазаключается в ориентации на точность моделирования процесса (точность результатаявляется следствием точности модели, а не главной задачей).

Хотя, конечно, такаямодель может не дать быстрый вариант получения требуемого (например, втехническом задании) результата.По [89] важнейшим свойством методов прикладной – в отличие оттеоретической – лингвистики является оптимизация. Термин «прикладнаялингвистика» выступает здесь в российском или даже скорее советском значении: каксиноним компьютерной, вычислительной, об этом будет чуть ниже. Подоптимизацией понимается такая модель языковой системы (или подсистемы), прикоторой этот объект сохраняет в результирующем представлении только тесущественные свойства, которые необходимы для данной практической задачи.Иными словами, если для теоретического исследования предполагается полнаямодель, например, полное описание этого объекта со всеми его характеристиками,сложностями и т. п., то прикладное оптимизированное описание должно бытьудовлетворительным только для данной конкретной задачи.13Анатолий Николаевич Баранов приводит в качестве примера категориювремени (пример приводится полностью по [89]).

Теоретический подход, взависимости от выбранной концепции, будет требовать:• описание грамматической категории времени (выделение граммем,морфологических способов выражения граммем, сочетаемость граммемкатегории времени с граммемами других грамматических категорий),классификация лексики со значением временных отношений, классификациясинтаксических конструкций;• в рамках уровневой модели языка — семантика временных отношений →способы выражения на синтаксическом уровне; → способы выражения налексическом уровне; → способы выражения на морфологическом уровне.Прикладное описание будет выглядеть совершенно по-другому:• составление технического задания (определяется заказчиком);• анализ проблемной области (сколько типов временных отношенийпредставлено в проблемной области и каковы формальные способы выражениятемпоральных отношений в данном подъязыке);• формирование метаязыка, способов описания проблемной области,совместимых с другими привлекаемыми метаязыками;• применение метаязыка → результирующее представление (модель)проблемной области;• проверка результирующего представления (объяснительная и предсказательнаясила модели; компьютерная реализация или эксперимент).Прикладные модели ориентированы на конкретные коммуникативныеситуации, конкретные языки (подъязыки), в существенно большей степени огрубляютмоделируемый объект и допускают широкие возможности выбора инструментамоделирования.Обещанные несколько слов про терминологию.

Как-то укоренилось, чтотермин «прикладная лингвистика» в зарубежной и отечественной науке имеютсущественноразличноезначение.Взарубежнойнаукелингвистика«прикладывается», прежде всего, к такой безусловно прикладной задаче, какобучение языку. Наше понимание термина ближе всего к компьютерной иливычислительной / машинной / инженерной лингвистике5 (наша специальность«Прикладная и математическая лингвистика» (в номенклатуре ВАК) за рубежомскорее всего найдет себе аналоги на факультетах Computer Science).Впрочем, неоднородность толкования этих терминов в отечественной наукеналицо.

Приведу в качестве примера два толкования «компьютерная лингвистика»6Недаром при обсуждении названия школы так долго шли обсуждение и выбор наименования.Про термин «инженерная лингвистика» стоит сказать отдельно. Только что мы говорили об одном егопонимании (в широком смысле). Однако иногда можно встретить этот термин и в узком смысле: для того,чтобы подчеркнуть заведомо суженную задачу обработки текстовой информации.

Например, однократноерешение такой задачи (даже на материале одной коллекции), не претендующее на построение долговременноймодели, но требующее получения быстрого результата (иногда с минимальными требованиями к точности). Вслучае такой сильно зауженной постановки задачи рассуждения о принципе моделирования могут казатьсяизбыточными, не нужным теоретическим довеском.6Термина «вычислительная лингвистика» в этом тезаурусе нет, что понятно в силу выбора источников дляработы.514(автор Е.Г.Соколова) из Русско-английского тезауруса по компьютерной лингвистике(Доступен на http://uniserv.iis.nsk.su/thes/) [147].Дескрипторназваниеязыкреляторопределение 1определение 2автор словарной статьикомпьютерная лингвистикарусскийнаправлениевприкладнойлингвистике,ориентированноенаиспользованиекомпьютерныхинструментов – программ, компьютерных технологийорганизации и обработки данных – для моделированияфункционирования языка в тех или иных условиях,ситуациях, проблемных сферах и т.д., а также вся сфераприменения компьютерных моделей языка в лингвистике исмежных дисциплинах.область Искусственного Интеллекта, занимающаясякомпьютерным моделированием владения языком с цельюпередачи информации, а также решением прикладных задачавтоматической обработки текстов и звучащей речиСоколова Е.Г.И далее толкование оригинального английского термина.Дескрипторназваниеязыкреляторопределение 1computational linguisticsанглийскийComputational linguistics is a discipline between linguisticsand computer science which is concerned with the computationalaspects of the human language faculty.

Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Нашёл ошибку?
Или хочешь предложить что-то улучшить на этой странице? Напиши об этом и получи бонус!
Бонус рассчитывается индивидуально в каждом случае и может быть в виде баллов или бесплатной услуги от студизбы.
Предложить исправление
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5140
Авторов
на СтудИзбе
441
Средний доход
с одного платного файла
Обучение Подробнее