Большакова Е.И. и др. - Автоматическая обработка текстов на естественном языке и компьютерная лингвистика (1027379), страница 28
Текст из файла (страница 28)
2002134. Откупщикова, М. И. Синтаксис связного текста: учебное пособие / М. И. Откупщикова. – Л.,1982. – 103 с.135. Падучева Е.В. Высказывание и его соотнесенность с действительностью – М., 2001136. Пивоварова Л.М., Ягунова Е.В. Извлечение и классификация терминологических коллокаций наматериале лингвистических научных текстов. Предварительные наблюдения // Материалы второго87Международного симпозиума «Терминология и знание» М., 2010137. Пивоварова Л. М. Устойчивые конструкции, характеризующие тексты СМИ // Прикладная иматематическая лингвистика: Материалы секции XXXIX Международной филологическойконференции, CПб.
2010.138. Л.М. Пивоварова, Е.В. Ягунова Информационная структура научного текста. Текст в контекстеколлекции // Труды международной конференции “Корпусная лингвистика – 2011” – СПб., 2011 (впечати)139. Пиотровский Р.Г. Лингвистическая синергетика: исходные положения, первые результаты,перспективы СПб. 2006140. Пиотровский Р.Г. Информационные измерения языка. Л., 1968141. Пиотровский Р.Г.
Лингвистический автомат (в исследовании и непрерывном обучении СПб.,1999142. Прогноз в речевой деятельности. М. / Авт. колл.: Р.М. Фрумкина (отв. ред.), А.П. Василевич,П.Ф. Андрукович, Е.Н. Герганов. 1974.143. Рогожникова Р. П. Толковый словарь сочетаний, эквивалентных слову. М., 2003.144. Савина А.В., Ягунова Е.В. Исследование коллокаций с помощью экспериментов синформантами // Труды международной конференции “Корпусная лингвистика – 2011” – СПб., 2011(в печати)145. Сахарный Л.В. Тема-рематическая структура текста: основные понятия // Язык и речеваядеятельность. 1998, №1146. Сахарный Л.В., Сибирский С.
А., Штерн А. С. Набор ключевых слов как текст // Психологопедагогические и лингвистические проблемы исследования текста – Пермь, 1984Севбо И.П. Структура связного текста и автоматизация реферирования – М.: Наука, 1969147. Соколова Е. Г., Семенова С. Ю., Кононенко И. С., Загорулько Ю. А., Кривнова О. Ф., Захаров В.П. Особенности подготовки терминов для русско-английского тезауруса по компьютернойлингвистике // Компьютерная лингвистика и интеллектуальные технологии: По материаламежегодной Международной конференции «Диалог» (Бекасово, 25-29 мая 2011 г.). Вып. 10 (17).- М.:Изд-во РГГУ, 2011.148. СЭСРЯ – Стилистический энциклопедический словарь русского языка / Под. ред.
М.Н.Кожиной – М.: Флинта: Наука, 2003.149. Файн В.С. Распознавание образов и машинное понимание естественного языка – М.: Наука,1987150. Шайкевич А.Я., Андрющенко В.М., Ребецкая Н.А., Статистический словарь языка русскойгазеты (1990-е годы). М. 2008151. Шенк Р. Обработка концептуальной информации – М., 1980152. Шмелев А.Д. Русский язык и внеязыковая действительность – М.: Языки славянских культур,2002153. Штерн А.
С. Перцептивный аспект речевой деятельности – Л., 1992154. Ягунова Е.В. Формальные и неформальные критерии вычленения ключевых слов из научных иновостных текстов // Русский язык: исторические судьбы и современность: IVМеждународныйконгресс исследователей русского языка (Москва, МГУ им. М.В.Ломоносова, филологическийфакультет 20-23 марта 2010 г.): Труды и материалы / Составители М.Л. Ремнева,, А.А Поликарпов.
–М.: Изд-во Моск. ун-та. 2010а155. Ягунова Е.В. Эксперимент и вычисления в анализе ключевых слов художественного текста //Философия языка. Лингвистика. Лингводидактика №1 Пермь 2010б156. Ягунова Е.В. Ключевые слова в исследовании текстов Н.В. Гоголя // Проблемы социо- ипсихолингвистики. Пермь, 2011157. Ягунова Е.
В., Пивоварова Л. М. От коллокаций к конструкциям // Русский язык:конструкционные и лексико-семантические подходы / Отв. ред. С.С.Сай. СПб, 2011 (ACTALIINGUIISTIICA PETROPOLIITANA. Труды Института лингвистических исследований РАН. Отв.редактор / Н. Н. Казанский) (в печати)158. Ягунова Е.В. Вариативность стратегий восприятия звучащего текста (экспериментальноеисследование на материале русскоязычных текстов разных функциональных стилей). Пермь. 2008.159. Ягунова Е.В., Пивоварова Л.М.
Природа коллокаций в русском языке. Опыт автоматическогоизвлечения и классификации на материале новостных текстов // Научно-техническая информация,Сер.2, №6. М. 2010а. с.30-4088160. Ягунова Е.В., Пивоварова Л.М.. Извлечение и классификация коллокаций на материале научныхтекстов. предварительные наблюдения // V Международная научно-практическая конференция"Прикладная лингвистика в науке и образовании" памяти Р.Г. Пиотровского (1922-2009) :Материалы. СПб. 2010б С.
356-364161. Ягунова Е.В., Пивоварова Л.М. Исследование структуры новостного текста какпоследовательности связных сегментов // Компьютерная лингвистика и интеллектуальныетехнологии. По материалам ежегодной международной конференции «Диалог». Периодическоеиздание. Вып.
10 (17).. М., 2011.162. Ягунова Е.В., Пивоварова Л.М., Клышинский Э.С. Коммуникативная функция глаголов вгазетных и научных текстах // Материалы конференции «Понимание в коммуникации-5». Сб. работ. –М. 2011 С. 206-209.163. Савина А.В., Ягунова Е.В. Исследование коллокаций с помощью экспериментов синформантами // Труды международной конференции “Корпусная лингвистика – 2011” – СПб., 2011(в печати)164. Янко Т. Е. Коммуникативные стратегии русской речи – М., 200189ЧАСТЬ II.КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА: МЕТОДЫ,РЕСУРСЫ, ПРИЛОЖЕНИЯ(БОЛЬШАКОВА Е.И.)Глава 1.ВведениеТермин компьютерная лингвистика (КЛ) в последние годы все чаще встречаетсяв связи с разработкой различных прикладных программных систем, в том числе –коммерческих программных продуктов.
Связано это бурным ростом в обществетекстовой информации, в том числе в сети Интернет, и необходимостьюавтоматической обработки текстов на естественном языке (ЕЯ). Указанноеобстоятельство стимулирует развитие компьютерной лингвистики как области наукии разработку новых информационных и лингвистических технологий.В рамках компьютерной лингвистики, существующей уже более 50 лет (иизвестной также под названиями машинная лингвистика, автоматическаяобработка текстов на ЕЯ) предложено много перспективных методов и идей, нодалеко не все они еще нашли свое выражение в программных продуктах,используемых на практике. Наша цель – охарактеризовать специфику этой областиисследований, сформулировать ее основные задачи, указать ее связи с другиминауками, дать краткий обзор основных подходов и используемых ресурсов, а такжекратко охарактеризовать существующие приложения КЛ.
Для более подробногоознакомления с этими вопросам можно рекомендовать книги [4, 16, 37].Глава 2.Задачи компьютерной лингвистикиКомпьютерная лингвистика возникла на стыке таких наук, как лингвистика,математика, информатика (Computer Science) и искусственный интеллект. Истоки КЛвосходят к исследованиям известного американского ученого Н. Хомского в областиформализации структуры естественного языка [7]; ее развитие опирается нарезультаты в области общей лингвистики (языкознания) [36]. Языкознание изучаетобщие законы естественного языка – его структуру и функционирование, и включаеттакие области:Фонология – изучает звуки речи и правила их соединения при формировании речи;Морфология – занимается внутренней структурой и внешней формой слов речи,включая части речи и их категории;Синтаксис – изучает структуру предложений, правила сочетаемости и порядкаследования слов в предложении, а также общие его свойства как единицы языка.Семантика и прагматика – тесно связанные области: семантика занимаетсясмыслом слов, предложений и других единиц речи, а прагматика – особенностямивыражения этого смысла в связи с конкретными целями общения;Лексикография описывает лексикон конкретного ЕЯ – его отдельные слова и ихграмматические свойства, а также методы создания словарей.Результаты Н.
Хомского, полученные на стыке лингвистики и математики,заложили основу для теории формальных языков и грамматик (часто называемыхгенеративными, или порождающими грамматиками). Эта теория относится ныне кматематической лингвистике и применяется для обработки не столько ЕЯ, ноискусственных языков, в первую очередь – языков программирования. По своемухарактеру это вполне математическая дисциплина.90К математической лингвистике относят также и квантитативную лингвистику,изучающую частотные характеристики языка – слов, их комбинаций, синтаксическихконструкций и т.п., При этом используется математические методы статистики, такчто можно назвать этот раздел науки статистической лингвистикой [14].КЛ тесно связана и с такой междисциплинарной научной областью, какискусственный интеллект (ИИ) [40], в рамках которого разрабатываютсякомпьютерные модели отдельных интеллектуальных функций. Одна из первыхработающих программ в области ИИ и КЛ – это известная программа Т.
Винограда,которая понимала простейшие приказы человека по изменению мира кубиков,сформулированные на ограниченном подмножестве ЕЯ [32]. Отметим, что несмотряна очевидное пересечение исследований в области КЛ и ИИ (поскольку владениеязыком относится к интеллектуальным функциям), ИИ не поглощает всю КЛ,поскольку она имеет свой теоретический базис и методологию. Общим для указанныхнаук является компьютерное моделирование как основной метод и итоговая цельисследований.Таким образом, задача КЛ может быть сформулирована как разработкакомпьютерных программ для автоматической обработки текстов на ЕЯ. И хотя приэтом обработка понимается достаточно широко, далеко не все виды обработки могутбытьназванылингвистическими,асоответствующиепроцессоры–лингвистическими.
Лингвистический процессор должен использовать ту или инуюформальную модель языка (пусть даже очень простую), а значит, быть так или иначеязыково-зависимым (т.е. зависеть от конкретного ЕЯ). Так, например, текстовыйредактор Microsoft Word может быть назван лингвистическим (хотя бы потому, чтоиспользует словари), а редактор NotePad – нет.Сложность задач КЛ связана с тем, что ЕЯ – сложная многоуровневая системазнаков, возникшая для обмена информацией между людьми, выработанная в процессепрактической деятельности человека, и постоянно изменяющаяся в связи с этойдеятельностью [36, 38]. Другая сложность разработки методов КЛ (и сложностьизучения ЕЯ в рамках языкознания) связана с многообразием естественных языков,существенными отличиями их лексики, морфологии, синтаксиса, разные языкипредоставляют разные способы выражения одного и того же смысла.Глава 3.Особенности системы ЕЯ: уровни и связиОбъектом лингвистических процессоров являются тексты ЕЯ.