Лингвистическое обеспечение процедуры извлечения имплицитной информации при проведении семантических экспертиз
Описание файла
PDF-файл из архива "Лингвистическое обеспечение процедуры извлечения имплицитной информации при проведении семантических экспертиз", который расположен в категории "". Всё это находится в предмете "филология" из Аспирантура и докторантура, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата филологических наук.
Просмотр PDF-файла онлайн
Текст из PDF
На правах рукописиКОНДРАШОВА Дарья СергеевнаЛИНГВИСТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ПРОЦЕДУРЫИЗВЛЕЧЕНИЯ ИМПЛИЦИТНОЙ ИНФОРМАЦИИПРИ ПРОВЕДЕНИИ СЕМАНТИЧЕСКИХЭКСПЕРТИЗСпециальность 10.02.21. – прикладная и математическаялингвистикаАВТОРЕФЕРАТдиссертации на соискание ученой степеникандидата филологических наукМосква 2010Работа выполнена на кафедре теоретической и прикладной лингвистикифилологического факультета ФГОУ ВПО «Московский государственныйуниверситет имени М. В. Ломоносова».Научный руководитель:доктор филологических наук, профессорКобозева Ирина МихайловнаОфициальные оппоненты:доктор филологических наук, профессорКукушкина Ольга ВладимировнаЛаборатория общей и компьютернойлексикологии и лексикографиии кафедра русского языкафилологического факультетаФГОУ ВПО «Московскийгосударственный университетимени М.
В. Ломоносова»кандидат филологических наукКотов Артемий АлександровичОтдел когнитивных исследованийФГУ «Российский научный центр«Курчатовский институт» (г. Москва)»Учреждение Российскойакадемии наук «Институтпроблем информатики РАН»Ведущая организация:Защита состоится «24» ноября 2010 г. в 15 часов 00 минут на заседаниидиссертационного совета Д.501.001.24 при ФГОУ ВПО «Московскийгосударственный университет имени М. В. Ломоносова» по адресу: 119991, Москва,Ленинские горы, МГУ им. М. В.
Ломоносова, 1-й корпус гуманитарных факультетов,филологический факультет.С диссертацией можно ознакомиться в читальном зале 1-го корпуса гуманитарныхфакультетов ФГОУ ВПО «МГУ им. М. В. Ломоносова».Автореферат разослан «__» ________ 2010 г.Ученый секретарьдиссертационного советаА. М. Белов2Кондрашова Д.С. Автореф. дис. ... к.ф.н. М.: 2010ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫРеферируемая диссертация посвящена проблеме скрытых смыслов вестественно языковых текстах и принадлежит к числу работ прикладного характера,проводимых в области лингвистической семантики.Феномен имплицитного в языке не раз привлекал внимание лингвистов,логиков и философов.
Среди отечественных ученых к ним, в частности, относятсяЕ. Г. Борисова, К. А. Долинин, Анна А. Зализняк, В. А. Звегинцев, Л. В. Лисоченко,Ю. С. Мартемьянов, А. А. Масленникова, И. М. Кобозева, Е. В. Падучева, Ю. К.Пирогова, а среди зарубежных авторов – П. Грайс, Дж. Р. Серль, Р. С. Сталнакер,Г. Фреге, Л.
Картуннен, Е. Л. Кинэн, П. Ф. Строусон, Ч. Филлмор, Р. Ван дер Сандт,Н. Эшер и А. Ласкаридес и другие. С появлением все новых работ, направленных напостижение сущности этого феномена, концепт имплицитного становился все более иболее определенным и получал более адекватное представление.
Параллельно сразработкой классификаций имплицитной информации были выявлены различныеаспекты имплицитного как языкового явления: неоднородность, сосуществование сэксплицитным планом выражения, извлекаемость, важность учета контекстуальнойинформации при анализе, градуированность степени имплицитного. Однако,несмотря на существующие подходы к пониманию этого феномена (ср., например,работы Е.
В. Падучевой, Л. В. Лисоченко, А. А. Масленниковой, анализируемые внастоящем исследовании), до сих пор еще не было предложено единой концепцииинтерпретации имплицитно выраженного содержания, в том числе и в аспектереализации компьютерного извлечения имплицитной информации моделямиавтоматического понимания текста (АПТ).Актуальность исследования определяется, таким образом, тем, что в ходеданной работы предпринята попытка создания лингвистического обеспеченияпроцедуры извлечения имплицитной информации из текста, ориентированной нареализацию системами АПТ и направленной на решение практических задач,возникающих при проведении судебных лингвистических экспертиз.
В разработкелингвистического обеспечения такой процедуры и заключается конечная цельработы. Потребность в лингвистических экспертизах – особенно семантических,например, связанных с делами по защите чести и достоинства – все время возрастает,что делает разработку их методик актуальнейшей задачей. Не менее актуальным внастоящее время является автоматизация деятельности человека в различныхобластях.
Поскольку главной подзадачей семантической экспертизы являетсясмысловой анализ текста, то решение проблемы автоматизации экспертнойдеятельности следует искать в рамках проблемной области АПТ.Материалом для исследования послужили тексты реальных судебныхсемантических экспертиз (т. е. тексты экспертных исследований, составленныеэкспертами), сопровождаемые текстами, подвергнутыми экспертизе (т.
е. текстами,которые анализировали эксперты при проведении этих экспертиз). К рассмотрению3принимались экспертные исследования монологических текстов наиболеечастотного типа – анализ текста с целью выявления наличия в нем негативнойинформации о деятельности кого-либо.Основным источником материала послужили экспертные исследования,любезнопредоставленныесотрудникамиГосударственногоучрежденияРОССИЙСКИЙ ФЕДЕРАЛЬНЫЙ ЦЕНТР СУДЕБНОЙ ЭКСПЕРТИЗЫ ПРИМИНИСТЕРСТВЕ ЮСТИЦИИ РОССИЙСКОЙ ФЕДЕРАЦИИ. Также в качествеисточника материала была использована литература, содержащая аналогичныесведения.Таким образом, объектом исследования является имплицитная информация,содержащаяся в тексте на ЕЯ, в аспекте его автоматической обработки.
Предметомисследования является процесс моделирования извлечения имплицитной информациииз текста.Достижение указанной цели работы с учетом специфики выбранного языковогоматериала для проведения исследования подразумевает решение следующих задач: определение современного уровня развития систем, для которых разрабатываетсялингвистическое обеспечение вышеупомянутой процедуры; сопоставление существующих подходов к имплицитной информации и кклассификации ее типов; выявление типовых семантических задач, решаемых в ходе экспертнойдеятельности; формулирование подхода к имплицитной информации как к объектумоделирования; соотнесение с каждым выделяемым типом имплицитной информацииопределенного модуля в составе системы АПТ; внесение предложений по реализации и / или собственно реализация одного илинескольких модулей в рамках произвольной и / или заданной автоматическойсистемы.Методы исследования.
При решении данных задач использовался методсопоставления и критического анализа существующих подходов к имплицитнойинформации и к классификации ее типов; проводился многоаспектныйсемантический анализ языкового материала: лексико-семантический, синтактикосемантический, контекстный семантический, а также формально-семантический (канализу отдельных случаев привлекалась теория сегментной репрезентациидискурса).Научная новизна работы заключается в том, что здесь впервые намечаютсявозможные пути решения проблемы автоматизированной обработки всех проявленийимплицитного плана содержания ЕЯ текста применительно к задачам судебнойсемантической экспертизы и предлагаются способы решения ряда подзадач этоймногогранной проблемы.4Кондрашова Д.С. Автореф. дис.
... к.ф.н. М.: 2010Положения, выносимые на защиту:1. Имплицитный уровень выражения смысла представляет собой целыйкомплекс явлений в речевой деятельности, обладающий внутренними взаимосвязями,это особая подсистема в рамках языковой системы.2. Понятие пресуппозиции следует рассматривать не просто как разновидностьимплицитной информации, но как конститутивный компонент имплицитнойинформации и как системообразующий элемент имплицитного уровня выражениясмысла.3.
В современном российском судопроизводстве назрела необходимостьсоздания единой экспертной методики анализа спорных текстов, позволяющей нарядус эксплицитно выраженными смыслами анализировать имплицитный плансодержания и в то же время обеспечивать объективность семантической экспертизы.4. В качестве основы такой методики может быть использована идеологиятеории сегментной репрезентации дискурса.В работе получены следующие результаты:1. Выявлен комплекс типовых семантических задач, встающих передэкспертами-лингвистами при проведении исследования спорного текста по делам озащите чести, достоинства и деловой репутации.2. Проведено систематизированное разграничение типов имплицитнойинформации, предназначенное для использования экспертом-лингвистом приисследовании спорного текста на предмет наличия в нем негативной информации одеятельности кого-либо.3.
Разработана архитектура лингвистического обеспечения процедурыизвлечения имплицитной информации при проведении семантических экспертиз,представляющая собой комплекс модулей семантического компонента системы АПТ,оказывающих поддержку экспертного анализа имплицитного плана содержанияспорного текста на предмет наличия в нем негативной информации о деятельностикого-либо.4. Предложен вариант модели автоматического определения тональностивысказываний в адрес политических деятелей, реализованный в рамкахотечественной системы извлечения знаний OntosMiner™.Результаты работы могут в дальнейшем иметь как теоретическое, так ипрактическое применение.
Теоретическая значимость работы состоит в том, чтовыдвинутые положения могут быть использованы специалистами в областисемантической теории. Данное исследование также может представлять интерес длялингвистов, разрабатывающих модели семантического анализа текстов наестественном языке, в частности, для разработчиков систем, нацеленных наизвлечение из текста скрытой информации; а также для лингвистов-экспертов,проводящих семантические исследования спорных текстов, что составляетпрактическую значимость работы.5Апробация работы. Основные результаты исследования были представлены ипрошли обсуждение в ходе докладов на всероссийских и международныхконференциях: VIII Международной конференции «Cognitive Modeling in Linguistics»(Болгария, г.