Лингвистическое обеспечение процедуры извлечения имплицитной информации при проведении семантических экспертиз (1100954)
Текст из файла
На правах рукописиКОНДРАШОВА Дарья СергеевнаЛИНГВИСТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ПРОЦЕДУРЫИЗВЛЕЧЕНИЯ ИМПЛИЦИТНОЙ ИНФОРМАЦИИПРИ ПРОВЕДЕНИИ СЕМАНТИЧЕСКИХЭКСПЕРТИЗСпециальность 10.02.21. – прикладная и математическаялингвистикаАВТОРЕФЕРАТдиссертации на соискание ученой степеникандидата филологических наукМосква 2010Работа выполнена на кафедре теоретической и прикладной лингвистикифилологического факультета ФГОУ ВПО «Московский государственныйуниверситет имени М. В. Ломоносова».Научный руководитель:доктор филологических наук, профессорКобозева Ирина МихайловнаОфициальные оппоненты:доктор филологических наук, профессорКукушкина Ольга ВладимировнаЛаборатория общей и компьютернойлексикологии и лексикографиии кафедра русского языкафилологического факультетаФГОУ ВПО «Московскийгосударственный университетимени М.
В. Ломоносова»кандидат филологических наукКотов Артемий АлександровичОтдел когнитивных исследованийФГУ «Российский научный центр«Курчатовский институт» (г. Москва)»Учреждение Российскойакадемии наук «Институтпроблем информатики РАН»Ведущая организация:Защита состоится «24» ноября 2010 г. в 15 часов 00 минут на заседаниидиссертационного совета Д.501.001.24 при ФГОУ ВПО «Московскийгосударственный университет имени М. В. Ломоносова» по адресу: 119991, Москва,Ленинские горы, МГУ им. М. В.
Ломоносова, 1-й корпус гуманитарных факультетов,филологический факультет.С диссертацией можно ознакомиться в читальном зале 1-го корпуса гуманитарныхфакультетов ФГОУ ВПО «МГУ им. М. В. Ломоносова».Автореферат разослан «__» ________ 2010 г.Ученый секретарьдиссертационного советаА. М. Белов2Кондрашова Д.С. Автореф. дис. ... к.ф.н. М.: 2010ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫРеферируемая диссертация посвящена проблеме скрытых смыслов вестественно языковых текстах и принадлежит к числу работ прикладного характера,проводимых в области лингвистической семантики.Феномен имплицитного в языке не раз привлекал внимание лингвистов,логиков и философов.
Среди отечественных ученых к ним, в частности, относятсяЕ. Г. Борисова, К. А. Долинин, Анна А. Зализняк, В. А. Звегинцев, Л. В. Лисоченко,Ю. С. Мартемьянов, А. А. Масленникова, И. М. Кобозева, Е. В. Падучева, Ю. К.Пирогова, а среди зарубежных авторов – П. Грайс, Дж. Р. Серль, Р. С. Сталнакер,Г. Фреге, Л.
Картуннен, Е. Л. Кинэн, П. Ф. Строусон, Ч. Филлмор, Р. Ван дер Сандт,Н. Эшер и А. Ласкаридес и другие. С появлением все новых работ, направленных напостижение сущности этого феномена, концепт имплицитного становился все более иболее определенным и получал более адекватное представление.
Параллельно сразработкой классификаций имплицитной информации были выявлены различныеаспекты имплицитного как языкового явления: неоднородность, сосуществование сэксплицитным планом выражения, извлекаемость, важность учета контекстуальнойинформации при анализе, градуированность степени имплицитного. Однако,несмотря на существующие подходы к пониманию этого феномена (ср., например,работы Е.
В. Падучевой, Л. В. Лисоченко, А. А. Масленниковой, анализируемые внастоящем исследовании), до сих пор еще не было предложено единой концепцииинтерпретации имплицитно выраженного содержания, в том числе и в аспектереализации компьютерного извлечения имплицитной информации моделямиавтоматического понимания текста (АПТ).Актуальность исследования определяется, таким образом, тем, что в ходеданной работы предпринята попытка создания лингвистического обеспеченияпроцедуры извлечения имплицитной информации из текста, ориентированной нареализацию системами АПТ и направленной на решение практических задач,возникающих при проведении судебных лингвистических экспертиз.
В разработкелингвистического обеспечения такой процедуры и заключается конечная цельработы. Потребность в лингвистических экспертизах – особенно семантических,например, связанных с делами по защите чести и достоинства – все время возрастает,что делает разработку их методик актуальнейшей задачей. Не менее актуальным внастоящее время является автоматизация деятельности человека в различныхобластях.
Поскольку главной подзадачей семантической экспертизы являетсясмысловой анализ текста, то решение проблемы автоматизации экспертнойдеятельности следует искать в рамках проблемной области АПТ.Материалом для исследования послужили тексты реальных судебныхсемантических экспертиз (т. е. тексты экспертных исследований, составленныеэкспертами), сопровождаемые текстами, подвергнутыми экспертизе (т.
е. текстами,которые анализировали эксперты при проведении этих экспертиз). К рассмотрению3принимались экспертные исследования монологических текстов наиболеечастотного типа – анализ текста с целью выявления наличия в нем негативнойинформации о деятельности кого-либо.Основным источником материала послужили экспертные исследования,любезнопредоставленныесотрудникамиГосударственногоучрежденияРОССИЙСКИЙ ФЕДЕРАЛЬНЫЙ ЦЕНТР СУДЕБНОЙ ЭКСПЕРТИЗЫ ПРИМИНИСТЕРСТВЕ ЮСТИЦИИ РОССИЙСКОЙ ФЕДЕРАЦИИ. Также в качествеисточника материала была использована литература, содержащая аналогичныесведения.Таким образом, объектом исследования является имплицитная информация,содержащаяся в тексте на ЕЯ, в аспекте его автоматической обработки.
Предметомисследования является процесс моделирования извлечения имплицитной информациииз текста.Достижение указанной цели работы с учетом специфики выбранного языковогоматериала для проведения исследования подразумевает решение следующих задач: определение современного уровня развития систем, для которых разрабатываетсялингвистическое обеспечение вышеупомянутой процедуры; сопоставление существующих подходов к имплицитной информации и кклассификации ее типов; выявление типовых семантических задач, решаемых в ходе экспертнойдеятельности; формулирование подхода к имплицитной информации как к объектумоделирования; соотнесение с каждым выделяемым типом имплицитной информацииопределенного модуля в составе системы АПТ; внесение предложений по реализации и / или собственно реализация одного илинескольких модулей в рамках произвольной и / или заданной автоматическойсистемы.Методы исследования.
При решении данных задач использовался методсопоставления и критического анализа существующих подходов к имплицитнойинформации и к классификации ее типов; проводился многоаспектныйсемантический анализ языкового материала: лексико-семантический, синтактикосемантический, контекстный семантический, а также формально-семантический (канализу отдельных случаев привлекалась теория сегментной репрезентациидискурса).Научная новизна работы заключается в том, что здесь впервые намечаютсявозможные пути решения проблемы автоматизированной обработки всех проявленийимплицитного плана содержания ЕЯ текста применительно к задачам судебнойсемантической экспертизы и предлагаются способы решения ряда подзадач этоймногогранной проблемы.4Кондрашова Д.С. Автореф. дис.
... к.ф.н. М.: 2010Положения, выносимые на защиту:1. Имплицитный уровень выражения смысла представляет собой целыйкомплекс явлений в речевой деятельности, обладающий внутренними взаимосвязями,это особая подсистема в рамках языковой системы.2. Понятие пресуппозиции следует рассматривать не просто как разновидностьимплицитной информации, но как конститутивный компонент имплицитнойинформации и как системообразующий элемент имплицитного уровня выражениясмысла.3.
В современном российском судопроизводстве назрела необходимостьсоздания единой экспертной методики анализа спорных текстов, позволяющей нарядус эксплицитно выраженными смыслами анализировать имплицитный плансодержания и в то же время обеспечивать объективность семантической экспертизы.4. В качестве основы такой методики может быть использована идеологиятеории сегментной репрезентации дискурса.В работе получены следующие результаты:1. Выявлен комплекс типовых семантических задач, встающих передэкспертами-лингвистами при проведении исследования спорного текста по делам озащите чести, достоинства и деловой репутации.2. Проведено систематизированное разграничение типов имплицитнойинформации, предназначенное для использования экспертом-лингвистом приисследовании спорного текста на предмет наличия в нем негативной информации одеятельности кого-либо.3.
Разработана архитектура лингвистического обеспечения процедурыизвлечения имплицитной информации при проведении семантических экспертиз,представляющая собой комплекс модулей семантического компонента системы АПТ,оказывающих поддержку экспертного анализа имплицитного плана содержанияспорного текста на предмет наличия в нем негативной информации о деятельностикого-либо.4. Предложен вариант модели автоматического определения тональностивысказываний в адрес политических деятелей, реализованный в рамкахотечественной системы извлечения знаний OntosMiner™.Результаты работы могут в дальнейшем иметь как теоретическое, так ипрактическое применение.
Теоретическая значимость работы состоит в том, чтовыдвинутые положения могут быть использованы специалистами в областисемантической теории. Данное исследование также может представлять интерес длялингвистов, разрабатывающих модели семантического анализа текстов наестественном языке, в частности, для разработчиков систем, нацеленных наизвлечение из текста скрытой информации; а также для лингвистов-экспертов,проводящих семантические исследования спорных текстов, что составляетпрактическую значимость работы.5Апробация работы. Основные результаты исследования были представлены ипрошли обсуждение в ходе докладов на всероссийских и международныхконференциях: VIII Международной конференции «Cognitive Modeling in Linguistics»(Болгария, г.
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.















