Лингвистическое обеспечение процедуры извлечения имплицитной информации при проведении семантических экспертиз, страница 6
Описание файла
PDF-файл из архива "Лингвистическое обеспечение процедуры извлечения имплицитной информации при проведении семантических экспертиз", который расположен в категории "". Всё это находится в предмете "филология" из Аспирантура и докторантура, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата филологических наук.
Просмотр PDF-файла онлайн
Текст 6 страницы из PDF
В качестве объектов тональных высказываний рассматривалисьпреимущественно политические деятели, политические партии, а также22Кондрашова Д.С. Автореф. дис. ... к.ф.н. М.: 2010коммерческие организации. Большая часть разработанных фаз направлена навыявление именно негативной тональности. Это обстоятельство обусловлено впервую очередь общей тональностью современных СМИ, в особенности,русскоязычных, а, соответственно, и количественным преимуществом собранныхпримеров на негатив по сравнению с позитивом.Основные шаблоны, призванные выявлять высказывания с негативнойтональностью в отношении ключевого объекта, базируются на использовании такихключевых лексем, как обвинять, критиковать, упрекать. Эти и подобные имлексемы составили ядро разработанной системы.
При создании шаблонов активноиспользовались также словосочетания и целые выражения, за которыми в русскойязыковой картине мира закрепилась негативная тональная окраска: возбудитьуголовное дело против / в отношении..., нечистый на руку, воспользоватьсяслужебным положением, иметь связи в криминальном мире и под. Аналогичное ядробыло заложено и в основу создания шаблонов, нацеленных на извлечение позитива (исоставляющих ≈15% от общего объема разработанных).В виду огромного количества потенциальных способов выраженияпозитива / негатива в естественном языке проделанную работу по созданию шаблоновследует считать начальным этапом разработки модуля, который при необходимойдоработке сможет выдавать хорошие результаты по таким параметрам как точность иполнота выявления объектно-ориентированнного позитива и негатива впроизвольном русскоязычном тексте (имеется ввиду 100%-ная точность и полнота впределах 0,7 - 0,8 (если за единицу принять все искомые случаи) в связи сневозможностью учета ряда уникальных и индивидуальных способов выражения).Таким образом, на основе проведенного исследования заданной области знаний(тональность как оценочная модальность высказываний о Персоне / Организации) вреферируемой работе было предложено решение задачи автоматическогоопределения тональности и была проведена пробная реализация, котораяпродемонстрировала работоспособность лежащей в основе данного решения идеи.В заключении эксплицируются результаты исследования и намечаютсяперспективы дальнейшей работы в области автоматического анализа имплицитногосодержания текстов на ЕЯ.В процессе исследования были выявлены типовые семантические задачи,решаемые в ходе экспертной деятельности; был сформулирован подход кимплицитной информации как к объекту моделирования; а также было осуществленосоотнесение с каждым выделяемым типом имплицитной информации определенногомодуля семантического компонента системы АПТ, предназначенной дляавтоматизации экспертной деятельности и объективизации результатов экспертныхисследований.
В результате был получен комплекс, состоящий из 7 новых илимодифицированных модулей, которые должны войти в семантический компоненттакой системы.23Также была обоснована необходимость создания единой экспертной методики,основанной на современных достижениях лингвистической науки, которая могла быобеспечить объективность результатов, всесторонность и полноту экспертногоисследования (что предполагает, в частности, учет имплицитного плана содержания),а также представлять собой инструмент для подробного описания исследовательскогопроцесса.
В качестве основы такой методики была выбрана теория сегментнойрепрезентации дискурса. Была продемонстрирована возможность применения этойтеории к русскоязычному материалу (в реферируемой работе SDRT впервыеприменяется к развернутым естественным монологическим текстам на русскомязыке) и описали преимущества такого анализа.
С точки зрения задач АПТпредлагаемая теоретическая основа методики может пониматься как общая стратегиясемантического анализа, т. е. как одна из неотъемлемых составляющихсемантического компонента системы. Дальнейшее развитие предложенной схемысемантического компонента, обеспечивающего процедуру извлечения имплицитнойинформации, предполагает детальную разработку каждого из выявленных модулей.Помимо вышесказанного в рамках проведенного исследования была такжеосуществлена реализация автоматического определения тональности высказыванийна платформе семейства мультиязычных систем извлечения знаний OntosMiner, чтодемонстрирует реальную возможность использования современных прикладныхлингвистических технологий для оптимизации процесса решения задач судебнойсемантической экспертизы.Дальнейшее совершенствование алгоритма объектно-ориентированногоопределения тональности напрямую связано с совершенствованием общей моделиавтоматического семантического анализа входного текста.24Кондрашова Д.С.
Автореф. дис. ... к.ф.н. М.: 2010ПУБЛИКАЦИИОсновные результаты, полученные при выполнении диссертационногоисследования, опубликованы в 6 печатных работах, включая публикацию в издании,рекомендованном ВАК.1. Кондрашова Д. С. Опыт разработки автоматического определениятональности высказываний // Вестник Московского университета. Сер. 9.Филология. 2010. № 3. – C. 144-151.2. Кондрашова Д. С. Теория сегментной репрезентации дискурса как средствоповышения объективности семантической экспертизы текстов массовойкоммуникации//Языксредствмассовойинформациикакобъектмеждисциплинарного исследования: Материалы 2-й Международной конференции(Москва, филологический факультет МГУ имени М.
В. Ломоносова, 14-16 февраля2008 г.) / Сост. М. Н. Володина. – М.: МАКС Пресс, 2008. – C. 187-191.3. Кондрашова Д. С. Имплицитная информация в аспекте проблем судебнойлингвистической экспертизы // Скрытые смыслы в языке и коммуникации: Сб. науч.ст. / Ред.-сост. И. А. Шаронов. – М.: Российск.
гос. гуманит. ун-т, 2007. – C. 193-214.4. Кондрашова Д. С. Теория сегментной репрезентации дискурса для решениязадач судебной лингвистической экспертизы при извлечении из текста имплицитнойинформации. // Компьютерная лингвистика и интеллектуальные технологии: Трудымеждународной конференции «Диалог 2006» (Бекасово, 31 мая - 4 июня 2006 г.).
/Под. ред. Н. И. Лауфер, А. С. Нариньяни, В. П. Селегея. – М.: Изд-во РГГУ, 2006. –C. 275-279.5. Кондрашова Д. С. К проблеме классификации типов имплицитнойинформации. // Обработка текста и когнитивные технологии: Сборник статей. № 11.(Материалы VIII Международной конференции ‘Cognitive Modelling in Linguistics’,Varna, 2005). / Под ред. В.
Соловьева и др. – Казань: Каз. гос. университет, 2006. –Т. 1. – C. 245-252.6. Кондрашова Д. С. Опыт построения алгоритма интерпретации метафорна основе динамической иерархии типов. // Интерпретатор и текст: проблемыограничений в интерпретационной деятельности: Материалы Пятых Филологическихчтений (20-22 октября 2004). / Под ред. Т. А. Трипольской, М. А. Лаппо,О. А. Маркосовой. – Новосибирск: Изд. НГПУ, 2004.
– Ч. II. – C. 128-134.25.