Диссертация (1137218), страница 21
Текст из файла (страница 21)
Кластеризация выполняетсяпутем построения решетки замкнутых структурных описаний текстов.В работе также было продемонстрировано, что предложеннаямодель применима к задаче классификации коротких текстов. Наоснове модели был разработан численный метод, использующийядерные функции, определенные на деревьях. Данный метод былапробирован на задаче поиска с помощью классификации и на задачеклассификации технических текстов. Было проведено сравнение двухвариантов обучения на текстах: Обучение на деревьях разбора для отдельных предложений(существующая модель текста), Обучение на деревьях разбора для отдельных предложений,дополненных расширенными деревьями разбора ‒ деревьями,полученныминаосноведискурсивныхсвязеймеждупредложениями абзаца (предложенная в исследовании модельтекста).148Эксперименты продемонстрировали, что добавление новыхпризнаков без изменения схемы эксперимента улучшает качествоклассификации с использованием существующей модели и устраняетнедостатки, связанные с применением этой модели.Также в работе были предложены новая модель и метод поискатождественных денотатов в прикладной онтологии (и формальномконтексте), основанные на применении анализа формальных понятий.Метод был применен для построения отношения «та же сущность»,используемоговрассматриваемойпредставлениятекстовыхпозволяющийранжироватьданных.висследованиимоделиразработаниндекс,Былформальныепонятияпостепениуверенности в том, что объекты данного понятия тождественны другдругу.Былирассмотреныальтернативныеметодырешенияпоставленной задачи, основанные на попарном сравнении объектов, иальтернативный критерий отбора формальных понятий, основанныйнаприменениииндексаэкстенсиональнойустойчивости.Былпроизведен сравнительный анализ разработанного метода с егоальтернативами и выявлены основные свойства всех методов.Эксперименты на сгенерированных данных продемонстрировалипреимущества нового метода.
Эксперименты на реальных данныхпоказали, что разработанные метод и критерий для фильтрациипонятий демонстрируют высокую точность.В работе было также приведено описание программногокомплекса FCART, в который в рамках исследования был добавлениндекс для вычисления тождественных денотатов, и программногокомплекса для работы с текстовыми данными, объединяющего в себереализациюалгоритмов.предложенныхвработечисленныхметодови149Литература1. Биркгоф Г. Теория решеток. — М.: Наука, 1989.2.
Ильвовский Д., Климушкин М. Выявление дубликатов объектов вприкладных онтологиях с помощью методов анализа формальныхпонятий. НТИ, Сер. 2. – 2013. - № 1. - С.10-17.3. Кузнецов С.О. Быстрый алгоритм построения всех пересеченийобъектов из конечной полурешетки. НТИ, Сер. 2. – 1993. - №1. - С.17-20.4. Кузнецов С.О. Устойчивость как оценка обоснованности гипотез,получаемых на основе операционального сходства. НТИ. Сер.2 1990. - № 12. - С.21-29.5. Карнап Р. Значение и необходимость.
М., 1959.6. Монтегю Р. Прагматика и интенсиональная логика. – В кн.:Семантика модальных и интенсиональных логик. М., 1981.7. Фреге Г. Смысл и значение. – В кн.: Фреге. Избр. работы. М., 1997.8. Рассел Б. Исследование значения и истины. М., 1999.9. Теньер, Л. Основы структурного синтаксиса. / Пер. с франц. М.:Прогресс, 1988.— 656 с.10. Мельчук, И.А. Опыт теории лингвистических моделей «Смысл ⇔Текст».
М., 1974 (2-е изд., 1999).11. Евтушенко С.А. Система анализа данных «Concept Explorer».Труды 7-ой Национальной Конференции по ИскусственномуИнтеллекту (КИИ-2000). – Москва. - 2000, С.127-134.15012. Климушкин, М., Четвериков, Д. Исследование американскихполитических блогов на основе анализа формальных понятий.ЗОНТ-09.
- Новосибирск, РИЦ прайс-курьер. – 2009.13. Ильвовский Д. Применение семантически связанных деревьевсинтаксического разбора в задаче поиска ответов на вопросы,состоящие из нескольких предложений. НТИ. Сер.2 - 2014. - № 2. С.28-37.14. Ильвовский Д. А., Черняк Е.
Л. Системы автоматическойобработки текстов. Открытые системы. СУБД. 2014. № 01. С. 5153.15. Ильвовский Д. А., Климушкин М. А. Выявление дубликатовобъектов в прикладных онтологиях на основе методов анализаформальныхпонятий.Вкн.:Сборникдокладов9-ймеждународной конференции ИОИ-2012.
Торус Пресс, 2012.С.625-628.16. ГалицкийБ.А.,ИльвовскийД.A.Выявлениеискаженнойинформации: подход с использованием дискурсивных связей // XVнациональная конференция по искусственному интеллекту смеждународным участием КИИ-2016. Труды конференции. В 3-хтомах. Смоленск: Универсум, 2016, 2, с.23-33.17. Интернет-энциклопедияВикипедияhttps://en.wikipedia.org/wiki/Parse_tree[Интернет-портал].(датаURL:обращения:06.07.2014).18. Интернет-энциклопедияВикипедия[Интернет-портал].URL:https://en.wikipedia.org/wiki/Bag-of-words_model (дата обращения:07.07.2014).15119. Интернет-энциклопедияВикипедия[Интернет-портал]en.wikipedia.org/wiki/Cascading (дата обращения: 07.07.2014).20.
Ананьева М.И., Кобозева М.В. Дискурсивный анализ в задачахобработки естественного языка // Конференция «Информатика,управление и системный анализ», ИУСА, 2016.21. Литвиненко А. О. Описание структуры дискурса в рамках ТеорииРиторической Структуры: применение на русском материале//Труды Международного семинара Диалог. – 2001. – С. 159-168.22. Ontos [сайт].
URL - http://www.ontos.com/?page_id=630 (датаобращения: 07.07.2014).23. The Stanford Natural Language Processing Group [сайт]. URL:http://nlp.stanford.edu/ (дата обращения: 10.07.2014).24. Conexp-clj [сайт]. URL: http://daniel.kxpq.de/math/conexp-clj/ (датаобращения: 10.07.2014).25. Tockit: Framework for Conceptual Knowledge Processing [сайт].URL: http://www.tockit.org (дата обращения: 10.07.2014).26. Ganter B., Wille R. Formal Concept Analysis: MathematicalFoundations. - Berlin: Springer, 1999.27. Maedche, A., Zacharias, V. Clustering Ontology-based Metadata in theSemantic Web.
Proc. of 6th European Conference on Principles of DataMining and Knowledge Discovery. - 2002. - P. 348 – 360.28. Prediger, S. Logical scaling in formal concept analysis. ICCS, LectureNotes in Computer Science. – 1997. - Vol. 1257. Springer. - P. 332341.15229. Merwe, D., Obiedkov, S., Kourie, D. AddIntent: a new incrementalalgorithm for constructing concept lattices. - LNCS, Springer.
– 2004. –P. 205 – 206.30. Kuznetsov, S.O., Obiedkov, S., Roth, С. Reducing the RepresentationComplexity of Lattice-Based Taxonomies. U. Priss, S. Polovina, R.Hill, Eds., Proc. 15th International Conference on ConceptualStructures (ICCS 2007), Lecture Notes in Artificial Intelligence(Springer), Vol. 4604, pp. 241-254, 2007.31. Roth, C., Obiedkov, S., Kourie, D. On Succinct Representation ofKnowledge Community Taxonomies with Formal Concept Analysis.IJFCS (Intl Journal of Foundations of Computer Science). – 2008. – P.383-404.32. Galitsky, B., Ilvovsky, D., Lebedeva, N., Usikov, D.
Improving Trust inAutomation of Social Promotion. 2014 AAAI Spring SymposiumSeries. – 2014.33. Wille, R. Restructuring lattice theory: an approach based on hierarchiesof concepts. - Ordered Sets: Dordrecht/Boston, Reidel. – 1982. - P.445—470.34. Medina, R., Obiedkov, S.A. (eds.). Formal Concept Analysis.
6thInternational Conference, ICFCA 2008, Montreal, Canada. – Springer.– 2008.35. Newman, M.E.J., Strogatz, S., Watts, D. Random graphs with arbitrarydegree distributions and their applications. Phys. Rev. E 64. - 2001.36. Kuznetsov, S.O., Obiedkov, S., Roth, C. Reducing the representationcomplexity of lattice-based taxonomies. 15th Intl Conf on ConceptualStructures, ICCS 2007. - Sheffield, UK.
- LNCS/LNAI. Vol. 4604.Springer. – 2007.15337. Klimushkin, M., Chetverikov, D., Novokreshchenova, A. FormalConcept Analysis of the US Blogosphere during the 2008 PresidentialCampaign. 9th international session of the HSE "Baltic Practice". –Belgium. – 2009.38. Klimushkin, M.A., Obiedkov, S.A., Roth, C.
Approaches to theselection of relevant concepts in the case of noisy data. 8th InternationalConference, ICFCA2010, Morocco. – Springer. – 2010.39. Ilvovsky D. A., Klimushkin M. A. FCA-based Search for DuplicateObjects in Ontologies. in: Proceedings of the Workshop FormalConcept Analysis Meets Information Retrieval / Отв. ред.: S. O.Kuznetsov, C. Carpineto, A. Napoli. Vol.
977: CEUR WorkshopProceeding, 2013.40. Neznanov, A., Ilvovsky, D. A., Kuznetsov, S. FCART: A New FCAbased System for Data Analysis and Knowledge Discovery , in:Contributions to the 11th International Conference on Formal ConceptAnalysis. Dresden: Qucoza, 2013. P. 31-44.41. Neznanov A., Ilvovsky D., Parinov A. Advancing FCA Workflow inFCART System for Knowledge Discovery in Quantitative Data.Procedia Computer Science. 2nd International Conference onInformation Technology and Quantitative Management, ITQM 2014.Vol. 31.
Amsterdam: ELSEVIER, 2014. P. 201-210.42. Kuznetsov, S. O., Strok, F. V., Ilvovsky, D. A., Galitsky, B. ImprovingText Retrieval Efficiency with Pattern Structures on Parse Thickets.Proceedings of the Workshop Formal Concept Analysis MeetsInformation Retrieval. Vol. 977. CEUR Workshop Proceeding, 2013.P. 6-21.15443. Galitsky, B., Ilvovsky, D., Kuznetsov, S. O., Strok, F. Matching sets ofparse trees for answering multi-sentence questions // Proceedings of theRecent Advances in Natural Language Processing, RANLP 2013.