diss005-ilvovsky_AvtoRef (1137205), страница 5
Текст из файла (страница 5)
Применение метода повысило релевантность поискапо сравнению с альтернативными подходами. На нескольких наборахреальных интернет-данных было продемонстрировано, что вычислениесходства между текстами на уровне абзацев (обобщение чащ разбора)позволяет улучшить релевантность поиска по сравнению с использованиемсходства на уровне отдельных предложений и отдельных слов (модель«мешка слов»).3. Реализован численный метод классификации абзацев, использующийпредложенную модель. Было показано, что добавление новых признаков безизменениясхемыэкспериментапозволяетповыситькачествоклассификации, достигаемое при применении существующей модели, неиспользующей дискурсивную информацию.284. Получено таксономическое представление текстовых данных на основерешетки замкнутых структурных описаний.
Показана применимостьполученного представления в задаче кластеризации текстовых абзацев.5. Разработаны новая модель и численный метод поиска тождественныхденотатоввприкладнойонтологиииформальномконтексте,предназначенные для построения дискурсивных отношений «та жесущность»втекстовыхданных.Предложениндекс,позволяющийранжировать формальные понятия по степени уверенности в том, чтообъектыданногопонятиятождественны.Экспериментынасгенерированных и реальных данных показали преимущество передиспользовавшимися ранее альтернативами и высокую точность работынового метода.6. Разработан программный комплекс для работы с текстовыми данными,реализующий предложенные методы и алгоритмы.
Комплекс применен внескольких реальных задачах, связанных с поиском и классификациейтекстовых данных.Публикации по теме диссертацииПубликации в журналах, входящих в перечень ВАК:1. Ильвовский Д., Климушкин М. Выявление дубликатов объектов вприкладных онтологиях с помощью методов анализа формальных понятий.// НТИ, Сер. 2. – 2013. - № 1. - С.10-17, 0.75 п.л. (вклад автора 0.5 п.л.)2. ИльвовскийД.,Применениесемантическисвязанныхдеревьевсинтаксического разбора в задаче поиска ответов на вопросы, состоящие изнескольких предложений.
НТИ. Сер.2 - 2014. - № 2. - С.28-37, 0.9 п.л.3. Ильвовский Д. А., Черняк Е. Л. Системы автоматической обработкитекстов // Открытые системы. СУБД. 2014. № 01. С. 51-53. 0.45 п.л. (вкладавтора 0.3 п.л.)29Прочие публикации:1. Neznanov A., Ilvovsky D. A., Kuznetsov S. FCART: A New FCA-based Systemfor Data Analysis and Knowledge Discovery. Contributions to the 11thInternational Conference on Formal Concept Analysis. Dresden: Qucoza, 2013.P.31-44. 0.6 п.л.
(вклад автора 0.2 п.л.)2. Kuznetsov S. O., Strok F. V., Ilvovsky D. A., Galitsky B. Improving TextRetrieval Efficiency with Pattern Structures on Parse Thickets // Proceedings ofthe FCAIR. Vol. 977. M.: CEUR Workshop Proceeding, 2013. P.6-21. 0.77 п.л.(вклад автора 0.25 п.л.)3. Galitsky B., Ilvovsky D. A., Kuznetsov S. O., Strok F. V. Parse thicketrepresentationsoftextparagraphs//ПоматериаламежегоднойМеждународной конференции «Диалог».
Т.1. Вып. 12 (19). М.: РГГУ, 2013.C. 134-145. 0.73 п.л. (вклад автора 0.2 п.л.)4. Ильвовский Д. А., Климушкин М. А. Выявление дубликатов объектов вприкладных онтологиях на основе методов анализа формальных понятий //Сборник докладов 9-й международной конференции ИОИ-2012. ТорусПресс, 2012. С.625-628. 0.2 п.л. (вклад автора 0.1 п.л.)5. Galitsky B., Ilvovsky D., Kuznetsov S.
O., Strok F. Matching sets of parse treesfor answering multi-sentence questions // Proceedings of the RANLP 2013. –INCOMA Ltd. – 2013. – P. 285–294. 0.8 п.л. (вклад автора 0.3 п.л.)6. Galitsky, B. A., Ilvovsky, D., Kuznetsov, S. O., Strok, F. Finding MaximalCommon Sub-parse Thickets for Multi-sentence Search. // Graph Structures forKnowledge Representation and Reasoning. Springer. – 2014. – P. 39-57. 1.1 п.л.(вклад автора 0.3 п.л.)7. Ilvovsky D. Going beyond sentences when applying tree kernels // Proceedings ofthe Student Research Workshop.‒ ACL 2014.‒ P.
56-63. 0.75 п.л.308. Galitsky B., Ilvovsky D., Kuznetsov S. Rhetoric map of an answer to compoundqueries.‒ ACL-IJCNLP 2015.‒ Vol. 2: Short papers. Beijing: 2015. P. 681-686.0.6 п.л. (вклад автора 0.2 п.л.)9. Galitsky B., Ilvovsky D., Kuznetsov S. O. Text Classification into AbstractClasses Based on Discourse Structure. Proceedings of the RANLP 2015. Hissar:2015. P. 201-207. 0.8 п.л. (вклад автора 0.3 п.л.)10. Galitsky B., Ilvovsky D., Kuznetsov S. Text integrity assessment: Sentimentprofile vs rhetoric structure. 16th International Conference, CICLing 2015, Cairo,Proceedings, Part II.
Vol. 9042. Springer International Publishing, 2015. P.126139. 0.7 п.л. (вклад автора 0.3 п.л.)11. Mahalova T. N., Ilvovsky D., Galitsky B. Pattern structures for news clustering.Proceedings of the International Workshop FCA4AI at IJCAI 2015. BuenosAires: 2015. Ch. 5. P.35-42. 0.6 п.л. (вклад автора 0.2 п.л.)12. Strok F. V., Galitsky B., Ilvovsky D.
Pattern Structure Projections for LearningDiscourse Structures. 16th International Conference, AIMSA 2014, Varna,Bulgaria, 2014. Proceedings. Vol. 8722. L., NY, Dordrecht, Heidelberg, Springer,2014. P.254-260. 0.5 п.л. (вклад автора 0.2 п.л.)31Лицензия ЛР № 020832 от 15 ноября 1993 г.Подписано в печать ___________ 2017 г.Формат 60 х 84/16Бумага офсетная.Печать офсетная.Усл. печ. л. 1Тираж 100 экз. Заказ №______Типография издательстваНационального исследовательского университета – Высшей школыэкономики,125319, г.
Москва, Кочновский проезд, д.3.