Главная » Все файлы » Просмотр файлов из архивов » PDF-файлы » Тезаурусы в задачах информационного поиска. Лукашевич (2010)

Тезаурусы в задачах информационного поиска. Лукашевич (2010) (Тезаурусы в задачах информационного поиска. Лукашевич (2010).pdf), страница 2

PDF-файл Тезаурусы в задачах информационного поиска. Лукашевич (2010) (Тезаурусы в задачах информационного поиска. Лукашевич (2010).pdf), страница 2 Анализ текстовых данных и информационный поиск (63259): Книга - 10 семестр (2 семестр магистратуры)Тезаурусы в задачах информационного поиска. Лукашевич (2010) (Тезаурусы в задачах информационного поиска. Лукашевич (2010).pdf) - PDF, страница 2 (6322020-08-25СтудИзба

Описание файла

PDF-файл из архива "Тезаурусы в задачах информационного поиска. Лукашевич (2010).pdf", который расположен в категории "". Всё это находится в предмете "анализ текстовых данных и информационный поиск" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .

Просмотр PDF-файла онлайн

Текст 2 страницы из PDF

Единицы тезауруса: понятия и их текстовые входы16.1.Понятия vs. синсеты как единицы тезауруса16.2.Имя понятия и толкование16.3.Ввод понятий для группы близких по смыслу слов16.4.Ввод понятий для группы близких значений одного слова16.4.1.Принципы разделения значений в тезаурусе РуТез16.4.3.Описание отношений между значениями многозначного слова вонтологии для автоматической обработки текстов16.5.Словосочетания как источники понятий в лингвистическойонтологии2232232242252292292032042042052052082122122122152162182212222312337Принципы, предлагаемые для отбора словосочетаний длявключения в словари систем автоматической обработки текстов16.5.2.Ввод понятий тезауруса РуТез на основе значений многословныхвыражений16.5.2.1.

Существует и важно16.5.2.2. Словосочетание имеет «интересные» синонимы16.5.2.3. Отношения, которые не следуют из структуры словосочетания16.5.2.4. Достройка уровней тезауруса16.5.2.5. Словосочетание однозначно, а его компоненты многозначны16.5.2.6. Ввод понятия на основе сочинительной конструкции16.5.2.7. Перестановка слов ведет к разным понятиям16.6.Языковые выражения как текстовые входы понятий16.6.1.Типы онтологических синонимов16.6.2.Формирование синонимического ряда понятия16.6.3.Словосочетания, синонимичные отдельным словам16.6.4.Описание многозначности языковых единиц в тезаурусе РуТезЗаключение к главе 1616.5.1.235236236237237237238238239239240242243245246Глава 17.

Отношения между понятиями в тезаурусе РуТез17.1.Принципы описания отношений17.2.Описание родовидовых отношений в тезаурусе РуТез17.2.1.Принципы описания родовидовых отношений17.2.2.Принципы описания ролевых отношений в Тезаурусерусского языка РуТез17.3.Отношение ЧАСТЬ-ЦЕЛОЕ17.3.1.Принципы описания отношения17.3.2.Транзитивность отношения17.3.3.Как описать отношение ЧАСТЬ-ЦЕЛОЕ, если часть неявляется зависимой17.3.4.Сложные случаи описания отношений ЧАСТЬ-ЦЕЛОЕ17.4.Отношение онтологической зависимости в тезаурусе РуТез17.4.1.Влияние типа отношения онтологической зависимости накачество информационного поиска при расширении запроса17.4.2.Критерии установления отношения онтологической зависимости втезаурусе РуТез17.4.3.Свойства несимметричной ассоциации17.5.Симметричные ассоциации в тезаурусе РуТез17.6.Модификаторы отношений: нарушение условий надежности17.7.Примеры описания отношений17.7.1.Типовые примеры описания отношений17.7.2.Описание отношений между ролевыми понятиями и понятиямиконтекста17.8.Тезаурус РуТез как структураЗаключение к главе 17Заключение к части 4248249250250ЧАСТЬ 5.

ТЕЗАУРУС РУТЕЗ В КОМПЬЮТЕРНЫХ ПРИЛОЖЕНИЯХГлава 18. Построение тезаурусного индекса, автоматическое разрешениелексической многозначности18.1.Построение тезаурусного индекса и тезаурусной проекции18.2.Автоматическое разрешение многозначности18.2.1.Метод глобального подтверждения2728250253253256257258258259261262262263264264266268269270273273275275Метод взвешивания подтверждения от локального и глобальногоконтекстов18.2.2.1.

Учет локального и глобального контекста18.2.2.2. Семантическая близость понятий как функция от особенностей путиотношений между ними18.2.2.3. Числовая оценка семантической близости18.2.2.4. Этапы алгоритма18.3.Организация тестирования алгоритмов разрешения многозначности18.3.1.Тестирование алгоритмов разрешения многозначности на основеОбщественно-политического тезауруса18.3.2.Тестирование алгоритма разрешения многозначности на запросахиз правовой области18.3.3.Тестирование алгоритма разрешения многозначности поТезаурусу РуТезЗаключение к главе 1818.2.2.Глава 19.

Общественно-политический тезаурус как средство построениятематического представления текста19.1.Проблемы автоматического построения лексических цепочек19.1.1.Субъективность выделения лексических цепочек19.1.2.Построение лексических цепочек с учетом ситуативных отношений19.2.Автоматическое построение тематического представления текста19.2.1.Лексические цепочки и тематическая структура текста19.2.2.Примеры разбора лексических цепочек с учетом тематическойструктуры текста19.2.3.Автоматическое построение тематических узлов19.2.3.1.

Алгоритм построения тематических узлов19.2.4.Определение статуса тематического узла19.2.5.Порождение тематических узлов на основе мультиграфа19.2.6.Тестирование качества построения тематических узловЗаключение к главе 19Глава 20. Информационный поиск с учетом тезаурусных знаний20.1.Концептуальный индекс, веса понятий и отношений20.2.Общественно-политический тезаурус как поисковое средство вУниверситетской информационной системе РОССИЯ20.3.Тестирование эффективности информационного поиска наоснове Тезауруса20.4.Тезаурус и векторная модель в задаче поиска по коллекциинормативно-правовых актов РОМИП20.5.Использование комбинированных моделей для поиска документовпо запросам типа «формулировка проблемы» в правовой области20.5.1.Особенность задачи20.5.2.Алгоритм Феноменологическая модель20.5.2.1.

Обработка исходной формулировки вопроса20.5.2.2. Построение формулы описания формулировки запроса20.5.2.3. Применение феноменологической моделиЗаключение к главе 20Глава 21. Общественно-политический тезаурус как ресурс дляавтоматической рубрикации текстов21.1.Технология автоматического рубрицирования2772772782792802812822832832842852852852862882882902922932962982982993003003013053073093093113113123143153163169Описание смысла рубрики понятиями тезаурусаАвтоматическое рубрицирование на тематическом представленииИспользование информеров при решении задач классификацииЭксперимент по автоматической рубрикации текстов в рамкахсеминара РОМИП 200721.6.Тезаурус как база для методов машинного обучения в рубрикации.Метод ПФАЗаключение к главе 21.21.2.21.3.21.4.21.5.Глава 22. Общественно-политический тезаурус иавтоматическое аннотирование22.1.Автоматическое аннотирование одного текста на основетематического представления22.2.Построение структурной тематической аннотации текста22.3.Построение аннотации для новостного кластера на основетематического представления текстов кластера22.3.1.Построение тематического представления для новостного кластера22.3.2.Метод построение аннотации новостного кластера потематическому представлению кластера22.3.3.Тестирование предложенной модели аннотации новостного кластера22.3.3.Оценка качества аннотаций новостных кластеров22.3.3.1.

Тестирование аннотаций новостных кластеров методом ROUGE22.3.3.2. Тестирование аннотаций новостных кластеров Методом Пирамид22.3.3.3. Оценка связности аннотаций новостных кластеровЗаключение к главе 22ЧАСТЬ 6. РАЗВИТИЕ ТЕЗАУРУСА РУТЕЗ И РЕСУРСЫ,ОСНОВАННЫЕ НА ТЕЗАУРУСЕ РУТЕЗГлава 23.

Развитие и пополнение тезауруса РуТез23.1.Этапы развития тезауруса РуТез23.2.Первичное наполнение Общественно-политического тезауруса23.3.Пополнение тезауруса в результате работы вкомпьютерных приложениях23.4.Пополнение тезауруса на основе анализа спискарусскоязычных лемм23.5.Пополнение Общественно-политического тезауруса за счетпроникновения в профессиональные области23.6.Тезаурус РуТез: Создание двуязычной онтологииЗаключение к главе 23Глава 24. Онтология по естественным наукам и технологиям24.1.Проблемы разработки онтологии в сфере естественных наук24.2.Этапы создания онтологии ОЕНТ24.2.1.Автоматический набор терминологии по текстам24.2.2.Автоматизированное формирование первой версии онтологии24.2.3.Методология работы экспертов24.3.Текущее состояние проекта24.4.Изменения в описаниях понятий, полученных из Тезауруса РуТез24.4.1.Удаление текстовых входов понятия24.4.2.Замена отношений между понятиями онтологии-прототипана более длинные цепочки отношений10316318319321323324325325328328328330334335336337338338340341341342344345345345350351351352352353354354356357357Несоответствие наивной, бытовой картины мира инаучной картины мира24.4.4.Смена антропоцентрической картины мира на естественнонаучнуюкартину мира24.4.5.Пример24.4.6.Будущее развитие Онтологии ОЕНТЗаключение к главе 2424.4.3.ЗАКЛЮЧЕНИЕЛитература35835835936236336436711ВведениеОбласть современного информационного поиска чрезвычайно разнообразна.

Онавключает такие задачи, как собственно поиск информации, фильтрация, рубрикация икластеризация документов, поиск ответов на вопросы, автоматическое аннотированиедокумента и группы документов, поиск похожих документов и дубликатов,сегментирование документов и многое другое. Когда подобные операции выполняетчеловек, ему необходимо выявить основное содержание документа, его основную тему иподтемы, и для этого обычно используется большой объем знаний о языке, мире,организации связного текста.Абсолютноподавляющеечислосовременныхметодовобработкинеструктурированной информации решают эти задачи на основе минимальныхдополнительных предварительных знаний и базируются на моделях текста как набораслов (―bag of words‖), предлагая изощренные методы учета частотностей встречаемостислов в предложении, тексте, наборе документов, совместной встречаемости слов и т.п.Пословные модели не учитывают такие языковые явления как синонимия,многозначность, существование лексических отношений между словами.Недостаток лингвистических и онтологических знаний (знаний о мире),используемых в приложениях информационного поиска и автоматической обработкитекстов, приводит к разнообразным проблемам.

Нехватка знаний приводит кнерелевантному поиску в тех случаях, если способы формулировки запросов отличаютсяот способов описания релевантных ситуаций в документах. Эта проблема усугубляетсяпри обработке длинных запросов, при поиске ответов на вопросы в вопросно-ответныхсистемах, а также при поиске информации в специализированных поисковых системах, вкоторых содержится значительно меньшее число документов, чем в Интернет.

Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5285
Авторов
на СтудИзбе
418
Средний доход
с одного платного файла
Обучение Подробнее