2016 Вопросы к КР 1 (1185441)
Текст из файла
Вопросы осень 2016
-
Основные свойства естественного языка
-
Что такое графематический анализ? Что такое лемматизация
-
Как работает словарный морфологический анализ?
-
Как морфологические анализаторы обрабатывают слова, отсутствующие в словаре
-
Что такое постморфологический анализ. Основные методы.
-
Основные понятия информационного поиска
-
Виды поисковых систем по охвату и направленности. Особенности разных типов поисковых систем
-
Особенности научного поиска
-
Основные этапы обработки текстов в поисковой машине
-
Основные этапы обработки запроса в поисковой машине
-
Алгоритм сопоставления запроса с документами (Алгоритм Merge
-
Булевская модель информационного поиска. Преимущества и недостатки булевской модели поиска
-
Как измеряется качество булевского поиска
-
Алгоритм сопоставления запроса с документами (Алгоритм Merge)
-
Векторная модель информационного поиска. Показатели idf и tf.idf.
-
Классическая процедура оценки качества информационно поиска
-
Что такое РОМИП, какие задачи в нем решаются?
-
Кривая полнота-точность. 11-точечный график TREC?
-
Что такое пулинг в информационном поиске? Сложности, связанные с пулингом
-
Оценка качества в поисковых машинах Интернет.
-
Шкалы оценок. Мера NDCG
-
Что такое информационно-поисковые тезаурусы? Зачем они нужны? Где применяются сейчас
-
Назовите методы расширения запросов пользователей при информационном поиске.
-
Алгоритм Роккио для relevance feedback
-
Назовите проблемы расширения запроса при помощи обратной связи по релевантности
-
Вопросно-ответные системы: постановка задачи. основные компоненты, особенности тестирования.
-
Классификация вопросов в вопросо-ответных системах. Типы вопросов и типы ответов
-
Исправление несловарных ошибок на основе применения правила Байеса
-
Исправление ошибок перехода в другое словарное слова на основе применения правила Байса
-
Учет контекста при исправлении ошибок написания
Задачи на следующие темы:
-
Точность, полнота, F-мера – меры качества
-
Мера качества упорядочения: средняя точность
-
Нахождение близости между запросом и документом по векторной модели, языковой модели
-
Мера упорядочения: NDCG
-
Расширение запроса методов relevance feedback.
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.