Курсовая работа: Отслеживание взаимосвязей событий в новостном потоке
Описание
Содержание
2
Введение
Несомненно, отличительной особенностью современного мира явля-ется постоянно увеличивающийся поток информации, непрерывно посту-пающей из разных источников. Одной из важных частей этого являются новости, которые приходит из разных источников, включая как традици-онные СМИ, например, газеты, радио и телевидение, так и современные источники, такие как различные новостные сайты и социальные медиа. Отличительной особенностью является то, что в случае с социальными се-тями авторами новостной повестки дня служат сами пользователи. Одна-ко, парадоксальность ситуации заключается в том, что рост количества информации ведет к затруднению ее использования и снижению общего уровня информированности. Ведь увеличение темпов производства инфор-мации ведет, к так называемому, информационному шуму. В подобной си-туации возникает необходимость структурирования информации. Обобще-ние больших информационных потоков, которые непрерывно генерируют-ся в средствах масс-медиа, требует новых подходов к их обработке. Кроме этого, есть еще несколько причин для развития данной области:
• акцентирование внимания на некоторых аспектах про какое-либо про-исшествие;
Методы структурирования информации разнообразны. Причиной этого яв-ляется множество способов ее представления и организации. В зависимости от целей, применяются различные технологии и методы структурирования.[13] Целью структурирования данных является выделение ключевых элемен-тов из массива информации, а также логики взаимосвязанности этих эле-ментов. Результатом такого упрощения является удобство
| Введение ................................. | 3 | ||
| Постановказадачи........................... | 5 | ||
| Обзорлитературы ........................... | 7 | ||
| Глава 1. | Существующиерешения.................. | 9 | |
| 1.1. | Общиеконцепции....................... | 9 | |
| 1.2. | Тематическое моделирование . . . . . . . . . . . . . . . . . | 9 | |
| 1.2.1 | Вероятностный латентный семантический анализ . . | 11 | |
| 1.2.2 | Латентное размещение Дирихле . . . . . . . . . . . . | 11 | |
| 1.3. | Дистрибутивная семантика . . . . . . . . . . . . . . . . . . | 12 | |
| 1.3.1 | Латентно-семантический анализ (ЛСА) . . . . . . . . | 13 | |
| Глава 2. | Построение математической модели . . . . . . . . . . | 15 | |
| 2.1. | Основныепонятия....................... | 15 | |
| 2.2. | Критерии наличия взаимосвязей . . . . . . . . . . . . . . . | 15 | |
| 2.3. | Векторныемодели....................... | 17 | |
| 2.4. | Функциисходства....................... | 18 | |
| 2.5. | Временнаязависимость.................... | 19 | |
| 2.6. | Удаление слабых зависимостей . . . . . . . . . . . . . . . | 21 | |
| 2.7. | Удаление сквозных зависимостей . . . . . . . . . . . . . . | 22 | |
| Глава 3. | Практическая реализация . . . . . . . . . . . . . . . . . | 23 | |
| 3.1. | Описаниедатасета....................... | 23 | |
| 3.2. | Программныекомпоненты . . . . . . . . . . . . . . . . . . | 23 | |
| 3.3. | Ход программной реализации . . . . . . . . . . . . . . . . | 26 | |
| 3.4. | Полученныерезультаты ................... | 28 | |
| Выводы .................................. | 31 | ||
| Заключение................................ | 32 | ||
| Списоклитературы .......................... | 33 | ||
| | | | |
2
Введение
Несомненно, отличительной особенностью современного мира явля-ется постоянно увеличивающийся поток информации, непрерывно посту-пающей из разных источников. Одной из важных частей этого являются новости, которые приходит из разных источников, включая как традици-онные СМИ, например, газеты, радио и телевидение, так и современные источники, такие как различные новостные сайты и социальные медиа. Отличительной особенностью является то, что в случае с социальными се-тями авторами новостной повестки дня служат сами пользователи. Одна-ко, парадоксальность ситуации заключается в том, что рост количества информации ведет к затруднению ее использования и снижению общего уровня информированности. Ведь увеличение темпов производства инфор-мации ведет, к так называемому, информационному шуму. В подобной си-туации возникает необходимость структурирования информации. Обобще-ние больших информационных потоков, которые непрерывно генерируют-ся в средствах масс-медиа, требует новых подходов к их обработке. Кроме этого, есть еще несколько причин для развития данной области:
- получение новых знаний по определенному новостному событию;
- необходимость систематизации и упорядочивания знаний;
• акцентирование внимания на некоторых аспектах про какое-либо про-исшествие;
- представление информации в более наглядном и понятном виде.
Методы структурирования информации разнообразны. Причиной этого яв-ляется множество способов ее представления и организации. В зависимости от целей, применяются различные технологии и методы структурирования.[13] Целью структурирования данных является выделение ключевых элемен-тов из массива информации, а также логики взаимосвязанности этих эле-ментов. Результатом такого упрощения является удобство
Характеристики курсовой работы
Учебное заведение
Семестр
Просмотров
1
Размер
426,5 Kb
Список файлов
Отслеживание взаимосвязей событий в новостном потоке.doc
Комментарии
Нет комментариев
Стань первым, кто что-нибудь напишет!
МГУ им. Ломоносова
Tortuga










