Для студентов СПбПУ Петра Великого по предмету ДругиеПоиск и использование шаблонов последовательных событий при анализе логовПоиск и использование шаблонов последовательных событий при анализе логов
2024-07-252024-07-25СтудИзба
ВКР: Поиск и использование шаблонов последовательных событий при анализе логов
Описание
Оглавление
3
Введение
Уже в течение многих лет неуклонно растет интерес к методам обнаружения знаний в базах данных (knowledge discovery in databases). Объемы современных баз данных, которые весьма внушительны, вызвали устойчивый спрос на новые масштабируемые алгоритмы анализа данных. Одним из популярных и весьма актуальных методов обнаружения знаний являются алгоритмы поиска шаблонов последовательных событий (sequential pattern mining или SPM).
Использование шаблонов позволяет находить закономерности между связанными во времени событиями.
Одним из примеров области применения таких знаний может послужить интернет-торговля. Поиск наиболее частых последовательностей покупок позволяет получить информацию о том, через какой промежуток времени после покупки товара “А” человек наиболее склонен купить товар “Б”, или в какой последовательности приобретаются товары. Получаемые закономерности в действиях покупателей можно использовать для персонализации клиентов, формирования более выгодного предложения, стимулирования продаж определенных товаров или управления запасами.
Другим примером области применения задачи SPM может послужить веб-аналитика. Зная наиболее популярные последовательности переходов по страницам, можно размещать на соответствующих страницах определенный контент или изменить структуру сайта с целью более быстрого и удобного доступа к некоторым страницам. Подобный анализ сайтов обычно требует больших денежных затрат (в случае привлечения сторонних организаций), либо наличия эксперта в данной области, поскольку свободные решения
4
(Яндекс.Метрика, Google
Введение ....................................................................................... | 4 | |||
1 | . Постановка задачи ................................................................... | 6 | ||
2 | . Обзор существующих решений задачи SPM ............................ | 7 | ||
2 | .1. Формальное описание задачи SPM ........................................ | 7 | ||
2 | .2 | . Алгоритмы вида «candidate generate-and-test» ..................... | 10 | |
2 | .3 | . Алгоритмы вида «pattern-growth»…...…………………….... ...27 | ||
2 | .4 | . Итоги обзора………………………………………………………. 30 | ||
3 | . Реализация и сравнительный анализ выбранных алгоритмов | |||
решения задачи SPM ................................................................... | 32 | |||
4 | . Описание механизма определения типов журналов .............. | 40 | ||
5 | . Выбранные алгоритмы и результаты их работы в проекте | |||
GDLogTool ................................................................................... | 48 | |||
5 | .1 | . Описание проекта GDLogTool ............................................. | 48 | |
5.2. Применение выбранных алгоритмов и результатов их работы | ||||
в проекте GDLogTool .................................................................... | 52 | |||
Заключение .................................................................................. | 56 | |||
Список литературы ..................................................................... | 58 |
3
Введение
Уже в течение многих лет неуклонно растет интерес к методам обнаружения знаний в базах данных (knowledge discovery in databases). Объемы современных баз данных, которые весьма внушительны, вызвали устойчивый спрос на новые масштабируемые алгоритмы анализа данных. Одним из популярных и весьма актуальных методов обнаружения знаний являются алгоритмы поиска шаблонов последовательных событий (sequential pattern mining или SPM).
Использование шаблонов позволяет находить закономерности между связанными во времени событиями.
Одним из примеров области применения таких знаний может послужить интернет-торговля. Поиск наиболее частых последовательностей покупок позволяет получить информацию о том, через какой промежуток времени после покупки товара “А” человек наиболее склонен купить товар “Б”, или в какой последовательности приобретаются товары. Получаемые закономерности в действиях покупателей можно использовать для персонализации клиентов, формирования более выгодного предложения, стимулирования продаж определенных товаров или управления запасами.
Другим примером области применения задачи SPM может послужить веб-аналитика. Зная наиболее популярные последовательности переходов по страницам, можно размещать на соответствующих страницах определенный контент или изменить структуру сайта с целью более быстрого и удобного доступа к некоторым страницам. Подобный анализ сайтов обычно требует больших денежных затрат (в случае привлечения сторонних организаций), либо наличия эксперта в данной области, поскольку свободные решения
4
(Яндекс.Метрика, Google
Характеристики ВКР
Предмет
Учебное заведение
Семестр
Просмотров
1
Размер
1,07 Mb
Список файлов
ПОИСК И ИСПОЛЬЗОВАНИЕ ШАБЛОНОВ ПОСЛЕДОВАТЕЛЬНЫХ СОБЫТИЙ ПРИ АНАЛИЗЕ ЛОГОВ.doc