Диссертация (Исследование и разработка методов автоматической кластеризации интернет-пользователей и интернет-ресурсов для персонализации поиска)
Описание файла
Файл "Диссертация" внутри архива находится в папке "Исследование и разработка методов автоматической кластеризации интернет-пользователей и интернет-ресурсов для персонализации поиска". PDF-файл из архива "Исследование и разработка методов автоматической кластеризации интернет-пользователей и интернет-ресурсов для персонализации поиска", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ «МЭИ» . Не смотря на прямую связь этого архива с НИУ «МЭИ» , его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст из PDF
Федеральное государственное бюджетное образовательное учреждение высшегопрофессионального образования«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ «МЭИ»На правах рукописиЗейн Али НажиИССЛЕДОВАНИЕ И РАЗРАБОТКА МЕТОДОВ АВТОМАТИЧЕСКОЙКЛАСТЕРИЗАЦИИ ИНТЕРНЕТ-ПОЛЬЗОВАТЕЛЕЙ И ИНТЕРНЕТРЕСУРСОВ ДЛЯ ПЕРСОНАЛИЗАЦИИ ПОИСКАСпециальность 05.13.11 –Математическое и программное обеспечение вычислительных машин,комплексов и компьютерных сетейДиссертация на соискание учёной степеникандидата технических наукНаучный руководителькандидат технических наукдоцент Мороховец Ю.Е.Москва 20142ОГЛАВЛЕНИЕВВЕДЕНИЕ......................................................................................................................61.
АНАЛИЗ СУЩЕСТВУЮЩИХ МЕТОДОВ КЛАССИФИКАЦИИИНТЕРНЕТ-ПОЛЬЗОВАТЕЛЕЙ И ИНТЕРНЕТ-РЕСУРСОВ,ПРИМЕНЯЕМЫХ ДЛЯ ПЕРСОНАЛИЗАЦИИ ПОИСКА.......................................191.1. Примеры использования информации о пользователях и ихактивности в социальных сетях для решения задач персонализации......................191.2. Методы некластерной классификации Интернет-пользователейи Интернет-ресурсов.....................................................................................................241.3. Кластерные методы классификации Интернет-пользователейи Интернет-ресурсов.....................................................................................................341.4.
Математические модели кластерных методов – иерархические иитерационные алгоритмы кластеризации...................................................................381.5. Основные результаты и выводы по первой ........................................................402. ЛИНГВИСТИЧЕСКИЙ АНАЛИЗ ЗАПРОСОВ ИНТЕРНЕТ-ПОЛЬЗОВАТЕЛЕЙИ ТЕКСТОВ ИНТЕРНЕТ-РЕСУРСОВ........................................................................422.1. Методы анализа содержания текста.....................................................................422.2. Лингвистическая обработка запросов Интернет-пользователейи текстов Интернет-ресурсов.......................................................................................452.3.
Основные результаты и выводы по второй главе...............................................503. РАЗРАБОТКА МЕТОДОВ КЛАСТЕРИЗАЦИИ ИНТЕРНЕТОБЪЕКТОВ С ДИНАМИЧЕСКИМИ КОМПОНЕНТАМИ......................................513.1. Динамические изменения в кластерной структуре Интернет-объектов……...513.2. Переход от динамической к статической кластеризациис применением числовых коэффициентов усиления................................................613.3. Трёхтактная кластеризация Интернет-ресурсов с применениемDOM-фильтрации.........................................................................................................703.4.
Выбор методов кластеризации Интернет-пользователей и Интернет-ресурсов,3прошедших DOM-фильтрацию ...................................................................................803.5. Основные результаты и выводы по третьей главе..............................................824. ОБОБЩЁННОЕ МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ ИНТЕРНЕТ-ОБЪЕКТОВИ ЕГО ПРИМЕНЕНИЕ В КЛАСТЕРНОМ АНАЛИЗЕ ДЛЯ ПЕРСОНАЛИЗАЦИИПОИСКА........................................................................................................................834.1. Метод экспериментального исследования модели графов длякомбинированной кластеризации................................................................................834.2.
Метод экспериментального исследования модели графов для обобщённойкластеризации................................................................................................................884.3. Результаты экспериментального сравнения методовкомбинированной и обобщённой кластеризации.......................................................914.4.
Основные результаты и выводы по четвертой главе........................................1025. РЕАЛИЗАЦИЯ МЕТОДОВ КЛАСТЕРИЗАЦИИ ИНТЕРНЕТПОЛЬЗОВАТЕЛЕЙ И ИНТЕРНЕТ-РЕСУРСОВ В СИСТЕМАХПЕРСОНАЛИЗАЦИИ ПОИСКА...............................................................................1045.1.
Концепция построения корпоративной системы персонализации Интернетпоиска...........................................................................................................................1045.2. Структуризация данных о поисковой активности Интернетпользователей...............................................................................................................1085.3. Структуризация данных о содержании Интернет-ресурсов............................1185.4. Описание программных модулей internet_res_search иie_analyzer.....................................................................................................................1235.5. Описание программного модуля HTMLDocDom...............................................1295.6.
Подсистема кластерного анализа и классификации Интернет-пользователей иИнтернет-ресурсов......................................................................................................1325.7. Экспериментальные исследования и оценка результатов................................1415.8. Основные результаты и выводы по пятой главе...............................................157ЗАКЛЮЧЕНИЕ............................................................................................................159СПИСОК СОКРАЩЕНИЙ И ТЕРМИНОВ………..................................................164СПИСОК ЛИТЕРАТУРЫ …………………………..................................................1684СПИСОК ИЛЛЮСТРАТИВНОГО МАТЕРИАЛА………………………………..176ПРИЛОЖЕНИЕ 1. ИСХОДНЫЙ SQL-КОД КЛАСТЕРИЗАЦИИ МЕТОДАМИ TFи TF-DOM.....................................................................................................................182ПРИЛОЖЕНИЕ 2.
МЕРЫ БЛИЗОСТИ.....................................................................185ПРИЛОЖЕНИЕ 3. АНАЛИЗ МЕТОДОВ КЛАСТЕРИЗАЦИИИНТЕРНЕТ-ПОЛЬЗОВАТЕЛЕЙ И ИНТЕРНЕТ-РЕСУРСОВ................................188П.1. Математическое описание Интернет-пользователейи их дивизивная кластеризация.................................................................................188П.2.
Агломеративная кластеризация Интернет-пользователей.............................193П.3. Математическое описание Интернет-ресурсови их кластеризация методом k-средних....................................................................197П.4. Кластеризация Интернет-ресурсов методом Форель……..............................206ПРИЛОЖЕНИЕ 4. РЕАЛИЗАЦИЯ КОМБИНИРОВАННОЙ И ОБОБЩЕННОЙКЛАСТЕРИЗАЦИИ С ПОМОЩЬЮ SQL-СКРИПТА……….................................214ПРИЛОЖЕНИЕ 5. РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯПРИМЕНЕНИЯ МЕТОДОВ КОМБИНИРОВАННОЙ ИОБОБЩЕННОЙ КЛАСТЕРИЗАЦИИ ......................................................................218ПРИЛОЖЕНИЕ 6.
ИСХОДНЫЙ КОД ПРОГРАММНОГОМОДУЛЯ internet_res_search....................................................................................223ПРИЛОЖЕНИЕ 7. ИСХОДНЫЙ КОД ПРОГРАММНОГОМОДУЛЯ ie_analyzer.................................................................................................228ПРИЛОЖЕНИЕ 8. ИСХОДНЫЙ КОД ПРОГРАММНОГОМОДУЛЯ АС КИПР....................................................................................................239ПРИЛОЖЕНИЕ 9. SQL-СКРИПТЫ СОЗДАНИЯ КОМПОНЕНТОВБД InternetDB...............................................................................................................253ПРИЛОЖЕНИЕ 10. ТАБЛИЦА СООТВЕТСТВИЯ КОДИРОВАННЫХСИМВОЛОВ В ПОИСКОВЫХ СИСТЕМАХ RU-НЕТА........................................264ПРИЛОЖЕНИЕ 11.
ИСХОДНЫЙ КОД ПРОГРАММОГО МОДУЛЯHTMLDocDom..............................................................................................................265ПРИЛОЖЕНИЕ 12. ПРОЦЕДУРЫ КЛАСТЕРНОГО АНАЛИЗА,5РЕАЛИЗОВАННЫЕ В СРЕДЕ MS SQL Server 2012................................................274ПРИЛОЖЕНИЕ 13. АКТ О ВНЕДРЕНИИ РЕЗУЛЬТАТОВРАБОТЫ.......................................................................................................................3036ВВЕДЕНИЕИнтернет в 21-ом веке является неотъемлемой частью повседневной жизни.Экономическая, социальная и научная деятельность человечества в той или инойстепени связана с Интернет-технологиями.