Диссертация (1137055)
Текст из файла
Федеральное государственное автономное образовательное учреждение высшегообразования«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ«ВЫСШАЯ ШКОЛА ЭКНОМИКИ»На правах рукописиОрлов Михаил АнатольевичРАЗРАБОТКА МОДЕЛИ И МЕТОДА ЛИНЕЙНОЙМНОГОКРИТЕРИАЛЬНОЙ СТРАТИФИКАЦИИСпециальность 05.13.18 – Математическое моделирование, численные методы икомплексы программДиссертация на соискание учёной степеникандидата технических наукНаучный руководитель:доктор технических наук,старший научный сотрудникМиркин Борис ГригорьевичМосква – 20172ОглавлениеВведение ........................................................................................................................... 6Глава 1.
Разработка модели многокритериальной линейной стратификации ........ 151.1.Методы многокритериального ранжирования и способы их применения дляавтоматической стратификации................................................................................... 151.1.1. Использование собственного вектора ............................................................... 181.1.2. Разбиение по Парето ........................................................................................... 191.1.3.
Правило Борда ..................................................................................................... 201.1.4. Модифицированный метод к-средних .............................................................. 211.1.5. Пороговое агрегирование ...................................................................................
221.1.6. Оптимизация линейных весов ........................................................................... 231.2. Модель автоматической линейной многокритериальной стратификации и еесвойства .......................................................................................................................... 231.2.1. Модель и пример линейной стратификации. ................................................... 231.2.2. Аппроксимационная задача формирования линейной комбинации критериев......................................................................................................................................... 261.2.3. Влияние шкалы критериев на веса в задаче линейной многокритериальнойстратификации ...............................................................................................................
271.2.4. Отличие линейной стратификации от задачи кластер анализа ...................... 291.2.5. Отличие линейной стратификации от упорядочения по главной компоненте......................................................................................................................................... 30Выводы по главе 1 .........................................................................................................
34Глава 2. Разработка и экспериментальная верификация алгоритмов линейнойстратификации ............................................................................................................... 3532.1.1. Решение задачи линейной стратификации на основе эволюционногоподхода ........................................................................................................................... 362.1.2. Решение задачи линейной стратификации на основе квадратичнойоптимизации: алгоритм ЛинСтрат .............................................................................. 382.1.3.
Свойства алгоритма ЛинСтрат .......................................................................... 412.2. Организация вычислительных экспериментов по сравнению алгоритмовстратификации и ранжирования .................................................................................. 432.2.1. Методы стратификации, используемые в экспериментах .............................. 432.2.2.
Генерация синтетических данных ..................................................................... 442.2.3. Предобработка реальных данных ...................................................................... 502.2.4. Оценка качества результатов стратификации .................................................. 512.3. Эксперименты по сравнительной оценке методов стратификации насинтетических данных .................................................................................................. 522.3.1. Валидация алгоритма ЛинСтрат на синтетических данных ...........................
522.3.2. Влияние размерности данных ............................................................................ 532.3.3. Влияние количества сгенерированных объектов............................................. 542.3.4. Влияние интенсивностей страт .......................................................................... 552.3.5. Влияние размаха страт........................................................................................
562.3.6. Влияние зашумленности (толщины) страт ....................................................... 582.4. Экспериментальное сравнение методов стратификации и ранжирования нареальных данных ........................................................................................................... 592.4.1. Библиометрические показатели публикационной активности ...................... 602.4.2. Сравнение алгоритмов стратификации на данных о библиометрическихпоказателях академических журналов и стран мира ................................................. 6142.5.
Использование линейной стратификации для приоритизации базовых станций......................................................................................................................................... 68Выводы по главе 2 ......................................................................................................... 72Глава 3. Применение метода ЛинСтрат в проблеме оценки научного вкладаученого (на примере разделов, связанных с анализом данных и машиннымобучением) ..................................................................................................................... 743.1.
Обзор подходов к оценке научного вклада ученых............................................ 753.2. Таксономический ранг ученого ............................................................................ 773.3. Разработка тестовой базы для оценки таксономического ранга ученого ........ 813.3.1. Таксономия разделов, связанных с анализом данных и машиннымобучением....................................................................................................................... 813.3.2.
Формирование выборки ученых и вычисление их таксономических рангов833.3.3. Косвенные характеристики: показатели цитируемости и авторитетности ... 863.4. Агрегированные критерии, соответствующие стратификации и их сравнение......................................................................................................................................... 90Выводы по главе 3 .........................................................................................................
94Глава 4. Комплекс программ, реализующий методы формированиястратификации, и полигон для их экспериментального сравнения ......................... 964.1. Программная реализация алгоритмов решения задачи линейнойстратификации ............................................................................................................... 964.2.
Программы для генерирования синтетических стратифицированных данных......................................................................................................................................... 994.3. Комплекс программ для проведения вычислительных экспериментов посравнению методов стратификации и ранжирования ............................................. 1014.4. Сравнение программных реализаций алгоритмов по вычислительнойпроизводительности ....................................................................................................
1035Выводы по главе 4 ....................................................................................................... 105Заключение .................................................................................................................. 107Список литературы ..................................................................................................... 109Приложение. Таксономия разделов, связанных с анализом данных и машиннымобучением, по классификации ACM CCS 2012 .......................................................
1186ВведениеАктуальность темы. Выбор из имеющихся альтернатив по многимкритериям – одна из основных операций при принятии решений. Несложнопредставить ситуации, в которых приходится осуществлять одновременно какразбиение, так и ранжирование, то есть выделять упорядоченные однородныегруппы вариантов. Примером может служить разбиение фирм на группы поуровню риска банкротства или стран по уровню кредитного риска [1].Представление множества альтернатив в виде упорядоченных друг относительнодруга классов, с одной стороны, позволяет более компактно представить данные,с другой может служить источником информации при выборе вариантов.
Другиепримеры подобных задач:- ранжирование университетов по уровню преподавания и научныхразработок [2, 3, 4];- ранжирование академических журналов по уровню цитируемости (сразбиением на квартили) [4, 5, 6, 7];- многокритериальная ABC классификация ресурсов [8, 9, 10];- ранжирование стран по уровню инноваций [11] и др.Необходимость использования ранжированных разбиений возникает нетолько в задачах принятия решений, но и в других областях. Например, всоциологии рассматривается так называемая социальная стратификация [22]населения на классы по уровню богатства/бедности; а в минералогии –стратификация пород по уровню залегания [12]. Поэтому удобно называтьранжированное разбиение стратификацией [13].В большинстве приведенных задач стратификации рассматриваемыекритерии сводятся воедино путем вычисления среднего или средневзвешенногосреднего, причем веса критериев определяются экспертным путем, «вручную»,либо же с помощью эвристической процедуры.
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.