Диссертация (1137055), страница 2
Текст из файла (страница 2)
Примером являются такиеавторитетные рейтинги как World University Ranking (Times Higher Education),Technology Achievement Index (United Nations) и др.7Понятно, что с дальнейшей дигитализацией общества и накоплениеминформацииразнообразиеовсевозможныхзадачхарактеристикахмногокритериальнойобъектов,стратификацииколичествообъектовибудетнарастать. Достаточно упомянуть такое актуальное направление как развитиерекомендательных систем, будь это выбор кинофильма для просмотра, книги длячтения или университета для обучения.Вместе с тем в литературе отсутствует сколько-нибудь удовлетворительнаяпроработка такой формулировки проблемы многокритериальной стратификации,которая бы позволяла автоматически находить веса критериев и страты толькоисходя из их геометрической структуры.
Это делает актуальной проблему такойавтоматизациизадачимногокритериальнойстратификации,котораябыосновывалась на линейной свёртке критериев и при этом носила модельный, а нечисто эвристический характер.Мы считаем, что следует вести речь о разработке критерия, позволяющегоавтоматическиопределятьсовокупностьпараллельныхгиперплоскостейпространства критериев, которые в основном содержат все рассматриваемыеобъекты.
Эти параллельные гиперплоскости и будут задавать искомые страты. Внекотором смысле такой подход сродни подходу кластер-анализа. Однакопонятие стратификации отличается от понятия кластерного разбиения какминимум в двух аспектах:- Cтраты упорядочены направлением «оси» вектора нормали, а кластеры –нет.- Кластеры формируются как компактные образования вокруг своих«центров», тогда как страты – это «слои» геометрического пространствакритериев, которые могут содержать и достаточно удаленные друг от другаобъекты.Объектомисследованияявляетсяпроблемамногокритериальногоранжированного разбиения, т.е. многокритериальной стратификации.Предметом исследования является разработка и обоснование методикипостроения многокритериальной линейной стратификации.8Цель исследования – разработка и верификация математической модели,численныхметодовикомплексапрограммдлямногокритериальных стратификаций с использованиемформированиялинейной свёрткикритериев.Эта цель предполагает решение следующих задач:1.Разработатьматематическуюмодельпредставлениямногокритериальных вариантов в виде совокупности страт, характеризуемыхзначениями линейной свёртки критериев.2.Провести анализ критерия этой модели с точки зрения его сходства иразличия с другими критериями агрегирования.3.Разработать эффективные численные методы построения (локально)оптимальной линейной стратификации и оценки параметров предложенной модели;4.Провести численные эксперименты для верификации нашей разработкии сравнения ее с другими методами агрегирования критериев, для чего разработатьгенератор «синтетических» стратифицированных данных с учетом различныххарактеристик реальных стратификаций.5.Разработать комплекс программ для реализации и верификациипредложенных методов на реальных и синтетических данных.6.Использоватьразработанныйкомплекспрограммприрешениизначимых практически ориентированных задач многокритериальной стратификации.Методы, использованные в исследовании:1.Методы теории принятия решений, включая правило Борда, границыПарето и др.2.Методы системного анализа, включая ABC-классификацию ресурсови ранжирование по влиянию (Authority ranking).3.Теоретические разработки в области кластер-анализа, включаяаппроксимационную трактовку метода к-средних.4.Численныеоптимизацию.методыоптимизации,включаяквадратичную95.Методы разработки и проведения контролируемого вычислительногоэксперимента.Научная новизна.
В диссертации получен ряд новых научных результатов,выносимых на защиту:1.Предложенааппроксимирующаягеометрическаяданныевмодельвиделинейнойсовокупностистратификации,«параллельных»гиперплоскостей – страт.2.Предложен численный метод ЛинСтрат для формирования линейнойстратификации на основе этой модели с использованием чередующейся иквадратичной оптимизации.3.Предложена методика генерации синтетических данных линейнойстратификации для проведения контролируемых вычислительных экспериментов.4.Разработан комплекс программ для численного решения задачистратификации, генерации синтетических данных и проведения вычислительныхэкспериментов.5.С использованием разработанного математического обеспеченияпроведены расчеты по верификации метода ЛинСтрат на синтетических данных ивыявлены границы его применимости.6.С использованием разработанного математического обеспеченияпроведены расчеты по сравнению метода ЛинСтрат с рядом популярных методовмногокритериального ранжирования на реальных и синтетических данных,доказавшие его сравнительную эффективность.7.Проведен анализ различных компонент научного вклада (научныйуровень результатов, цитируемость, авторитетность) на примере дисциплины«Анализ данных и машинное обучение».Теоретическаязначимостьработысостоитвразработкеновойматематической модели линейной стратификации и численного метода ееидентификации, а также схемы порождения синтетических страт, позволяющейучесть их различные характеристики в численных экспериментах.10Практическая значимость работы заключается в создании комплексапрограмм,реализующегоалгоритмылинейнойстратификацииипредназначенного для решения исследовательских и прикладных задач.
Этоткомплекс программ применен для решения задачи приоритизации базовыхстанций в компании ПАО «МТС».Достоверность и обоснованность полученных результатов подтвержденастрогостьюиспользованныхматематическихмоделейиметодов,вычислительными экспериментами по сравнению результатов примененияразработанных и традиционных методов на конкретных задачах.Апробация работы. Основные результаты работы докладывались наследующих семинарах и конференциях:1.The Second International Conference on Information Technology andQuantitative Management (ITQM-2014), Москва, июнь 2014 г. Доклад на тему: «Aconcept of multicriteria stratification: definition and solution».2.Conference «Optimization, Control, and Applications in the InformationAge», July 2014, Chalkidiki, Greece. Доклад на тему: «Three aspects of the researchimpact by a scientist: measurement methods and an empirical evaluation».3.Conference of the International Federation of Classification Societies,Bologna, Italy, July 2015.
Доклад на тему: «Using taxonomies and aggregate rankingsfor measuring research impact».4.Общемосковскийпостоянныйнаучныйсеминар«Теорияавтоматического управления и оптимизации», Москва, октябрь 2015 г. Доклад натему: «Проблема оценки научного вклада (на примере исследований по анализуданных и машинному обучению».5.Общемосковский научный семинар «Математические методы анализарешений в экономике, бизнесе и политике», Москва, октябрь 2015 г. Доклад натему: «Проблема оценки научного вклада (на примере исследований по анализуданных и машинному обучению)».11Личный вклад.
Автором разработаны:1.Математическаямодельлинейнойстратификациинаосновеаппроксимации данных совокупностью «параллельных» гиперплоскостей – страт.2.Численный метод ЛинСтрат для автоматического формированиялинейной свертки критериев и стратификации на заданное число страт.3.Методикаиалгоритмгенерациисинтетическихлинейнореализующийалгоритмлинейнойстратифицированных данных.4.Комплекспрограмм,стратификации, алгоритм генерации синтетических страт.Автором проведена верификация разработанного метода стратификации нареальных и синтетических данных, а также его сравнение с популярнымиметодами многокритериального ранжирования.
Автор принимал участие впроекте по оценке составляющих научного вклада ученого на основе таксономиипредметнойобласти,вкоторомнапрактикеуспешнобылпримененразработанный алгоритм стратификации. Метод и комплекс программ былиприменены для решения задачи приоритизации базовых станций в компании ПАО«МТС».Содержание работы. Диссертация состоит из введения, четырех глав,заключения, списка литературы из 94 наименований и приложения.Во введении раскрывается актуальности темы исследования.
Ставятся целии задачи исследования. Описывается объект и предмет исследования, а такжетеоретическая значимость и новизна.В первой главе дается общее описание проблемы автоматизациимногокритериальной стратификации. Приводится обзор основных методовранжирования, на основе которых может быть получена стратификация. Даетсяклассификация методов стратификации в зависимости от способа агрегированиякритериев.
Формулируется модель линейных страт и метод стратификации наоснове этой модели. Рассматриваются некоторые особенности и примерыприменения метода линейной стратификации. Проводится сравнение методалинейной стратификации и метода главных компонент.12Во второй главе предлагается алгоритм оптимизации целевой функциимногокритериальной стратификации на основе решения задачи квадратичногопрограммирования.верификацииДляпроведенияалгоритмавычислительныхразработанасхемаэкспериментовгенерациипоискусственныхстратифицированных данных. Эта схема генерации страт позволяет гибкоучитывать такие геометрические аспекты страт как ориентация, толщина, размахи интенсивность.
Предлагаемый алгоритм экспериментально сравнивается ссуществующимиметодамистратификациинаискусственныхданных,ипоказывается его преимущество в большинстве рассмотренных случаев. Также вэтой главе алгоритм стратификации верифицируется на реальных данных –библиометрических показателях научных журналов и стран.
На этих данныхновыйалгоритм приводитк хорошоинтерпретируемым иадекватнымрезультатам. Также оказалось, что на этих данных алгоритм позволяет построитьразбиение, наиболее согласованное с разбиениями построенными по отдельновзятым критериям.Втретьейглавеметодлинейной стратификации применяется впроблематике оценки научного вклада ученого. Рассматриваются три различныхсоставляющие научного вклада.