Автореферат (Разработка модели и метода линейной многокритериальной стратификации)
Описание файла
Файл "Автореферат" внутри архива находится в папке "Разработка модели и метода линейной многокритериальной стратификации". PDF-файл из архива "Разработка модели и метода линейной многокритериальной стратификации", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ ВШЭ. Не смотря на прямую связь этого архива с НИУ ВШЭ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст из PDF
На правах рукописиОрлов Михаил АнатольевичРАЗРАБОТКА МОДЕЛИ И МЕТОДА ЛИНЕЙНОЙМНОГОКРИТЕРИАЛЬНОЙ СТРАТИФИКАЦИИСпециальность 05.13.18 – Математическое моделирование, численныеметоды и комплексы программАвторефератдиссертации на соискание учёной степеникандидата технических наукМосква – 2017Общая характеристика работыАктуальность темы. Выбор из имеющихся альтернатив по многимкритериям – одна из основных операций при принятии решений.
Несложнопредставить ситуации, в которых приходится осуществлять одновременно какразбиение, так и ранжирование, то есть выделять упорядоченные однородныегруппы вариантов. Примером может служить разбиение фирм на группы по уровнюриска банкротства или стран по уровню кредитного риска. Представлениемножества альтернатив в виде упорядоченных друг относительно друга классов, содной стороны, позволяет более компактно представить данные, с другой – можетслужить источником информации при выборе вариантов. Другие примерыподобных задач:- ранжирование университетов по уровню преподавания и научныхразработок;- ранжирование академических журналов по уровню цитируемости (сразбиением на квартили);- многокритериальная ABC-классификация ресурсов;- ранжирование стран по уровню инноваций и др.Необходимость использования ранжированных разбиений возникает нетолько в задачах принятия решений, но и в других областях.
Например, всоциологии рассматривается так называемая социальная стратификация населенияна классы по уровню дохода; а в минералогии – стратификация пород по уровнюзалегания. Поэтому удобно называть ранжированное разбиение стратификацией.В большинстве практических задач многокритериальной стратификациирассматриваемые критерии сводятся воедино путем вычисления средневзвешенныхзначений, причем веса критериев определяются экспертным путем, «вручную»,либо же с помощью эвристической процедуры. Примером являются такиеавторитетные рейтинги, как World University Ranking (Times Higher Education),Technology Achievement Index (United Nations) и др.
Понятно, что с дальнейшей3дигитализациейобществаинакоплениеминформацииовсевозможныххарактеристиках объектов количество и разнообразие задач многокритериальнойстратификации объектов будет нарастать. Достаточно упомянуть такое актуальноенаправление, как развитие рекомендательных систем, будь это выбор кинофильмадля просмотра, книги для чтения или университета для обучения.Вместе с тем в литературе отсутствует сколько-нибудь удовлетворительнаяформализацияпроблемымногокритериальнойстратификации,котораябыпозволяла автоматически находить и веса критериев, и сами страты исходя толькоиз геометрической структуры данных. Это делает актуальной проблему такойавтоматизации задачи многокритериальной стратификации, которая основываласьбы на линейной свертке критериев и при этом носила модельный, а не чистоэвристический характер.Мы считаем, что следует вести речь о разработке критерия, позволяющегоавтоматическиопределятьсовокупностьпараллельныхгиперплоскостейпространства критериев, которые в основном содержат все рассматриваемыеобъекты.
Эти параллельные гиперплоскости и будут задавать искомые страты. Внекотором смысле такой подход сродни подходу кластер-анализа. Однако понятиестратификации отличается от понятия кластерного разбиения как минимум в двухаспектах:- страты упорядочены направлением «оси» вектора нормали, а кластеры –нет;- кластеры формируются как компактные образования вокруг своих«центров», тогда как страты – это «слои» геометрического пространства критериев,которые могут содержать и достаточно удаленные друг от друга объекты.Объектомисследованияявляетсяпроблемамногокритериальногоранжированного разбиения, т.е. многокритериальной стратификации.Предметом исследования является разработка и обоснование методикипостроения многокритериальной линейной стратификации.4Цель исследования – разработка и верификация математической модели,численных методов и комплекса программ для формирования многокритериальныхстратификаций с использованием линейной свертки критериев.Эта цель предполагает решение следующих задач:1.
Разработать математическую модель представления многокритериальныхвариантов в виде совокупности страт, характеризуемых значениями линейнойсвёртки критериев.2. Провести анализ критерия этой модели с точки зрения его сходства иразличия с другими критериями агрегирования.3. Разработать эффективные численные методы построения (локально)оптимальной линейной стратификации и оценки параметров предложенной модели.4. Провести численные эксперименты для верификации нашей разработки исравнения ее с другими методами агрегирования критериев, для чего разработатьгенератор «синтетических» стратифицированных данных с учетом различныххарактеристик реальных стратификаций.5.
Разработать комплекс программ для реализации и верификациипредложенных методов на реальных и синтетических данных.6. Использовать разработанный комплекс программ при решении значимыхпрактически ориентированных задач многокритериальной стратификации.Методы, использованные в исследовании:1. Методы теории принятия решений, включая правило Борда, границыПарето и др.2. Методы системного анализа, включая ABC-классификацию ресурсов иранжирование по влиянию (Authority ranking).3. Теоретическиеразработкивобластикластер-анализа,включаяаппроксимационную трактовку метода к-средних.4. Численные методы оптимизации, включая квадратичную оптимизацию.5. Методы разработки и проведения контролируемого вычислительногоэксперимента.5Научная новизна. В диссертации получен ряд новых научных результатов,выносимых на защиту:1.Предложенагеометрическаямодельлинейнойстратификации,аппроксимирующая данные в виде совокупности «параллельных» гиперплоскостей– страт.2.
Предложен численный метод ЛинСтрат для формирования линейнойстратификации на основе этой модели с использованием чередующейся иквадратичной оптимизации.3. Предложена методика генерации синтетических данных линейнойстратификации для проведения контролируемых вычислительных экспериментов.4. Разработан комплекс программ для численного решения задачистратификации, генерации синтетических данных и проведения вычислительныхэкспериментов.5.Сиспользованиемразработанногоматематическогообеспеченияпроведены расчеты по верификации метода ЛинСтрат на синтетических данных ивыявлены границы его применимости.6.Сиспользованиемразработанногоматематическогообеспеченияпроведены расчеты по сравнению метода ЛинСтрат с рядом популярных методовмногокритериального ранжирования на реальных и синтетических данных,доказавшие его сравнительную эффективность.7. Проведен анализ различных компонент научного вклада (научныйуровень результатов, цитируемость, авторитетность) на примере дисциплины«Анализ данных и машинное обучение».Теоретическаязначимостьработысостоитвразработкеновойматематической модели линейной стратификации и численного метода ееидентификации, а также схемы порождения синтетических страт, позволяющейучесть их различные характеристики в численных экспериментах.Практическая значимость работы заключается в создании комплексапрограмм, реализующего алгоритмы линейной стратификации и предназначенного6для решения исследовательских и прикладных задач.
Этот комплекс программ былприменен при решении задачи приоритизации базовых станций в компании ПАО«МТС».Достоверность и обоснованность полученных результатов подтвержденастрогостью использованных математических моделей и методов, вычислительнымиэкспериментамипосравнениюрезультатовпримененияразработанныхитрадиционных методов на конкретных задачах, а также расчетами при решенииприкладных задач.Апробация работы. Основные результаты работы докладывались наследующих семинарах и конференциях:1. The Second International Conference on Information Technology andQuantitative Management (ITQM-2014), Москва, июнь 2014 г. Доклад на тему: «Aconcept of multicriteria stratification: definition and solution».2.
Conference «Optimization, Control, and Applications in the InformationAge», July 2014, Chalkidiki, Greece. (Доклад на тему: «Three aspects of the researchimpact by a scientist: measurement methods and an empirical evaluation».3. Conference of the International Federation of Classification Societies,Bologna, Italy, July 2015.
Доклад на тему: «Using taxonomies and aggregate rankingsfor measuring research impact».4. Общемосковскийпостоянныйнаучныйсеминар«Теорияавтоматического управления и оптимизации», Москва, октябрь 2015 г. Доклад натему: «Проблема оценки научного вклада (на примере исследований по анализуданных и машинному обучению».5. Общемосковский научный семинар «Математические методы анализарешений в экономике, бизнесе и политике», Москва, октябрь 2015 г. Доклад натему: «Проблема оценки научного вклада (на примере исследований по анализуданных и машинному обучению)».7Личный вклад. Автором разработаны:1.Математическаямодельлинейнойстратификациинаосновеаппроксимации данных совокупностью «параллельных» гиперплоскостей – страт.2. Численный метод ЛинСтрат для автоматического формированиялинейной свертки критериев и стратификации на заданное число страт.3.Методикаиалгоритмгенерациисинтетическихлинейностратифицированных данных.4.
Комплекс программ, реализующий алгоритм линейной стратификации,алгоритм генерации синтетических страт.Автором проведена верификация разработанного метода стратификации нареальных и синтетических данных, а также его сравнение с популярными методамимногокритериального ранжирования. Автор принимал участие в проекте по оценкесоставляющих научного вклада ученого на основе таксономии предметной области,в котором на практике успешно был применен разработанный алгоритмстратификации. Метод и комплекс программ были применены для решения задачиприоритизации базовых станций в компании ПАО «МТС».Содержание работы.
Диссертация состоит из введения, четырех глав,заключения, списка литературы из 94 наименований и приложения.Вовведениираскрываетсяактуальностьтемыдиссертации,формулируются цели и задачи исследования, предмет и объект исследования,определяются цели работы, описываются методы исследования, излагаютсяосновные научные результаты, обосновывается теоретическая и практическаязначимость работы, даётся общая характеристика исследования.Вглавемногокритериальной1даетсяобщеестратификации.описаниеПриводитсяпроблемыобзоравтоматизацииосновныхметодовмногокритериального ранжирования, на основе которых может быть полученастратификация. Выделяются популярные методы, представляющие основныеподходы: метод ранжирования на основе собственного вектора (ранжирование повлиянию – authority ranking), разбиение Парето (partition via maximal elements),8правило Борда (Borda count), и метод линейной оптимизации весов (linear weightoptimization).Формулируется модель линейных страт как совокупность параллельныхгиперплоскостейвпространствекритериев.Такаямодельпозволяетсформулировать аппроксимационную задачу формирования линейной комбинациикритериев.