Диссертация (1151117), страница 19
Текст из файла (страница 19)
При этом, 7 критериев используются приформировании рейтинга THE WUR. Количество публикаций, отраженных в базеданных WOS, является также существенным критерием, поскольку имеютвысокий вес при составлении ведущих мировых рейтингов (Таблица 13).Таблица 13.Ключевые факторы деятельности университетов№п/пИспользуются вИндикатор базы InCitesTHE WUR1Академический штат / Количество студентов+(Acadstaff / Stdnt)2Преподавателисиностранным+гражданством/Академический штат (Acadstaffint /Acadstaff)3Количество присужденных научных степеней /+/-*Академический штат (Doctoraldegree / Acadstaff)4Цитирование на однупубликацию (Normalized+citation impact - country adj)5Количество публикаций (Papers)6Работы, написанные в международном соавторстве+(Papersintco-author / Papers)7Доходы от научной деятельности / Академический+/-*штат (Resincome / Acadstaff)8Студенты с иностранным гражданством/общая+численность студентов (Stdntint / Stdnt)* в рейтинге THE WUR используются данные показатели нормализованнымиРезультаты моделирования.
Изучаемым университетам, показателидеятельностикоторыхпредставляютсобоймногомерныевекторы,сопоставляются определенные участки на полученных картах. При этом вектора,115схожие в исходном многомерном пространстве, оказываются рядом и на картах[70]. Для того, чтобы отразить относительную величину того или иногокомпонента вектора соответствующие участки карты окрашиваются в некоторыйцвет, который можно рассчитать следующим образом.Пусть значения заданного поля принадлежат диапазону [a, b].В нашемслучае от 0 до 1, данный отрезок разбиваются на четыре равных интервала,цветовая граница которого определяется в соответствии с кодировкой RGB.(Таблица 14).Таблица 14.Цветовая гамма двухмерной картыiКрасный цвет (R) Зеленый цвет (G) Синий цвет (B)0 a99992551 a + (b – a) * 0,25992552552 a + (b – a) * 0,599255993 a + (b – a) * 0,75255255994 b2559999Для расчета цветовой гаммы новой точки между границами i и (i-1),справедливо неравенство −1 < <Тогда цветовую гаммаR, G, B можно рассчитаться соответственно последующим формуламR – (3.9), G – (3.10), B – (3.11) [82, 88]: = −1 + ( − −1 ) ∗ − −1 − −1 = −1 + ( − −1 ) ∗ − −1 = −1 + ( − −1 ) ∗ − −1 − −1 − −1(3.9)(3.10)(3.11)На рисунке 29 приведены результаты кластеризации для данных поведущим университетам мира из БД InCites за 2012 год, представленные в видекарт Кохонена.
Качество обучения полученной нейросетевой модели, лежащей воснове карты Кохонена: 79% распознанных примеров на обучающем множестве,62% - на тестовом.116Рисунок 29 – Результат кластеризации университетов по данным 2012 годаКаждому из сформированных кластеров можно дать обобщенное описание. 1-ый кластер – университеты- мировые лидеры. В 1-ый кластер вошло107 университетов, он характеризуется высоким показателем публикационнойактивности, что следует из анализа цветовой гаммы соответствующей карты(Papers), на которой ячейки, отвечающие 1-му кластеру, окрашены в болеесветлые цвета, соответствующие высоким значениям показателя Papers.
Такжеуниверситетам, сформировавшим 1-ый кластер, свойственны наиболее высокиезначения показателя Resincome / Acadstaff и значения выше среднего поостальным 6-ти выбранным показателям. В данный кластер вошли такиеуниверситеты, как (расположены в алфавитном порядке):California Institute of Technology (CALTECH) (USA); Columbia University(USA); Harvard University (USA); Imperial College London (UK); Korea AdvancedInstitute of Science and Technology (Korea); Korea University (Korea); MassachusettsInstitute of Technology (USA); Peking University (China); Seoul National University(Korea); Stanford University (USA); University of California Berkeley (USA);117University of California Davis(USA); University of California Irvine (USA);University of Cambridge (UK); University of Tokyo (Japan); Yale University (USA). 2-ой кластер характеризуется высокими показателями международнойдеятельности (более «теплая» цветовая гамма на картах, соответствующихпоказателям Stdnt int / Stdnt и Acad staff int / Acad staff ) при «средних» значенияхпрочих показателей.
В данный кластер вошло 83 университета. 3 и 4 кластеры – университеты, занимающие «средние» позиции. Всего вуказанные кластеры вошло 323 университета.При этом, в 4 кластер вошли такие университеты, как (расположены валфавитном порядке): МГУ им. М.В. Ломоносова, СПбГУ, МФТИ, НГУ,University of Oslo (Norway), Technical University of Berlin (Germany); University ofMilan (Italy); University of Helsinki (Finland). 5 кластер– университеты, занимающие позиции «ниже среднего» – 179университетов.
В данном кластере расположились все остальные отечественныеуниверситеты, представленные в базе данных InCites, а именно (расположены валфавитном порядке): ДВФУ, КФУ, НИТУ «МИСиС»,НИУ ВШЭ, НИЯУ«МИФИ», ТГУ, ТПУ, ННГУ имени Н.И. Лобачевского, УрФУ, НИУ ИТМО,ЛЭТИ,НИУ МГТУ им. Н.Э. Баумана, РГУНГ, НИУ МГУ имени Н. П. Огарёва,НИУ МАИ, НИУ МЭИ, РУДН, СибГАУ, Первый МГМУ им.
И. М. Сеченова,СФУ, ВГУ.Метод k-meansКластеризация методом k-means применяется в тех же задачах, что исамоорганизующиеся НС Кохонена, однако, результаты работыk-meansневозможно просмотреть в виде двухмерных карт.Данный метод был разработан в 1956 году Гуго Штейнгаузом [101], однако,признание получил в 1967 году после публикации Маккуина [90].Разработанный алгоритм стремится минимизировать суммарное квадратноеотклонение данных в кластере от центра кластера соответствует формуле (3.12).118 = ∑=1 ∑∈ ( − )(3.12)где – число кластеров; – полученные кластеры, i=1,2…,k; –центройд длякластера .Сравнение полученных результатов с ведущими мировыми рейтингами.Поскольку перед отечественными университетами стоит задача по вхождению втоп-100 в один из мировых рейтингов, то верификация полученных результатовпроисходила путем сравнения спискауниверситетов, находящихся в 1-омкластере (ведущие университеты) с результатами по трем другим, признаннымведущим мировым рейтингам (THE WUR, QS, ARWU) [42].
В случае, еслиуниверситет, который в результате кластеризации оказался в 1-ом кластеревходит в топ-100 в один из трех рейтингов THE WUR, QS, ARWU, то будемсчитать, что отнесение данного университета в ведущий кластер корректно.Полные результаты данной верификации отражены в приложении 5.
Из 107университетов, которые вошли в ведущий кластер при помощи карт Кохонена врейтингах топ-100 представлен 102 университет, из оставшихся 5 университетов 3достаточно близки к вхождению в топ-100, занимая места в хотя бы одном изрейтингов с 105 по 130. Отнесение оставшихся двух университетов к ведущемукластеру признается ошибкой. Метод k-means определи ведущий кластер из 108университетов из них 96 представлены в рейтингах топ-100. Таким образом,алгоритм построение НС Кохонена дает меньше ошибок и в ходе дальнейшегоисследования будет применяться именно данный метод.3.3.Метод оценки изменения показателей деятельности университетовВажнейшейцельюдляведущихотечественныхуниверситетов,сформулированной Президентом РФ в Указе от 7 мая 2012 год № 599, являетсяих присутствие к 2020 году в сотне лучших университетов (согласно мировомурейтингу).
В связи с этим достаточно интересной задачей является оценкаперспективы выполнения данного Указа к намеченному сроку [107].В исходной выборке данных по многим университетам отсутствует полнаяинформация за выбранный временной период с 2004 по 2012годы, что119неудивительно, поскольку формирование рейтингов - это относительно молодоетечение, которое еще не успело накопить достаточной всеобъемлющейстатистической информации по университетам. Если из итоговой выборкиданных отбросить данные по университетам, у которых отсутствует информацияпо одному из критериев на временном промежутке с 2004 года, то значительносократится исследуемая выборка данных.С другой стороны, можно использовать среднее арифметическое значенийпоказателей деятельности университетов, представляющее собой сумму всехзначений, деленное на их количество за каждый год, как приведено в Таблице 15согласно формуле (3.13):̅ =1∗ ∑=1 =1( 1 + ⋯ + )(3.13)Где – показатель исследуемого университета, а n – количествоуниверситетов в выборке.Таблица 15.Среднеарифметическое для показателя «процент иностранных сотрудников»Процент иностранных сотрудниковУниверситет200420052006200720082009201020112012AALBORG UNIV0.20.170.180.210.210.240.210.220.23AALTO UNIV----0.060.090.070.180.09AARHUS UNIV---0.070.070.160.160.170.190.140.150.160.160.170.170.180.19ABERYSTWYTH UNIV 0.1………………………………………………………………………………………YORK UNIV----0.230.230.230.240.23YUAN ZE UNIV-----0.040.040.040.04ZHEJIANG UNIV0.050.060.070.070.0800.010.020.02Среднеарифметическое0.1280.1160.1170.1170.1220.1340.1370.1400.144Однако, данные, представленные в выборке, являются сильно разнороднымис явными лидерами и аутсайдерами.
Соответственно, если смотреть динамикутакого временного ряда, то вполне возможна ситуация, когда лидеры в выборкестановятся еще сильнее, а аутсайдеры еще сильнее отстают. Если рассмотреть120данную выборку в целом, используя среднеарифметические значения, то картинаиз года в год останется примерно на одном уровне.Для того, чтобы построить прогноз, необходимо провести оценкупредставленной выборки данных. Наш временной ряд состоит из 9 значений(данные с 2004 по 2012 год), т.е.
достаточно небольшое количество наблюдений;именно поэтому в проведенном исследовании используется регрессионныйанализ. В регрессионном анализе строится уравнение, описывающее зависимостьпеременной от , что позволяет прогнозировать значения переменной .Подробнее об этом изложено в гл. 10 книги Айвазяна, Мхитаряна [4]. Врезультате линейного регрессионного анализа получаются коэффициенты и уравнения регрессии (3.14): = + (3.14)Коэффициент представленный в формуле 3.14 определяет смещениепрямой относительно начальной позиции по вертикальной оси.