Диссертация (1137117), страница 11
Текст из файла (страница 11)
Изучается множество, состоящее из 6 объектов, описываемых 3показателями. Поочередно используем порядково-фиксированную, порядковоинвариантную и диффузионно-инвариантную паттерн-кластеризации с цельюразбиения исходного множества объектов.Результатомиспользованияпорядково-фиксированнойкластеризации является следующее разбиение:. ПосколькуДалее,и,применимпаттерн-.порядково-инвариантнуюпаттерн-кластеризациюкнабору данных таблицы 6. Результат получится аналогичным предыдущему, т.е.получим следующее разбиение:ив данном случае. Очевидно,.При использовании диффузионно-инвариантной паттерн-кластеризациирезультат разбиения отличается:и,..Очевидно, что выполняется свойство о соотношении предложенныхиндексов неоднородности инновационного развития: 1/3 ≤ 1/3 ≤ 1/2.Практическаяапробацияпорядково-фиксированногоипорядково-инвариантного инновационных индексов приведена в разделе 3.Отметим, что целесообразность использования конкретного предложенногоиндекса неоднородности инновационного развития прямо связана с постановкойрешаемой задачи и исходными данными.
Следует учитывать, что, в общем случае,,амаксимальноблизкиепозначениямпоказателейисследуемых объектов кластеры получаются при использовании диффузионноинвариантной паттерн-кластеризации. Однако, в связи с данной особенностьювозможна ситуация, когда в исходном множестве не существует двух объектов,обладающих не только схожей внутренней структурой, но и весьма близкимизначениями всех показателей.772.8 Разработка комплекса программ на основе новой ординальнойпарно-сопоставительной моделиВ данном подразделе описан комплекс программ, разработанный дляиспользования на практике предложенной в работе новой оригинальнойординальной парно-сопоставительной выявления анализа паттернов.
Данныйкомплекс получил свидетельство о государственной регистрации программ дляЭВМ № 2016614336 (дата государственной регистрации: 21 апреля 2016).Комплекс программ написан на языке программирования Visual Basic forApplications (VBA) и совместим с весьма распространенной линейкой продуктовкорпорации Microsoft (Microsoft Office), что позволяет обрабатывать массивыданных в распространенных форматах .xls, .xlsx и .xlsm без применениязагрузки/выгрузки данных в иных форматах, а также визуализировать полученныерезультаты без использования дополнительных программных комплексов.Основу разработанного комплекса составляют 4 программы.
Разбиениевсего комплекса на программы, а программ – на функции позволяет уменьшитьколичество строк исходного кода, оптимизировать компьютерную версию новойординальной парно-сопоставительной модели выявления паттернов и сократитьвременные затраты, требуемые для получения конечных результатов.Программа 1 состоит из 3 основных функций, позволяющих использоватьна практике новый оригинальный метод «порядково-фиксированная паттернкластеризация».20Первая функция является вспомогательной, рассчитываетмощность исходного множества исследуемых объектов и количество показателей.Остальныефункцииформируютпоследовательностипарныесравненияи, формируют k кодировокопределяют, а такжепроизводят расчет расстояний Хемминга между кодировками объектов.
На основеполученных кодировокформируются порядково-фиксированные паттерн-20оригинальногоПолноеописаниеновогометодаанализапаттернов«порядково-фиксированная паттерн-кластеризация», его основные свойства, алгоритмическое решение ивычислительная сложность приведены в подразделе 2.2.78кластеры, номера которых выводятся на экран ПК.
Напомним, что согласноиспользуемому оригинальному методу анализа паттернов, общее количествополученных порядково-фиксированных паттерн-кластеров не превышаетвычислительная сложность метода,а.Программа 2 использует 3 основные функции программы 1, а также 3дополнительные. В данной программе производитсясравненийпоказателей исследуемых объектов, формируются добавочные кодировкиипроизводится расчет расстояний Хемминга между новыми кодировками объектов.Данныйалгоритмпозволяетиспользоватьновыйоригинальныйметод«порядково-инвариантная паттерн-кластеризация» 21 .
В качестве результатов наэкран выводится разбиение исходного множества объектов на порядковоинваринатные паттерн-кластеры. Вычислительная сложность методаМодификацияданнойпрограммыпозволяетвыявлятьдиффузионно-инвариантные паттерн-кластеры.22 Вычислительная сложность, приэтом, возрастает доПрограмма 3 позволяет визуализировать результаты программы 1. С этоцелью, для каждого порядково-фиксированного паттерн-кластера строятсядиаграммы, состоящие из кусочно-линейных функций, каждая из которыххарактеризует один из исследуемых объектов. В качестве алгоритмическогорешения для визуализации данных в VBA выбрано x1Line, что позволяет нетолько наглядно демонстрировать результаты на диаграммах, но и выгружатьполученные кусочно-линейные функции в различные форматы, в т.ч. и .doc и.docx (к примеру, для составления различных отчѐтов), а также .ppt и .pptx.21Полное описание нового оригинального метода «порядково-инвариантная паттерн-кластеризация», его основные свойства, алгоритмическое решение и вычислительная сложностьприведены в подразделе 2.3.22См.
подраздел 2.4 «Диффузионно-инвариантная паттерн-кластеризация».79Программа 4 позволяет визуализировать результаты, полученные припомощи программы 2. С этой целью также строятся диаграммы, содержащиекусочно-линейные функции. Название каждой диаграммы соответствует номерупорядково-инвариантногопаттерн-кластера.Отметим,чтопривыгрузкерезультатов в Microsoft Excel существует определѐнное ограничение: даннаяпрограмма не позволяет размещать более 255 кусочно-линейных функций наодной диаграмме. В связи с этим, при визуализации порядково-инвариантногопаттерн-кластера, содержащего более 255 объектов, строятся дополнительныедиаграммы.При помощи описанного выше комплекса программ рассчитываютсяпредложенныевработеновыеоригинальныеиндексынеоднородностиинновационного развития.
Паттерны, построенные при помощи данногокомплекса на основе показателей Глобального индекса инноваций, Индексаинновативности, а также данных образования и патентной активности приведеныв 3.1-3.5; расчет индексов неоднородности – в 3.6. Описание полученных прирасчѐтах кодировок объектов приведены в приложениях 1-6.Поскольку программы данного комплекса являются взаимосвязанными,целесообразным представляется применение всего комплекса, однако, принеобходимости, возможно использование некоторых из них по отдельности. Нижеприведѐм агрегированную блок-схему разработанного комплекса программ.80Рисунок 23.
Агрегированная блок-схема разработанного комплекса программ,основанного на ординальной парно-сопоставительной модели.Заключение по Разделу 2В разделе 2 описан общий метод анализа паттернов и его модификации.Приведены ссылки на некоторые метрики, используемые для разбиенияисходного множества объектов на непересекающиеся подмножества. Рассмотренановая оригинальная ординарная парно-сопоставительная модель, основанная на81новых методах анализа паттернов: «порядково-фиксированной», «порядковоинвариантной» и «диффузионно-инвариантной» паттерн-кластеризаций. Описаныосновные свойства и алгоритмические сложности. Работа предложенных методовпродемонстрирована на простых примерах.
Сформулированы и доказаны 1утверждение и 3 теоремы. Применение порядково-инвариантной паттернкластеризации продемонстрировано на примере классических тестовых данных«Anderson-Fisher Iris Data» и «Balance Scale Data Set».Приведены результаты, показывающие эффективность предложенныхметодов при решении прикладных задач. Обоснована актуальность разработкиновой модели выявления паттернов. Предложены численные методы расчетановых оригинальных индексов неоднородности инновационного развития,базирующихся на рассмотренных методах анализа паттернов.
Описаны ихсвойства, предложены случаи использования каждого конкретного индекса поотдельности. Методы расчета предложенных индексов рассмотрены на простыхпримерах.82РАЗДЕЛ 3ИССЛЕДОВАНИЕ НЕОДНОРОДНОСТИИННОВАЦИОННОГО РАЗВИТИЯВ данном разделе применены новые методы анализа паттернов, описанныев разделе 2 для исследования неоднородности инновационного развития ипостроения соответствующих индексов.
В качестве используемых данныхвыступаютпоказатели,применяемыедлярасчѐтаГлобальногоиндексаинноваций, описанного в разделе 1, данные образования и патентной активностинекоторыхстран,атакжеосновныепоказатели,входящиевИндексинновативности. Использованы отчѐты [26-29], данные образования и патентнойактивности [65, 66], а также [51].3.1ИсследованиевходныхпоказателейГлобальногоиндексаинновацийДлярасчетаиндексовнеоднородностиинновационногоразвития,предложенных в разделе 1, необходимо построить паттерны на основепредложенных в разделе 2 алгоритмов.
Однако, в связи с тем фактом, чтоинновационное развитие представляет собой сложный для изучения процесс, вработе применены несколько различных комбинаций показателей индекса GII.Исследовались как отдельно входной в выходной субиндексы (при комбинации сконечным значением Глобального индекса инноваций), так и выходныепоказатели GII. В 3.1.1 – 3.1.4 использованы следующие показатели иобозначения23:1. Inst – «Учреждения»;2.
Нuman Cap&R – «Человеческий капитал и исследования»;3. Infr – «Инфраструктура»;23Для удобства визуального восприятия построенных в дальнейшем кусочно-линейныхфункций, используются сокращѐнные названия (вместо83).4. MS – «Развитость и удобство внутреннего рынка»;5. BS – «Развитость и удобство ведения бизнеса»;6. GII – Глобальный индекс инноваций.Таким образом, в данных разделах используются 5 входных показателей, а вкачестве выходного применяются конечные значения самого Глобальногоиндекса инноваций.
Исследование проведено для 2012-2015гг. На базеполученных паттернов построены индексы неоднородности инновационногоразвития.Отметим,чтовсвязииспользованиемданныхбольшоготерриториального охвата, наиболее целесообразным являлось применениепорядково-инвариантнойпаттерн-кластеризации.Использованиепорядково-фиксированной паттерн-кластеризации, в связи с особенностью своего алгоритма,приводит к получению относительно малого числа паттернов (что, для некоторыхисследований может оказаться весьма полезным), а диффузионно-инвариантнаяпаттерн-кластеризация – относительно большого числа паттернов (в т.ч. и«уникальных»)24.3.1.1 Входные показатели Глобального индекса инноваций 2012Несмотря на тот факт, что Глобальный индекс инноваций измеряется с 2007года, исследование неоднородности инновационного развития на базе GIIвработе начинается с данных 2012 года.
Данное обстоятельство обуславливаетсяначаломпримененияотносительносхожихисходныхпоказателейсформированием GII-2012. Исследование проведено для 141 страны, каждая изкоторых отнесена к определѐнному паттерну.Далее опишем некоторые результаты, полученные с использованием новыхметодов анализа паттернов. Для исследования использованы данные из [26].24Согласно предложенному в разделе 2 алгоритму диффузионно-инвариантной паттерн-кластеризации, метод объединяет не только объекты, имеющие схожие внутренние структуры,но и весьма близкие значения самих показателей, что и обуславливает, в данном случае,получение относительно большого количество «уникальных» паттернов.841-2012100Nepal8060Paraguay40Switzerland20Zambia0InstHumanCap&RInfrMSBSGIIРисунок 24.