Автореферат (Индексы неоднородности инновационного развития), страница 2
Описание файла
Файл "Автореферат" внутри архива находится в папке "Индексы неоднородности инновационного развития". PDF-файл из архива "Индексы неоднородности инновационного развития", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ ВШЭ. Не смотря на прямую связь этого архива с НИУ ВШЭ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст 2 страницы из PDF
Всего приведено 18 индексов, прямо или косвенно описывающихинновационное развитие.Для формирования термина «инновации» в работе используетсяопределение, приведѐнное Организацией экономического сотрудничества иразвития (OECD): «Инновация есть введение в употребление какого-либонового или значительно улучшенного продукта (товара или услуги) илипроцесса, нового метода маркетинга или нового организационного метода вделовой практике, организации рабочих мест или внешних связях».В подразделе 1.2 приведен обзор по системе параллельных координат,используемой в работе для визуального отображения исследуемых индексов, атакже исследования неоднородности инновационного развития. Авторомобщей идеи является Alfred Inselberg (1985 год). В более поздних работахEdward Wegman предложил использование параллельных координат длямногомерного анализа больших данных, а также обозначил проблемупредставления n-мерных данных на плоскости, в связи с чем предложилматематический аппарат перевода Декартовых координат в параллельные.Вовторомразделепредставленановаяординальнаяпарно-сопоставительная модель анализа паттернов, реализуемая в виде 3 новыхоригинальных методов, основанных на парном сравнении показателей9исследуемыхобъектов.Описаныосновныесвойстваметодов,ихвычислительная сложность, приведена блок-схема программной реализации, атакже продемонстрирована эффективность их применения на примереклассических тестовых данных.
Описаны численные методы вычисленияиндексовнеоднородностиразработаннойинновационногоординальнойразвития,базирующихсяпарно-сопоставительноймоделинаанализапаттернов. Приведены некоторые свойства предложенных индексов, а такжерассмотрены примеры их расчета.В подразделе 2.1 приведено описание метода анализа паттернов, а такжеописанацелесообразностьразработкиновойординальнойпарно-сопоставительной модели. В качестве исходных данных рассматриваетсянекоторое множество X: |X|=k.
Объектампоставлены во взаимнооднозначное соответствие вектора, где–значение j-го показателя i-го объекта. Задача: разбить множество X на vнепересекающихсяподмножества.Полученныеподмножествадолжнысодержать близкие по некоторой мере близости объекты, причѐм самиподмножества должны существенно отличаться между собой.Подраздел 2.2 посвящен первому оригинальному методу, на которомбазируетсяординарнаяпарно-сопоставительнаямодель–порядково-фиксированной паттерн-кластеризации.
Для данного метода учитываетсяхарактер парных отношений смежных показателей. Каждому объектуставится во взаимно однозначное соответствие последовательность символов, такая, что10Следует отметить, что значения исходных показателей исследуемых объектовпринадлежат множеству действительных чисел. В силу дискретности иограниченностимножествазначенийпарныхотношений,использование символьной последовательностипозиционного кодавозможнов качественекоторого числа, что удобно при оптимизациии построении компьютерного алгоритма, в частности, в связи с возможностьюзамены операции кодового сравнения объектов на простую арифметическуюоперацию сравнения чисел.
Таким образом, в качестве кодировки объектовпредлагается использование̅̅̅̅̅,∑Выбор данного представления объектов обуславливается удобством виспользовании и однозначностью кодирования. Таким образом, исследуемыеобъектыдесятичнымихарактеризуются векторамикодировками.Дляразбиенияиданныхобъектовнаподмножества требуется оценить меру близости сформированных по формуле(4) кодировок. В данном методе предложено использовать расстояниеХемминга1:∑Таким образом, рассматриваются 2 случая:1)– объектыиобъединяем в единое подмножество(кластер);1Подразумевается использование общего случая расстояния Хемминга для кодовыхпоследовательностей одинаковой длины произвольного алфавита.11–2)относимобъектыикразличнымподмножествам (кластерам).Вычислительную сложностьпорядково-фиксированной паттерн-кластеризации можно определить следующим образом.
Множество X содержитвсего k объектов, описанных кодировками из m-1 символов, определяемыхформулами (1)-(3). Всего требуется произвести k(k-1)/2 сравнений объектов.Таким образом,Подраздел 2.3 посвящен второму предложенному в работе методуанализа паттернов, на котором базируется ординальная парно-сопоставительнаямодель – порядково-инвариантной паттерн-кластеризации. Данный метод независит от выбора последовательности используемых показателей. Отмечается,что для рассмотрения всех возможных последовательностей необходимоисследовать m! перестановок, что требует значительных временных ивычислительных затрат.
Поэтому предлагается альтернативный подход.Сначала проводится порядково-фиксированная паттерн-кластеризация,разделяющая множество X напорядково-фиксированных паттерн-кластеров. Это позволяет уменьшить необходимое в дальнейшем количествоопераций.Далее, каждому объектуставится во взаимно однозначноесоответствие полный взвешенный орграфзначениям, вершины которого соответствуютпоказателейопределяетсясоотношениями,соответствующихавесвершин.рѐберКоличествонеобходимых парных сравнений показателей определяется общим количествомрѐберсоответствующего графа (учитывая, что 2 показателя соединяютсяединственным ребром) по формуле12Веса рѐбер определяются какТакимобразом,аналогично(4),формируем∑∑новыйдесятичныйпозиционный кодАналогично (5), вычисляется расстояние Хемминга d между объектами,которые ранее были объединены в один порядково-фиксированный паттернкластер. Возможны 2 случая:1.объединяем соответствующие объекты в один порядково-инвариантный паттерн-кластер;2.относим соответствующие объекты в разные порядково-инвариантный паттерн-кластеры.В работе сформулированы и доказаны ряд важных свойств формируемыхпорядково-инваринатных паттерн-кластеров.Утверждение1.Порядково-инвариантныепаттерн-кластерынепересекаются.Иными словами, один объект, описанный вектором, не может принадлежать двум различным порядковоинвариантным паттерн-кластерам.Замечание.
Утверждение 1 фактически определяет однозначностьпорядково-инвариантной паттерн-кластеризации, а потому имеет важноеприложение как для построения алгоритма ее реализации, так и длядоказательства других свойств.13Теорема 1. Если существует такая последовательность Р расположенияпоказателей А, В, С, …, L, при котором их значения для всех объектов образуютстрого монотонную возрастающую (убывающую) последовательность, то этиобъекты образуют порядково-инвариантный паттерн-кластер.Рассмотрен вопрос существования обратного утверждения к теореме 1.
Вобщем случае, обратная теорема неверна. Однако, справедливо следующееутверждение.Теорема 2. Если объектыинвариантномупаттерн-кластеру,принадлежат одному порядковотосуществуеттакойпорядокPрасположения анализируемых показателей А, В, С, …, L, при котором ихзначениядлявсехобъектовобразуютмонотоннуюнеубывающую(невозрастающую) последовательность.Определенавычислительнаяпаттерн-кластеризациисложностьпорядково-инвариантной. Всего исследуются k объектов, описанных mпоказателями. Для составления десятичной кодировки каждого объектатребуется m(m-1)/2 сравнений.
Для сравнения кодировок всех объектов иразделения на порядково-инвариантные паттерн-кластеры требуется k(k-1)/2сравнений. Таким образом, вычислительная сложность предложенного методасоставляетПодраздел 2.4 посвящен третьему предложенному в работе методуанализа паттернов, на котором базируется ординальная парно-сопоставительнаямодель – диффузионно-инвариантной паттерн-кластеризации.В его основележит идея поиска (и объединения в единые кластеры) объектов, настолькоблизких по структуре и значениям своих показателей, что взаимный обмензначениями отдельных из них не сказывается существенным образом на ихсхожести (в смысле принадлежности к единому кластеру). Фактически этоозначает, что возможно заменять значения показателя одного из объектов14другим.
Сами объекты, при этом, хотя и могут менять формы кусочнолинейных функций, не теряют схожести по отношению друг к другу.Доказана следующая теорема.Теорема 3. Пусть два объекта x1 x11, x12 , , x1m и x2 x21, x22 , , x2m принадлежат одному кластеру v, построенному с использованием евклидоварасстояния – d e xi , z RV между объектами и центром кластера z z1 , z2 , , zm ,где RV– радиус кластера.
Образуем новые объекты x1* и x2* , обменявсоответствующие значения одной из координат исходных объектов x1 и x2 .Тогда1)Евклидовы расстояния между исходными объектами de x1 , x2 имежду вновь образованными объектами de x1* , x2* равны, de x1 , x2 de x1* , x2* .2)По меньшей мереодин из вновь образованных объектовпринадлежит данному кластеру v.Подраздел 2.5 описывает результаты применения предложенных в работеновых методов анализа паттернов к классическому набору тестовых данных«Anderson-Fisher Iris Data».
Поскольку данный набор тестовых данных широкоиспользуется при проверке эффективности различных методов кластеризации,его применение возможно не только для проверки новых, разрабатываемыхметодов, но и для сопоставления вновь полученных результатов с работойиных, известных алгоритмов. В частности, в работах Ф.Т. Алескерова и Б.Г.Миркина демонстрируются различные возможности метода анализа паттернов,в том числе, и для тестовых данных «Anderson-Fisher Iris Data».Приведем общую постановку задачи. Исследуется множество. При этом заранее известно, что исходное множество объектов можноразделить на 3 подмножества:- Iris Setosa (Ирис щетинистый);- Iris Versicolor (Ирис разноцветный);- Iris Virginica (Касатик виргинский),15каждое из которых содержит по 50 объектов.
Каждому объектупоставлено во взаимно однозначное соответствие вектора,где-характеризует длину чашелистика исследуемого объекта (sepal length);-характеризует ширину чашелистика исследуемого объекта (sepal width);-характеризует длину лепестка исследуемого объекта (petal length);-характеризует ширину лепестка исследуемого объекта (petal width).Постановка задачи: используя данные измерений приведенных Ирисов,разбить множествона 3 непересекающиеся подмножества, каждое изкоторых будет содержать цветы только одного вида.