Диссертация (1137117), страница 10
Текст из файла (страница 10)
Случай, когдаисследуемые показатели весьма схожи.69На рисунке 20 наглядно видно, что, несмотря на различия видов ирисов,кусочно-линейные функции весьма схожи.В связи с тем фактом, что разбиение исходных данных при помощипорядково-инвариантной паттерн-кластеризации уже проведено на первом этапе,для улучшения результатов требуется определенная работа с исследуемымипоказателями.Дляэтого,предлагаетсяиспользованиемодуляразностипоказателей (при использовании произведения получим аналогичный результат).Подробное описание использования модуля разности приведено в [42].
Приведѐмконечные результаты (см. таблицу 8).Таблица 8. Результаты порядково-инвариантной паттерн-кластеризацииЦветокIris SetosaIris VersicolorIris VirginicaЧислоэкземпляров505050Ошибочноклассифицировано014Таким образом, ошибка составляет 5/150 = 0,03. Данный результатсопоставим с работой других известных методов. В качестве основных плюсовиспользования порядково-инвариантной паттерн-кластеризации можно отметитьне только высокую точность полученных результатов (при предварительнойработе с исходными данными), но и относительно низкую вычислительнуюсложность.2.6 Применение новых методов анализа паттернов на классическихтестовых данных «Balance Scale Data set»Набор данных «Balance Scale Data set» содержит классические данные,относительно часто используемые при тестировании различных методовкластерногоанализа.Данныйнаборсмоделировандляпроведенияпсихологических экспериментов. Приведем общее описание данных.Всего исследуются 625 строк по 5 показателям (в используемых ранеетерминах |X|=625,), описывающим состояние рычажныхвесов, длины рычагов и вес чаш.
Показательописывает фактическое состояниевесов, в связи с чем принимает одно из 3 возможных значений:70- «B» – balance (рычажные весы находятся в состоянии равновесия);- «R» - right (стрелка рычажных весов отклонена вправо);- «L» - left (стрелка рычажных весов отклонена влево).Остальные показатели могут принимать целочисленные значения от 1 до 5,описывающие:-– фактический вес левой чаши рычажных весов;-– длина рычага левой чаши рычажных весов;-– фактический вес правой чаши рычажных весов;-– длина рычага правой чаши рычажных весов.Исходные данные распределены следующим образом: 288 отклонены влево(«L»); 288 – вправо ((«B»).«R»); 49 – находятся в состоянии равновесияПрименим порядково-инвариантную паттерн-кластеризацию к описанномувыше набору данных. Результатом являются порядково-инвариантные паттернкластеры, обладающие весьма схожими визуальными особенностями, в связи счем возможно их объединить в 3 обобщѐнные группы.Для первой группы характерным является симметрия левой и правой частейкусочно-линейных функций.
В данную группу входят 45 строк, соответствующихсостоянию «равновесие» (которых= «B»). Всего в исходных данных 49 строк, для= «B».Длявторойитретьейгруппхарактернойявляетсязеркальнаясимметричность кусочно-линейных функций, входящих в каждую из нихотносительно друг друга. Другими словами, каждому объекту группы 2соответствует зеркально-симметричная кусочно-линейная функция группы 3 (см.рисунок 21).71Рисунок 21. Зеркально-симметричные кусочно-линейные функции обобщѐнных групп 2 и 3.К данным группам относятся строки, соответствующие отклонению стрелкивесов влево (= «L») и отклонению стрелки весов вправо (= «R»).Рисунок 22.
Другой пример зеркально-симметричных кусочно-линейных функцийобобщѐнных групп 2 и 3.Таким образом, исходный набор данных разделяется на 3 обобщѐнныегруппы,соответствующиеследующимсостояниямрычажныхвесов:«равновесие», «отклонение влево» и «отклонение вправо». Отметим, чтопорядково-инвариантнаяпаттерн-кластеризацияобразуетпорядково-инвариантные паттерн-кластеры, содержащие только один тип строк (длякоторых= «B»; либо= «L»; либо= «R»).
Исключением являются строки,соответствующие состоянию равновесия (данная группа описана выше). Вотличие от 45 других строк, для которых= «B», данные объекты былиотнесены к группам с зеркально-симметричной формой кусочно-линейныхфункций (т.е. для которых= «L» или= «L»).72В качестве основного результата применения порядково-инвариантнойпаттерн-кластеризации к набору классических данных «Balance Scale Data Set»можно отметить, что при относительно низкой вычислительной сложностиошибка составляет всего 4 строки, т.е. менее 1%.2.7Численныеметодырасчетаиндексовнеоднородностиинновационного развитияВ разделе 1 приведен обзор основных существующих подходов к оценкеинновационного развития, сводящихся, в основном, к присвоению определѐнномутерриториальномуобразованиюконкретнойчисловойхарактеристики,позволяющей делать вывод об успешности инновационного развития.
В связи сэтим, встает вопрос об однородности исследуемой системы с точки зренияинновационного развития. В данном разделе приведен математический аппарат,позволяющий рассчитывать индексы неоднородности инновационного развития, атакже краткие примеры. Апробация предложенных индексов на конкретныхданных инновационного развития приведена в разделе 3.Под неоднородностью будем понимать структурные различия объектов,входящихвисследуемоемножество.Такимобразом,дляопределениянеоднородности всего множества предлагается определить количество схожихвнутренних структур объектов (по анализируемым показателям).
С этой целью, взависимости от требуемой в конкретной задаче точности, используется один изпредложенныхфиксированная,вышеновыхметодовпорядково-инвариантнаяанализаилипаттернов(порядково-диффузионно-инвариантнаяпаттерн-кластеризации). Исследуемое множество будем считать полностьюоднородным (индекс неоднородности равен 1), если все объекты образуютединый паттерн, и полностью неоднородным (индекс неоднородности равен 0),если никакие 2 объекта невозможно объединить, используя предложенныеметоды.Таким образом, исходя из используемого при разбиении исходногомножества метода, предлагаются к рассмотрению следующие 3 индекса:731.Порядково-фиксированныйинновационныйиндекс.Возможноприменение для предварительных расчѐтов и общей оценки исследуемогомножества объектов X. Рассчитывается как{Свойства порядково-фиксированного инновационного индекса:а) Численное значение порядково-фиксированного инновационного индексаесть неотрицательная величина, меньшая или равная единице:б) Длялюбого числа порядково-фиксированных паттерн-кластеров,большего единицы, порядково-фиксированный инновационный индекс большенуля, т.е..в) При равенстве числа порядково-фиксированных паттерн-кластеров иисследуемых объектов, порядково-фиксированный инновационный индекс равен0, т.е.г) При возрастании числа порядково-фиксированных паттерн-кластероввозрастает численное значение порядково-фиксированного инновационногоиндекса, т.е.где:и– некоторые численные значения количества порядково-фиксированных паттерн-кластеров;и–соответствующиеипорядково-фиксированныеинновационные индексы.2.Порядково-инвариантный инновационный индекс.
Применяется дляболее подробной оценки исследуемого множества объектов X. Рассчитывается как74{Свойства порядково-инвариантного инновационного индекса:Численноеa)значениепорядково-инвариантногоинновационногоиндекса есть неотрицательная величина, меньшая или равная единице:б) Длялюбого числа порядково-инвариантных паттерн-кластеров,большего единицы, порядково-инвариантный инновационный индекс большенуля, т.е..в) При равенстве числа порядково-инвариантных паттерн-кластеров иисследуемых объектов, порядково-инвариантный инновационный индекс равен 0,т.е.г) При возрастании числа порядково-инвариантных паттерн-кластероввозрастаетчисленноезначениепорядково-инвариантногоинновационногоиндекса, т.е.гдеи– некоторые численные значения количества порядково-инвариантных паттерн-кластеров;и–соответствующиеипорядково-инвариантныеинновационные индексы.3.Диффузионно-инвариантный инновационный индекс.
Исходя изиспользуемого при формировании паттерн-кластеров метода, применяетсявслучае необходимости оценки неоднородности множества объектов X, состоящемиз весьма схожих объектов. Рассчитывается как75{Свойства диффузионно-инвариантного инновационного индекса:а)Численноезначениедиффузионно-инвариантногоинновационногоиндекса есть неотрицательная величина, меньшая или равная единице:б) Длялюбого числа диффузионно-инвариантных паттерн-кластеров,большего единицы, диффузионно-инвариантный инновационный индекс большенуля, т.е..в) При равенстве числа диффузионно-инвариантных паттерн-кластеров иисследуемых объектов, диффузионно-инвариантный инновационный индексравен 0, т.е.г) При возрастании числа диффузионно-инвариантных паттерн-кластероввозрастает численное значение диффузионно-инвариантного инновационногоиндекса, т.е.гдеи– некоторые численные значения количества диффузионно-инвариантных паттерн-кластеров;и– соответствующиеидиффузионно-инвариантныеинновационные индексы.Соотношение всех предложенных индексов можно выразить следующемсвойством: при расчете различных индексов неоднородности инновационногоразвития на одном множестве выполняется соотношение76Рассмотрим предложенные индексы на примере гипотетических данныхтаблицы 6.