Диссертация (1138018), страница 10
Текст из файла (страница 10)
В случае подтверждения гипотезы 1, исследование можетперейти на второй этап согласно схеме исследования (рисунок 3): классификациятипов МП и устойчивость результатов кластерного анализа.2.2 Последовательность типологизации МП в России с помощью кластерногоанализаМетодологияСМРиспользуеткластерныйанализдляописаниясуществующих комбинаций типов МП в стране методом К-средних. В данноманализе методика усовершенствована:1) Добавлен факторный анализ. Теперь количество индикаторов в каждомтипе МП зависит от результатов подтверждающего факторного анализа.2) Кластерный анализ базируется на сформированных факторах, порезультатам CFA.3) Кластерный анализ проводится в два этапа: иерархический кластерныйанализ (для определения оптимального количества кластеров) и кластерныйанализ методом K-means.4) Добавлена проверка устойчивости решения кластерного анализа.Длякаждойкомпанииввыборкерассчитываетсяинтенсивностьиспользования типа МП, которая измеряется в интервале от 0.2 до 1.Интенсивность МП принимает минимальное значение 0.2 в случае если,респондент опровергал все утверждения (или индикаторы), определяющиеконкретный тип МП (соответствует значению 1 по шкале Лайкерта).
Напротив,максимальное значение 1 достигается, если компания всегда осуществляетдеятельность, описанную в подпункте к вопросу анкеты (соответствует значению5 по шкале Лайкерта). В результате, проводится нормирование пятибалльной52шкалы Лайкерта, путем отношения суммы ответов индикаторов, образующихфактор (тип МП) к максимальной сумме баллов (максимальное количествовычисляется умножением количества индикаторов, образующих фактор, на пять).Одним из параметров проверки результатов кластерного анализа являетсяустойчивость полученного решения.
Устойчивость проверяется по следующимпоказателям: 1) на предмет устойчивости конечных центров кластеров,количества компаний в кластерах, а также доля компаний классифицированныхкорректно (таблица 4).Таблица 4 – Параметры устойчивости кластерного анализа к изменениямначальных центров кластеров и массиву данных№12КритерийустойчивостиМетод проверкиКомментарийДвумерное пространство, осямикоторого выступают типы МП.Устойчивость проверяетсяграфически путем наложениядиаграмм в одних и тех же осях изразных подвыборок. Принезначительном измененииразмера выборки предполагается,что границы графиков будут оченьблизки друг к другуУстойчивостьконечныхцентровкластеровГрафический:диаграммыВороногоУстойчивостьразмера кластераПолученные кластеры в разныхподвыборках должны бытьсопоставимы друг с другом дляпроведения сравнения.СопоставлениеСопоставимыми кластерами вколичестваисследовании являются текомпаний вкластеры, центры которыхкластерах из разныхнаходятся на минимальномподвыборокрасстоянии.
Расстояние междукоординатами центров кластеровопределяется по формулеЕвклидова расстояния.53Продолжение таблицы 4 – Параметры устойчивости кластерного анализа кизменениям начальных центров кластеров и массиву данных№3КритерийустойчивостиМетод проверкиСравнение междуподвыборкамиВерноприсвоенногоклассифицированныекластера и наборомкомпаниикомпаний вкластерахКомментарийЕсли решение кластерногоанализа устойчивое, токоличество неверноклассифицированных компанийстремится к нулю.
Происходитэто по причине одинаковыхкластерных границ, поэтомукомпании четко попадают водни и те же кластеры приизменении выборки наневысокий процент (в данномслучае 10%)Источник: составлено автором.Для проверки устойчивости случайным образом формируются подвыборкиобщей базы данных, где вероятность попадания компании в подвыборкусоставляет 90%. В исследовании созданы пять подвыборок, количество компанийкоторых составляет примерно 90% общей базы данных. Компании в подвыборкиотобраныслучайнымобразом,араспределениеданныханалогичнораспределению в общей базе данных.Для каждой подвыборки осуществляется процедура кластерного анализа:иерархический кластерный анализ и кластерный анализ K-means. Результатомкластерного анализа являются конечные центры сформированных кластеров вкаждой подвыборке, набор и количество компаний в кластерах.Устойчивость конечных центров кластеров в исследовании проверяетсяграфически с помощью диаграммы Вороного.
«Диаграмма Вороного дляконечного множества точек S на плоскости представляет такое разбиениеплоскости, при котором каждая область этого разбиения образует множествоточек, более близких к одному из элементов множества S, чем к любому другомуэлементу множества» [Препарата, Шеймос, 1989]. То есть пространство54разделяется на области, каждая область обладает своим центром, все наблюденияраспределяются таким образом, что расстояние до центра выбранной областиявляется минимальным в сравнении с расстояниями до центров других областей.Координаты конечных центров кластеров являются основой для построениядиаграммВороного(центрывыделенныхобластей).Интенсивностьиспользования типов МП служит координатами компаний выборки в пятимерномпространстве (за счет пяти типов МП). Простым перебором комбинаций типовМП в качестве осей двухмерного пространства строятся диаграммы Вороного.Наглядно устойчивость кластерного решения получается путем наслоенияграфиков одного массива данных на результаты другого массива данных приусловии одинаковых осей координат.
То есть тип МП оси абсцисс массива 1совпадает с типом МП оси абсцисс массива 2, аналогично с осью ординат.Результатом являются 100 графиков диаграмм Вороного – 10 комбинацийтипов МП в двумерном пространстве, 10 комбинаций массивов данных дляграфического изображения конечных центров кластеров, для наглядности награфике будет представлено сопоставление двух массивов данных (рисунок 4).КомбинациитиповМПпоосям TMDM ITIMNMдиаграмм ВороногоTMDMITIMNMРисунок 4 – Возможные комбинации типов МП в качестве осей диаграмм Вороного вдвухмерном пространствеИсточник: составлено автором.55В случае если результаты кластерного анализа устойчивые, то принебольшом изменении выборки (10%) графики будут практически идентичныдруг другу.Устойчивость результатов кластерного анализа в работе проверяется такжес помощью количества компаний в сопоставимых кластерах и корректноклассифицированных компаний в подвыборках.
Для оценки двух другихпараметров устойчивости после проведения процедуры K-means для каждой из1000 подвыборок необходимо определить, какие кластеры сопоставимы скластерами в других подвыборках. Сопоставимость кластеров подвыборокдостигнута с помощью решения следующей задачи (формула 1)∑!!!!!!!! !" ∗!"—> min!!!! !! = 1,!!!! !" =1,(1)∀∀Xij € {1;0},где Dij – дистанция между кластерами i и j; Xij – переменная сопоставимостикластеров i и j, которая в значении 1 означает, что кластеры i и j сопоставимы, взначении 0 – не сопоставимы.Следующимклассифицированныхшагомявляетсякомпанийвизмерениекластерыдляпоказателя1000корректносгенерированныхподвыборок, построение частотного распределения вычисленного показателя иопределение среднего значения этого показателя.
Гипотеза 2 (Н2): результатыкластерного анализа устойчивы к изменению массива данных на 10%. Важноотметить, что если результаты кластерного анализа являются устойчивыми, товозможно проводить процедуру попарного сравнения между полученнымикластерами. Если результаты кластерного анализа не являются устойчивыми, тораспределение данных является или близко к однородному, что не даетоднозначных результатов и не представляет интереса для дальнейшегоисследования кластеров.
В таком случае исследователям стоит сразу перейти квыявлению взаимосвязи методом KNN.562.3 Методы исследования взаимосвязи МП и финансовых результатовкомпанииИсследование взаимосвязи МП и финансовых результатов компанииявляется новизной в глобальном проекте СМР. В рамках исследований СМРдобавлялилишьсубъективныепоказателиROIкомпанийотносительноближайшего конкурента в качестве характеристики кластера, но никакихстатистических зависимостей не устанавливали. В исследовании используется дваподхода для изучения взаимосвязей с финансовыми показателями деятельностифирмы: межкластерное попарное сравнение финансовых показателей компаний иметод машинного обучения KNN (k ближайших соседей), с помощью последнегоопределяются типы МП, которые используют финансово успешные и финансовонеуспешные компании.2.3.1 Попарное сравнение кластеров по финансовым показателям: выручка,чистая прибыль, ROS, ROIСуществует предположение, что компании, активно использующие МП,относящиеся к, так называемому, кластеру «Гибрид высокоактивный», гдеинтенсивность использования компанией всех типов МП выше среднейинтенсивности по выборке, являются финансово успешными.
Используя данныйметод, автор не устанавливает первопричину финансовой успешности: компаниифинансово успешны благодаря активному использованиям всех типов МП или,наоборот, финансовое положение самих компаний позволяет использовать всетипы МП выше среднего в выборке. А также, компании, интенсивностьиспользования МП которых ниже, чем в среднем по выборке, находятся взатруднительном финансовом положении, и их можно отнести к финансовонеуспешным компаниям. Подтверждение или опровержение этих предположенийбудет проверено с помощью попарного сравнения кластеров, сформированных врезультатекластерногоанализа,ифинансовыхпоказателейкомпаний,57находящихся в этих кластерах. Информация по чистой прибыли компании,выручки, рентабельности активов и рентабельности реализации за период 20082012 гг. получена благодаря базе данных СПАРК.














