Диссертация (1138018), страница 17
Текст из файла (страница 17)
В двумерном пространстве графически видны различия распределенияинтенсивности использования между типами МП.Финансово неуспешные компании группируются в правом верхнем углуплоскости координат, что свидетельствует о высоком значении интенсивностииспользования типов МП. Такое высокое значение использования демонстрируютследующие пары типов МП: TM и NM, DM и IM, DM и NM, IT и IM, IT и NM, IMи NM. Таким образом, финансово неуспешные компании демонстрируютдостаточно высокий уровень использования большинства типов МП.99Рисунок 14 – Распределение использования типов МП финансово неуспешными российскимикомпаниями (группа № 1) в двумерном пространствеИсточник: [Лагутаева, Третьяк, Григорьев, 2016].В противовес финансово неуспешным компаниям успешные компанииконцентрируются по центру плоскостей, либо в левом нижнем углу, заисключением IM и NM типов МП (рисунок 15).100Рисунок 15 – Распределение использования типов МП финансово успешными российскимикомпаниями (группа № 4) в двумерном пространствеИсточник: [Лагутаева, Третьяк, Григорьев, 2016].Выборка представляет характеристику компаний по 6 критериям: пятьтипов МП по интенсивности использования и значение темпа прироста чистойприбыли.
Результаты исследования будут представлены с двух сторон: точностьметода KNN на базе СМР-СПАРК и описание МП, характерных для областей скоэффициентом соответствия более 50%.ДлякаждогоспособаразбиениякомпанийбазыСМР-СПАРКнафинансовые группы вычислен показатель точности. Точность классификации –отношение количества корректно классифицированных объектов к общемуколичеству наблюдений. Основой для классификации компаний на группы споследующим применением KNN метода в исследовании являются финансовыепоказатели компаний.
Алгоритм KNN также, как и любой другой алгоритм101машинного обучения, разделяет базу данных на выборку для обучения (выборка«оптимизация») и выборку для тестирования (выборка «тест»). Цель алгоритмавычислить оптимальное количество k (параметр ближайших соседей), прикоторомдостигаетсямаксимальноезначениеточности.Навыборке«оптимизации» алгоритм выбирает оптимальное k, на выборке «тест» алгоритмпроверяет точность предлагаемого метода. Пропорция компаний для обеихвыборок может меняться. В данном исследовании имеется дело с базой данныхнебольшого размера, поэтому автор предполагает, что метод перекрестнойпроверки окажется точнее, чем обучение на половине базы и проверкарекомендуемых значений для второй половины выборки.
Для небольших выборокKNN данные рекомендуется анализировать с учетом перекрестной проверкибольшего числа подвыборок, то есть база данных случайным образом делится на10 равных частей, затем девять случайно выбранных частей служат для обученияи одна десятая для тестирования. Исследуются значения k от 1 до 11 соседей, гдедля каждого k вычисляется коэффициент точности, результаты отражены втаблице 10 (50% базы данных отобраны случайным образом для выборки«оптимизация и 50% базы данных отобраны случайным образом для выборки«тест») .Таблица 10 – Коэффициенты соответствия метода KNN на двух подвыборках:«Оптимизация» и «Тест»Количествоближайшихсоседей (k)Способ 1 разбиения компанийСпособ 2 разбиения компанийТочность методана выборке«Оптимизация»Точностьметода навыборке«Тест»Точность методана выборке«Оптимизация»Точностьметода навыборке«Тест»1100%28%100%32%264%26%67%29%348%28%53%28%439%29%52%25%536%26%48%26%102Продолжение таблицы 10 – Коэффициенты соответствия метода KNN на двухподвыборках: «Оптимизация» и «Тест»Количествоближайшихсоседей (k)Способ 1 разбиения компанийСпособ 2 разбиения компанийТочность методана выборке«Оптимизация»Точностьметода навыборке «Тест»Точность методаТочностьна выборкеметода на«Оптимизация» выборке «Тест»634%29%45%26%734%28%47%25%833%28%45%23%931%28%47%21%1030%29%47%21%1128%29%44%21%Источник: [Лагутаева, Третьяк, Григорьев, 2016].Во втором способе применения KNN данные анализируются с учетомперекрестной проверки большего числа подвыборок: база данных случайнымобразом делится на 10 равных частей, затем девять случайно выбранных частейслужат для оптимизации и одна десятая для тестирования.
В результате быловыбрано k, при котором коэффициент соответствия был максимален (таблица 11).Таблица 11 – Результаты исследования методом KNN с учетом перекрестнойпроверки: значение оптимального индекса соответствияПоказательСпособ 1Способ 2Точность метода навыборке«оптимизация»76%74,4%Точность метода навыборке «тест»32.6%33.3%1011Оптимальное kИсточник: [Лагутаева, Третьяк, Григорьев, 2016].Невысокоезначение103коэффициента соответствиянавыборке«тест»свидетельствует о том, что в целом нет общих закономерностей в использованииопределенныхстратегийввыбореМПкомпаниямидлядостиженияопределенного финансового уровня (вхождения в определённую группу). Однаковзаимосвязь между МП и индексом в малых окрестностях МП-пространстваоднозначно существует, поскольку для сфер, включающих до семи компаний,коэффициент соответствия на всех выборках наблюдался выше 25%, чтосвидетельствует о неслучайном процессе классификации.
Возможно, на первыйвзгляд точность 25% и 33% не сильно отличаются друг от друга, поэтому приняторешение сопоставить вероятность точности метода, соответствующую значению33% и выше. Для этого построены 10 000 баз данных аналогичного количестванаблюдений (129 наблюдений), где значение 1 принималось с вероятностью 25%,значение 0 с вероятностью 75%.
Точность метода вычислялась с помощьюотношения количества компаний, значение которых соответствовало единице кобщему количеству компаний (129). Рисунок 16 демонстрирует распределениеточности метода при условии, что финансовая группа присваивалась компаниислучайнымобразом.Наиболеечастовстречающаясяточностьметодасоответствует значению 25%, именно то, с которым происходило сравнение.Вероятность получения точности 33% и более принимает значение 1.9%. Такойрезультат подтверждает наличие взаимосвязи между типами МП и темпомприроста чистой прибыли.104Рисунок 16 – Точность метода при случайном распределении компаний на классыИсточник: составлено автором.Таким образом, наличие локальных взаимосвязей МП и индекса доказано.Гипотеза (Н3) о существовании взаимосвязи между МП и прибыльностьюкомпании подтверждена с помощью метода KNN.
Далее последует описаниенескольких окрестностей МП-пространства, где структуры данных очевидны.Для изучения взаимосвязи на локальном уровне для каждой компанииотобраны 29 компаний, максимально приближенных по типам МП (достигаетсяна основании Евклидового расстояния, где 5 типов МП являются координатамикомпании в пространстве). Таким образом созданы сферы радиусом 30 компаний.Изучив детально 10 сфер, в которых коэффициент соответствия на выборке«тест» выше 50% значения, выявлено, что наборы МП для компаний финансовоуспешных сфер, принципиально отличаются от финансово неуспешных.105Координаты центров как успешных, так и неуспешных компаний, сопоставленысо средней интенсивностью использования типа МП по выборке всех 129компаний (таблицы 12 и 13 соответственно).
Если значение координаты центравыше среднего значения интенсивности использования типа МП по всей выборкеданных, следовательно, данный тип МП используется компаниями высокоинтенсивно.Таблица 12 – Координаты центров сфер неуспешных компаний№ Области МП-пространстваTMDMITIMNM10.890.820.960.780.9420.900.930.900.920.7030.780.840.620.900.8440.900.830.880.680.90Средняя интенсивностьиспользования типа МП повыборке0.740.670.620.740.67Примечание: Выделены значения, которые превышают среднюю интенсивность по выборкеИсточник: [Лагутаева, Третьяк, Григорьев, 2016].Таким образом, установлено, что компании с негативными финансовымирезультатами используют все пять типов МП с высокой интенсивностью (Таблица12). Здесь можно назвать две возможные причины полученного результата.Перваяпричина:применяямаркетинговыйинструментарий,копаниинеанализируют его эффективность и используют все возможные опции, чтоприводит к негативным последствиям для общих финансовых результатовкомпании.
Вторая причина: респонденты, не обладали широкими знаниями вобласти маркетинга, либо хотели показать завышенные результаты компании,утверждая использование всего спектра МП максимально, что в итоге исказилокартину использования МП и продемонстрировало уровень знаний специалистовпо маркетингу в компаниях.106Успешные с финансовой точки зрения компании (Таблица 13), относящиесяк 4 группе, в своей маркетинговой деятельности придерживаются селективнойстратегии и максимально используют инструменты IM, иногда комбинируя стипами IM, IT и NM.Таблица 13 – Координаты центров сфер успешных компаний№ Области МП-пространстваTMDMITIMNM50.630.700.640.890.4060.640.500.880.880.8670.670.660.760.820.4680.620.660.680.820.7890.640.720.700.80.70100.700.640.421.000.52Средняя интенсивностьиспользования типа МП повыборке0.740.670.620.740.67Примечание: Выделены значения, которые превышают среднюю интенсивность по выборкеИсточник: [Лагутаева, Третьяк, Григорьев, 2016].В результате применения алгоритма KNN на локальном уровне обнаруженоразличие в наборах МП финансово успешных и финансово неуспешных компаний(гипотеза Н4 подтверждена).












