Диссертация (1138018), страница 11
Текст из файла (страница 11)
Более того, осуществляетсяпроверка значимых различий между кластерами по критериям: индекса должнойосмотрительности; индекса финансового риска, индекса платежной дисциплины.Перечисленныепоказателипомогаютопределитьфинансовоесостояниекомпаний и принять решение об инвестициях и будущих перспективахплатежеспособности организации.2.3.2 Возможность установления взаимосвязи между темпом прироста чистойприбыли и МП с помощью метода машинного обученияИсследования в менеджменте с помощью методов машинного обучения,которые в свою очередь относятся к методам искусственного интеллектараспространены только в узконаправленных отраслях, в основном связанных скомпьютерными технологиями и Интернет-безопасностью, и занимают лишь 2%публикаций в сфере менеджмента среди всех областей науки (рисунок 5).58Рисунок 5 – Предметные области публикаций с ключевым словом «Artificial Intelligence»Источник: составлено автором на основе данных Scopus, 31834 статей, период публикаций 19702015 гг.Определение «искусственного интеллекта», опубликованное на сайтеАссоциации совершенствования искусственного интеллекта13: научное пониманиеи воплощение в машинах механизмов, лежащих в основе мышления и разумногоповедения.
Искусственный интеллект предполагает два процесса: обучение итренировку машины. Одним из методовискусственного интеллекта, которыйотносится к продукционным моделям представления знаний, является метод Kближайших соседей. Метод k-ближайших соседей возник в 1950-х гг. и основноеего предназначение – алгоритм классификации, основанный на распознаваниесхожих моделей поведения в данных. Начиная с 2002 года, публикации статей сиспользованием метода k-ближайших соседей резко возрастает (рисунок 6).
Ростпубликаций можно обосновать развитием дисциплин машинного обучения(machine learning) и статистических методов интеллектуального анализа данных(data mining). Благодаря последней дисциплине применение методов широкораспространилось в смежных дисциплинах. Однако в сфере бизнеса именеджмента исследования методом KNN занимают менее 2% (рисунок 7).Сайт ассоциации Association for the Advancement of Artificial Intelligence:http://www.aaai.org/home.html.
Ссылка на определение «искусственного интеллекта»:http://aitopics.org/topic/ai-overview.1359Рисунок 6 – Количество публикаций, поиск по ключевому слову «KNN method»Источник: составлено автором на основе данных Scopus, количество статей: 2828 за период1963-2014 гг.Рисунок 7 – Предметные области публикаций с ключевым словом «KNN method»Источник: составлено автором на основе данных Scopus, 3569 статей, период публикаций1963-2016 гг.60Простота понимания и применения метода являются его неоспоримымипреимуществами и объясняют популярность его среди инструментов научныхисследований в мире.
Как и любой другой метод машинного обучения, алгоритмметода KNN проходит два этапа: обучение и непосредственно классификацию.Технически, алгоритм применения метода представляет собой инкрементальноеобучение на подвыборке базы данных. В теории алгоритм KNN относится ккатегории «ленивые обучаемые» («lazy learners»), поскольку алгоритм непрогнозирует никакие модели, что позволяет относительно быстро обрабатыватьданные. В процессе обучения алгоритм выбирает такое количество ближайшихсоседей k, которое при заданных условиях максимально точно классифицируетнаблюдения.
Далее оптимальное число k тестируют на других подвыборках базыданных и проверяют точность классификации метода. Ближайшие соседивыбираются программой на основании минимальной дистанции, рассчитанной поформуле Евклидова расстояния, где интенсивности использования типов МПявляются координатами компаний в выборке.
Иногда возникают спорныеситуации, например, оптимальное число k соответствует значению девять. Этоозначает, что зная классы девяти ближайших соседей, можно наиболее точнопредсказать класс объекта. А что если классы, которыми обладают соседираспределились в равной степени: три соседа относятся к классу №1, три соседа кклассу №2 и три соседа к классу №3, какой класс присваивать наблюдаемомуобъекту? Здесь играют роль заданные условия алгоритма, которых существуетнесколько модификаций. Самый простой способ, когда алгоритм присваиваетклассобъектуобыкновеннымбольшинством.Вслучаеодинаковогораспределения соседей на классы подключают вероятностную модель, когдаслучайным образом с равной вероятностью из списка классов алгоритмприсваивает класс объекту.
Второй вариант, когда в зависимости от дистанцииприсваивается вес «соседу», в итоге класс, набравший наибольший вес,присваивается объекту. В настоящем исследовании при классификации объектовиспользуется второй вариант.61Алгоритм выявления взаимосвязи МП и финансовых показателей методомKNN (рисунок 8), который является частью третьего этапа общей схемыисследования взаимосвязи финансовых результатов и МП.Присвоениеклассакомпании взависимостиот финансовогопоказателя*ПрименениеалгоритмаKNN длявсейвыборки**Выбороптимального k,соответсвующегомаксимальной точностиметода***Точностьметода 25%и менееТочностьметодаболее 25%Отсутствиевзаимосвязимеждуфинансовымпоказателеми типамиМПВыявлениевзаимосвязей налокальномуровнеРазделениепространстваданных на равныеобласти: Созданиесфер пространствадля каждойкомпании ввыборке.Выбор сфер,гдекоэффициентточности50% и болееРисунок 8 – Этап 3 схемы исследования взаимосвязи финансовых результатов и МП: выявление взаимосвязи методом машинного обученияПримечания:* Методология присвоения класса компаниям выборки:1) компании с отрицательным темпом прироста чистой прибыли (33%, класс №1)2) компании, значение показателя которых 1,5 и более пунктов, т.е.
высокое значение и очень высокое (26%, класс №4)3) границы интервалов для компаний классов №2 (26%) и №3 (15%) определялись разницей между верхней границы интервалагруппы №1 и нижней границы интервала группы №4, после эта разница делится поровну.** Методология создания подвыборки «обучение» и подвыборки «тест»: база данных случайным образом делится на 10 равных частей,затем девять случайно выбранных частей служат для обучения и одна десятая для тестирования.*** Точность метода – отношение количества корректно классифицированных объектов к общему количеству наблюдений.Источник: составлено автором.62-Интерпретациярезультатов62Сфера включаеткомпанию и 29ближайшихкомпаний поЕвклидовомурасстоянию(координаты интенсивностьиспользованиякаждого типа МП)ПрименениеKNNалгоритмадля каждойсферы- Сравнениецентров сфер сосреднимзначениеминтенсивностииспользованияМП- Выявлениеразличийфинансовоуспешныхкомпаний(классы 3 и 4) ифинансовонеуспешныхкомпаний(классы 1 и 2)63Основой классификации на группы с последующим применением KNN метода висследовании являются финансовые показатели компании.
Темп прироста чистойприбыли выбран в качестве основы классификации, поскольку финансовыйпоказатель позволяет отследить изменение чистой прибыли в динамике,используется в исследованиях для оценки маркетинговой деятельности в бизнесе.Более того, показатель чистой прибыли и темпа прироста чистой прибыли взарубежных исследованиях является одним из ключевых показателей дляустановления взаимосвязи с элементами маркетинговой деятельности.
Выбортакого показателя позволяет провести сопоставление результатов российского ииностранных исследований. Результаты МП обладают отложенным эффектом[Day, 1999] и зачастую отслеживаются нефинансовыми показателями [Ойнер,2008].Для каждой компании в выборке рассчитан темп прироста чистойприбыли на основе данных СПАРК по формуле (2).Темп прироста чистой прибыли =ЧП!"#! ! ЧП!"##ЧП!"##(2),где ЧП2011 и ЧП2012 – чистая прибыль компании в 2011 и 2012 годах,соответственно.Все компании выборки в зависимости от финансового показателя разделенына четыре группы (таблица 5): 1) финансово неуспешные компании «минус»; 2)финансово неуспешные компании; 3) финансово успешные копании; 4)финансово успешные копании «плюс».
Границы интервалов каждой группыопределялись двумя способами – наиболее интуитивный и часто встречающийся вэкономики – деление компаний на квартили и, исходя из двух критериев:значения самого индекса и количества компаний в группе (здесь преследуетсяцель не допустить сильного преобладания компаний одной группы). Такимобразом, в первой группе отранжированы компании по возрастанию индекса ипервые 25% отнесены в группу №1, вторые №2, третьи и четвертые в группы №364и №4, соответственно. Границы интервалов во втором случае определялисьследующимобразом:впервуюгруппуопределенывсекомпаниисотрицательным темпом прироста чистой прибыли (доля группы №1 составила33%).
Далее выделены компании, которые имеют положительные значенияпоказателя, соответствующие 1,5 и более пунктам, т.е. высокое значение и оченьвысокое. Таких компаний в выборке оказалось 26%. Границы интервалов длягрупп №2 и №3 определялись разницей между верхней границы интервалагруппы №1 и нижней границы интервала группы №4, после эта разница делитсяпополам и образует границу между группами №2 (26% компаний) и №3 (15%компаний).Таблица 5 – Классификация компаний в зависимости от значения темпаприроста чистой прибылиГруппаСпособ определения границ интервалов группПо квартилямКоличествокомпаний в группеПо заданным интерваламДолякомпаний вгруппеКоличествокомпаний вгруппеДолякомпаний вгруппе13325%4333%23225%3426%33225%1915%43225%3326%Источник: [Лагутаева, Третьяк, Григорьев, 2016].Чтобы интуитивно понять работу алгоритма классификации компаний потемпу прироста чистой прибыли в зависимости от интенсивности использованиятипов МП, описывается схема его применения.












