Диссертация (1138375), страница 18
Текст из файла (страница 18)
Метод главных компонент позволил сократить количество показателейбез потери значимой информации путем их группирования в латентныеконструкции. На основе анализа сорока девяти переменных было выделенодвенадцать главных компонент, характеризующих деятельность театральныхучреждений и объясняющих существенную долю вариации данных выборки.Сформированные компоненты являются стандартизированными измерителями имогут быть эффективно использованы на дальнейших этапах эмпирическогоанализа.2. Результаты проведенного анализа позволили сформировать матрицу,состоящую из сгруппированных показателей, которые представляют собойудобный набор измерителей деятельности театральных учреждений, применимыйдля сравнительного анализа.
Метод главных компонент позволил проверитьобоснованность использования показателей, выделенных на основе научнойлитературы, а также исключить избыточные показатели, не отражающие разбросданных выборки.2.3. Кластерный анализ совокупности театральных учреждений РоссийскойФедерацииРезультаты анализа данных методом главных компонент позволиливыделить систему из 12 латентных конструкций – стандартизированныхпеременных, которые являются наиболее применимыми для оценки деятельноститеатральных учреждений, в том числе для оценки эффективности.Принимая во внимание гетерогенность объектов в выборке театральныхучреждений и наличия у них специфических черт, автор полагает, что объектыобладают схожими характеристиками, которые позволяют кластеризовать их.Данный этап эмпирического исследования является чрезвычайно важным, так какнетолькопозволяетсформироватьчеткоепониманиеосовокупности100театральных учреждений и наличии в ней типов объектов со схожими чертами, нотакже позволяет провести дальнейшее сравнение эффективности деятельностиучреждений культуры с поправкой на особенности объектов в рамках каждого извыявленных кластеров.
Таким образом, предложенный подход делает возможнымпроведениесравнительногоанализаэффективностидеятельностиэтихучреждений в условиях относительной гомогенности подвыборок.В исследовании был проведен кластерный анализ 2951 объекта с помощьюметода k-средних (k-means). Под объектом мы понимаем театральное учреждениев конкретный год наблюдений. При этом мы предполагаем, что объекты могутсущественно менять свои характеристики, поэтому тестируем их сквознымспособом по всем годам, не учитывающим панельной структуры данных, с цельюдалее проследить, насколько объекты стабильно идентифицированы в рамкахкаждого из кластеров во времени.
Метод k-средних заключается в итерационнойпроцедуре разбиения множества объектов на заданное число кластеров k. Приэтом вычисляются центроиды кластеров – векторы, элементами которых являютсясредние значения переменных по всему кластеру. При новой итерациипроисходит смещение центров кластеров, и алгоритм стремится минимизироватьрасстояние между элементами внутри кластеров.В диссертационной работе кластеризация была проведена на основезначений двенадцати латентных конструкций, выделенных на предыдущем этапеанализа с применением метода главных компонент. С помощью некоторогоколичества итераций в исследовании было выявлено, что выделение четырехкластеров на основе системы из двенадцати стандартизированных переменныхпредставляется наиболее правомерным. Внутри кластера объекты являютсягомогенными, в то время как между собой кластеры в значительной степениразличны.Результаты представленного в диссертационном исследовании кластерногоанализа были опубликованы в работе [Зеленская, 2018б].Распределение объектов на кластеры представлено в Таблице 2.16.Кластеры различаются по размеру: минимальное количество объектов в кластере101– 9, максимальное – 1871.
Выделение малочисленного кластера не являетсяслучайным. При проведении итераций с помощью метода k-средних, наличиеданного малочисленного кластера сохранялось (к примеру, при разбивке на3 кластера в малочисленном кластере сохранялось 10 объектов, при разбивке на5 кластеров – 11 объектов).
Данный факт говорит о статистической устойчивости(робастности) результатов и, как следствие, правомерности выделения этогокластера, составляющего 0,3% выборки. Очевидно, что он представляет собойобъекты, схожие между собой, но радикально отличающиеся от основной частивыборки. Данные кейсы нельзя игнорировать, но оцениваться они должныотдельно от основной части выборки.
Робастность результатов подтверждаетсятем фактом, что большинство театральных учреждений попали в один и тот жекластер в течение пяти лет, наблюдаемых в исследовании. В то же время, переходнекоторого количества объектов в другие кластеры в одном-двух годахнаблюдения является легко объяснимым, поскольку эффективность деятельноститеатральных учреждений в разные годы, наблюдаемая через двенадцатьлатентных конструкций, на основе которых выделяются кластеры, можетснижаться или наоборот повышаться. Таблица 2.17 иллюстрирует описательныестатистики по выделенным автором кластерам.102Таблица 2.16 Распределение объектов на кластерыКластер1234ВсегоВсегоза 2012-2016 гг.Кол-во%объектов90.3948 32.121234.17187163.42951100Составлено автором2012 годКол-вообъектов2189173785862013 год%0.3432.252.964.51100Кол-вообъектов2185223785872014 год%0.3431.523.7564.4100Кол-вообъектов2189263795962015 год%0.3431.714.3663.59100Кол-вообъектов1187293735902016 год%0.1731.694.9263.22100Кол-вообъектов219829363592%0.3433.454.961.32100103Таблица 2.17 Описательные статистики (минимальное, среднее, максимальное значения) по четырем кластерамГлавные компоненты, характеризующие деятельность театральных учрежденийКла- Значе- НефинансовыестерниеФин.ресурсымин13.00127среднее20.257721макс33.40041Количество объектов: 9мин-1.21533среднее0.6557432ТекущиерасходыКапитальныерасходыМероприятия –общееМестныемероприятияВыездныемероприятия13.4554120.724726.2116618.7683532.033743.67727-5.22134-2.326181.2769231.7476063.2421268.9862591.6275382.665825.020654-0.153496.63719812.867457.67850810.8982814.91432-0.433890.143182-0.525710.063527-0.73434-0.02391-2.89390.348651-3.014580.923067-1.093590.092781макс5.623046Количество объектов: 948мин0.432126среднее3.3904653макс8.791105Количество объектов: 1233.4875825.43066510.166849.7606778.7029310.6889462.28518213.813570.3599073.33628211.00466-2.310390.83417427.21031-1.041420.766086.300465мин-1.40968среднее-0.65655макс2.367014Количество объектов: 1871мин-1.40968-0.00251Всего среднее-0.64462-0.339512.934886-0.57874-0.427267.142844-1.58439-0.0311428.50787-0.64462-0.01081-0.57874-0.0137326.2116643.67727ресурсы4макс33.40041Составлено авторомОбщаяпосещаемостьМестнаяпосещаемостьРабота сдетьми3.7684316.14803310.83557Абсолютнаяпопулярность2.2090444.5004599.19752Доходы-1.13266-0.120873.30254721.7803933.5185648.98925-1.7127520.7635987-4.8801250.814519-1.7000050.142858-2.65932-0.54339-0.847360.1231886.7095754.5533852.2348753.64314411.866394.568233-1.538271.1898442.319449-0.658031.1861915.941324-1.0657853.2260816.977165-2.9447651.4870183.352009-0.4704151.4998325.837462-2.65932-0.909265.2205130.4945764.85287114.54359-4.31584-0.2276216.21218-6.69009-0.550772.004604-1.11198-0.155911.26842-1.771439-0.6468796.998759-10.13476-0.5390061.304846-4.646194-0.18882532.97912-2.659320.3908964.897933-0.84507-0.573947.479745-5.221340.000249-4.315840.009503-6.690090.005059-1.111980.000647-1.7714390.0028714-10.134760.0006503-4.6461940.002413-2.659320.035005-0.84736-0.0198228.5078716.212188.70293112.8674514.9143210.8355732.9791211.8663948.98925104Рассмотрим кластеры подробнее.
Для наглядности используем лепестковуюдиаграмму (Рисунок 2.3), построенную на основе средних значений по двенадцатилатентным конструкциям.Кластер 1Кластер 2Кластер 3Кластер 4нефинансовые ресурсы35доходыфинансовые ресурсы302520работа с детьмитекущие расходы151050абсолютная популярностькапитальные расходы-5местная посещаемостьмероприятия - общееобщая посещаемостьместные мероприятиявыездные мероприятияРисунок 2.3 Средние значения главных компонент по четырем кластерамроссийских театровСоставлено авторомВ Кластер 1, представленный девятью объектами, вошли два учреждениякультуры: Государственный академический Мариинский театр (2012-2016 гг.) иГосударственный академический Большой театр России (2012-2014, 2016 гг.)14.Кластер 1 выделяется по большинству переменных, используемых для построениякластеров.