Диссертация (1138729), страница 10
Текст из файла (страница 10)
– функция соседства с центром в нейроне-победителе,
При этом вектор выбирается случайно из обучающей выборки на итерации
. Функция
представляет собой невозрастающую функцию от времени (итерации) и выражает расстояния между нейроном-победителем и соседними нейронами в сети. Эта величина, называемая также радиусом обучения, выбирается достаточно большой на начальном этапе обучения и постепенно сокращается таким образом, что в конечном итоге обучается один нейрон-победитель. Наиболее часто используется функция
, линейно убывающая от времени.
Рассмотрим теперь функцию скорости обучения . Наиболее часто используются два варианта этой функции: линейная и обратно пропорциональная времени
, где A и B — это константы, выбранные таким образом, чтобы выполнялось условие
. Хотя, как отмечают Дебок и Кохонен [14]: «…выбор закона, по которому
уменьшается до нуля, не является очень принципиальным…». Применение функции
приводит к тому, что все вектора из обучающей выборки вносят примерно равный вклад в результат обучения. Как уже отмечалось ранее, процесс обучения состоит из двух основных фаз: на первоначальном этапе выбирается большое значение скорости обучения и радиуса обучения, что позволяет расположить вектора нейронов в соответствии с распределением данных в выборке, а затем производится точная подстройка весов, когда значения параметров скорости обучения много меньше начальных.
Для завершения процесса визуализации необходимо определить цвет ячеек на карте. Самый простой вариант – использование градаций серого, но в принципе можно использовать любую градиентную палитру. Цвет ячейки определяется в зависимости от значения компонент (близкие по значению компоненты имеют близкие по оттенку цвета). Карты в совокупности образуют атлас («слоеный пирог»), отображающий расположение компонент, связи между ними, а также относительное расположение различных значений компонент. Такой набор карт может использоваться для анализа закономерностей, имеющихся между компонентами набора данных.
По мнению зарубежных исследователей (см., например, Ли (Н.Li [75])), программный пакет Viscovery SOMine, разработанный Eudaptics29, является одной из лучших реализаций методологии СОК (SOM30). Программа позволяет использовать три метода кластеризации: кластеризация по методу Уорда, модифицированная кластеризация Уордa и кластеризация методом одиночной связи. «SOM-Ward» кластеризация использует классический метод Уорда [88], что позволяет получить кластеры с минимальной внутрикластерной вариацией. Метод одиночной связи (метод «ближайшего соседа») определяет расстояние между кластерами как расстояние между двумя ближайшими объектами (соседями) из разных кластеров. Согласно алгоритму Уорда («SOM-Ward») кластеризация начинается с того, что каждый объект формирует свой собственный кластер, а процесс объединения объектов ограничивается исключительно их топологической близостью. В результате обычно получается несколько больших и набор меньших кластеров.
Ли (H.Li) [75], рассматривая вопрос сравнения качества различных методов кластеризации, применил классический подход, при котором исследуется задача, с уже известным составом кластеров. В итоге методы «SOM-Ward» и «SOM-modified Ward», реализованные в пакете Viscovery SOMine, позволили с точностью свыше 90% определить количество и состав кластеров, в то время как при использовании метода К-средних качество определения состава кластеров оказалось ниже, составив чуть более 80%. В то время как метод К-средних требует изначального задания числа кластеров, в методах, реализованных в Viscovery SOMine, программа определяет и число кластеров и качество кластеризации при данном числе кластеров. А поскольку исследователь заранее не знает числа кластеров в наборе данных, то метод СОК, позволяющий достаточно точно определять их число, является крайне востребованным на практике.
Именно этот метод применен нами на таком важном этапе нашей работы, как выявление специализаций, характерных для российских банков. Кластеризация по методу СОК была реализована с использованием программного пакета Viscovery SOMine.
Для определения специализаций нами исследована структура активов российских банков, для чего в активах-нетто выбраны процентные доли следующих показателей: «МБК выданные», «Кредиты, выданные физическим лицам», «Кредиты, выданные юридическим лицам и органам власти» и «Вложения в ценные бумаги». Таким образом, определение специализации банков для целей данного исследования основывается на изучении структуры их активных операций и не учитывает специализацию банка по структуре привлеченных средств31. Анализ корреляции свидетельствует о том, что эти показатели можно считать независимыми (уровень корреляции не превышает по модулю 0,3), и они могут использоваться для определения типа специализации банка.
Таблица 6. Корреляция показателей, используемых для определения специализации
МБК выданные | Кредиты физ. лицам | Кредиты юр. лицам | Вложения в ценные бумаги | ||
МБК выданные | Pearson Correlation | 1 | 0,118(**) | -0,257(**) | -0,190(**) |
Sig. (2-tailed) | 0,000 | 0,000 | 0,000 | ||
N | 13233 | 13233 | 13233 | 13233 | |
Кредиты физ. лицам | Pearson Correlation | 0,118(**) | 1 | -0,286(**) | -0,192(**) |
Sig. (2-tailed) | ,000 | ,000 | ,000 | ||
N | 13233 | 13233 | 13233 | 13233 | |
Кредиты юр. лицам | Pearson Correlation | -0,257(**) | -0,286(**) | 1 | -0,301(**) |
Sig. (2-tailed) | 0,000 | 0,000 | 0,000 | ||
N | 13233 | 13233 | 13233 | 13233 | |
Вложения в ценные бумаги | Pearson Correlation | -0,190(**) | -0,192(**) | -0,301(**) | 1 |
Sig. (2-tailed) | 0,000 | 0,000 | 0,000 | ||
N | 13233 | 13233 | 13233 | 13233 |
** Корреляция значима на уровне 0,01 (2-tailed)
В ходе анализа исследуемой выборки, состоящей из 401 банка, было выявлено четыре группы банков, различающихся приоритетными направлениями деятельности. Эти группы можно условно обозначить как «корпоративные», «ссудные», «универсальные» и «банки для банков».
В расчете процентной доли используются брутто-показатели по статьям активов. Следует заметить, что в случаях превышения «доли» уровня в 100% наблюдается значительный объем создаваемых резервов по выданным ссудам (до 40% от всех выданных ссуд), что, конечно же, является аномальным. Такие особенности отличают банк «Викинг» (лиц. 2), а также банк «Капитал» (лиц. 575) (см. Приложение 2).
Для «корпоративных» банков характерна более высокая доля в портфеле активов ссуд, выданных юридическим лицам и органам власти (57%). Эта группа банков – самая многочисленная.
Профиль деятельности «ссудных» банков характеризуется не только кредитованием коммерческих организаций (34%), но и значительной долей кредитов, выданных физическим лицам (23%). Поскольку многие российские кредитные организации часто не способны выдавать кредиты на значительные сроки и в больших объемах, как того требуют крупные коммерческие организации, то значительное место в банковской системе занимают банки, удовлетворяющие потребности небольших коммерческих фирм и населения.
Деятельность «универсальных» банков характеризуется высокой долей ценных бумаг (28%) и кредитов, выданных юридическим лицам (30%). Из-за высокой доли ценных бумаг в активах эти банки также можно охарактеризовать как спекулятивные. Структура активов этих банков в достаточной степени диверсифицирована, так как они также проводят активные операции на межбанковском рынке (7%) и кредитование физических лиц (7%), но доля этих операций в общем объеме незначительна.
«Банки для банков» отличаются высокой долей выданных межбанковских кредитов (24% активов), а также кредитов коммерческим организациям (34%). Вложения в ценные бумаги составляют в среднем 10% активов этих банков. «Банки для банков» практически не занимаются кредитованием населения (4%).
Таблица 7. Специализации банков (центры кластеров)32
| МБК выданные | Ценные бумаги | Кредиты юр. лицам | Кредиты физ. лицам |
Корпоративные | 4,3% | 3,9% | 56,7% | 7,9% |
Ссудные | 3,5% | 2,7% | 34,2% | 22,5% |
Универсальные | 7,2% | 27,6% | 29,5% | 7,4% |
Банки для банков | 24,3% | 10,2% | 33,9% | 3,5% |
Рисунок 1. Специализации банков (центры кластеров)