Диссертация (1138748), страница 11
Текст из файла (страница 11)
Поитогам каждый из n объектов присвоен какому-либо кластеру; На следующем шаге итерации для определенных кластеров повторнорассчитываются центры масс, и так каждую итерацию. Данный итеративный59процесс происходит так долго, пока определенный критерий не прекратитуменьшать значение на каждом шаге итерации. Чаще всего применяетсякритерий оценки суммы квадратов ошибок (расстояний). На рис. 7проиллюстрирован механизм работы k-means для k кластеров, равного двум.Выбор числа не имеет однозначного решения, а значит всегда будет оставатьсясложным вопросом и относиться больше к области экспертного выбора. Вслучае, когда исследователь не готов остановиться на каком-то количествекластеров и не имеет предпосылок или требований к количеству кластеров, торекомендуются подойти к этому процессу итеративно: указать 2 кластера,после этого рассмотреть вариант при 3-х, 4-х, 5-и кластерах и т.д., анализируяполучающиеся результаты кластеризации.Рис.
7 Пример работы алгоритма k-средних (k=2) (Источник:Чубукова, 2010)60Наиболее важным критерием оценки качества полученных кластеровявляется проведение анализа сравнения средних между всеми параметрамикластеров. Если кластеры значимо различаются по всем параметрам, то можносчитать проведенную кластеризацию успешной. В случаях же, если некоторыепараметры разделились не значимо, то вероятно стоит рассмотреть вариантыс другим количеством кластеров, вероятно меньшим, или исключить даннуюпеременную поняв, что она случайно распределена относительно остальныхпеременных и провести кластеризацию с ней в текущем наборе исследуемыхпараметров объектов не представляется возможным.Второй проверкой, которую стоит произвести – проверка на стабильностькластеризации, особенно это актуально, если объекты исследования меняютсяс течением времени, и имеется статистика об их изменении.
В результатекачественно проведенной кластеризации, получившиеся кластеры должныбыть устойчивы к изменениям, связанным с течением времени.Среди основных преимуществ алгоритма k-means: Скорость работы; простота применения; понятность и прозрачность функционирования алгоритма.В качестве минусов алгоритма k-means отмечаются чувствительность квыбросам и ошибкам в данных. Выбросы часто вносят сильное искажение всреднее, в рамках конкретного кластера. Для решения данной проблемыприменяется модификация данного алгоритма – k-медианы, который из-засвойств расчета медианы не чувствителен к выбросам.2.2 Учет абонентских предпочтений потребителей услугтелекоммуникационной компании на основе кластерногоанализаДля современной телекоммуникационной компании становится все болееважным детальнее понимать и учитывать в своем развитии интересы своихклиентов.
В идеальной ситуации компания бы учитывала интересы и61возможности каждого клиента, формировала индивидуальное предложение,которое бы подходило исключительно ему, но в действительности имеяразличные ресурсные ограничения компании приходится сопоставлять своивозможности и ожидаемые выгоды от учёта предпочтений клиентов.Построение точной модели, которая была бы способна формироватьиндивидуальные предложения, на текущей момент не представляетсявозможным. При этом потребность в дифференциации предложенийтарифных планов на свои услуги, телекоммуникационным компаниямочевидна, вследствие этого есть потребность каким-то образом формироватьнекоторый набор предложений услуг для клиентов.Решением существующего противоречия между потребностью учётаособенностей клиентов и реальными ресурсными возможностями компаниистановится подход по сегментированию клиентской базы (Вейнберг, 2013).
Стем, чтобы получить группы клиентов со схожими характеристиками, данноеразделение производится по «признакам сегментирования» (Конрад, 2012).В качестве «признаков сегментирования» могут выступать различныегруппы параметров, описывающих клиентов. Помимо наиболее популярных ипонятных признаков (Андреева, 2012) в телекоммуникационной отраслиимеютсяисвои,специфические.Совокупныйсписок«признаковсегментирования»: Географическиепризнаки(принадлежностькразличнымрегиональным структурам, различной плотности населения иклиматических особенностей) Психографические характеристики (типы личности, темперамент,социальная среда) Демографические признаки (пол, возраст, семейное положение,образование, доход, вид деятельности)62 Лояльность (длительность взаимодействия с компанией, оценкадеятельности компании, жалобы на деятельность компании) Стоимостные (выручка от звонков по различным направлениям,выручка от отправленных СМС сообщений, выручка от Интернет ит.п.) Потребительские (количество минут исходящих разговоров навнутреннюю сеть, количество отправленных СМС сообщений,количество мегабайт скаченного Интернет трафика и т.п.) Уровень качества потребляемых услуг (доля обрывов звонков,скорость функционирования сети Интернет и т.п.)Какие именно признаки необходимы компании для сегментированиязависит от цели, которую преследует сегментирование, и в действительностикомпания может использовать любые признаки из перечисленных и способнасгенерировать другие.
При формировании тарифной политики допустимоиспользование очень широкого спектра признаков, например, качество связинекоторой местности, и, если где-то не выгодно или нет юридическойвозможности модернизировать качество предоставляемой связи, компаниямогла бы это учесть и предоставить финансовые скидки для повышениялояльностиклиентов.Втекущейзадачеисследованиястоитучетпотребительских предпочтений абонентов, что очевидно, является одной изнаиболее важных групп признаков абонентов.В работе Вейнберга Р.Р.
(Вейнберг, 2013) анализируется как именнонеобходимо выявлять профили клиентского потребления. Клиент отличаетсяот абонента тем, что один клиент в рамках сотовой компании, тем, что можетпредставлять, как одно устройство потребления, так и группу и физически этомогут быть различные потребители. Абонент же — это всегда одноустройство, а значит физически только один потребитель.63Для выявления профилей клиентского потребления в работе проводитсясравнительный анализ методов кластеризации К-средних, К-медоид и ГафГева, с оценкой оптимального количества кластеров по методу изгиба поТорндайку.В качестве абонентских характеристик помимо 12 характеристикпотребления, выраженных в долевом потреблении услуг мобильной связивнутриклиентскогокластера,представленагруппаличностныххарактеристик, таких как пол, возраст и образ жизни.Результатом применения всех трех методов кластеризации, при заданномограничении кластеров от 2 до 15, к 1000 случайных клиентов компании МТС,является оптимум в виде 4-х кластеров клиентского потребления.
Которыйполучается путем применения метода изгиба по Торндайку.Работа представляет явный интерес и актуальность. Среди недостатковданного подхода можно указать построение профилей потребления наклиентах телекоммуникационной компании, а не на абонентах. Так проводяоценку на клиентах, можно получить очень крупных клиентов, у которыхвозможно 10, 100 и большие порядки количества абонентов, что вдействительностивстречаетсявтелекоммуникационнойкомпании.Клиентами сотовых операторов являются не только физические лица, но иорганизации разного размера. Абонент же всегда остается физически однимпотребителем, если не учитывать возможность потребления с одногоустройства несколькими людьми, что, конечно, тоже происходит, в случаеесли устройством является модем, предоставляющий связь с сетью Интернетна семью.Другой недоработкой является отсутствие сравнительного анализа сметодами,автоматическиопределяющимиструктурупотребленияивыделения количества профилей потребления непосредственно из самихданных потребления, например, метода самоорганизующихся карт Кохонена.64Недостатком можно считать и применение личностных характеристик,таких как пол, возраст, образ жизни и др., поскольку в действительности нетак важно какой у абонента пол, если потребление всех характеристик(голосовая связь, смс, доступ к сети Интернет и др.) происходит одинаково.Личныехарактеристикибудутвесьмаактуальныприпроведениимаркетинговых адресных компаний, но при формировании профиляпотребления, они, вероятно, внесут только не целесообразное разбиениекластеровнесвязанногоспотреблением.Приэтомличностныехарактеристики, если они взяты с момента регистрации (покупки sim-картыклиентом), могут не отражать действительного потребителя связи, так каккрайне часто распространены ситуации, когда sim-карта приобретается однимфизическим лицом, а используется другим.
Например, покупка sim-картыродителями для своих детей, престарелых родителей, супруг или иныхродственников.Формирование тарифной политики в первую очередь ориентируется насопоставление объема услуг, предлагаемого для потребления абоненту, истоимости данного объема. Вследствие чего, считается целесообразнымсегментировать абонентов именно по всему набору потребительскиххарактеристик и сопоставить его с существующими тарифными планами, длянахождения оптимального соотношения объема потребляемых услуг и, какследствие, удовлетворенности потребителя, т.е. максимизации полезности дляабонента и максимизации прибыли для компании. Для сегментации абонентовпо потребительским характеристикам наиболее перспективным кажетсяиспользование одного из методов кластеризации.
Кластеризация абонентов похарактеристикам потребления означает формирование независимых профилейпотребления, что в свою очередь позволит более осознанно разрабатыватьновые тарифные планы. Несомненно, важным свойством будет устойчивостьданных профилей с течением времени, что позволит телекоммуникационнойкомпании производить меньше корректировок тарифных планов и высвободитресурсы для большей кастомизации под полученные профили потребления.65Полный список использованных исходных характеристик потребления услугсвязи представлен в приложении 2.В рамках данной работы анализируется влияние тарифной политикикомпании на прибыль от ее основной деятельности. Для оценки прибыльностикомпании предлагается использовать характеристику долгосрочной прибылиотклиента(CLV–clientlife-timevalue),котораяпоказываетдисконтированную прибыль от клиента за все время потребления им услугкомпании (Berger, 1998; Pfeifer, Carraway, 2000; Fader, Hardie, e Lee, 2005;Dwyer, 1989; Dipak, Siddhartha, 2002).
Показатель CLV одновременнохарактеризует и удовлетворенность абонента своим взаимодействием скомпанией (Третьяк, Слоев, 2012), т.к. позволяет учесть долю оттокаабонентов на анализируемом временном периоде. −1() = () ∗ ∑=1 (1+) − () ∗ ∑=1 (1+)−0,5(25)Где: () – долгосрочная ценность абонентской базы за период ,; T – горизонт планирования; d - ставка дисконтирования; GC() - доходы от абонентов к моменту ; M() - расходы на абонента к моменту ; r - доля оттока абонентов за период от 0 до , 0 – момент началапланирования;2.3 Информационно логическая модель кластеризации абонентовЗадача формирования профилей потребления клиентов весьма сложная(Галямов, 2014). Несомненно, для компании, как и для клиента важно, чтобыучитывалось именно мнение клиента, но при этом компания собирает строгие66данные о клиентах только в перспективе абонентов.