Автореферат (1138747), страница 4
Текст из файла (страница 4)
Расходы на стимулирование перехода абонента на другойтарифный план в рамках данного исследования не учитываются, поскольку нерассматривается влияние маркетинговых мероприятий.Расчет планируемой прибыли телекоммуникационной компании на всемпериоде прогнозирования T определяется по формуле (6): () = ∑=1 ∑=1 ∗ ( ) ∗ (, , , )(6)Где: () – прибыль сотовой компании на всем периоде планирования T; ( )–количество -гоабонентовкластераабонентскогопотребления.Аналогичнымобразомможетбытьрассчитанаприбыльтелекоммуникационной компании на любом этапе планирования.Предложенаконцепцияразработкиновоготарифногопланателекоммуникационной компании на основе выявленных устойчивыхгрупп существующих тарифных планов и предпочтений абонентовнелинейно связанных с характеристиками тарифных планов.Формирование нового тарифного плана включает в себя сложноформализуемые параметры, что делает автоматизированное формированиеновоготарифногопланавесьманетривиальнойзадачей.Количествостоимостных характеристик, описывающих тарифный план, может бытьбольшим, вместе с тем, отношение абонентов к стоимостным характеристикамменяется в зависимости от их величины, что вероятно, отразится в виденелинейной связи CLV и стоимостных характеристик тарифного плана.Решение данной задачи возможно с использованием нейронной сети, посколькуданный метод позволяет автоматически учесть нелинейность взаимосвязейпараметров.
Математические принципы, заложенные в алгоритм, схожи спринципами работы человеческого мозга, что обеспечивает большую гибкостьпри анализе данных. Другим большим преимуществом нейронной сетиявляется универсальность ее применения при работе с различными типамиданных. Поэтому использование данного метода позволяет построитьнейросетевую модель, которая обеспечит выявление взаимосвязи стоимостныххарактеристик с CLV для всех абонентских кластеров. Выделяется триосновных недостатка данного метода.Первый, высокая вероятность переобучения алгоритма, вследствиеизлишне точного учета нелинейных связей алгоритмом.
Данная проблемаособенно актуальна для выборок небольшого объема. Второй, невозможностьвоспринять и логически проанализировать сформировавшиеся связи. Третийнедостаток является следствием второго и специфичен для задачи «построенияоптимального тарифного плана для каждого абонентского кластера на всепериоды». Поскольку не позволяет непосредственно получить комбинациюстоимостных характеристик, которая будет оценена нейронной сетью похарактеристике CLV как максимальная. Первый недостаток не являетсясущественным для данного исследования, поскольку выборка содержитдостаточно большое количество наблюдений.Второй недостаток алгоритма нейронной сети также не критичен дляданной задачи, т.е. им можно пренебречь, так как цель исследования необъяснить влияние стоимостных характеристик на величину CLV, а определитьоптимальный тарифный план.Нивелировать влияние третьего недостатка можно за счет примененияэвристического алгоритма, способного подобрать ту комбинацию стоимостныххарактеристик, на которой обученная нейронная сеть позволит получитьмаксимальный CLV, для заданного абонентского кластера за определенныйпериод планирования.
Справиться с данной задачей способен любой21эвристический алгоритм, в том числе, и весьма популярный в настоящее время,генетическийалгоритм.Наиболеесущественнымипреимуществамигенетических алгоритмов являются: возможность нахождения глобальногоэкстремума, универсальность работы с оптимизируемыми показателями, атакже быстрота работы.Разработана информационно-логическая модель создания и оценкинового тарифного плана на основе синтеза нейронной сети и генетическогоалгоритма (рис.
2).K множествоабонентскихкластеровK множество абонентскихкластеров Ki, где i = [1...I].Ki характеризуетсяповеденческимихарактеристикамиP множество тарифныхплановP множество тарифныхпланов Pj, где j = [1...J]. Pjхарактеризуетсястоимостнымхарактеристикамтарифных плановВвод стоимостныххарактеристиктарифных плановэкспертомИнвесторы- Период планированиятарифной политики (T)- Временной шагпланирования тарифнойполитики (ts), где s = [1...S]- Ставка дисконтирования(d)Обученная нейронная сеть.Прогнозирующая значениеCLV каждого абонентскогокластера по всем периодампланированияОценка CLV По наборустоимостныххарактеристиктарифного планаГенетический алгоритмгенерирующий стоимостныехарактеристики тарифногопланаУсловиеостановкиалгоритмаРасчет значения CLVкаждого кластера по всемпериодам планированияна всех тарифных планахРасчет доходности абонента покаждому кластеру тарифныхпланов для каждого абонентскогокластера. На всех периодахпланирования тарифной политикиОбучение нейронной сети,прогнозирующей CLV Для каждогоабонентского кластера взависимости от периодапланирования и стоимостныххарактеристик тарифного планаРезультаты оценкитарифного планавведенного экспертомНабор стоимостныххарактеристикмаксимизирующих CLVТарифного планаРис.
2 Информационно-логическая модель формирования и оценки тарифного планателекоммуникационной компанииВ третьей главе диссертационного исследования была проведенаапробация предложенного подхода на выборке из 2 356 753 наблюдения поабонентам Москвы и Московской области за период с 1 января 2011 по 31декабря 2014. Выработаны рекомендации по формированию тарифнойполитики с учетом выявленных индивидуальных предпочтений абонентскихкластеров на основании ожидаемой прибыльности по различным группамтарифных планов.
Спрогнозирована прибыль с учетом перехода абонентов надругие группы тарифных планов, рекомендованные в соответствии срезультатами,полученныминаосноверазработаннойинформационно-логической модели, реализованной в SPSS Modeler v.16 (рис. 3, 4, 5).На рис. 3 в соответствии с пунктами от 1 до 10 представлены этапыподготовки данных, кластеризации абонентов и тарифных планов.1.Источник данных, содержащий факты потребления и тарификацииабонентов, подключенный тарифный план.222.Вычисление среднего трафика на абонента для выравнивания трафика оттренда, сезонных отклонений и минимизации шумов.Рис. 3 Подготовка данных, кластеризация абонентов и тарифных планов.13.Расчет долевых характеристик потребления.4.Расчет стоимостных характеристик потребления абонента.5.Исключениетарифныхтехнических,планов,путемVIP-тарифовисключенияи1%другихспецифическихабонентов,наименеераспространенных ТП, это оставляет из 198 ТП – 83 наиболее популярных.6.Применение узла исключения аномалий, он удаляет 1% записей, которыенаиболее сильно отличаются от других наблюдений (аналог удалениявыбросов).7.Выделение методом главных компонент 14-и латентных, независимыхДалее в пронумерованных от 1 до 10 пунктах списка раскрывается содержание узлов, указанных на рис.
3 впримечании к узлам модели123переменных из 34-х первичных характеристик, отражающих абонентскоепотребление.8.Проведение кластеризации 2 356 753 наблюдений абонентов по 14факторам,методомабонентскихсамоорганизующихсякластера,характеристикам.Анализхарактеристикам:интернетзначимокартКохонена,различающихсяполученныхтрафик,кластеровголосовойвыявилопопервичнымпотрафик,24основнымCLV,средняяпродолжительность жизни клиента позволил сделать следующие выводы.Абоненты 11 кластера потребляют только интернет трафик: в среднем 6,8 гб вмесяц и эта величина значительно больше, чем в любом другом кластере, приэтом потребление голосового трафика составляет 10 минут, CLV равно 730рублям, а средняя продолжительность жизни составляет 20,5 месяцев.Абоненты, попавшие в кластеры 4, 6, 8, 10, 15, 18, 21 имеют высокоепотребление голосового трафика (от 338 минут, до 601) и очень малоепотребление интернет трафика (от 74 мб до 200 мб).
Абоненты кластеров 22,23, 24 характеризуются крайне низким потреблением услуг связи (до 72 минутголосового трафика и до 124 мб). Абоненты 1, 2 и 3 кластеров показываютнаибольшуюпотребностьвпотребленииуслугсвязи,таксредняяпродолжительность голосовых вызовов в месяц составляет от 739 минут и до909, а интернет трафика от 329 мб до 462. В качестве параметров длякластеризации использовались характеристики потребления услуг связи, но приэтом все кластеры также значимо различаются по значению CLV.9.Выделение 5-и независимых, латентных переменных методом главныхкомпонент, на основе 14-и первичных стоимостных характеристик тарифныхпланов, таких как: стоимость минуты голосового вызова, стоимость одногомегабайта трафика, стоимость отправленного СМС сообщения и т.п.10.Проведение кластеризации с использованием самоорганизующихся картКохонена множества из 83 тарифных планов и получение 11 групп тарифныхпланов (ТП), имеющих статистически значимые различия, на основевыявленных 5 независимых факторов.