Диссертация (1137263), страница 5
Текст из файла (страница 5)
В 2003 году Overture, Google, и FindWhatпредложили автоматические инструменты для измерения рекламодателями [48], чтобы те могли выставить соответствующиеставки за клик. SNAP заявил как основную схему списания денегс рекламодателя в своей поисковой системе в 2004 году.Все вышеперечисленные схемы , и могут быть вразной степени привлекательны для рекламодателей – в зависимостиот того, что они хотят получить от рекламной компании. При –это скорее узнаваемость бренда, – эффективность рекламногообъявления, – заинтересованности клиента [13]. На сегодняшнийдень текущая схема списания денег с рекламодателя за клик являетсянаиболее актуальной и оптимальной с точки зрения полезности дляпоисковой интернет-системы и рекламодателей интернет-рекламы.261.3Задача распределения рекламной информации по разнымрекламным блокам на странице результатов поиска.На странице поисковой выдачи выделяется несколько мест, гдемогут быть показаны рекламные объявления:Гарантированныепоказы—местадляобъявлений,расположенные справа или снизу от результатов поиска.Спец-размещение—местодляпоказаобъявлений,расположенное сверху над результатами поиска (Рис.
1.).Результаты поискаПоказы справаСпец-размещениезапрос пользователяРис. 1. Место для показов рекламы на странице результатов поиска компании «Яндекс».27Спец-размещение является привилегированным местом дляразмещения рекламы и приоритетно для рекламодателей [7] вследствиетого, что оно расположено над результатами поиска: после того, какпользователь задаёт запрос поисковой системе, первое что он видит –это рекламные объявления, поэтому его внимание будет обращеноименно на них.
Так как цель рекламодателя – посещение пользователемего сайта, то такой способ размещения наиболее предпочтительный.Среди рекламодателей существует большое количество желающихпопасть в блок спец-размещения, поэтому среди них происходитконкуренциязапоказ.Инструментомконкуренцииявляетсявыставление ставки, по которой торгуется рекламное объявление. Чемболее привлекательным является для рекламодателя показ в блокеспец-размещения – тем более высокую ставку он выставит для своегообъявления.
Из-за высокой конкуренции и высоких ставок спецразмещения является так же наиболее прибыльным местом показарекламы для поисковой системы.Диссертационное исследование посвящено моделированию отборарекламных объявлений для показа в блоке спец-размещения.Целесообразность показа рекламного объявления над результатамипоиска определяется двумя основными критериями. Первый – этовероятность того, что пользователь кликнет на предъявленноеобъявление (кликабельность – , − − ).Можно сказать, что это – степень эффективности показа объявления,его характеристика привлекательности для пользователя.
Второйкритерий – это ставка (), назначенная рекламодателем за клик поего рекламному объявлению, показанному в рекламном блоке надрезультатами поиска.Для вероятности клика пользователя по данному объявлению,конечно, можно дать только оценку, поскольку как пользователи, так и28объявления постоянно меняются. На оценку вероятности клика влияетбольшое количество разнообразных факторов. В настоящее времяпредсказание – это открытый вопрос для исследователей. Наданный момент существует большое количество различных методов иподходов к предсказанию кликабельности, а также к выбору факторов,от которых она зависит [27], [55], [53], [21], [61].Среди них различаются следующие категории: История показов: CTR зависит от истории кликов и показов самогоконкретного объявления. При накоплении достаточной статистикиможно говорить о том, что наблюдаемый CTR приближается к«истинному» CTR объявления [12], [1]. Текст объявления: количество слов в ключевой фразе, по которойбыло показано объявление; количество слов в заголовке и текстеобъявления; доля заглавных символов в тексте объявления;различныеморфологическиеэмоциональнаяокраскатекстахарактеристики,например:объявления,количествоприлагательных, количество глаголов в повелительном наклонениии т.д.
[34], [41]. Запрос-ключевое слово: мощность пересечения слов запроса иключевой фразы; количество слов, отличающихся в запросе иключевой фразе [25]. Запрос-текст объявления: ∙ запроса и заголовка/телаобъявления, ∙ запроса и полного текста объявления и т.д.[39]. Рекламодатель: характеристики рекламной компании, бюджет,стратегия [62]. Пользователь: социально-демографические характеристики (такиекак пол, возраст, средний доход), предпочтения пользователя потематикам, предрасположенность к клику в данный конкретный29момент, кликал ли он на это объявление в прошлом, на сколькочасто он кликает на рекламу и т.д. [10], [65], [18]. Запрос: количество слов в запросе, количество символов в запросеи т.д.; навигационность, насколько запрос является коммерческим,частотность [15]. Позиционно-временной контекст: дата и время показа объявления(существует существенная разница в CTR одного и того жеобъявления, показанного утром и вечером или в будние дни ивыходные).
Сюда же можно отнести то, на какой страницепоисковой выдачи показано объявление [6]. Сопутствующие элементы: сюда входят такие признаки, какхарактеристики объявлений, показанных вместе с текущим, а так жерезультаты поисковой выдачи [9].Всё многообразие признаков используется машинным обучениемдля построения алгоритма предсказания вероятности клика пообъявлению. Однако в данной работе мы не будем касаться этоговопроса, и примем что оценка для каждой пары «ключевая фраза– рекламное объявление» нам задана.Ожидаемый доход поисковой системы, списываемый со счетарекламодателя за клик пользователя по конкретному рекламномуобъявлению, может быть оценен как произведение вероятности кликана ставку, назначенную за объявление. Именно эта ( − − ) = ∙ ввеличинанастоящеевремяслужит критерием, по которому отбираются кандидаты для показа врекламном блоке над результатами поиска. В действительностисписание денежных средств происходит несколько сложнее – согласноаукциону второй цены: списывается ставка предыдущего объявления(следующего по позиции) [29], [47].30Условия показа рекламного объявления в рекламном блоке надрезультатами поиска определяются двумя ограничениями: во-первых,количество мест для показа рекламных объявлений в рекламном блокеограничено, поэтому в действующей системе для одного запросадопускаетсяпоказ не более трех рекламных объявлений.
Такимобразом один показ рекламного блока состоит из непустогомножества рекламных объявлений, показанных одновременно поодному запросу пользователя. Во-вторых, считается, что не по всемпоисковым запросам нужно показывать рекламный блок надрезультатами поиска, так как объявления не всегда содержат полезнуюдля пользователя информацию и менее релевантны его запросу чемрезультаты поиска. Поэтому в системе показов рекламных объявленийпринято условие, что покрытие – доля запросов пользователей, покоторым показывается реклама над результатами поиска, ко всемзапросам пользователей, должна быть ограничена сверху.
Для этоговводится критерий показа рекламного объявления в рекламном блокенад результатами поиска. Если объявления (для данного запроса)превышаетнекоторыйпорог,тоэтообъявлениестановитсякандидатом на показ в рекламном блоке над результатами поиска,иначе рекламное объявление заведомо не будет показано. Критерийподбирается таким образом, чтобы часть результатов поиска несопровождалась рекламой над ними вообще.Если число кандидатов, прошедших порог, не больше трех, то всеони будут показаны. Если же их число превышает три, то в рекламномблоке над результатами поиска показываются только три рекламныхобъявления с наибольшим значением .311.4Существующие постановки задачи оптимизации показоврекламы и методы определения критерия показа врекламном блоке.1.4.1 Различные постановки задачи оптимизации показоврекламы.В литературе можно выделить три подхода к оптимизациипоказов рекламных объявлений над результатами поиска.Первый подход использует в качестве способа обученияалгоритмаранжированиярекламныхобъявленийоптимизациюрелевантности рекламы [46], [52], [16], цель состоит в максимизацииколичества кликов.В случае если алгоритм машинного обученияможет точно предсказывать клик по рекламному объявлению и егорелевантность, то этот подход также приводит к максимизации доходапоисковой системы.
Для того чтобы учесть суммарный доходпоисковой системы, один подход объединяет в себе доход ирелевантность в форме линейной комбинации [52], другой –умножение показателя релевантности на ставку рекламодателя [14].Оба этих метода являются эвристическими, поэтому нахождениеоптимальныхпараметровдостаточнозатруднительно.Когданастраиваемых параметров достаточно много, эвристический выборэтих параметров становится невозможным, так как вычислительнаясложность увеличивается экспоненциально с ростом числа параметров.Второй подход разделяет ожидаемый доход на две части,каждую из которых он старается максимизировать: и ставкарекламодателя. Предложено несколько алгоритмов для предсказания объявления с высокой точностью[27], [55], [53], [32].Предположением этого подхода, как указано в [32], является то, чтосуществует собственная релевантность объявления, которая не зависит32от контекста запроса пользователя.
Объявление с высоким значением может быть и неревантным конкретному запросу пользователя.В итоге, механизм, изложенный в первой работе [46], даетрезультатытольковслучаевысокойточностипредсказаниярелевантности объявления. Вторая и третья работы [52], [16]используют двух-шаговую оптимизацию дохода вместо релевантности.Несмотря на то, что в этих работах действительно есть определённоеувеличениедоходности,однако,релевантностьобъявленийзначительно падает.Третий подход состоит в следующем: как обсуждалось влитературе [43], [35], существует два важных фактора, от которыхзависит решение пользователя о том кликнуть на определённоеобъявление или нет. Во-первых, это – позиционность (зависимостьвероятности клика от позиции, на котором показывается объявление),которое приводит к увеличению числа кликов на рекламныеобъявления, размещённые на верхних позициях.
Другая состоит в том,что на вероятность клика пользователя влияет не только абсолютнаярелевантность конкретного рекламного объявления, но и общеекачество других объявлений в рекламном блоке. Многие авторыстроят ранжирующую функцию исходя именно из этих двух факторови достигают достаточно хороших результатов [38], [43], [49]. В работеЧжу [67] предлагается два подхода к сочетанию прибыли ирелевантности рекламных объявлений, связанных с построениемсложных целевых функций.Другие не оптимальные модели рассматриваются в работах [55],[68], [58], [5].331.4.2 Существующие методы выбора критерия показа врекламном блоке.Когдаоптимизационнаязафиксироватьранжирующийзадачапоставлена,критерийотборанеобходимообъявлений.Классической ранжирующей функцией для отбора объявлений дляпоказа в рекламном блоке над результатами поиска является .Одна из крупнейших поисковых компаний Yahoo! сортируетрезультаты поиска в зависимости от точности соответствия фраззапроса и купленной ключевой фразы, и только после этого поставке, соответствующей рекламному объявлению [36].Системапоказов интернет-рекламы на поиске Google AdWords в 2002 годуизменила критерий ранжирования рекламных объявлений со ставки заклик на ставку за клик умноженную на кликабельность.