Диссертация (1137263), страница 15
Текст из файла (страница 15)
Для определения значимости отклоненияосновных характеристик используется A/B-testing [24], [44].Рассмотрим более подробно этап подбора параметров критерия показаобъявления в рекламном блоке. Для этой части системы есть болееподробная схема (Рис. 26.).Критерии подбора параметров:Hits, CTR, MoneyПодбор параметров критерияпоказаOff-line предсказание, , ЭкспериментРис. 26. Схема подбора параметров критерия показа.Рассмотрим более подробно каждый из пунктов: Критерииподборапараметровкритерияпоказа:, , .В качестве критериев выбраны следующие характеристики: – ограничение на покрытие рекламы (см п. 1.3).
Для поисковойсистемы важно то, насколько много она показывает рекламныхобъявлений над результатами поиска, так как от этого показателязависят её основные показатели: во-первых доход (так как рекламныйблок над результатами поиска – самое прибыльное место для показарекламы), а во-вторых – удовлетворение пользователя.115 –средняякликабельностьобъявлений, показанныхнадрезультатами поиска (см п. 1.3). При подборе параметров оцениваетсяпо более новой формуле предсказания кликабельности конкретныхрекламных объявлений. Средняя кликабельность говорит как окачестве самого объявления, так и о том, на сколько рекламарелевантна запросам пользователей.
– доход поисковой системы – важная составляющая еёуспешной работы.До того как будут подобраны параметры критерия показа, необходимозафиксировать критерии-ограничения по основным характеристикам.В зависимости от этих ограничений можно получить разныепостановки задач оптимизации показов рекламы (см. п.4.2), например,такиекак:{ = , = , → },{ , % <= −, = , → }.Каждаяизпостановок задачи оптимизации требует отдельного рассмотрения.
Наданный момент допустим, что метод подбора параметров критерияпоказа в рекламном блоке над результатами поиска для каждой из нихзафиксирован. Подбор параметров критерия показа, off-line прогноз.Как только параметры критерия показа получены и показы рекламызафиксированы – у нас есть off-line предсказание изменения системыпо основным её характеристикам. Также у нас есть возможностьзапустить on-line эксперимент для проверки полученных off-lineпредсказаний. Проведение on-line эксперимента.На данный момент каждый эксперимент проводится на некоторойдоле интернет-пользователей поиска «Яндекса» (обычно эта долясоставляет от 1 до 5%): на все их запросы реклама показывается по116новому экспериментальному методу (будь то новая формулапредсказания или просто изменение параметров критерия показав рекламном блоке).
В среднем за день это примерно 1.4 миллионовзапросов с показом рекламного блока над результатами поиска.Мониторинг эксперимента производится с периодичностью в день (кактолько накапливаются соответствующие логи показов рекламы),существует две эталонных выборки (с базовой текущей формулой), скоторыми сравниваются остальные экспериментальные формулы. Длякаждой из характеристик экспериментов считается значимость еёотклонения от соответствующей базовой характеристики эталонов. Попрошествии (как минимум) недели эксперимента можно говорить о егоon-line результатах [24], [44]. Сравнение off-line предсказания и результатов on-lineэкспериментов.Надо принимать во внимание то, что у эксперимента на частипоисковоготрафикаестьобратнаясвязьотрекламодателей,пользователей и т.д.
Из-за этого влияния off-line и on-line результатымогут различаться. Важно определить: значимо они отличаются друг отдруга или нет.экспериментаЕсли отличие не значимо и (или) результатысчитаютсяположительными(достаточнымидлявнедрения на всём трафике поисковых запросов), то текущая формулапредсказания кликабельности заменяетсянаэкспериментальнуюформулу (или происходит изменение параметров критерия показа нановые значения), и весь процесс повторяется снова. Если же on-lineпредсказания оказываются неудовлетворительными, то новая формула(или новые параметры критерия показа) отвергается и ищется причинанесоответствия ожидаемого и действительного.117Одним из наиболее важных и существенных этапов для решениязадачи размещения рекламных объявлений на запрос пользователяявляется подбор параметров показа в рекламном блоке надрезультатами поиска.4.2Различные постановки задачи оптимизации системыпоказов рекламных объявлений.Исходя из основных характеристик поисковых интернет-систем,можно выделить несколько типов оптимизационных задач:− { = , = , → }Максимизация средней кликабельности при остальных неизменныхпараметрах.
При данной постановке задачи мы максимизируемэффективность показов рекламы с учётом ограничения по покрытию ипо суммарному доходу. Это означает, что мы не хотим показывать надрезультатами поиска больше рекламы, чем раньше, при этом оставаясьпри том же доходе. Однако, среднее качество рекламных объявлениймы хотим улучшить, тем самым количество кликов так же увеличится.Это говорит о том, что пользователи, которым показывается такое жеколичество рекламы, станут в среднем кликать больше, тем самымповышается их достижение цели по поиску нужной им информации.Для рекламодателей это тоже эффективно: за те же самые денежныесредства их бюджетов кликов они получают больше, следовательносредняя стоимость для них рекламной компании уменьшается.− { = , = , → }Максимизация дохода от показов рекламы при ограничении напокрытие и средний .
В данной постановке задачи оптимизации мыпытаемся увеличивать доход поисковой системы до тех пор, покаограничения на покрытие или на средний выполняются. Мы нехотим увеличивать количество поисковых запросов с рекламным118блоком над поисковыми результатами (то есть «зарекрамленность»поисковой выдачи), а также не хотим уменьшать эффективность ипривлекательность рекламы для пользователя, фиксируя для этогосреднюю кликабельность. Однако при этой постановке задачистрадают рекламодатели: за то же количество кликов они заплатятбольше денежных средств (то есть им придётся повысить ставки).− {, % ≤ −, = , → }Максимизация при уменьшении покрытия не больше чем на процентов относительно текущего состояния, неизменный доход.
Мыхотим уменьшить покрытие, при этом эффективность рекламы так жеповышается (мы показываем меньше рекламы, при этом показываемтолько наиболее кликабельную), однако при уменьшении покрытияколичество кликов по рекламе может уменьшается, следовательно исуммарный доход может уменьшится. Чтобы этого не происходилоставится ограничение на суммарный доход.Hits=const2Money, %1,510,5001234CTR, %Рис. 27. Изменения средней кликабельности и дохода поисковойсистемы при разных вариантах опт , опт и опт− {, % ≤ −, = , → }1195Максимизация суммарного дохода при увеличении покрытия небольше чем на процентов относительно текущего состояния,неизменный . Может возникнуть задача увеличения текущегопокрытия рекламы, при этом ожидается увеличение количества кликови, соответственно, дохода. Однако чем больше рекламы мыпоказываем, тем больше среди показанных рекламных объявленийвстречаются объявления с низкой кликабельностью.
В связи с этимцелесообразно ограничение по среднему рекламных объявлений,показанных в рекламном блоке над результатами поиска.Пример работы алгоритма для разных постановок задач (Рис. 27.).В данной оптимизационной задаче мы фиксируем покрытие рекламойнад результатами поиска и ищем различные варианты изменениясредней кликабельности и дохода поисковой системы. На графике (Рис.27.) каждая точка – это изменение характеристик системы длянекоторого набора параметров критерия показа.
Видно, что при разныхзначениях параметров могут решаться разные оптимизационныезадачи, например: Максимизациядоходапрификсированнойсреднейкликабельности. Максимизация средней кликабельности при фиксированномдоходе. Увеличениедоходана1%,максимизациясреднейкликабельности. Увеличение средней кликабельности на 3%, максимизациядохода поисковой системы.Полученный в результате диссертационного исследования видкритерия показа позволяет решать оптимизационные задачи любого изпредставленных типов.1204.3Подбор параметров критерия показа.Как только вид задачи оптимизации определён, то необходимоподобрать оптимальные параметры критерия показа в рекламном блокенад результатами поиска: 1опт , 2опт и 3опт .
Система показоврекламных объявлений в интернет-системе «Яндекс» очень сложная,поэтому подбор параметров on-line на данном этапе мало возможен. Внастоящее время алгоритм подбирает 1опт , 2опт и 3опт на наборезапросов, состоящим из 100 000 случайных запросов из поисковыхлогов за неделю данных. Из этих 100 000 запросов только на частибудет показана реклама над результатами поиска (ограничение напокрытие), однако чтобы получить значения 1опт , 2опт и 3опт нужнопросмотреть весь набор запросов и соответствующих им объявленийкандидатов на показ.Для подбора значений параметров 1опт , 2опт и 3опт былреализован комплекс программ, включающий в себя следующиекомпоненты:1) QueryPool.py – выбор из лога показов рекламных объявленийслучайного набора запросов необходимого размера. На входпрограммедаютсялогирекламныхпоказов:временнаяпоследовательность запросов пользователей, на которые былопоказано хотя бы одно рекламное объявление.