Диссертация (1137263), страница 6
Текст из файла (страница 6)
Yahoo!начал вычислять метрику Click Index приводя позиционнуюнаблюдаемую кликабельность к стандартной. Эта стандартнаякликабельность показывается в интерфейсе рекламодателя, как их«истинная» кликабельность, но ранжирование происходит уже подругому критерию.Таким образом, при сортировке по отбор объявлениязависит только от вероятной выгоды его показа для поисковойсистемы, что является не совсем корректным по отношению кпользователям и рекламодателям.Внаучнойлитературевстречаетсядостаточнобольшоеколичество работ с различными критериями отбора объявлений дляпоказа в рекламном блоке над результатами поиска.Первым из критериев отбора, описанным в статье Агарвала [7]является ∙ + , где – качество объявления (внашем случае это предсказываемый ), а – количественная мераполезностиобъявлениядляпоисковой34системывкачествеобучающего материала и дополнительной информации о качестве(вообще говоря, это – некоторое начальное предсказание дляновых рекламных объявлений).
При выборе нужно следить забалансом между показами новых и старых объявлений. В продолжениеэтого критерия существует такая схема отбора объявлений, как по ∙ + , где = ∙ ∙ (), а – константа,показывающая на сколько полезно обучение на данном объявлении, тоесть баланс между долгосрочным и краткосрочным показомобъявления. Данный метод интересен тем, что начальный прогнозкачества объявления не является одной константой, а зависит отдисперсии этого прогноза и его ставки, то есть отбирается тообъявление на показ, которое принесёт поисковой системе большийдоход.Вторым направлением для выбора критерия показа объявленийявляетсярелевантностьрекламногообъявления–степеньзапросусоответствияпользователясодержания(семантическоесоответствие поискового запроса и текста объявления) [14], [21], [46].Однако отбор только посредством релевантности учитывает толькоинтересыпользователя.Рекламодательпрактическинеможетнапрямую повлиять на отбор его объявления на показ, так как егоставка не входит в критерий показа рекламных объявлений надрезультатами поиска.
Поисковая интернет-система тоже имеетдостаточно ограниченное влияние на свои основные показатели, такиекак суммарные клики, среднюю кликабельность и доход: отборобъявлений зависит только от запроса пользователя, и от тогонасколько корректно составлен текст объявления и оптимизировансайт рекламодателя под текущий запрос.Третьим подходом является выбор в качестве характеристик, откоторых зависит критерий показа объявлений, следующих: на сколько35фраза, по которой показывается объявление, является широкотематической или узко-тематической. Тут возникает проблемабаланса между фразами: зачастую бывает достаточно сложноопределить тематичность фраз, для этого нужно собирать и хранитьбольшое количество информации, а также обновлять её по меренакопления статистики. Следующей характеристикой рекламныхобъявлений являетсяинформация о продавце и информация обренде, представляемом объявлением [33]. Однако тут есть сложностьв достоверности данных для разных пользователей, а также изменениепредпочтений и вкусов.
Не всегда представляется возможным собратьдостаточную статистику по всем рекламодателям и брендам, а для тех,кто впервые встретился пользователю, информации нет никакой и каких ранжировать остаётся под вопросом.Четвёртымподходомсредиработ, посвящённыхотборуобъявлений в рекламный блок, является применение позиционныхмоделей показа рекламы [66]. Чжаном было выявлено, что позиция, накоторой было показано объявление, влияет на его кликабельность,следовательно, важно её учитывать при отборе объявлений.
Также дляразных рекламных объявлений показ на той или иной позиции можетиметь различный эффект, важно учесть совместный показ группыобъявлений, причём каждого на своей собственной позиции.Позиционные эффекты будут рассмотрены в данной работе какрасширение одного из критериев показа рекламных объявлений в блокенад результатами поиска.Пятым подходом, совместно с позиционной моделью, часторассматривается модель, зависящая от пользователя, то есть вкритерий показа добавляется параметр, зависящий от характеристикпользователя.
Например в [57] критерий показа имеет вид: ∙ ∙ ∙ ≥ , где добавляется мультипликативный множитель –36персональныйпризнак,обозначающийнасколькоданныйпользователь расположен кликать на рекламу в данный момент посравнению со среднестатистическим пользователем.Шестым в качестве критерия показа рекламного объявления надрезультатами поиска пробовался критерий вида ∙ . Данныйвид критерия даёт достаточно большую степень свободы при отбореобъявлений. Однако ограниченность данного метода заключается втом, что ставка и предсказанная вероятность клика входят вранжирующий критерий только как произведение одно на другое. Тоесть при любых и мы можем усиливать зависимость выбора либоот ставки данного объявления, либо от предсказанного объявления.
Более подробно про баланс между ставкой и качествомвыдачи (в нашем случае ) можно почитать в работе Агарвала [7].Как видно из представленного обзора, тема критерия показарекламных объявлений над результатами поиска актуальна и широкоисследуется научным сообществом. Также важно заметить, чтонекоторые авторы ставят оптимизационные задачи, однако врассмотренных работах есть некоторые ограничения и алгоритмыбольше эвристические и подходят только лишь к конкретнымпостановкам задачи оптимизации.1.5Постановка задачи исследования.Отбор объявлений для показа в рекламном блоке над результатамипоиска производится посредством критерия показа.
В современныхисследованиях не стоит конкретной оптимизационной задачи: каждыйиз исследователей предлагает вид критерия показа исходя из своихпредположений и предпочтений. В настоящем диссертационномисследованииоптимизационнойставитсязадачизадачапоказа37формальногорекламныхописанияобъявлений,еёматематической формулировки, а также решения исходя из внешнихограничений по некоторым характеристикам системы показоврекламы.Вышебылоприведенонекотороемножествотиповоптимизационных задач для поисковых интернет-систем.
Теперьнеобходимо зафиксировать какая именно оптимизационная задачабудет нами рассмотрена. Положим, что целесообразность показарекламных объявлений в рекламном блоке над результатами поисказадается несколькими критериями: Суммарныеденежныесредства,списываемыесосчетоврекламодателей (суммарный доход поисковой интернет-системы отпоказов рекламы на странице своей поисковой выдачи). Тогдаоптимизация правила отбора рекламных объявлений для показовнад результатами поиска представляется несложной задачей: нужнопросто подобрать такое значение критерия показа, при которомпокрытие будет в точности равно заданному ограничению (то естьдоля запросов с рекламой над результатами поиска фиксирована). Средняя кликабельность – то, насколько часто в среднемпользователь кликает на одно из показанных объявлений.
Этотпоказатель определяет удовлетворённость пользователя, а такжеэффективностьсамойрекламы.Средняякликабельностьсоответствует среднему значению по всем запросам и всемобъявлениям, попавшим в рекламный блок над результатамипоиска. Если эта величина мала, то пользователь либо перестанеткликать по рекламе, либо будет искать другие способы поискаинформации в интернете. Ни то ни другое не удовлетворяетпотребностям поисковой системы.В данной работе мы ставим задачу максимизации среднегозначения , но также действует ограничение на суммарный доход38поисковой системы, поэтому задача ставится как поиск условногомаксимумасреднейкликабельностиврекламномблокенадрезультатами поиска при условии, что сумма денежных средств должнабыть не меньше заданной величины.Кроме того, сохраняются ограничения на покрытие и на числорекламных объявлений в одном рекламном блоке над результатомпоиска.
Задача состоит в том, чтобы найти критерий показа,доставляющее максимум среднему значению CTR при упомянутыхограничениях.39ГЛАВА 2. ПОСТАНОВКА ЗАДАЧИ ОПТИМИЗАЦИИ ПОКАЗОВРЕКЛАМНЫХ ОБЪЯВЛЕНИЙ И ПОСТРОЕНИЕ АЛГОРИТМАПОДБОРА ПАРАМЕТРОВ КРИТЕРИЯ ПОКАЗА.2.1Математическая постановка задачи.2.1.1 Обозначения.Поставим задачу следующим образом: как для заданной выборкизапросовизаданногоспискарекламныхобъявленийнайтиоптимальную расстановку этих объявлений в рекламном блоке надрезультатами поиска для показа по этим заданным запросам [2], [19].Считаем, что ставки () для всех рекламных объявленийизвестны, а также известны оценки вероятности клика () длякаждой пары «запрос-объявление» (если данное рекламное объявлениев принципе не может быть совмещено с определенным ответом назапрос, то полагаем, что оценка равна нулю).
Считаем также, чтозаданы: минимальная сумма денежных средств, которая должнапоступить от рекламодателей, покрытие – доля результатов поиска,сопровождаемых рекламой над ними, а также максимальное числорекламных объявлений () в каждом рекламном блоке. При этихограничениях будем искать такую расстановку рекламных объявленийв блоке над результатами поиска, которая обеспечивает максимумсредней кликабельности – среднего значения .Задачу будем решать в том приближении, когда рекламодательплатит за клик по своей ставке, а не по правилу аукциона второй цены(сами деньги будут слегка завышены, но разницу в характеристиках мыможем достаточно точно проследить).Полагаем, что в нашей выборке имеется запросов, которые мыбудем нумеровать индексом (1 ≤ ≤ ), и задан список из баннеров, нумеруемых индексом (1 ≤ ≤ ) Обозначим далее:40 – ставка, назначенная рекламодателем за –ое рекламноеобъявление.