Стохастическая аппроксимация
6. Стохастическая аппроксимация
Под стохастической аппроксимацией понимается общее название ряда конкретных методов решения задач статистического оценивания. Эти методы объединяет то, что все они носят рекуррентный характер, т. е. имеющаяся к текущему моменту времени оценка уточняется тем или иным способом при поступлении нового наблюдения. Термин стохастическая аппроксимация был введён американскими математиками X. Роббинсом и С. Монро, предложившими в 1951 процедуру рекуррентного нахождения корня уравнения регрессии. В 1952 Дж. Кифер и Дж. Вольфовиц предложили процедуру итеративного нахождения экстремума функции регрессии.
Функцией регрессии называется математическое ожидание случайной величины, зависящей от параметра как функция этого параметра. Параметр может быть как скалярным, так и векторным. Пусть - случайная величина, зависящая от скалярного параметра ,
.
Требуется определить значение , при котором
. (5.1)
Здесь М означает математическое ожидание, d - заданное число. Таким образом, - корень уравнения регрессии (5.1). Если плотность распределения как функция х нам известна, то задача (5.1) становится обычной задачей численного анализа. Однако, как правило, плотность распределения нам не известна, а доступны лишь наблюдения реализаций случайной величины при фиксированном х. Эти наблюдения можно использовать для рекуррентной оценки (аппроксимации) х с помощью процедуры стохастической аппроксимации (Роббинс, Монро, 1951):
(5.2.)
Здесь — последовательность оценок величины , полученных на предыдущих шагах,
Рекомендуемые материалы
,
- случайная величина такая, что
. (5.3)
Символ означает условное математическое ожидание при фиксированных х1,х2.....
Обычно в качестве выбирается реализация случайной величины Y(xn) на шаге п алгоритма (5.2). Равенство (5.3) будет обеспечено, например, если независимы при разных п. При некоторых условиях на и дисперсию процесс (5.2) сходится почти всюду и в среднем квадратическом к . Процесс (5.2) напоминает детерминированный итерационный процесс нахождения корня одномерного уравнения и действительно превращается в таковой в случае, когда обычная (не случайная) функция параметра . Процедура стохастической аппроксимации для отыскания такого значения хэ, при котором достигает экстремума (максимума), имеет вид (Кифер, Вольфовиц, 1952)
,
, , , (5.4.)
Бесплатная лекция: "2.1. Основные этапы процесса маркетинговых исследований" также доступна.
, ,
Смысл обозначений тот же самый, что и в процессе (5.2). При определённых предположениях на MY и DY процесс (5.4) сходится к хэ почти всюду и в среднем квадратичном. Процесс (5.4) является стохастическим аналогом градиентного метода нахождения точки экстремума функции, при этом вместо градиента вычисляется аппроксимирующее его разностное отношение. Существуют многомерные (х и - векторы) обобщения процедур (5.2) и (5.4). Исследовалась проблема оптимального (в некотором смысле) выбора параметров ап и сп.
Некоторое представление о возможных применениях процессов стохастической аппроксимации может дать следующий пример. Пусть некоторое производство характеризуется величиной выпуска , зависящей от •«технологии» х и случайного параметра .
могут быть как скалярными, так и векторными величинами. Предположим, что случайный параметр характеризует чистоту исходного продукта. Чтобы обеспечить заданную или экстремальную величину выпуска , необходимо выбрать технологию в соответствии с конкретным реализованным значением . Существенная смена технологии каждый раз при поступлении новой партии сырья (новой реализации ) часто бывает невозможна. В такой ситуации более целесообразно пытаться управлять величиной математического ожидания выпуска MY(x), выбирая управляющий параметр х так, чтобы обеспечить её максимальный или заданный уровень. Такой подбор может быть осуществлён в период опытной эксплуатации путём итерационного изменения параметра по формулам типа (5.2) или (5.4). Уточнение технологии в такой ситуации возможно и в процессе нормальной эксплуатации.
Стохастическая аппроксимация позволяет уточнять параметры модели, обеспечивающие в среднем требуемый или экстремальный результат в процессе накопления наших знаний о действии случайных факторов.
Процедуры стохастической аппроксимации обобщены в различных направлениях. В частности, предложены и изучены методы стохастической аппроксимации в ситуации, когда наложены априорные ограничения на множество возможного изменения параметра . Эти методы используются для получения приближённых решений задач стохастического программирования. Методы стохастической аппроксимации широко используются в теории автоматического управления, статистической теории распознавания образов и смежных областях.