Л.А. Растригин - Теория и применение случайного поиска (1121205), страница 24
Текст из файла (страница 24)
Теория планирования экспериментов существенно связана с градиентными методамн, так как именно этн методы позволяют реализовать идею плана эксперимента. Единственное, что обьединяет эти теории, это то, что обе они поисковые. Поэтому, если предположить, что существует общая теория поиска, то теория планирования экспериментов и теория случайного поиска, по-виднмому, будут ее составными частями. После того как мы сформулировали общие требования к критерию эффективности, рассмотрим конкретную проблему сравнения метода крутого восхождения и метода случайного поиска в задаче поиска экстремума.
Важно отметить, что эта проблема приобретает более широкий «общепоисковый» смысл: каково оптимальное число измерений функции отклика объекта для принятия решения о продвижении к экстремуму? й 6.3. пРОБлемА ОптимАльнОгО числА измеРении Уточним объект исследования. Вектор существенных входных воздействий Х будет рассматриваться как п-мерный вектор независимых параметров (факторов), т.
е. Х= (х„...,х„). Влияние вектора помехи Е будет заключаться в том, что результат измерения имеет вид Я(Х, Е) =Я(Х) +е, где е — нормально распределенная случайная величина, не зависящая от номера измерения; Я(Х) — истинный отклик объекта. Относительно отклика Я(Х) будем предполагать, что 155 » Я(Х) = ~ агхь 1 Здесь 1аь..., а„) =ассад 91Х) — вектор градиента функции отклика. Число и+1 выбирается кратным четырем. Это делается потому, что в гиперкубы таких размерностей очень просто (в виде плана дробной реплики) вписывается правильный симплекс, образующий необходимое ротатабельное планирование первой степени (специальное ортогональное планирование). Необходимость такого планирования имеет тот смысл, что оно оптималыю для метода крутого восхождения. Существуют алгоритмы вписывання правильных снмплексов в гиперкубы произвольных размерностей.
Более тонкие вопросы оптимальности такого вписываиия симплексов обсуждались В. Г. Горским и В. 3. Бродским 15). Однако полученный ниже результат вряд ли будет зависеть от фактора «днскретности» числа и. Итак, для метода крутого восхождения замеры функции отклика производятся в и+1-й вершине симплекса, построенного по ортогональному плану. Для того чтобы и случайному поиску были предоставлены кравные возможности» для сбора информации, было предложено выбирать две точки следующим образом. Одна точка— центр симплекса, вторая — одна из упомянутых вершин этого симплекса. Прн этом выбор любой вершины равновероятен. Здесь следует учесть, что прп таком подходе план ортогонального симплекса должен быть строго фиксирован для всех стадий эксперимента.
Если же план симплекса меняется от одной группы замеров к другой, то для случайного поиска необходимо будет увеличить базу измерения в два раза. В этом случае первая точка должна находиться в вершине, противоположной вершине второй точки. Изменение планов симплекса применяется всякий раз для контроля так называемых дрейфов. Используя чобщепоисковые» термины, требование о равноценности информации, собираемой тем нлн другим методом, можно сформулировать как требование одинаковой длины пробного шага (д). Перейдем к критерию эффективности для того, чтобы получить критерий сравнения метода крутого восхождения и метода случайного поиска в задаче поиска максимума отклика.
1. Цена пробного шага одинакова. Это следует из единст- )ьв венцостн объекта исследования для обоих методов, Без ограничения общности (как будет показано ниже) его можно принимать равным единице. 2. Затраты на одно решение принимаются равными сумме цен пробных шагов. Мы не включаем в этн затраты цену реализации алгоритма па ЦВМ, так как она обычно пренебрежимо мала по сравнению с ценой пробного шага. Таким образом, цена решения при использовании метода крутого восхождения просто равна и+1, а прп использовании метода случайного поиска — 2. 3. Понятие точности определяется следующим образом.
Пусть 1О; (н соответственно — ф;) — угол между направлением градиента функции отклика и его оценкой, получаемой в методе крутого восхождения (соответственно прн случайном поиске) на 1-л1 этапе принятия решения. Тогда точность метода крутого восхождения сов О= =М(сов О;), где М вЂ” знак математического ожидания. Соответственно точность метода случайного поиска сов ф =М(сов ф). Теперь можно ввести критерий эффективности обоих методов. Пусть отношение цены точности к цене пробного шага (принятой за единицу) для метода крутого восхождения — й„а длн метода случайного поиска — Й,. Тогда эффективность крутого восхождения равна сов Π— й,, а+1 а для метода случайного поиска— сов лр 2 Отсюда критерий сравнения методов 2совО А, 2совО (а+1)сов лр 77С (и+1)сов лр Мы выбираем 1=1, Результаты нашего исследования, как будет указано ниже, могут быть использованы и при А~!.
В работе !61 принято, что !в7 где а„— длина рабочего шага при использовании метода крутого восхождения, а, — длина рабочего шага прн использовании метода случайного поиска. (Под рабочим шагом понимаетсп шаг после принятия решения.) В работе (6] было предложено выбирать длину рабочего шага для метода крутого восхождения большей, чем для случайного поиска.
Это предложение обосновывалось тем, что градиентный метод в среднем точнее определяет направление движения к экстремуму, так как осреднение ведется по большему числу измерений. Конкретно было предложено выбирать й = =1(а, х), соз ф где к --- отношение С,К.О. помехи прп пробном шаге к модулю градиента. Однако необходимо рассматривать коэффициент точности и в зависимости от ограничений А=1(и, я, 6), где 6 обозначает, как было упомянуто выше, конкретный вид ограничений, накладываемых на возможные варьирования вектора входных параметров Х. Например, если дисперсия варьирования случайного поиска, являюШаяся действительно функцией 1(п, н), удовлетворяет ограничениям 6, то й=1.
(Дисперсия метода крутого восхождения всегда меньше дисперсии случайного поиска.) Таким образом, конкретный вид оценки й в работе 16] недостаточно обоснован. В практической ситуации исследователю неизвестно значение параметра к. В этом случае вопрос о выборе того или нного метода следует решать с позиции теории адаптации и обучения. Выбрав тот пли иной метод поиска первоначально достаточно произвольно, можно затем по накопленной статистике по параметру х сделать объективный выбор того или иного метода, Обучающиеся модели поисков для обоих методов известны. Это симплекс-метод при градиентном подходе [1], с одной стороны, и различные модели случайного поиска, рассмотренные в работе К.
К. Рипы 17], — с другой, Следует отметить, что в работе 2 сов 6 (и+ 1) соз ф Эта величина характеризует отношение средних потерь метода крутого восхождения и случайного поиска, Очевидно, что прн у> ! эффективнее по быстродействию крутое восхождение, а прн у<! эффективнее случайный поиск. Оценки интересующих нас величин сов 6 и сов ф приведены в приложении 1. В табл. 1 этого приложения приведены численные расчеты оценок для некоторых значений параметров н и х. Для метода крутого восхождения была найдена экспериментально оценка ! 1 —. — — ~» соз 0 = — —:.:.—. —.
=-:: —. =, ) 1+на ~/ а и+1 (6.3.1) Верхняя оценка совпадает с оценкой, данной П. В. Ермуратскпм (9). Из формулы (6.3.!) видно, что сов 6! обладает следующими свойствамн: 1) «стабилизация по и» -- с увеличением п оценка изменяется слабо и прп л . 19 практически не меняется; 2) «фильтрация малого сигнал໠— с увеличением помехи оценка ж! /х.
йзй'л Для метода случайного поиска, введя константу 8= 4о» имеем оценку 1 Г 1 р 1 ° 36» созф=, ~1 — — — — +--- — — — -----. —.... (6.3.2) иф~д~ 1!(и+2) 2!(а+2) (и+4) 159 Э. В. Оганесяна, Э. А. Степаняна [8) наряду с моделями обучения рассматривалась классифпцирующая модель случайного поиска. Итак, без ограничения общности можно положить й =-1, и критерий сравнения обоих методов приобретает простой вид: Из (6.3.2) следует, что как при малой, так и прн большой по- 1 мехе сов ф убывает, как п.' с увеличением а. Для случая, когда помехи отсутствовали, это положение было доказано в[10), Таким образом, при методе крутого восхождения потери на поиск прямо пропорциональны числу измерений, т. е.
и+1, в то время как этн же потери для случайного поиска прямо пропорциональны )'л. Следовательно, для каждого н существует такое и, при котором случайный поиск эффективнее по быстродействию (у(1). На рис. 6.4. показаны зоны эффективности для метода крутого восхождения (у)!) и для случайного поиска (у<1) при различных значениях и и х.