Труды семинара Бурбаки за 1988 г (947402), страница 51
Текст из файла (страница 51)
Тогда формула (7.!6) дает с точностью до мультипликативных констант: ил е ьл Теперь наложим условие — "= —, где а 1, так что (7.15), ил л (7.14) дадут нам последовательно: е-(ИВ)л е и е-ьл 1 л л К, пал/Веб (А/В) а ( К + ! К пал/Веь (л/е) л (7.18) Обращаясь 'сейчас к времени вь/числения Е =Ел, мы можем вычислить ошибку а!ы и температуру Т(с) после 7. элементар- ных шагов алгоритма: 1 В п — — 1оп 1„ Ь А (7.19) 1 е(Ы еть"— ь /л ° 1 В А Т„,—— !ок/л ьл !ОВ Ь . 47.20) Итак, мы видим, что для этого минимизиру)ощего режима охлаждения температура должна убывать как А/1ои7., где Е— время вычисления, а расстояние между ть и ))м(и — порядка 1//.е/л.
Заметим, что В в общем случае меньше, чем А, и что .время вычисления Кл при температуре Т имеет порядок с/е)(, Х ехр (А/Тл). Далее, формула (7.18) показывает, что Š— К„, так что существенная часть времени вычисления проводится при самой низкой температуре, которая достигнута за зто время. Это означает, что такие режимы «отпуска» на самом деле очень близки к глауберовской динамике при фиксированной низкой температуре. Конечно, черты, которыми обладает именно этот пример, не обязаны сохраняться для всех режимов охлаждения, основанных на оценке (7.14), но, вероятно, формулы (7.19) и (7.20) для е(с) и Т(ь! являются лучшими «грубыми» нижними пределами, которых можно достичь при помощи режимов, основанных на формуле (7.14).
Укажем теперь, что в выборе ступенчатого режима охлаждения Т„остается много свободы; как легко проверить, в этой схеме за очень быстрое охлаждение приходится попросту платить значительно более долгими периодами при каждой фиксированной температуре. Один из интересных аспектов выкладок, приведенных в параграфах 6 и 7, состоит в том, что константа А = С) — Сь введенная в формулах (7.6), (6,6), была строго отождествлена Чан и Чоу (СИ!апд и С/)ов) с константой Я теоремы 5.6. Мы можем также интерпретировать другую основную константу Р, введенную Гаеком (см. (5.5)). Действительно, допустим, что мы интересуемся только скоростью, с которой в рассмотренных нами режимах «отпуска» стремится при и-»+е)о к нулю ч„[Е~Ем)н!.
Тогда выберем в качестве о вектор- столбец, соответствующий индикаторной функции множества Е'~Ем)н, и будем интересоваться поведением )(Р/) о, где р.— мера на Е с полной массой, равной О. Тогда мы можем написать„ в силу (7.3) — (7.5): Ркл к~Тел где Ю'„— подмножество (вообще говоря, собственное) множества Л„всех собственных значений матрицы Р„, не равных 1. А именно, очень может оказаться, что Ях ло =0 для некоторых Х ~ Л„, и такие Х не войдут в йт .
Поэтому, если собственное значение из Ят"„ с наибольшим модулем есть (й + 1)-е в порядке б вания, константа А = С, — С» из предшествующих выкладок заменится константой Ал —— Сл — Се+) (в обозначениях (6.4)— (6.6) ). Тогда естественно ожидать, что выполнено следующее предположение: (7.21) Константа Р, введенная Гаеком для характеризации минимизирующих режимов охлаждения (см. 5.5), совпадает с Сев — Се+) для некоторого целого /е ) 1, где Са — «цень(», введенные Вентцелем (см. (6.4)). В. ПАРАЛЛЕЛЬНОЕ ОСУЩЕСТВЛЕНИЕ АЛГОРИТМОВ «ОТПУСКА» Как показывают предшествующие асимптотические резульбыть довольно тат ы, алгоритмы «отпуска» имеют тенденцию быт д дленными, и в задачах глобальной оптимизац ии большая ме часть прикладных исследовании полагается на «быстрые» ре— .99.
жимы охлаждения типа Т. = Теа, где а — О. — л =0.95 или а=О. Р. Аеенкотт Нет нужды говорить, что с математической точки зрения минимизирующее свойство для этих режимов охлаждения не выполняется; это не препятствует тому, чтобы они с пользой работали после надлежащей подгонки, соответствующей данному применению (см., например, Бономн — Луттон (Вопопп' — 1п11оп), ,Дрейфус (РгеуЫз), Урн (13Ъу) среди многих других специалистов). Другой подход, значительно более недавний, состоит в том, чтобы использовать для ускорения алгоритма параллгльньег вьечисления.
Здесь возникают довольно сложные математические вопросы и открывается широкое поле экспериментирования для специалистов в области параллельных вычислений. В настоящее время я занят исследованием этих вопросов в сотрудничестве с Труве, Графинем (Тгопне, Ога(1(ппе), Луттоном (1.п11оп), Буже (Воппе), Вира (Иго1), Русселем (Копззе!), Туранжо (Топгапйеап), Ури (1)пгу) и др.
в рамках проекта СМЕТ вЂ” Парижский университет — Юг. В этом кратком обзоре я выберу только один аспект проблемы параллельных вычислений при процедуре «отпуска». Вернемся к микроскопическому описанию конфигурационного пространства Е = Ее, где 5 — конечное множество индексов, нли «мест»; конфигурации обозначаются х = (х,),, а функция энергии Н(х), которую нужно минимизировать, имеет вид (см, 2 1) х8.1) Н(х)= ~ Нк (х), кяс где С вЂ” множество всех клик в 5, связанное с системой окрестностей Ят„зев 5. Напомним, что единственное ограничение на %'»~5 — то, чтобы з'я)»т.
тогда и только тогда, когда вен йг, Клики — в точности те подмножества К множества 5, для которых любые два места в К вЂ” соседи в 5. Потенциалы действия 11к. .Е-»-(ч зависят только от х., з ~ К Обозначим Р,(х) гиббсовскую меру (см. 2.2), связанную е энергией Н(х). Если Н(х) имеет вид (8.1), условное распределение х, при условии, что даны все хь ген Е'~з, зависит только от хь ген Я~;~з. Это — так называемое свойство марковского поля; если мы обозначим )т, = Я~,'~з, а через хе— сужение любой конфигурации х на множество Р ~ 5„это условное распределение (82) Р*(Л ~хе гел йт .) =Рт(х»=Л1хе ген )у,.) называемое также локальной спецификаиией Рт, легко вычислить. Процедура «отпуска» Определим сначала функцию (8.3) 0(Л,х )= Е 0 (у), где Лен Е, а у — любые конфигурации, такие, что у, = Л, а ус = =х» для всех ген Ф', Затем полагаем (8.4) и(хц,.)= ~ ехр~ — — Н(Л, хи„)1 к~с н получаем сразу (8.5) р,(Л !х, )=, ехр~ — — 0(Л, х )1.
В этом контексте элементарные шаги построения (последовательного) алгоритма «отпуска» состоят в том, чтобы сперва выбрать последовательность (з„) мест, от которой обычно требуется, чтобы она была периодична и посещала каждое место из множества 5. Фиксируем режим охлаждения Т„'«О. Для момента и назовем Х(п) текущей конфигурацией, и пусть Р„ есть а-алгебра, порожденная Х(й), й ( и. В последовательном алгоритме «отпуска» Х(п) — марковская цепь, такая, что Х(п+1) совпадает с Х(п) во всех местах зчь з„и такая, что для Х„т, =Х,„(а+1) выполняется соотношение (8.6) Р (Х„», = Л ~ Р ) = р, (Л / Х, (и), Г ев Я7, '~ з„), где Т в формулах (8.4) и (8.5) заменено на Т„.
Асимптотические результаты, аналогичные приведенным ранее в этом тексте, показывают, что если 1пп Т„!одп).О) О„ о.++а где Н вЂ” подходящая константа, то распределение Х(п) сосредоточивается иа множестве Ен,н конфигураций, минимизирующих Н. Строго говоря, эти алгоритмы не входят в абстрактные схемы, описанные ранее. Однако для малого Т » О, очевидно, имеем (см.
(8.4)): (8.Т) р ТЛ 1х„, ) р~ — — 1НТЛ, х ) — НТА, х ° )11, где х, — любая точка Ло ~ Е, минимизирующая функцию. Л-»Н(Л, х»»„). Теперь можно применить описанные ранее асимптотические результаты к анализу оптимальных скоростей охлаждения и показать, что константа 6 действительно совпадает с введенной Р. Лвенкогг Процедура «отпуская Гаеком константой Р, связанной с Н(х).
Ключевой пункт здесь следующий: формула (8.7) показывает, что при температуре Т и когда конфигурация х есть локальный минимум функции Н(х) переходная матрица Рав(Т) за один шаг «отпуска» в конфигурационном пространстве удовлетворяет соотношению р„„(Т) ехр ~ — — [Н (у) — Н (х)]+1, .хотя это последнее утверждение не выполняется для произвольного х еп Е. Теперь, если у нас есть доступ к компьютерам, допускающим .параллельные вычисления, естественная идея состоит в том, чтобы обновлять значения больших множеств мест одновре.менно, производя синхронньсй случайный выбор во всех этих местах; в момент и мы можем, например, принять решение изменить одновременно все Х,(п), причем сделать эти одновременные выборы независимыми, а для каждого э ее Е выбор Х,(н+ 1) при данном Х(н) производится опять-таки в соответствии с условным распределением (8.6).
Легко явно выписать переходную матрицу гу„я(Т) этой новой .цепи Маркова в конфигурационном пространстве при температуре Т; действительно, легко доказать, что ч8.8) где функция цены [Гяя задаегся формулой (8.9) [Г„„= Я ~[Г(у,, хм ) — [Г(2,, х, )~ (обозначения те же, что в (8.7)). Теперь, применяя теорию Фрейдлина — Вентцеля стохастических матриц с экспоненциально убывающими членами, можно получить оптимальные скорости охлаждения и понять природу предельного равновесного распределения.
Действительно, если рг — равновесное распределение для стохастической матрицы, задаваемой формулой (8.8), Фрейдлин — Вентцель показали, что предельная мера 1пп рт= Гсо существует и сосредоточена на г ° о. .множестве Е конфигураций, которые можно охарактеризовать следующим образом. Вспомним обозначения (6.3): функция цены [у,ь связывает с каждым графом 6 на Е цену [7(6). Пусть (8.10) и (х) = ш[ ([7 (6) ) 6 ~ Я ((х))), где 5(Е) для г" с:Е определено в (6.2). Тогда множество Ео, терминальных конфигураций есть (8.11) Ео — — (у ~ Е]и(у)= ш[ и(х)~. хыг Между Н(х) и [Г„а имеется явная, но двухступенчатая связь„ так что а рПоН нет основания для совпадения Ео с Емсн.