Методические указания (1161391), страница 17
Текст из файла (страница 17)
3.4.3. Метод существенной выборки.
Основная идея метода существенной выборки состоит в полной замене исходного выборочного процесса совершенно другим процессом. В новом выборочном процессе наблюдения корректируются своего рода взвешиванием так, чтобы среднее подкорректированных наблюдений было несмещенной оценкой среднего исходного процесса.
Пусть необходимо оценить интеграл
Его можно записать в другом виде .
Если -- есть новая плотность вероятности, то можно оценить Е, выбирая
с этой плотностью вместо плотности
и заменяя функцию
функцией
, где
-- можно интерпретировать как взвешивающий множитель. В последнем случае методом Монте-Карло вместо оценки
будет получена оценка
математическое ожидание которой также равно истинному значению показателя эффективности Е. Процедура оценивания будет отличаться тем, что вместо выборки с плотностью вероятности должна формироваться выборка с плотностью
, а функция
должна быть должна быть связана с весом
.
Оценки образуют семейство несмещенных оценок показателя эффективности Е, и можно поставить задачу о выборе оптимальной плотности
, при которой дисперсия оценки минимальная. Показано, что дисперсия минимизируется, если в качестве новой плотности вероятности взять
Оптимальность новой плотности вероятности означает, что выборка в основном производится из «значимых» областей (из них выбирается больше случайных точек), т.е. из тех областей , которые дают большие значения функции
и вклад которых в Е более существенен.
В действительности использовать плотность (10) для расчета интеграла (7) нельзя, поскольку в (10) входит значение , вычисление которого представляет собой задачу, эквивалентную по трудности исходной задаче (в случае знакопостоянной функции
в точности эквивалентную). Однако из выражения (10) можно сделать вывод о том, что целесообразно выбирать плотность
по возможности пропорциональной
. Такой метод выбора
часто приводит к величинам
с небольшими дисперсиями.
Рассмотренные методы уменьшения дисперсии можно комбинировать, выделяя, например, сначала из подынтегральной функции главную часть, а затем применяя метод существенной выборки.
3.4.4. Метод расслоенной выборки
Расслоенная выборка (стратифицированная выборка или выборка по группам) – это хорошо известный в статистике прием, который может быть с успехом с использованием для уменьшения дисперсии. По идее он весьма близок к методу существенной выборки: здесь также предполагается выбирать больше точек в более «существенных» областях, однако выбор регулируется не специальной плотностью, а указанием количества точек в различных областях.
Представим область, по которой производится интегрирование, в виде суммы конечного числа непересекающихся подобластей , так, что
(11)
очевидно, ,
. В области
рассмотрим случайную точку
с плотностью вероятности
и для оценивания
воспользуемся обычным методом Монте-Карло: т.к.
то, выбрав независимых реализаций
случайной величины
с плотностью вероятности
,
, можем записать оценку для
:
Складывая такие оценки для всех , получим новую несмещенную оценку показателя эффективности
Найдем дисперсию оценки (15). Очевидно,
так как здесь реализации независимых случайных величин
.
Дисперсию легко вычислить. Она равна
Если разбиение и число
фиксированы, то минимум выражения (16) равен
Последнее утверждение легко доказывается с помощью неравенства Коши-Буняковского. Действительно, представляя величину согласно (18) в виде
и используя неравенство Коши-Буняковского, получим
, где справа стоит (16). Остается проверить что при подставке (19) в выражение (16) получается (18).
В реальных задачах дисперсии , как правило, заранее неизвестны. Известны лишь вероятности
. Оказывается, этого уже достаточно, чтобы выбрать
, обеспечивающие уменьшение дисперсии.
Если разбиение фиксировано, то при
величина
не превосходит дисперсии
оценки
, получаемой методом Монте-Карло, т.е.
В действительности выбирать по формуле (18) или
нельзя, так как
обязаны быть целыми. Обычно выбирают любые из ближайших к (19) или
целых чисел, лишь бы удовлетворялось условие
.
3.5. Комбинированные методы оценки показателей эффективности сложных систем.
3.5.1. Объединение результатов экспериментов, проводимых на моделях различной сложности
В связи с необходимостью использовать разные источники информации о системе возникает задача обоснованного объединения всех имеющихся данных о системе и разработке методов оценивания ее характеристик по информации, полученной как в результате натурных испытаний, так и в результате имитационного моделирования. Методы, в основе которых лежит этот подход, называют комбинированными. Анализ комбинированных методов оценивания вероятностных характеристик сложных систем проведем на методике, разработанной В.Н.Пугачевым.
Будем сначала считать, что для исследования сложной системы разработаны две модели: полная точная модель, в которой достаточно детально отражены структура и процессы функционирования исходной системы, и упрощенная модель этой же системы. Первая модель обычно оказывается настолько сложной, что единственно возможным методом исследования ее вероятностных характеристик является метод статистических испытаний, причем для получения данных необходимого объема требуются значительные затраты машинного времени. Поэтому часть данных целесообразно получать на упрощенной модели.
Исследование любой разумно упрощенной модели системы всегда дает определенную информацию об исходной системе, и правильное использование этой информации позволяет получить более точное значение вероятностных характеристик исходной системы.
Весьма эффективной и универсальной вычислительной процедурой, позволяющей объединить результаты экспериментов на моделях различной сложности, является метод коррелированных процессов, разработанный В.Н.Пугачевым.
При реализации метода коррелированных процессов по сравнению с обычной процедурой метода статистических испытаний дополнительные затраты возникают при разработке упрощенных моделей, получении на них данных, а также при расчетах оценок с использованием более сложных алгоритмов обработки. Однако эти дополнительные затраты, как правило, окупаются существенным уменьшением объема моделирования на точной модели. Поэтому метод коррелированных процессов находит широкое применение в задачах моделирования сложных систем.
Пусть необходимо оценить n-мерный вектор вероятностных характеристик точной модели (1)
при условии, что на упрощенной модели m-мерный вектор вероятностных характеристик (2) можно определить точно. Здесь
и
n- и m-мерные векторы, компоненты которых представляют собой некоторые функции от значений процессов соответственно в точной и упрощенной моделях.
Предположим, что с точной и упрощенными моделями проведено независимых между собой экспериментов в одинаковых условиях. Статистические значения
и
векторов
и
, найденные по экспериментам, будут
(4)
где -- выборка значений вектора
, полученная на точной модели;
-- выборка значений вектора
, полученная на упрощенной модели.
Задача состоит в определении оптимальности оценки вектора
по значениям
,
и
, т.е. в отыскании оценки вероятностных характеристик точной модели по статистическим значениям вероятностных характеристик точной и упрощенной моделей и точным значениям вероятностных характеристик упрощенной модели.
Оценку будем строить в классе по отношению к векторам
,
и
оценок, т.е.
где А – матрица ; B и C матрицы размером
.
Для -й компоненты
вектора
соответственно будем иметь
где ,
,
-- векторы-строки, образованные из соответствующих строк матриц А, В, С.
Векторы ,
и
найдем из условия несмещенности компоненты
и минимума ее дисперсии. Именно в этом смысле оценку
будем называть оптимальной.
Условие несмещенности записывается в следующем виде:
В силу (1)-(4)
Поэтому условие несмещенности с учетом (8) будет
Так как компоненты и
могут быть любыми, то вектор
имеет только
- элемент, равный 1, а все остальные его элементы равны 0. Кроме того,
+
=0 (10).
Поэтому формулу (6) для оценки можно записать в следующем виде:
Вектор в (11) найдем, исходя из минимума дисперсии оценки
. Дисперсия оценки
равна