Советов Б.Я., Яковлев С.А. Моделирование систем (3-е изд., 2001) (1186218), страница 59
Текст из файла (страница 59)
Возможна ситуация, когда случайные £, и ц стохастическизависимы, хотя причинно они являются для системы S независимыми. При статистическом моделировании наличие такой зависимости может иметь место, например, из-за коррелированности последовательностей псевдослучайных чисел, используемых для имитации событий, положенных в основу вычисления значений х и у.Таким образом, корреляционный анализ устанавливает связьмежду исследуемыми случайными переменными машинной модели249и оценивает тесноту этой связи.
Однако в дополнение к этомужелательно располагать моделью зависимости, полученной послеобработки результатов моделирования.Регрессионный анализ результатов моделирования. Регрессионный анализ дает возможность построить модель, наилучшим образом соответствующую набору данных, полученных в ходе машинного эксперимента с системой S. Под наилучшим соответствиемпонимается минимизированная функция ошибки, являющаяся разностью между прогнозируемой моделью и данными эксперимента.Такой функцией ошибки при регрессионном анализе служит суммаквадратов ошибок.Пример 7.2. Рассмотрим особенности регрессионного анализа результатов моделирования при построении линейной регрессионной модели.
На рис. 7.2, а показаныточки jf„ у„ ;'=Т7Д полученные в машинном эксперименте с моделью Мы системы S.Делаем предположение, что модель результатов машинного экса)перимента графически можетбыть представлена в виде прямойу=<р{х)=Ь0+Ъ1х,где $ — величина, предсказываемаярегрессионноймоделью.Требуется получить такие значения коэффициентов Ь0 я Ьи приРис. 7.2. Построение линейной регрессионной которых сумма квадратов ошибокмоделиявляется минимальной.
На рисунке ошибка ей / = 1 , N, для каждойэкспериментальной точки определяется как расстояние по вертикали от этой точкидо линии регрессии у=q> (x).Обозначим y,=b0+b1Xi, / = 1 , N Тогда выражение для ошибок будет иметь видкe,=yi-yi=b0+b1x,-yl,а функция ошибки F 0 = £ {Ьо+Ьп-уЩ1.i-iДля получения Ь0 и Ьх, при которых функция F0 является минимальной, применяются обычные методы математического анализа. Условием минимума являетсяdFJ3b0=6;dF0ldbL=0.Дифференцируя F0, получаемdFal8b0 = d £ (i 0 +6 1 x,-^ I ) J /5i 0 = 2 ( M 0 + i 1 £(«1dFJdb^d\i-lJC,-5>,)-0,i-l£ {Ь0 + Ь1Х1-у,)2!дЬ1=2Ь0 £ X.+2A, £ xf-2/£ад=0Решая систему этих двух линейных алгебраических уравнений, можно получитьзначения Ь0 и bL В матричном представлении эти уравнения имеют вид250КJ»NI**0I*?1-1h1-1кI*.—I.
У.1-1Ni-11-2Решая это уравнение, получаем*о-(I У. I *?-1 *. I *.)/[* I *?-(£*)}*i=(* 1 ья-! * ji *)/[* i x>-(i *<)2}где N — число реализаций при моделировании системы.Соотношения для вычисления Ьа и Ь1 требуют минимального объемапамяти ЭВМ для обработки результатов моделирования. Обычно мерой ошибкирегрессионной модели служит среднее квадратичное отклонение* - [ ( £ «?)/(АГ-2)],/2-|[1 (*о-А1*1-л)я]^-2)|"2.Для нормально распределенных процессов приблизительно 67% точек находитсяв пределах одного отклонения ае от линии регрессии и 95% — в пределах 2в> (трубкиА в В соответственно на рис.
7.2, 6). Для проверки точности оценок Ь0 и Ь.регрессионной модели могут быть использованы, например, критерии Фишера (Fраспределение) и Стьюдента (/-распределение). Аналогично могут быть оцененыкоэффициенты уравнения регрессии и для случая нелинейной аппроксимации.Дисперсионный анализ результатов моделирования.
При обработке и анализе результатов моделирования часто возникает задачасравнения средних выборок. Если в результате такой проверкиокажется, что математическое ожидание совокупностей случайныхпеременных {Ух)}, {/2)}, •••, {Уп)} отличается незначительно, тостатистический материал, полученный в результате моделирования,можно считать однородным (в случае равенства двух первых моментов). Это дает возможность объединить все совокупности в однуи позволяет существенно увеличить информацию о свойствах исследуемой модели Мм, а следовательно, и системы S. Попарноеиспользование для этих целей критериев Смирнова и Стьюдентадля проверки нулевой гипотезы затруднено в связи с наличиембольшого числа выборок при моделировании системы. Поэтомудля этой цели используется дисперсионный анализ.Пример 7.3.
Рассмотрим решение задачи дисперсионного анализа при обработкерезультатов моделирования системы в следующей постановке. Пусть генеральныесовокупности случайной величины {у(1)}, (У2'}, •••, {ум} имеют нормальное распределение и одинаковую дисперсию Необходимо по выборочным средним значениям при некотором уровне значимости у проверить нулевую гипотезу Н0 о равенствематематических ожиданий.
Выявим влияние на результаты моделирования толькоодного фактора, т е рассмотрим однофакторный дисперсионный анализ.Допустим, изучаемый фактор х привел к выборке значений неслучайной251величины У следующего вида: у1а у2, •••> Ук, где к — количество уровней факторах. Влияние фактора будем оценивать неслучайной величиной Dx, называемойфакторной дисперсией:Лх-oJ- £(y,-y)lk,1-1где р — среднее арифметическое значение величины У.Вели генеральная дисперсия D [у] известна, то для оценки случайности разбросанаблюдений необходимо сравнить D \у] с выборочной дисперсией Si, используякритерий Фишера (F-распределение). Если эмпирическое значение F3 попадает в критическую область, то влияние фактора х считается значимым, а разброс значенийх — неслучайным.
Если генеральная дисперсия D [х] до проведения машинногоэксперимента с моделью Мм неизвестна, то необходимо при моделировании найтиее оценку.Пусть серия наблюдений на уровне у-, имеет вид у,\, уцут, где и — числоповторных наблюдений на I-M уровне. Тогда на ;'-м уровне среднее значениенаблюдений1 "У-=~п I УФi-iа среднее значение наблюдений по всем уровнямI * "1 *У—JZ I I У'у-г. Z УОбщая выборочная дисперсия всех наблюденийПри этом разброс значений у определяется суммарным влиянием случайныхпричин и фактора х.
Задача дисперсионного анализа состоит в том, чтобы разложитьобщую дисперсию D\y] на составляющие, связанные со случайными и неслучайнымипричинами.Оценка генеральной дисперсии, связанной со случайными факторами,*м^СЦ*-Ц(£")"}а оценка факторной дисперсииAt-£M-£eM.Учитывая, что факторная дисперсия наиболее заметна при анализе среднихзначений на I-M уровне фактора, а остаточная дисперсия (дисперсия случайности) длясредних значений в п раз меньше, чем для отдельных измерений, найдем болееточную оценку выборочной дисперсии'Д . + 1 А > М = 7 — , 1 iy.-yfпкJ1-ХУмножив обе части этого выражения на п, получим в правой части выборочнуюдисперсию Si, имеющую (к— 1)-к> степень свободы. Влияние фактора х будет значимым, если при заданном у выполняется неравенство SljD0[y\>F\-yВ противномслучае влиянием фактора х на результаты моделирования можно пренебречь и счя252тать нулевую гипотезу Я 0 о равенстве средних значений на разлнчных уровняхсправедливой.Таким образом, дисперсионный анализ позволяет вместо проверки нулевой гипотезы о равенстве средних значений выборокпроводить при обработке результатов моделирования проверкунулевой гипотезы о тождественности выборочной и генеральнойдисперсий.Возможны и другие подходы к анализу и интерпретации результатов моделирования, но при этом необходимо помнить, что ихэффективность существенно зависит от вида и свойств конкретноймоделируемой системы S.7.3.
ОБРАБОТКА РЕЗУЛЬТАТОВ МАШИННОГО ЭКСПЕРИМЕНТАПРИ СИНТЕЗЕ СИСТЕМПри синтезе системы S на базе машинной модели Мм задачапоиска оптимального варианта системы при выбранном критерииоценки эффективности и заданных ограничениях решается путеманализа характеристик процесса функционирования различных вариантов системы, их сравнительной оценки и выбора наилучшеговарианта. Независимо от того, как организуется выбор наилучшеговарианта системы — простым перебором всех проанализированныхпри машинных экспериментах результатов или с помощью специальных процедур поиска оптимального варианта, например методов математического программирования,— элементарной операцией является сравнение статистически усредненных критериев оценкиэффективности вариантов систем [9, 29, 33, 53].Особенности машинного синтеза.
Учитывая то обстоятельство,что конкурирующие варианты системы S отличаются друг от другаструктурой, алгоритмами поведения, параметрами, число такихвариантов достаточно велико. Поэтому при синтезе оптимальноговарианта системы 5 ^ особенно важно минимизировать затратыресурсов на получение в результате моделирования характеристиккаждого варианта системы. Исходя из этих особенностей, при синтезе системы S обработку и анализ результатов моделированиякаждого варианта системы S следует рассматривать не автономно,а в их тесной взаимосвязи. Очевидно, что задача синтеза оптимального варианта моделируемой системы S^ должна быть уже поставлена при планировании машинного эксперимента с моделью Мы.В предыдущей главе было показано, что искусственная организация статистической зависимости между выходными характеристиками сравниваемых вариантов St и S2 системы дает выигрышв точности оценки средних значений, вероятностей и дисперсий приположительно коррелированных критериях qy и qz.
Корреляциямежду критериями qx и q2 возникает в силу того, что случайныевекторы253описывающие воздействие внешней среды Е на варианты Sx и S2системы, имеют общие составляющие v =(t;l5 ..., vk), в то времякак составляющие («tVi, ••-, vP) и («j$i, ..., viP) статистическинезависимы.Если через v=(vt, ..., vk) обозначить фиксированные значениясоставляющих v = {vt, ..., v*), то условные средние значения qi и q2будут такими:Mi (« ) = М [qjv] = М [q2jv],т. е, являются функциями переменных « =(vlt ..., vk).Рассмотрим особенности обработки результатов моделирования, когда сравниваемые в ходе проведения имитационных экспериментов полные средние значения критериев qtaq2 примут видHi=M[qi]= J ...