Советов Б.Я., Яковлев С.А. Моделирование систем (2001) (1186219), страница 59
Текст из файла (страница 59)
Пусть необходимо сравнить две дисперсии а\ и Ъ\,полученные при обработке результатов моделирования и имеющие fcj и к2 степенейсвободы соответственно, причем а\>а\. Для того чтобы опровергнуть нулевуюгипотезу Н0: a\—<ri, необходимо при уровне значимости у указать значимостьрасхождения между а\ и а\. При условии независимости выборок, взятых из нормальных совокупностей, в качестве критерия значимости используется распределениеФишера (/"-критерий) F=a\ja\, которое зависит только от числа степеней свободыk1 = Ni — l, k2 = N2—l, где Nl и N2 — объемы выборок для оценки of и а\ соответственно.Алгоритм применения критерия Фишера следующий: 1) вычисляется выборочноеотношение F=S\lS\\ 2) определяется число степеней свободыfc,=N1—1 и к2 =N2 — 1;3) при выбранном уровне значимости у по таблицам /'-распределения находятсязначения границ критической области Fi = l/[Fi-y/2(k1, k2)]; F2=Fi^y/2(k1, k2);4) проверяется неравенство F1£l^F2iесли это неравенство выполняется, тос доверительной вероятностью /? нулевая гипотеза Н0: а\=а\ может бытьпринята.Хотя рассмотренные оценки искомых характеристик процессафункционирования системы S, полученные в результате машинногоэксперимента с моделью Л/м, являются простейшими, но охватывают большинство случаев, встречающихся в практике обработкирезультатов моделирования системы для целей ее исследованияи проектирования.2'-77.2.
АНАЛИЗ И ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВМАШИННОГО МОДЕЛИРОВАНИЯВозможность фиксации при моделировании системы S на ЭВМзначений переменных (параметров) и их статистическая обработкадля получения интересующих экспериментатора характеристик позволяют провести объективный анализ связей между этими величинами. Для решения этой задачи существуют различные методы,зависящие от целей исследования и вида получаемых при моделировании характеристик. Рассмотрим особенности использованияметодов корреляционного, регрессионного и дисперсионного анализа для результатов моделирования систем [7, 11, 18, 21, 25, 46].Корреляционный анализ результатов моделирования.
С помощьюкорреляционного анализа исследователь может установить, насколько тесна связь между двумя (или более) случайными величинами,наблюдаемыми и фиксируемыми при моделировании конкретнойсистемы S. Корреляционный анализ результатов моделированиясводится к оценке разброса значений г\ относительно среднего значения у, т. е. к оценке силы корреляционной связи. Существованиеэтих связей и их тесноту можно для схемы корреляционного анализа у=М[г]1£=х] выразить при наличии линейной связи между исследуемыми величинами и нормальности их совместного распределения с помощью коэффициента корреляциигь=м#-м[яьм[г1-мш1>/вщш==М[£-к]М[т,-11Ж<Гп0д,т. е. второй смешанный центральный момент делится на произведение средних квадратичных отклонений, чтобы иметь безразмернуювеличину, инвариантную относительно единиц измерения рассматриваемых случайных переменных.Пример 7.1. Пусть результаты моделирования получены при N реализациях,а коэффициент корреляцииКL (*к-*)(Ук-5!)•_>-i1»Z хкУк-Nxyt^iОчевидно, что данное соотношение требует минимальных затрат машиннойпамяти на обработку результатов моделирования.
Получаемый при этом коэффициент корреляции |г{ 4 |<1. При сделанных предположениях »"{, = 0 свидетельствуето взаимной независимости случайных переменных ^ и п. исследуемых при моделировании (рис. 7.1, а). При |г{,| = 1 имеет место функциональная (т. е. нестохастическая)линейная зависимость вида y=ba + b1x, причем если Г{» > О, то говорят о положительной корреляции, т.
е. большие значения одной случайной величины соответствуютбольшим значениям другой (рис. 7.1, б). Случай 0<Г{,<1 соответствует либоналичию линейной корреляции с рассеянием (рис. 7.1, в), либо наличию нелинейнойкорреляции результатов моделирования (рис 7 1, г).248а)У5)Ъч=0Ъп='в)0<г^1г)00^ОРис. 7.1. Различные случаи корреляции переменныхДля того чтобы оценить точность полученной при обработкерезультатов моделирования системы S оценки г(т целесообразноввести в рассмотрение коэффициент w=ln[(l+r { ,)/(l— г{,)]/2, причем vv приближенно подчиняется гауссовскому распределению сосредним значением и дисперсией:д,=1п[(1 +r f ,)/(l -r{„)]/2, ol= 1/(ЛГ-3).Из-за влияния числа реализаций при моделировании Л" на оценкукоэффициента корреляции необходимо убедиться в том, что0^Г{,<1 действительно отражает наличие статистически значимойкорреляционной зависимости между исследуемыми переменнымимодели Мм.
Это можно сделать проверкой гипотезы Н0: Г{,=0. Еслигипотеза Н0 при анализе отвергается, то корреляционную зависимость признают статистически значимой. Очевидно, что выборочное распределение введенного в рассмотрение коэффициента w приГ{,=0 является гауссовским с нулевым средним /^=0 и дисперсиейal—(N— 3) - 1 . Следовательно, область принятия гипотезы Я 0 определяется неравенством-2«,2<v^V=3 ln[(l +г{„)/(1 -r{„)]/2<za/2,где 2а/2 подчиняется нормированному гауссовскому распределению.Если Г(п лежит вне приведенного интервала, то это означает наличиекорреляционной зависимости между переменными модели на уровне значимости у.При анализе результатов моделирования системы S важно отметить то обстоятельство, что даже если удалось установить тесную зависимость между двумя переменными, то отсюда еще непосредственно не следует их причинно-следственная взаимообусловленность.
Возможна ситуация, когда случайные £, и ц стохастическизависимы, хотя причинно они являются для системы S независимыми. При статистическом моделировании наличие такой зависимости может иметь место, например, из-за коррелированности последовательностей псевдослучайных чисел, используемых для имитации событий, положенных в основу вычисления значений х и у.Таким образом, корреляционный анализ устанавливает связьмежду исследуемыми случайными переменными машинной модели249и оценивает тесноту этой связи. Однако в дополнение к этомужелательно располагать моделью зависимости, полученной послеобработки результатов моделирования.Регрессионный анализ результатов моделирования.
Регрессионный анализ дает возможность построить модель, наилучшим образом соответствующую набору данных, полученных в ходе машинного эксперимента с системой S. Под наилучшим соответствиемпонимается минимизированная функция ошибки, являющаяся разностью между прогнозируемой моделью и данными эксперимента.Такой функцией ошибки при регрессионном анализе служит суммаквадратов ошибок.Пример 7.2.
Рассмотрим особенности регрессионного анализа результатов моделирования при построении линейной регрессионной модели. На рис. 7.2, а показаныточки jf„ у„ ;'=Т7Д полученные в машинном эксперименте с моделью Мы системы S.Делаем предположение, что модель результатов машинного экса)перимента графически можетбыть представлена в виде прямойу=<р{х)=Ь0+Ъ1х,где $ — величина, предсказываемаярегрессионноймоделью.Требуется получить такие значения коэффициентов Ь0 я Ьи приРис. 7.2. Построение линейной регрессионной которых сумма квадратов ошибокмоделиявляется минимальной.
На рисунке ошибка ей / = 1 , N, для каждойэкспериментальной точки определяется как расстояние по вертикали от этой точкидо линии регрессии у=q> (x).Обозначим y,=b0+b1Xi, / = 1 , N Тогда выражение для ошибок будет иметь видкe,=yi-yi=b0+b1x,-yl,а функция ошибки F 0 = £ {Ьо+Ьп-уЩ1.i-iДля получения Ь0 и Ьх, при которых функция F0 является минимальной, применяются обычные методы математического анализа. Условием минимума являетсяdFJ3b0=6;dF0ldbL=0.Дифференцируя F0, получаемdFal8b0 = d £ (i 0 +6 1 x,-^ I ) J /5i 0 = 2 ( M 0 + i 1 £(«1dFJdb^d\i-lJC,-5>,)-0,i-l£ {Ь0 + Ь1Х1-у,)2!дЬ1=2Ь0 £ X.+2A, £ xf-2/£ад=0Решая систему этих двух линейных алгебраических уравнений, можно получитьзначения Ь0 и bL В матричном представлении эти уравнения имеют вид250КJ»NI**0I*?1-1h1-1кI*.—I.
У.1-1Ni-11-2Решая это уравнение, получаем*о-(I У. I *?-1 *. I *.)/[* I *?-(£*)}*i=(* 1 ья-! * ji *)/[* i x>-(i *<)2}где N — число реализаций при моделировании системы.Соотношения для вычисления Ьа и Ь1 требуют минимального объемапамяти ЭВМ для обработки результатов моделирования. Обычно мерой ошибкирегрессионной модели служит среднее квадратичное отклонение* - [ ( £ «?)/(АГ-2)],/2-|[1 (*о-А1*1-л)я]^-2)|"2.Для нормально распределенных процессов приблизительно 67% точек находитсяв пределах одного отклонения ае от линии регрессии и 95% — в пределах 2в> (трубкиА в В соответственно на рис.
7.2, 6). Для проверки точности оценок Ь0 и Ь.регрессионной модели могут быть использованы, например, критерии Фишера (Fраспределение) и Стьюдента (/-распределение). Аналогично могут быть оцененыкоэффициенты уравнения регрессии и для случая нелинейной аппроксимации.Дисперсионный анализ результатов моделирования. При обработке и анализе результатов моделирования часто возникает задачасравнения средних выборок. Если в результате такой проверкиокажется, что математическое ожидание совокупностей случайныхпеременных {Ух)}, {/2)}, •••, {Уп)} отличается незначительно, тостатистический материал, полученный в результате моделирования,можно считать однородным (в случае равенства двух первых моментов). Это дает возможность объединить все совокупности в однуи позволяет существенно увеличить информацию о свойствах исследуемой модели Мм, а следовательно, и системы S.