Н.А. Спирин, В.В. Лавров - Методы планирования и обработки результатов инженерного эксперимента (1062945), страница 22
Текст из файла (страница 22)
Онпредложил такое нелинейное преобразование величины rxy, при котором законраспределения этой оценки, вообще говоря, довольно сложный, практическиприближается к нормальному. Это преобразование производится по формуле1 1 + rxy.Z * = ln2 1 − rxy(4.22)Среднеквадратичное отклонение случайной величины z* зависит от числа опытов1344. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…σ Z* =1,n−3(4.23)а математическое ожидание очень близко к числу, получающемуся после подстановки в формулу (4.22) вместо rxy истинного значения коэффициента корреляции rxy*. Эти свойства величины Z* позволяют просто оценить, в каких пределах может находиться истинное значение коэффициента корреляции, если по nопытам получены некоторые значения его выборочного значения (оценки) rxy.Если граничное значение rxy имеет тот же знак, что и rxy*, то можно считать впервом приближении, что корреляционная связь между переменными достоверна.Пример 4.1.
При обработке n=17 пар данных x и y выборочный коэффициент корреляции составил rxy= – 0,94, т.е. величина y связана с x достаточносильной причинной связью, близкой к функциональной зависимости. Требуетсяопределить значимость и найти доверительный интервал выборочного коэффициента корреляции.Определение значимости коэффициента rxyt = rxyn−21 − (rxy )2= 0,9417 − 21 − (0,94) 2= 10,6.Критерий Стьюдента t0,05;15=2,13 (СТЬЮДРАСПОБР (0,05;15)=2,13145).Поскольку t>tα;n-2, то коэффициент корреляции существенен.Определение доверительного интервала. По формулам (4.22) и (4.23)определим величину Z*:1 1 − 0,94Z * = ln= −1,7382 1 + 0,94и ее среднеквадратичное отклонение:1S * == 0,267.Z17 − 3Зададимся вероятностью того, что истинное значение Z отличается отвычисленного на основании оценки коэффициента корреляции Z* не более чемна δZ.
Учитывая нормальный закон распределения Z, имеем при вероятности:90%:δZ=1,64⋅SZ =1,67⋅0,267=0,438;95%:δZ=1,96⋅0,267=0,523;99,7%:δZ=3,00⋅0,267=0,801.1354. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…Таким образом, истинное значение Z лежит в пределах Z1 ≤ Z ≤ Z2, где свероятностью, например, 90%, Z1= -1,738-0,438= -2,176 и Z2= -1,738+0,438= 1,300. Для заданных значений вероятностей значения Z1 и Z2 составят:90%:Z1= – 2,176, Z2= –1,300;95%:Z1= – 2,261, Z2= –1,215;99,7%:Z1= – 2,539, Z2= –0,937.Этим значениям Z1 и Z2 соответствуют коэффициенты корреляции, полученные из формулы (4.22).
Чтобы определить численные значения коэффициентов корреляции из формулы (4.22), можно воспользоваться инструментом«Подбор параметра» из электронных таблиц Microsoft Excel (меню «Сервис/Подбор параметра…»). В результате получим следующее решение:90%:r1= -0,97, r2= -0,86, т.е. -0,97≤rxy≤-0,86;95%:r1= -0,98, r2= -0,84, т.е. -0,98≤rxy≤-0,84;99,7%:r1= -0,99, r2= -0,73, т.е.
-0,99≤rxy≤-0,73.Следовательно, доверительные интервалы подтверждают достаточно сильнуюпричинную связь между анализируемыми параметрами.Таким образом, корреляционный анализ устанавливает связь между исследуемыми случайными переменными и оценивает тесноту этой связи.4.5. Регрессионный анализНиже излагаются основные положения регрессионного анализа, применение которого для обработки результатов наблюдений связано с меньшимчислом ограничений, чем при корреляционном анализе.
Как и корреляционныйанализ, регрессионный анализ включает в себя построение уравнения регрессии, например, методом наименьших квадратов и статистическую оценку результатов. Если в регрессионном анализе расчет коэффициентов ведется темиже методами, например наименьших квадратов, то его теоретические предпосылки требуют других способов статистической оценки результатов.При проведении регрессионного анализа примем следующие допущения:1) входной параметр x измеряется с пренебрежимо малой ошибкой. Появление ошибки в определении y объясняется наличием в процессе не выяв1364. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…ленных переменных и случайных воздействий, не вошедших в уравнение регрессии;2) результаты наблюдений y1, y2,..., yi,..., yn над выходной величинойпредставляют собой независимые нормально распределенные случайные величины;3) при проведении эксперимента с объемом выборки n при условии, чтокаждый опыт повторен m* раз, выборочные дисперсии S12,..., Si2,..., Sn2 должныбыть однородны.
При выполнении измерений в различных условиях возникаетзадача сравнения точности измерений. При этом следует подчеркнуть, что экспериментальные данные можно сравнивать только тогда, когда их дисперсииоднородны. Это означает, как уже отмечалось (см. п.
3.5.1 и 3.5.2), принадлежность экспериментальных данных к одной и той же генеральной совокупности.Напомним: однородность дисперсий свидетельствует о том, что среди сравниваемых дисперсий нет таких, которые с заданной надежностью превышали бывсе остальные, т.е. была бы большая ошибка. При одинаковом числе параллельных опытов однородность дисперсии, как мы уже показали, можно оценитьпо критерию Кохрена, а для сравнения двух дисперсий целесообразно воспользоваться F-критерием Фишера (см. примеры 3.4–3.5).После того как уравнение регрессии найдено, необходимо провести статистический анализ результатов. Этот анализ состоит в следующем: проверяется значимость всех коэффициентов и устанавливается адекватность уравнения.1374.
АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…4.5.1. Проверка адекватности моделиПри моделировании приходится формализовать связи исследуемого явления (процесса), из-за чего возможна потеря некоторой информации об объекте. Иногда некоторые связи не учитываются. В то же время основное требование к математической модели заключается в ее пригодности для решенияпоставленной задачи и адекватности процессу. Регрессионную модель называют адекватной, если предсказанные по ней значения у согласуются с результатами наблюдений.
Так, построив модель в виде линейного уравнениярегрессии, мы хотим, в частности, убедиться, что никакие другие модели не дадут значительного улучшения в описании предсказания значений у. В основепроцедуры проверки адекватности модели лежат предположения, что случайные ошибки наблюдений являются независимыми, нормально распределенными случайными величинами с нулевыми средними значениями и одинаковымидисперсиями.Сформулируем нуль-гипотезу Н0: "Уравнение регрессии адекватно".Альтернативная гипотеза Н1: "Уравнение регрессии неадекватно".Для проверки этих гипотез принято использовать F-критерий Фишера.При этом общую дисперсию (дисперсию выходного параметра) Sy2 сравнивают с остаточной дисперсией Sy ост2.Напомним, чтоnS y2 =∑[ yi =1i− y ]2nS y2 ост =;n −1∑[ yi =1i)− yi ]2n−l,(4.24)где l=k+1 – число членов аппроксимирующего полинома, а k – число факторов.Так, например, для линейной зависимости (4.5) k=1, l=2.В дальнейшем определяется экспериментальное значение F-критерия1384.
АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…F = S y2 S y2 ост ,(4.25)который в данном случае показывает, во сколько раз уравнение регрессиипредсказывает результаты опытов лучше, чем среднее y =1 n∑ yi = C = const.n i =1Если F>Fα;m1;m2, то уравнение регрессии адекватно. Чем больше значениеF превышает Fα;m1;m2 для выбранного α и числа степеней свободы m1=n-1,m2=n-l, тем эффективнее уравнение регрессии.Рассмотрим также случай, когда в каждой i-й точке xi для повышения надежности и достоверности осуществляется не одно, а m* параллельных измерений (примем для простоты, что m* одинаково для каждого фактора). Тогдачисло экспериментальных значений величины у составит nΣ=n⋅m*.В этом случае оценка адекватности модели производится следующимобразом:m*1) определяется y i = ∑ yij m * – среднее из серии параллельных опытовj =1при x=xi, где yij – значение параметра у при x=xi в j-м случае;)2) рассчитываются значения параметра y i по уравнению регрессии приx=xi;3) рассчитывается дисперсия адекватности2S ад=n)m * ∑ [ y i − yi ]2i =1n−l,где n – число значений xi; l – число членов аппроксимирующего полинома (коэффициентов bi), для линейной зависимости l=2;4) определяется выборочная дисперсия Y при x=xi:m*S i2 =∑[ yj =1ij− y i ]2m * −1;5) определяется дисперсия воспроизводимости1394.
АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…n2Sвосп= ∑ Si2 n .i =1Число степеней свободы этой дисперсии равно m=n(m*-1);6) определяется экспериментальное значение критерия Фишера22F = SадSвосп.7) определяется теоретическое значение этого же критерия Fα;m1;m2,где m1=n-l; m2= n (m*-1);8) если F≤Fα;m1;m2, то уравнение регрессии адекватно, в противном случае– нет.4.5.2. Проверка значимости коэффициентов уравнения регрессииНадежность оценок bi уравнения регрессии можно охарактеризовать ихдоверительными интервалами ∆bi, в которых с заданной вероятностью находится истинное значение этого параметра.Наиболее просто построить доверительные интервалы для параметровлинейного уравнения регрессии, т.е. коэффициентов b0 и b1.
При этом предполагается, что для каждого значения случайной величины x=xi имеется распре)деление со средним значением y i = b 0 + b1x i и дисперсией S 2 = S 2восп . Инымиyiсловами, делается допущение, что случайная величина Y распределена нормально при каждом значении xi, а дисперсия S 2 во всем интервале измененияyix постоянна: S2 = const (см. рис. 4.9).yiДля линейного уравнения среднеквадратичное отклонение i-го коэффициента уравнения регрессии S b i можно определить по закону накопления ошибок1404.