С.Л. Ахназарова, В.В. Кафаров - Методы оптимизации эксперимента в химической технологии (1062947), страница 24
Текст из файла (страница 24)
26) >=! и — объем выборки. Затем последовательно соединяют точки (х,, у) отрезками прямой. Полученная ломаная называется эмпирической линией регрессии у по х. По виду эмпирической линии регрессии можно подобрать уравнение регрессии у =)(х). 4. Линейная регрессия от одного параметра. Требуется определить по методу наименьших квадратов коэффициенты линейного уравнения регрессии >г у = Ь, + Ь,х (1Ч. 26) по выборке объема и. Система нормальных уравнений при этом имеет вид у л л Коэффициенты Ь, н 6, легко найти при помощи определителей: г=! Ь проще найти по известному Ь, из первого уравнения системы: Ь,=у — Ь, х.
г'=! ! 1 ~~ у! х! —,)' (Ь, + Ь, х;) х>= О, г=! г=-! или ()н.зП л л лье+ Ь, ~~ х; = ~«' уг, г=! г=! их) и Рис. 26. Эмпирическая лилия регрессии !29 !28 Уравнение ((Ч.ЗО) показывает, что между коэффициентами Ь и Ь, существует корреляционная зависимость. Для оценки силы линейной связи (ГЧ. 26) вычисляется выборочный коэффициент корреляции г': л ) «(х! — х)(у! — у) г=! гл (л — 1) в, вр где в„, ь, — выборочнь>е среднеквадратичные отклонения. 5-529 Из уравнений (1Н.
29) и (1Н. 31) имеем л ~3 ха!в й! ах л ~ уэ— (1Н. 32) 5 8 !О 15 20 25 20 17 !! 5 с сг,, у (растворимость ВаСЬ, 6), .. 32 д у = ба+ бзх. !) = (Оу! /аау (1Н. 34) ()Н.33) (1Н. 35) г=! г=! г=! г-! авосп г=! (1Н. 36) л ~ ху — ~х! тэ 1520 = — 1,355 ~, — = — 0,90. 2804 г» = — 1,355 воспр Л л~ хе — ~ х! ()Н. 37) !31 130 Пример 1.
Требуется определить зависимость растворимосги хлорида бария в воде (у) а присутствии хлорида кальция !х) при 70'С. Объем выборки и-6. Зксперимеиальные данные приведены ниже: Р е ю е н и е. Определим коэффициенты уравнения линейной регрессии аида Коэффициент Ы определим по формуле (!Ч.20), !в — по формуле !!Ч 30).
Для этого экспериментальные данные и резул~таты расчета представим в виде таблицы, Проверку вычислении можно провести по формуле ~, (х! + у!)к = ~' ха + 2 ~» х! у! + !) уэ В данном примере имеем 4738-8!4 Ч- 2 720 4 2484, т,е, вычисления проведены правильно Используем полученные в таблице суммы для определения коэффициентов Рс и Ы: 6 720 — 58 110 !10+ 1,355.58 6. 814 — 58Я ' 6 По формуле (!Ч 32) определим выборочныи коэффициент коррелызии: Коэффициент корреляции очень близок к единице, следовательно, зависимость межлу х и у является практически линейной в изученном диапазоне и Имеет вид л У = 31 43 — 1,355 х.
После того как уравнение регрессии найдено, необходимо провести статистический анализ результатов. Этот анализ заключается в проверке значимости всех коэффициентов регрессии в сравнении с ошибкой воспроизводимости и адекватности уравнения. Такое исследование называется регрессионным анализом.
Примем при проведении регрессионного анализа следующие допущения: 1 Входной параметр х измеряется с пренебрежимо малой ошибкой по сравнению с ошибкой в определении у. Большая ошибка у объясняется наличием в каждом процессе невыявленных переменных, не вошедших в уравнение регрессии. 2 Результаты наблюдений уп у,,...,у, над выходной величиной у представляют собой независимые, нормально распределенные случайные величины.
Ъ При проведении эксперимента с объемом выборки л при условии, что каждыи опыт повторен т раз, ! = 1,2,...,л. выборочные дисперсии хп за,...,хз должны быть однородны. Однородность дисперсий при одинаковом числе степеней свободы проверяют по критерию Кохрена, а при разном — по критерию Бартлета. Определенная по параллельным опытам дисперсия воспроизводимости 4э„„,необходима для оценки значимости коэффициентов уравнения регрессии и проверки адекватности уравнения эксперименту. Оценка значимости коэффициентов производится по критерию Стьюдента где г), -/-й коэффициент уравнения регрессии; уз — среднее квадратичное отклонение у-го коэффициента, Если г, больше табличного гав для выбранного уровня значимости Р и числа степеней свободы 7" =у,„пр, то коэффициент б, значимо отличается от нуля; зз определяется по закону накопления ошибок (!1 36): Если выборочные дисперсии зы зээ,...,з„" .однородны, получим т1 д Х (У;и-У1)' и- ! аа осеет Х сот )ест (! Н.
49) ((н, 36) с=и! 4д = 55ад/)ад Р=Р 1аа вд воспр (1Ч. 39) (! Н. 50) (1Ч. 40) (1Ч. 41) л пв ~~ (у! — у;)а 1--1 (!Ч. 51) л — ! (!Ч. 42) Х Х (у.— у!)* Ь=! и=-1 воспр = (1Ч. 52) лв 1 — 1 У! = ~ У!и! 3П; и=1 л (лс — !) (1Н. 43) ~воепр = 55аоспр/)весов (1Н,44) л д Х( — у) = аз аад ест (1Н. 53) (1Н.
45) ((Ч. 54) ()Ч. 46) Ху: и=! уо !П (1Ч. 55) Ы.„ — остаточная сумма квадратов; л 55ост = „в/~(У!и У1) ~ ПЧ.42) 1=! и=.! ~р~ (у! — у)а 1=! !ест =. ~„"1! 1=1 (1Н. 48) (1Ч. 56) и — 1 !32 133 Незначимые коэффициенты исключаются из уравнения регресии Оставшиеся коэффициенты пересчитываются заново, поскольку коэффициенты закоррелированы друг с другом. Адекватность уравнения проверяется по критерию Фишера: "= 4д) авсспр где з. — дисперсия адекватности;3„'„в,— дисперсия воспроизводимости; ۄ— сумма квадратов адекватности; 55ад = 55ост 55воспр, г" — число степеней свободы дисперсии адекватности; )ад = )оет )воепр = П ! — число коэффициентов в уравнении регрессии; Севоспр СуММа КВаДРатоВ, СВЯЗаииав С ДИСПЕРСИЕЙ ВОСПРОИЗВОДИМО- сти два Р л ив 1 еовоепр = ~ т„(У!и У1) ! 1=1 и=-! !в',,— число степеней свободы дисперсии воспроизводимости; л )воспр= У(п1! 1) ивп 1=-1 ~ (У1и У!) 1=1 и=-1 веспр л 1 (пв! — 1) )в„— число степеней свободы остаточной дисперсии атил окажется меньше табличного значения Е! ()1,,гт) для уровня значимости р и числа степеней свободы г! =у, и ут = )'„„р, уравнение адекватно эксперименту, Для одинакового числа опытов т, = 1п, =...= т, =...=-т, = т вычисления упрощаются: Если опыты проведены б53 параллельных, а для получения дисперсии воспроизводимости проделана отдельная серия из и! опытов, гогда Я (у.' — у')' ап и ! воспр При отсутствии параллельных опытов и дисперсии воспроизводимости можно оценить качество аппроксимации принятым уравнением, СРааина Зтс, И ДИСПЕРСИЮ ОтНОСИтЕЛЬНО СРЕДНЕГО Зт! по критерию Фишера 4(1!) Р= ' ест(!4) (1Ч.
57) ~~~у Р„(х;) Р!. (х!) .= О, 5=! (!Ч.б!) л у = Ьь + Ь, х + Ь, кх. (!Ч.56) При этом Зная многочлены уравнения регресЬхь!. Многочлены Р~ (х) =- 1, (1Ч. 62) (!Ч. 63) и л л Ькл+Ь! ~~ х! + Ь, ~~ к,:= ~~ у1, Е=! ! ! !=! л+1 Р,(к) =-х —— 2 (1Ч. 59) (1Ч. 64) к=! Ю=! Например, (л -!. !) (л + 2) б (1Ч. 65) !=1 к-! ((Ч.бП! л у! и ! = т (у! — у!)з!(л — !). !' ! с=! Ьо = л !34 135 В этом случае критерий Фишера показывает, во сколько раз уменьшается рассеяние относительно полученного уравнения регрессии по сравнению с рассеянием относительно среднего.
Чем больше значение Р превышает табличное ~,о!, )з) для выбранного уровня значимости р и чисел степеней свободы )! =л — 1 и )! =л — й тем эффективнее уравнение регрессии. 5. Параболическая регрессия. Если уравнение регрессии представляет собой полином некоторой степени, то при применении метода наименьших квадратов коэффициенты этого полинома находят решением системы линейных уравнений. Например, требуется определить по методу наименьших квадратов коэффициенты квадратичной функции — параболы второго порядка; д( (х) 07 (х) д( (х) — =1; — =к; —,=кх дЬ дЬ, дд! и система нормальных уравнений имеет вид; Ья ~ к! + Ь! ~4 ха!+ Ь, .'Ь, «з = ~ к; у!, Ьл',Ь~ ха+ Ь,~~у ха+аз ~~) к',= ~~~~~к,у!. Аналогичными по структуре уравнениями будут определяться коэффициенты параболы любого порядка.
Адекватности уравнения регрессии эксперименту добиваются повышением степени полинома. При этом в связи с наличием корреляции между коэффициентами все коэффициенты регрессии нужно вычислять заново. При переходе от (г-й степени полинома к (7!+ В-й в правой части уравнения регрессии добавляется одно слагаемое вида Ь, х'+ ', но все )г+ 2 коэффициента приходится рассчитывать заново. В качестве критерия при вычислениях рассматривается остаточная дисперсия Как только з;„,.„перестанет быть значимо меньше з „.„.„увеличе- ние степени (г нужно прекратить, Значимость различия между и 54! ! проверяется по критерию Фишера; Р =- 4754+! .
Если полученное Г-отношение меньше табличного Г, с7!, )4) для выбранного уровня значимости и чисел степеней свободы )! =)» и )з =Д„, увеличение степени (г нужно прекратить. б. Полиивмы Чебышева. Уравнение регрессии, выраженное через полиномы Чебышева, имеет вид л У =Ь!Р4(х)-РЬ,Р, (х)+- ... + Ьхрх(х), (1Ч. 60) где Рс(х)РР!Гх)....,Р„(х) — ортогональные полиномы Чебышева на множестве точек х„х,,...,х„.
Это означает, что для всех ик) выполняются соотношения где Рх !(х) зависит только от объема выборки л. Чебышева Рх !(х), при каждом увеличении степени сии необходимо вычислять только коэффициент Чебышева определяются по формулам Ь! (л! — Ь') Рх+ (х) = Р! (х) Р (х) — Р,, (к). 4 (44! — 1) Р ! ( + ) ! бл'+ 1бл+ 11 (л+ !) (л+ 2) (л+ 3) 2 !О 20 (! Ч.бб) + 9лз+ 2(л -1. 4 (л -(- 1) (2лз+ 7л -)- го) 7 7 + (л + !)(л 4 2) (л + 3) (л + 4) 60 Определяя коэффициенты Ьм Ь!,...,Ь„уравнения регрессии (1Ч. 60) по методу наименьших квадратов, получим !де з=! а ив л (1Ч. 74) (1Ч. 68» (1Н.76) з=! (1Н.76) пад д ост и — й — ! (1Ч.69) (1Н. 77) (1Ч. 70) и Х л (пг — 1) Рг (;» 12 (1Ч. 78) и Х ° = ' г л (л* — !)(лг — 4) г () 180 с=! (1Н.
79) (1Ч. 80) (1Ч.7!) з=! гжи г Зад = 88д ! — ад «г Рд (!). (1Ч.82) с=! 136 137 "~~у; Р, (хй ! =1 ь,= = "и ии', Рг! (х!) ~э~ у! Рд (х!) з=! ь,== и ~З Рг (хб Вычисленные по формулам (1Ч.68» коэффициенты Ь, не зависят от того, каков бу.дет порядок определяемого уравнения регрессии. При нахождении уравнения регрессии методом последовательных уточнений используются все ранее найденные Ьп Повышение порядка уравнения регрессии на 1 приводит к определению только одного коэфФициента.
При этом удобными получаются формулы для расчета остаточной дисперсии для уравнения регрессии й-го порядка; где суммы квадратов отклонений Ю определяются по рекуррентнои формуле и 88д =- 85д, - Ьд Рд (х,). г и(з ! — — ! Необходимо только заранее подсчитать Ыи- и и и ппи = ~(у! — адрд(х!)! = «~' (у! — у)г =.
~~ у— з=! с=! с=! л При равноотстояших значениях аргумента хг=х,+й; хд=х,+2й; ...; хи=и,+(и — 1)й, где й — шаг интерполяции, вычисления коэффициентов облегчаются Сделаем замену пере!сенных: г= — + !. (! Ч. 72) й Тогда каждое значение х, заменится своим номером, т. е. Определим коэффициенты уравнения регрессии вида А У =адРд (г) + а,Р, (г) + ... + адРд(г), ((Ч.73) и иг', у! Р, (!) ! а,= и Х Рг(!) с=! ~ »ВРд(д с=! ад= и Х Рд(!) Суммы, стоящие в знаменателе, можно определить по сокращеА- ной формуле: (й!) п (лг — !) (л* — 4) ... (пг — йг) Х ° -'' Рд(д [(2й Н !Нг 2*и(2й ! !) з=! где (2й — (»!1 — произведение всех нечетных чисел от 1 до 2й — ! включительно.