Н.А. Спирин, В.В. Лавров - Методы планирования и обработки результатов инженерного эксперимента (1062945), страница 37
Текст из файла (страница 37)
В нашем случае критерий D=0,07934, следовательно, гипотеза о нормальности распределения данных о содержании кремния в2337. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …чугуне подтверждается. В противном случае система выдала бы соответствующеесообщение и выделила бы данный критерий отличительным цветом.Регрессионный анализПрименение системы STATISTICA для регрессионного анализа рассмотрим напримере исследования взаимосвязи среднемесячного удельного расхода кокса и соответствующей величины удельного выхода шлака по данным работы одной из доменных печей ОАО "Магнитогорский металлургический комбинат" (ОАО ММК), которые отражены в табл.
7.3. Напомним, что задача регрессионного анализа состоит втом, чтобы по наблюдениям входных (X) и выходных (Y) параметров:− построить регрессионную модель (уравнение регрессии), т.е. оценить параметрымодели (коэффициенты уравнения) наилучшим образом;− построить доверительные интервалы для коэффициентов модели;− проверить гипотезу о значимости регрессии;− оценить степень адекватности модели и т.д.Из теории доменного процесса известно, что величина расхода кокса зависитот выхода шлака, а не наоборот. Поэтому зависимой переменной Y будет являтьсявеличина удельного расхода кокса, а независимой переменной X – величина удельного выхода шлака.
Регрессионный анализ будем проводить в несколько этапов.Таблица 7.3Фактические данные о расходе кокса (К) ивыходе шлака (Ш) на одной из доменных печей ОАО ММК№К,Ш,№К,Ш,№К,Ш,п/пкг/ткг/тп/пкг/ткг/тп/пкг/ткг/тчугуначугуначугуначугуначугуначугуна1231231231391250314032416139325124382683244027762418252340826033416253634262704399244344452946441226054242723538424965419277642527936435263664332742347.
КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …Окончание табл. 7.31231231237395243373892546738724584082693840625268451291942526239384238693982531038424140399240704032441142426741419256714252591240323942418261723822251340924243398262733972441441627044421270744492801541025445398257753852561639225646398250763852281740324447438271773862181837723948437280784182531941926249411264794082562038225150406250804422702143026751409269814062432240625852391242824132592337924053399252834362662442025154435273843842422538925655420260854292752641125356416261863922372741927557420276873902592841327258386242884272622939223559390220893982423041825760427258904452801. Воспользуемся статистическим модулем Nonlinear estimation (Нелинейноеоценивание), в котором создадим новый файл exampl2.sta и занесем в него данныеиз табл. 7.3. На рис. 7.9 показан файл с исходными данными.
Переменные, содержащие данные об удельных расходе кокса и выходе шлака, обозначены соответственно KOKS и SLAG.2357. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …2. Последовательность регрессионного анализа в системе STATISTICA лучшевсего начинать с визуальной оценки положенияданных при помощи различных графическихсредств. Поскольку в нашем случае изучаетсязависимость типа Y=f(X), то для этой цели подойдет двумерный график Scatterplots из менюGraphs/Stats 2D Graphs.
В появившемся диалоговом окне (рис. 7.10) выбираем переменные Xи Y нажатием кнопки Variables. Имена выбранных переменных Var X (SLAG) и Var Y (KOKS)отображаются в окне диалога. В этом окне дополнительноможноотметитьтипграфика(Graph Type) – Regular, модель оценивания (FIT)– первоначально выберем Off, стиль графика(Style) – Normal, величину доверительного интервала и т.д. После нажатия кнопки OK на экРис.
7.9. Файл исходных данныхдля регрессионного анализаране в отдельном окне появляется построенныйграфик.3. Из анализа наблюдений положенияданных на графике делаем вывод о пригодности для оценивания полиномиальнойрегрессионной модели. Отметим в диалоговом окне (рис. 7.10) модель оцениванияPolynomial и нажмем кнопку ОК. В результате появится отдельное окно с графиком, вкотором на точечные данные нанесена кривая, подобранная по методу наименьшихквадратов и описываемая многочленом 5-го порядка (рис.
7.11). Уравнение многочлена представлено в заголовке графика и имеет следующий вид:y = −73616,8 + 1508,463 ⋅ x − 12,187 ⋅ x 2 + 0,049 ⋅ x 3 − 9,678 ⋅ 10 −5 ⋅ x 4 + 7,619 ⋅ 10 −8 ⋅ x 5 .Абсолютная величина каждого коэффициента в уравнении регрессии характеризует вклад соответствующей степенной составляющей на параметр отклика y.2367. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …y = −73616,8 + 1508,463 ⋅ x − 12,187 ⋅ x 2 + 0,049 ⋅ x 3 −− 9,678 ⋅ 10 −5 ⋅ x 4 + 7 ,619 ⋅ 10 −8 ⋅ x 5 .Рис.7.10. Окно построения графиков для подгонки модели оцениванияРис.7.11.
Полиномиальная кривая 5-го порядка, рассчитанная по методу наименьших квадратов2377. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …4. Для того чтобы проанализировать регрессионную модель, из главного менюсистемы Analysis (Анализ) выбираем пункт User-specified regression (Определяемаяпользователем регрессия).
На экране появляется начальное диалоговое окно (рис.7.12), в котором нажатием кнопки function to be estimated & loss function (функцияоценивания и функция потерь) можно с помощью формул задать функцию, которуюнеобходимо оценить, а также определить функцию потерь.Рис. 7.12. Начальное окно диалога по оценке параметровопределяемой пользователем регрессионной кривойРассмотрим в качестве примера в дальнейшем зависимость между удельнымрасходом кокса (KOKS) и удельным выходом шлака (SLAG) в виде полинома 3-йстепени:KOKS=b0+b1*SLAG+b2*SLAG2+ b3*SLAG3.Функция потерь по умолчанию задается в виде квадрата отклонения наблюдаемыхот предсказанных с помощью регрессионной модели значений (OBS-PRED)2.5.
Нажатие клавиши ОК приводит к появлению окна Model Estimation (Оценивание модели) для выбора метода и начальных установок для пользовательскойрегрессии (рис. 7.13). В качестве метода оценивания выберем квазиньютоновский. Вметодах нелинейного оценивания важно правильно подобрать начальные приближения. Неизвестными параметрами модели являются коэффициенты b0, b1, b2 и b3.Нажав кнопку Start values (Начальные значения), в появившемся диалоговом окневведем начальные значения, предсказанные на основе предварительного графического анализа данных: b0=-73616, b1=1508, b2=-12 и b3=0,049.
Нажатие клавиши ОКприводит к появлению окна оценок параметров модели на каждом шаге итерации.После того как оценивание завершится, внизу окна появится сообщение Parameterestimation process converged (Процесс оценивания параметров сошелся).2387. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …Рис. 7.13. Окно выбора метода и начальных установокдля пользовательской регрессии6. Далее нажимаем кнопку ОК, после чего открывается окно Results (Результаты), показанное на рис. 7.14. Окно результатов имеет следующую структуру:верхняя часть окна – информационная, нижняя содержит функциональные кнопки,позволяющие всесторонне просмотреть результаты анализа.Рис.
7.14. Окно результатов оценивания параметровпользовательской регрессии2397. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …Информационная часть содержит краткую информацию о проведенном анализе, а именно:•Modelis–видмоделиоценивания.ВнашемслучаеKOKS=b0+b1*SLAG+b2*SLAG2+ b3*SLAG3;•Dependent variable – зависимая переменная. В нашем примере это удельныйрасход кокса (KOKS);•Independent variables – количество независимых переменных. В примере независимая переменная одна – удельный выход шлака;•Loss function – вид функции потерь;•Final value – последнее значение параметра, по которому система проводилаподгонку модели.Функциональные кнопки позволяют представить результаты в виде таблиц играфиков. Выберем кнопку Parameter estimates (Параметры оценивания), и на экране появится окно, в котором отражены численные значения коэффициентов модели(рис.
7.15). Нажатие кнопки Fitted 2D function & observed vals (Подогнанная функцияи наблюдаемые значения) выводит на экран график результирующей кривой, наложенной на наблюдаемые значения исходных данных (рис. 7.16). Таким образом,уравнение регрессионной модели окончательно примет видy = 4984,803 − 54,333 ⋅ x + 0,21035 ⋅ x 2 − 0,000265 ⋅ x 3 .7. Далее следует оценить поведение остатков (residuals) модели, т.е. разностей между исходными (наблюдаемыми) значениями зависимой переменной и предсказанными с помощью модели. Исследуя остатки модели, можно оценить степеньее адекватности. С помощью функциональных кнопок в данном окне (см. рис.
7.14)можно проанализировать остатки как в графическом виде, так и в электронных таблицах.Рис.7.15. Результаты расчета коэффициентов регрессионной модели2407. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …Рис.7.16. График результирующей регрессионной кривой,наложенной на наблюдаемые исходные данныеСначала для оценки адекватности модели лучше всего использовать визуальные методы и затем, если потребуется, перейти к статистическим. Нажмем кнопку Normal Probability plot of residuals (График остатков на нормальной вероятностной бумаге), и выбранная зависимость появится на экране в отдельном окне (рис.7.17). Из графика остатков на нормальной вероятностной бумаге видно, что они достаточно хорошо ложатся на прямую, которая соответствует нормальному законураспределения. Поэтому гипотеза о нормальном распределении ошибок принимается.Далее нажмем кнопку Predicted vs.
residual values (Распределение остатков),и на экране появится график следующего вида (рис. 7.18). Из этого графика видно,что остатки хаотично разбросаны на плоскости и в их поведении нет закономерностей. Нет основания говорить, что остатки коррелированы между собой. Следовательно, можно заключить, что регрессионная модель достаточно адекватно описывает данные.2417. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …Рис.7.17.
График остатков на нормальной вероятностной бумагеРис.7.18. Распределение остатков на плоскости2427. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …Контрольные вопросы1. Какие преимущества дает экспериментатору использование средств вычислительной техники?2. Каковы возможности современных программ по обработке экспериментальныхданных?3.