Н.А. Спирин, В.В. Лавров - Методы планирования и обработки результатов инженерного эксперимента (1062945), страница 19
Текст из файла (страница 19)
3.9,а, т.е. имеютсяочень крутая левая ветвь и пологая правая. Такое распределение отличаетсяот нормального.Длявыполненияоперацийпреобразованиякаждоенаблюдениетрансформируется с помощью логарифмического преобразования x ′ = lg(x ).При этом левая ветвь кривой распределения сильно растягивается, ираспределение принимает приближенно нормальный вид (рис.3.9,б). Если при1143. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХпреобразовании получаются значения, расположенные между 0 и 1, то всенаблюдаемые значения для удобства расчетов и во избежание полученияотрицательных параметров необходимо умножить на 10 в соответствующейстепени, чтобы все вновь полученные, преобразованные значения былибольше единицы, т.е.
необходимо выполнить преобразования x ′′ = lg( x ⋅ 10a ).абx ′ = lg(x )Рис. 3.9. Преобразование функции f(x) к нормальному распределениюАсимметричноераспределениесоднойвершинойприводитсякнормальному преобразованием x ′ = lg(x ± a ). В отдельных случаях можноприменять и другие преобразования:а) обратная величина x ′ = 1 x;б) обратное значение квадратных корней x ′ = 1x.Преобразование "обратная величина" является наиболее "сильным".Среднее положение между логарифмическим преобразованием и "обратнойвеличиной" занимает преобразование "обратное значение квадратных корней".Для нормализации смещенного вправо распределения служат, например,aстепенные преобразования x ′ = x .
При этом для a принимают значения: а=1,5при умеренном и а=2 при сильно выраженном правом смещении. Рекомендуемчитателю придумать такие преобразования, которые удовлетворяли быисследователя в том или ином случае.1153. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХКонтрольные вопросы1. Какие задачи решают в ходе предварительной статистическойобработки экспериментальных данных?2. Что такое генеральная совокупность и выборка?3.
Что такое точечное оценивание? Перечислите точечные оценкиосновных параметров нормального распределения для непрерывной случайнойвеличины.4.Вчемзаключаетсяосновнаяидеяоцениванияспомощьюдоверительного интервала? С помощью каких распределений происходитпостроение доверительных интервалов для математического ожидания идисперсии?5. В чем заключается сущность статистических гипотез? Что такоенулевая и альтернативная статистические гипотезы?6.
С помощью каких критериев производится отсев грубых погрешностей?7. Какие задачи возникают при сравнении двух рядов наблюденийэкспериментальных данных? С помощью каких критериев они решаются?8. Что такое критерий согласия? Какова основная идея его использованияпри проверке гипотез о виде функции распределения?9. В чем заключается алгоритм использования критерия Пирсона дляпроверки гипотезы нормального распределения экспериментальных данных?10. Какова процедура использования критерия Колмогорова-Смирновадля проверки гипотезы нормального распределения?1164.
АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА.ЭМПИРИЧЕСКИЕ ЗАВИСИМОСТИ4.1. Характеристика видов связей между рядами наблюденийНа практике сама необходимость измерений большинства величин вызывается тем, что они не остаются постоянными, а изменяются в функции отизменения других величин.
В этом случае целью проведения эксперимента яв)ляется установление вида функциональной зависимости y =f(X). Для этогодолжны одновременно определяться как значения X, так и соответствующие им)значения y , а задачей эксперимента является установление математическоймодели исследуемой зависимости. Фактически речь идет об установлении связи между двумя рядами наблюдений (измерений).Определение связи включает в себя указание вида модели и определение ее параметров. В теории экспериментов независимые параметры X=(x1, ...,xk) принято называть факторами, а зависимые переменные y – откликами. Координатное пространство с координатами x1, x2, ..., xi, ..., xk называется факторным пространством.
Эксперимент по определению вида функции)y = f (x),(4.1)где x – скаляр, называется однофакторным. Эксперимент по определениюфункции вида)y =f(X),(4.1а)где X=(x1, x2, ..., xi, ..., xk) – вектор – многофакторным.Геометрическим представлением функции отклика в факторном пространстве является поверхность отклика. При однофакторном эксперименте(k=1) поверхность отклика представляет собой линию на плоскости, при двухфакторном (k=2) – поверхность в трехмерном пространстве.Связи в общем случае являются достаточно многообразными и сложными. Обычно выделяют следующие виды связей.1174. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…Функциональные связи (или зависимости) – это такие связи, когда приизменении величины X другая величина y изменяется так, что каждому значению xi соответствует совершенно определенное (однозначное) значение yi(рис.4.1,а). Таким образом, если выбрать все условия эксперимента абсолютноодинаковыми, то, повторяя испытания, получим одну и ту же зависимость, т.е.кривые идеально совпадут для всех испытаний.К сожалению, такие условия в реальности не встречаются.
На практикене удается поддерживать постоянство условий (например, физико-химическиесвойства шихты при моделировании процессов тепломассопереноса в металлургических печах). При этом влияние каждого случайного фактора в отдельности может быть мало, однако в совокупности они существенно могут повлиятьна результаты эксперимента. В этом случае говорят о стохастической (вероятностной) связи между переменными.aбвРис.4.1. Виды связей: а – функциональная связь, все точкилежат на линии; б – связь достаточно тесная, точкигруппируются возле линии регрессии, но не все они лежатна ней; в – связь слабаяСтохастичность связи состоит в том, что одна случайная переменная yреагирует на изменение другой X изменением своего закона распределения(см. рис.
4.1, б). Таким образом, зависимая переменная принимает не одно конкретное значение, а некоторое из множества значений. Повторяя испытания,мы будем получать другие значения функции отклика, и одному и тому же значению X в различных реализациях будут соответствовать различные значения1184. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…)y в интервале [xmin; xmax]. Искомая зависимость y =f(X) может быть найденалишь в результате совместной обработки полученных значений X и y.На рис. 4.1, б – это кривая зависимости, проходящая по центру полосыэкспериментальных точек (математическому ожиданию), которые могут и не)лежать на искомой кривой y =f(X), а занимают некоторую полосу вокруг нее.Эти отклонения вызваны погрешностями измерений, неполнотой модели и учитываемых факторов, случайным характером самих исследуемых процессов идругими причинами.Анализ стохастических связей приводит к различным постановкам задачстатистического исследования зависимостей, которые упрощенно можно классифицировать следующим образом:1) задачи корреляционного анализа – задачи исследования наличия взаимосвязей между отдельными группами переменных ;2) задачи регрессионного анализа – задачи, связанные с установлением аналитических зависимостей между переменным y и одним или несколькимипеременными x1, x2, ..., xi, ..., xk, которые носят количественный характер;3) задачи дисперсионного анализа – задачи, в которых переменные x1, x2, ..., xi,..., xkимеют качественный характер, а исследуется и устанавливаетсястепень их влияния на переменное y.Стохастические зависимости характеризуются формой, теснотой связи ичисленными значениями коэффициентов уравнения регрессии.)Форма связи устанавливает вид функциональной зависимости y =f(X) ихарактеризуется уравнением регрессии.
Если уравнение связи линейное, тоимеем линейную многомерную регрессию, в этом случае зависимость)y от Xописывается линейной зависимостью в k-мерном пространстве:k)y = b0 + ∑ b j x j ,(4.2)j =1где b0, ..., bj, ..., bk – коэффициенты уравнения. Для пояснения существа используемых методов ограничимся сначала случаем, когда x – скаляр. В общем1194.
АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…случае виды функциональных зависимостей в технике достаточно многообразны: показательные y = b 0 x b1 , логарифмические y = b 0 lg( x ) и т.д.Заметим, что задача выбора вида функциональной зависимости – задачанеформализуемая, так как одна и та же кривая на данном участке примерно содинаковой точностью может быть описана самыми различными аналитическими выражениями. Отсюда следует важный практический вывод. Даже в нашвек компьютеров принятие решения о выборе той или иной математическоймодели остается за исследователем. Только экспериментатор знает, для чегобудет в дальнейшем использоваться эта модель, на основе каких понятий будут интерпретироваться ее параметры.Крайне желательно при обработке результатов эксперимента вид функ)ции y =f(X) выбирать, исходя из условия ее соответствия физической природеизучаемых явлений или имеющимся представлениям об особенностях поведения исследуемой величины.
К сожалению, такая возможность не всегда имеется, так как эксперименты чаще всего проводятся для исследования недостаточно или неполно изученных явлений.)При изучении зависимости y =f(x)от одного фактора при заранее неизвестном виде функции отклика для приближенного определения вида уравнения регрессии полезно предварительнопостроить эмпирическую линию регрессии (рис.4.2). Для этого весь диапазонизменения x разбивают на равные инРис.4.2. К построениюэмпирической линии регрессиитервалы ∆x.
Все точки, попавшие в данный интервал ∆xj, относят к его середине x j . Для этого подсчитывают частныесредние для каждого интервала:nj∑ y jiy j = i =1 .nj(4.3)1204. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…k*Здесь nj – число точек в интервале ∆xj, причем ∑ n j = n , где k* – число интерj=1валов разбиения; n – объем выборки.Затем последовательно соединяют точки ( x j ; y j ) отрезками прямой.
Полученная ломаная называется эмпирической линией регрессии. По виду эмпирической линии регрессии можно в первом приближении подобрать вид урав)нения регрессии y =f(x).Под теснотой связи понимается степень близости стохастической зависимости к функциональной, т.е. показатель тесноты группирования экспериментальных данных относительно принятого уравнения модели (см. рис.4.1,б,в). В дальнейшем уточним это положение.4.2. Определение коэффициентов уравнения регрессииБудем полагать, что вид уравнения регрессии уже выбран и требуетсяопределить только конкретные численные значения коэффициентов этогоуравнения b= {b 0 ,..., b j ,..., b k } . Отметим предварительно, что если выбор видауравнения регрессии, как это уже отмечалось, – процесс неформальный и неможет быть полностью передан компьютеру, то расчет коэффициентов выбранного уравнения регрессии – операция достаточно формальная и ее следует решать с использованием компьютера.
Это трудный и утомительный расчет,в котором человек не застрахован от ошибок, а компьютер выполнит его значительно быстрее и качественнее.Существует два основных подхода к нахождению коэффициентов bj. Выбор того или иного из них определяется целями и задачами, стоящими передисследователем, точностью полученных результатов, их количеством и т.д.Первый подход – интерполирование.