Н.А. Спирин, В.В. Лавров - Методы планирования и обработки результатов инженерного эксперимента (1062945), страница 20
Текст из файла (страница 20)
Базируется на удовлетворении ус)ловию, чтобы функция y =(X,b) совпадала с экспериментальными значениями внекоторых точках, выбранных в качестве опорных (основных, главных) yi.1214. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…В этом случае для определения k+1 неизвестных значений параметров bjиспользуется система уравненийf(xi, b0, ..., bj, ...., bk) = yi,1≤i≤n.(4.4)В данном случае число независимых уравнений системы равно числуопорных точек, в пределе – n поставленных опытов.
С другой стороны, для определения k+1 коэффициентов необходимо не менее k+1 независимых уравнений. Но если число n поставленных опытов и число независимых уравненийравно числу искомых коэффициентов k+1, то решение системы может бытьединственно, а следовательно, точно соответствует случайным значениям исходных данных.
Таким образом, в предельном случае, когда число коэффициентов уравнения регрессии равноyчислу экспериментальных точек1n=k+1, все экспериментальныеточки будут совпадать с их расчетными2значениями.Следуетзаметить, что добиваться такоготочного совпадения путем значительного увеличения числа коэффициентов уравнения регрес-xсии часто просто неразумно, по-Рис.4.3.
Аппроксимация функциис большим (1) и небольшим (2) числомкоэффициентов biскольку экспериментальные результаты получены с большейили меньшей погрешностью, итакая функция может просто не отражать действительного характера изменения исследуемой величины в силу влияния помех (возмущений) (рис.4.3).Таким образом, задача в конечном счете сводится к решению системыk+1 уравнений с k+1 неизвестными. Основная сложность такого решения связана с нелинейностью системы, хотя в принципе при использовании компьютера она преодолима.1224. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…При числе опытов n большем, чем k+1 искомых коэффициентов, числонезависимых уравнений системы избыточно.
Избыточность информации можноиспользовать по-разному.После определения численных значений k+1 параметров проверяетсякачество аппроксимации путем сопоставления значений функции и экспериментальных данных в оставшихся, неиспользованных точках. Если обнаруженныемежду ними расхождения превышают допустимые по условию точности, топроцедуру определения коэффициентов bj можно повторить, приняв в качествеопорных (основных) другие точки.Таким образом, из этих уравнений в разных комбинациях можно составить несколько систем уравнений, каждая из которых в отдельности даст своерешение. Но между собой они будут несовместимыми.
Каждое решение будетсоответствовать своим значениям коэффициентов bj. Если все их построить награфике, то получим целый пучок аппроксимирующих кривых.Это открывает при n>k+1 совершенно новые возможности. Во-первых,этот пучок кривых показывает форму и ширину области неопределенности проведенного эксперимента. Во-вторых, может быть произведено усреднение всехнайденных кривых и полученная усредненная кривая будет гораздо точнее идостовернее описывать исследуемое явление, так как она в значительной степени освобождена от случайных погрешностей, приводивших к разбросу отдельных экспериментальных точек.
Поясним суть этого подхода на примередвух методов.1. Метод избранных точек (рис. 4.4). На основании анализа данных выдвигают гипотезу о виде (форме) зависимости f(X). Предположим, что она линейная, т.е. статистическая связь – это линейная одномерная регрессия)y = b 0 + b1x.(4.5)1234. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…Выбирают две наиболее характерные, по мнению исследователя, точки, через которые и проходитлиния регрессии (рис.
4.4). Задачавычисления коэффициентов b0 и b1 вэтом случае тривиальна. Если предполагается, что уравнение регрессииболее высокого порядка, то соответственно увеличивают число избранных точек. Недостатки такого подхо-Рис.4.4. Метод избранных точек:× – избранные точкида очевидны, так как избранные точки выбираются субъективно, а по-давляющая часть экспериментального материала не используется для определения параметров (коэффициентов) уравнения регрессии, хотя ее можно использовать в дальнейшем для оценки надежности полученного уравнения.2. Метод медианных центров.
Сущность этого метода поясняет рис.4.5.Обведенное контуром поле точек делятyна несколько частей, число которыхравно числу определяемых коэффициентов уравнения регрессии. В каждой изy IIэтих частей находят медианный центр,т.е. пересечение вертикали и горизон-yIтали слева и справа, выше и ниже которых оказывается равное число точек.Затем через эти медианные центрыxIx IIxпроводят плавную кривую и из решенияРис.4.5. Метод медианных точексистемы уравнений определяют коэф-фициенты регрессии bj. Так, в случае линейной зависимости (4.5) поле делитсяна две группы. Определяют средние значения x I , y I ; x II , y II для каждой изгрупп, а неизвестные коэффициенты b0, b1 определяют из решения системыуравнений:1244. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…y I = b 0 + b1 x I ;(4.5а)y II = b 0 + b1 x II .Если при выборе вида уравнения регрессии число его коэффициентов bjокажется больше числа уравнений (имеющихся результатов измерений) k+1>n,система (4.4) не будет иметь однозначного решения.
В этом случае необходимолибо уменьшить число определяемых коэффициентов k+1, либо увеличитьчисло опытов n.Второй подход – метод наименьших квадратов. Усреднение несовместимых решений избыточной системы уравнений n>k+1 может быть преодоленометодом наименьших квадратов, который был разработан еще Лежандром иГауссом. Таким образом, метод наименьших квадратов – это «новинка» почти200-летней давности.
Сегодня, благодаря возможностям компьютеров, этот метод вступил, по существу, в полосу своего «ренессанса».Определение коэффициентов bj методом наименьших квадратов основано на выполнении требования, чтобы сумма квадратов отклонений экспериментальных точек от соответствующих значений уравнения регрессии была минимальна.
Заметим, что, в принципе, можно оперировать и суммой других четныхстепеней этих отклонений, но тогда вычисления будут сложнее. Однако руководствоваться суммой отклонений нельзя, так как она может оказаться малой прибольших отклонениях отрицательного знака.Математическая запись приведенного выше требования имеет видnФ( b 0 , b1 ,..., b j ,..., b k ) = ∑ [f ( x i ,b 0 , b1 ,..., b j ,..., b k ) − y i ] 2 → min,bji =1(4.6)где n – число экспериментальных точек в рассматриваемом интервале изменения аргумента x.Необходимым условием минимума функции Ф(b0,b1,...,bj,...,bk) являетсявыполнение равенства∂ Ф / ∂ b j = 0, 0 ≤ j ≤ k(4.7)или1254.
АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…n∑ [f ( x i ,b0 , b1,..., b j,..., bk ) − yi ]i =1∂ f (xi )= 0,∂ bj0 ≤ j ≤ k.(4.7а)После преобразований получимn∑ [f ( x i ,b 0 , b1 ,..., b j ,..., b k )i =1∂ f (x i ) n∂ f (x i )− ∑ yi= 0.∂ bj∂bji =1(4.8)Система уравнений (4.8) содержит столько же уравнений, сколько неизвестных коэффициентов b0, b1,..., bk входит в уравнение регрессии, и называется в математической статистике системой нормальных уравнений.Поскольку Ф≥0 при любых b0, ..., bk, величина Ф обязательно должнаиметь хотя бы один минимум. Поэтому если система нормальных уравненийимеет единственное решение, оно и является минимумом для этой величины.Расчет регрессионных коэффициентов методом наименьших квадратовможно применять при любых статистических данных, распределенных по любому закону.4.3.
Определение тесноты связи между случайными величинамиОпределив уравнение теоретической линии регрессии, необходимо датьколичественную оценку тесноты связи между двумя рядами наблюдений. Линиирегрессии, проведенные на рис. 4.1, б, в, одинаковы, однако на рис. 4.1, б точкизначительно ближе (теснее) расположены к линии регрессии, чем на рис. 4.1, в.При корреляционном анализе предполагается, что факторы и откликиносят случайный характер и подчиняются нормальному закону распределения.Тесноту связи между случайными величинами характеризуют корреляционным отношением ρxy. Остановимся подробнее на физическом смысле данного показателя.
Для этого введем новые понятия.Остаточная дисперсия S y2 ост характеризует разброс экспериментальнонаблюдаемых точек относительно линии регрессии и представляет собой показатель ошибки предсказания параметра y по уравнению регрессии (рис. 4.6):1264. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…S y2 ост =n1 n1) 2[]y−y=[ yi − f ( xi , b0 , b1 ,..., bk )]2 ,∑ i i n −1− k ∑n − l i =1i =1(4.9)где l=k+1 – число коэффициентов уравнения модели.Рис.4.6. К определению дисперсийОбщая дисперсия (дисперсия выходного параметра) S 2y характеризуетразброс экспериментально наблюдаемых точек относительно среднего значения y , т.е. линии С (см. рис.