rpd000003197 (1012246), страница 33
Текст из файла (страница 33)
Применяя приведенное общее выражение к имеющимся исходным данным получаем:
yi=f(xi)+ i , i=1,...,n.
Дальнейшая формализация задачи опирается на предположение о том, что все случайные величины 1, 2 ,..., n статистически независимы и одинаково распределены. Все многообразие подходов к решению задач регрессионного анализа во многом определяется тем, какие предположения относительно распределения ошибок 1, 2 ,..., n положены в их основу. Достаточно часто обоснованным является предположение о том, что ошибки i распределены по нормальному закону с параметрами N(0,2)
Следующей составляющей регрессионной модели является функция f(X). Как правило в практических задачах регрессионного анализа предполагают, что множество допустимых функций f(X) принадлежит параметрическому семейству f(X,), где -некоторый параметр. Тогда уравнение регрессии можно представить в виде:
yi=f(xi, )+ i , i=1,...,n.
В рамках такого представление восстановление зависимости между X и Y сводится к отысканию оценки * параметра по измерениям (xi, yi) i=1,...,n.
Наиболее простой является ситуация, когда функция f(X,) линейно зависит от параметров , то есть регрессионная модель может представлена в следующем виде: f(Х,)= А(Х), где А(Х)- некоторая известная матрица элементы которой зависят от Х. Эта задача носит название линейного регрессионного анализа. В случае, когда f(X,) не линейна по - имеет место задача нелинейного регрессионного анализа.
Лекция 9.doc
Лекция 9. Построение математической модели экспериментальных данных с помощью метода наименьших квадратов.
В процессе анализа экспериментальных данных встречаются процессы, характер протекания которых зависит от определенных величин x1, x2,..., xn. Переменные x1, x2,..., xn называют входными или независимыми переменными. Выходную переменную процесса y называют зависимой переменной или выходом процесса. Предполагается, что между независимыми переменными и выходом существует функциональная связь, выражаемая векторной записью следующего вида:
y=y(x), где x=( x1, x2,..., xn)Т- вектор значений независимых переменных.
Обычно, вид указанной зависимости на практике бывает неизвестен и тогда ее пытаются установить на основе обработки экспериментальных данных. Так как всякий эксперимент связан с появлением случайных ошибок, то для построения математических моделей на основе экспериментальных данных обычно используют методы математической статистики. Наиболее часто при решении этой задачи применяют метод наименьших квадратов (МНК) [36].
Метод наименьших квадратов предназначен для получения математической модели исследуемого процесса в виде: y=f(а,x), где- y выходная переменная; x=(x1,x2,...,xn)Т - вектор значений входных переменных; а=(а1,а2,... аk)Т-вектор параметров модели размерности (kx1); f -известная с точностью до параметров а1, а2,..., аk функция.
Ранее указывалось, что всякий эксперимент, в процессе которого проводятся измерения выходной переменной, связан с появлением случайных ошибок. С учетом этого модель эксперимента может быть представлена следующим образом:
y=f(а,x)+ ,
где - случайная ошибка измерений. Целью метода наименьших квадратов является получение оценок неизвестных параметров а1, а2,..., аk по экспериментальным данным. Проблема, однако состоит в том, что на практике вид функции f - неизвестен, поэтому обычно используют её разложение в ряд по некоторой системе базисных функций fi (например, в ряд Тейлора, Фурье и т. д.) с последующим переходом к модели линейной относительно коэффициентов а1, а2,..., аk:
f(а,x)= а1 f1(x)+ а2 f2(x)+...+ аk fk(x).
Предполагается, что fi(x),i=1,...,k - известные функции, образующие в совокупности вектор f(x)=( f1(x),..., fk(x))Т размерности (kx1). Тогда в векторном виде модель, используемая в МНК, может быть записана следующим образом:
y=аТ f(x) + = fТ(x)а+.
Пусть в серии из N опытов получены реализации x1,x2,...,xN вектора независимых переменных, xi=(x1i,..., xni),i=1,...,N. Реализации выхода процесса y*i в точках xi в совокупности образуют вектор наблюдений Y*=(y1*,..., yN*)Т размерности (Nx1). Если в процессе проведения эксперимента в некоторой точке xi получено несколько значений выходной переменной, в этом случае в качестве наблюдения в этой точке используется среднее значение всех наблюдений в этой точке.
Задача, как мы уже говорили, состоит в том, чтобы на основе наблюдений Y*=(y1*,..., yN*)Т найти наилучшие в определенном смысле оценки вектора параметров модели а. С учетом определенного таким образом вектора наблюдений модель эксперимента может быть представлена следующим образом:
Y*=Fa+,
где F-матрица размерности (Nxk) с компонентами:
= (1,...,N)Т- вектор ошибок измерений (Nx1).
Реализация МНК опирается на следующие предположения относительно характера распределения ошибок измерений:
1) систематические ошибки отсутствуют. То есть:
M[ ]=0
2) ошибки измерения i в точке xi не зависят от ошибок измерений j в точке xj. То есть:
M[i j]=0, ij
3) дисперсия ошибок измерений i во всех точках xi одинакова:
D[i ]=2, i=1,...,N
Интересующие нас оценки параметров модели а в МНК рассчитываются таким образом, чтобы ошибки оценивания в совокупности были минимальными. Для этого в МНК используется критерий следующего вида:
J=M[ (Y*-Fa)Т (Y*-Fa)]
В качестве оптимальных оценок а* параметров модели а принимаются такие, которые доставляют минимум критерию J [ 36 ].
a*=arg min M[ (Y*-Fa)Т (Y*-Fa)]
Раскрывая выражение по знаком математического ожидания с учетом выдвинутых предположений относительно ошибок оценивания получим:
J=J(a) = Y*Т Y*+аТFТF a-2 Y*ТF a
Указанное выражение в случае невырожденности матрицы FТF, то есть det(FТF)0 имеет единственный минимум при:
a* = (FТF)-1 FТ Y*=C FТ Y*,
где матрица C=(FТF)-1 размерности kxk называется дисперсионной матрицей. Доказано [ 36 ], что матрица (FТF) невырождена, если матрица F имеет ранг k. При справедливости выдвинутых предположений относительно ошибок измерения оценка a* обладают следующими свойствами:
1) она является несмещенной, то есть M[a*]=a;
2) она является состоятельной, то есть дисперсии i2 оценок ai* коэффициентов экспериментальной модели ai являются минимальными.
С учетом оценок ai*,i=1,..,k параметров модели ai,i=1,..,k оценки значений выходной переменной y* в рамках рассматриваемой модели могут быть получены на основе следующего соотношения:
y*=а*Т f(x)
Очевидно, что оценки параметров модели ai*,i=1,..,k, рассчитанные в условиях присутствия случайных ошибок в модели эксперимента отличаются от истинных значений ai,i=1,..,k, причем ошибка тем больше, чем больше дисперсия ошибок измерений. Показателями точности оценок ai* и оценок y* выходной переменной являются дисперсии i2 и y2. Эти дисперсии зависят не только от дисперсии ошибок наблюдений 2 но и от выбранной структуры модели и точек постановки опытов, то есть от матрицы F.
Заметим, что наличие такой зависимости делает принципиально возможным решение задачи планирования наблюдений, то есть выбора такого состава точек наблюдения, при котором эти дисперсии будут минимальными. В последующих разделах этот вопрос будет рассмотрен более подробно.
Для получения оценок дисперсий i2,i=1,..,k получим выражение для ковариационной матрицы Ka ошибок оценивания параметров модели:
Ka=M[(a*-ma)( a*-ma)Т],
где ma- вектор математических ожиданий оценок a*:
ma = M[a*]=M[C FТ Y*]= C FТ mY
Используя это выражение получаем:
Ka=M[(a*-ma)( a*-ma)Т]=M[C FТ(Y*- mY) (Y*- mY)Т F CТ]=
C FТ M[(Y*- mY) (Y*- mY)Т]F CТ
В свою очередь в силу независимости ошибок измерения i, i=1,…,N:
M[(Y*- mY) (Y*- mY)Т]= М[Т]=2
Тогда:
Ka= C FТ F CТ2
Поскольку, C = (FТ F)-1, а матрица FТ F-симметрична
C FТ F CТ= C
Следовательно,
Ka= C2
При этом дисперсии i2,i=1,..,k, характеризующие точность оценивания отдельных параметров модели представляют собой диагональные элементы матрицы Ka:
i2=с i i2,
а коэффициенты корреляции rij, характеризующие статистическую связь оценок ai* aj* представляют собой недиагональные элементы:
rij = с2 i j/ с ii с jj
Дисперсия y2, характеризующая точность оценивания выходной переменной в рамках принятой модели может быть получена на основе следующих соотношений:
y2= M[(y*-my)2]= M[((a*-ma)Тf(x))2]= M[fТ(x) (a*-ma)(a*-ma)Тf(x)]=
=fТ(x) Kaf(x)= fТ(x) C2f(x)= fТ(x) C f(x) 2
В том случае, если ошибки измерений i распределены по нормальному закону iN(0, 2) величина
Z=(a*i-ma)/ i
имеет стандартное нормальное распределение с нулевым математическим ожиданием и единичной дисперсией. Следовательно, задавая доверительную вероятность , по таблице стандартного нормального распределения находят соответствующую величину Z, представляющую собой квантиль нормального распределения для доверительной вероятности . Например, для =0.95 значение Z=1.96. Таким образом, имеет место следующее неравенство: