Многопараметрические линейные модели - описание модели
Глава 7 Многопараметрические линейные модели
В этой главе рассматриваются статистические линейные модели со многими параметрами. С использованием таких моделей могут оцениваться переменные отклика, зависящие предположительно от р факторов x1, x2, ..., xр, а также предсказываться их значения для новых значений факторов x1, x2, ..., xр. В качестве переменных отклика рассматриваются непрерывные случайные переменные, а факторами x1, x2, ..., xр являются контролируемые в опытах эксперимента дискретные или непрерывные неслучайные переменные, принимающие некоторые числовые значения. Вопросы прикладного линейного регрессионного анализа при контролируемых факторах рассмотрены в [Graybill, Iyer (1994), Ryan (1997), Draper, Smith (1998), Kutner с соавт. (2005) и др.] Теоретические методы изложены в [Searle (1971), Wang, Chow (1994), Hocking (2003), Seber, Lee (2003), Christensen (2010)] и др.
7.1. Описание модели
Представленная в разделе 2.6 линейная модель (2.6.3) с р факторами имеет вид
у=q0x0+q1x1+q2x2+…+qр–1xр–1+e. (7.1.1)
В ней, как и в простых линейных моделях, переменная x0 принимает значение равное 1. Для оценки параметров q0, q1, q2, …, qр–1 модели, называемых также коэффициентами регрессии, используется выборка наблюдаемых значений переменных уi отклика в п опытах эксперимента и соответствующие им значения факторов x1, x2,…, xр–1. Зависимость переменной отклика уi от влияющих на неё факторов в i-м опыте выражается в виде модели
уi=q0+q1xi1+q2xi2+…+qр–1xi(р–1)+ei, (i =1, 2,..., п) (7.1.2)
где xi1, xi2, …, xi(р–1) – устанавливаемые в i-м опыте значения факторов x1, x2,…, xр–1 и ei - случайная ошибка i-го опыта.
В п опытах эксперимента, проводимых при наборах разных значений влияющих на отклик переменных, результатами являются значения п случайных переменных отклика уi, а в моделях (7.1.2) имеется столько же случайных переменных ei ошибок. Как и в разделе 6.1, для случайных переменных ei и уi делаются следующие дополнительные допущения:
Рекомендуемые материалы
1. E(ei)=0 и Е(уi)=q0+q1x1+q2x2+…+qр–1xiр–1 для всех i =1, 2, ..., п.
2. D(ei)=s2 и D(уi)=s2 для всех i =1, 2, ..., п.
3. C(ei, ej) =0 и C(уi, уj) =0 для всех i≠j, где j =1, 2, ..., п.
Допущение 1 утверждает, что функция модели верна, то есть действительно линейная и все нужные влияющие на отклик переменные x1, x2, …, xр–1 в неё включены. Допущение 2 означает, что дисперсии переменных отклика у1, у2, …, уп в опытах эксперимента равны и не зависят от меняющихся значений переменных x1, x2, …, xр–1. Допущение 3 утверждает, что переменные у1, у2, …, уп не коррелированы друг с другом. Как правило, это допущение имеет место, когда для результатов опытов эксперимента справедлива гипотеза случайной выборки. Однако при рассмотрении данных реально проведённого эксперимента любое из выше принятых допущений может не соблюдаться. Для проверки справедливости этих допущений разработаны специальные методы, рассматриваемые в главе 8.
Если модель (7.1.2) записать для всех п опытов эксперимента, то получается система уравнений
у1=q0+q1x1+q2x2+…+qр–1x1(р–1)+e1
у2=q0+q1x1+q2x2+…+qр–1x2(р–1)+e2
...
уп=q0+q1x1+q2x2+…+qр–1xп(р–1)+eп.
Эту систему уравнений можно представить в матричном виде
=+
или более компактно
у=Xq+e, (7.1.3)
где
у=, X=, q= и e=.
В этом случае, сделанные выше допущения для случайных переменных ei и уi могу быть представлены в матричном виде:
1. E(e)=0 и Е(у)=Xq,
2. С(e)=D(e)=s2I и С(у)=D(у)=s2I.
При этом допущение С(e)=s2I включает в себя оба допущения D(ei)=s2 и С(ei, ej) =0.
В выражении (7.1.3) матрица X размеров пxр. В этой главе полагается, что n>р и матрица X полного ранга по столбцам. Если n<р или существует линейная зависимость между столбцами матрицы X, например, x5=(x1+x2+x3+x4)/4, то эта матрица неполного ранга по столбцам. Если в опытах эксперимента значения xij факторов планируются (по выбору исследователя), то без первого столбца матрица X представляет план эксперимента и иногда называется матрицей плана.
Коэффициенты регрессии или параметры q1, q2, …, qр–1 модели показывают степень влияния или воздействия факторов x1, x2, …, xр–1 на математические ожидания Е(уi) переменных отклика. Например, q1 показывает воздействие фактора x1 на ожидаемые значения переменных отклика в присутствии других факторов. В случае, если вектор-столбцы матрицы X модели не ортогональны, то это воздействие будет отличаться от воздействия фактора x1 на Е(уi) при отсутствии в модели других факторов. Например, параметры q0 и q1 в модели
у=q0+q1x1+q2x2+e,
будут отличаться от q0* и q1* в модели
у=q0*+q1*x1+e*
Изменение параметров при удалении из модели одного фактора показано (с оценками) в следующем примере.
Пример 7.1. В интегральной микросхеме коэффициент (у) усиления транзистора между эмиттером и коллектором зависит от двух контролируемых в процессе напыления переменных: времени (x1 в мин.) разгонки примеси эмиттера и эмиттерной дозы (x2 в единицах по 1014 ионов) [Myers с соавт. (2016) стр.17-18)]. После напыления брались 14 образцов, и полученные данные эксперимента представлены в таблице 7.1.
Оценим параметры линейной модели, используя коэффициент (у) усиления в качестве переменной отклика, а x1 и x2 в качестве влияющих на отклик переменных. Сначала рассмотрим простые модели (6.1.1) с одним фактором. Используя формулы (6.2.5) и (6.2.4) получаем уравнения оценки ожидаемых значений переменных отклика в зависимости только от x1 или только от x2 соответственно
=–394,3+6,8x1 и =1919–154,4x2.
Таблица 7.1. Значения коэффициента (у) усиления транзистора и факторов в опытах эксперимента
Опыты | x1 | x2 | у |
1 | 195 | 4,00 | 1004 |
2 | 255 | 4,00 | 1636 |
3 | 195 | 4,60 | 852 |
4 | 255 | 4,60 | 1506 |
5 | 255 | 4,20 | 1272 |
6 | 255 | 4,10 | 1270 |
7 | 255 | 4,60 | 1269 |
8 | 195 | 4,30 | 903 |
9 | 255 | 4,30 | 1555 |
10 | 255 | 4,00 | 1260 |
11 | 255 | 4,70 | 1146 |
12 | 255 | 4,30 | 1276 |
13 | 255 | 4,72 | 1225 |
14 | 230 | 4,30 | В лекции "Лекция 5 - Уравнения и передаточные функции" также много полезной информации. 1321 |
Теперь, если воспользоваться теоремой 7.2.1 следующего раздела и оценить по формуле (7.2.2) параметры линейной модели с двумя факторами, то уравнение оценки ожидаемых значений переменных отклика в зависимости от переменных x1 и x2 принимает вид
=484,82+7,03x1–213,39x2.
Как и ожидалось, результаты оценки параметров меняются при переходе от любой из моделей с одним фактором к модели с двумя факторами. Параметры модели со многими факторами иногда называют частными коэффициентами регрессии. Так как, например, результат оценки параметра q1 определяет ожидаемое изменение переменной отклика при изменении x1 на единицу, при постоянном значении переменной x2, а результат оценки параметра q2 определяет ожидаемое изменение переменной отклика при изменении x2 на единицу при постоянном значении переменной x1.
□
Однако если столбцы матрицы модели X сделать между собой ортогональными, то есть, если x1Т1=0, x2Т1=0 и x1Тx2=0, где 1, x1 и x2 вектор-столбцы матрицы X, то, как показано в разделе 6.2, получим q0=q0* и q1=q1*.