5_Факторн (Алексахин С.В., Балдин А.В., Николаев А.Б., Строганов В.Ю. - Прикладной статистический анализ)
Описание файла
Файл "5_Факторн" внутри архива находится в папке "Алексахин С.В., Балдин А.В., Николаев А.Б., Строганов В.Ю. - Прикладной статистический анализ". Документ из архива "Алексахин С.В., Балдин А.В., Николаев А.Б., Строганов В.Ю. - Прикладной статистический анализ", который расположен в категории "". Всё это находится в предмете "математический анализ" из 8 семестр, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "высшая математика" в общих файлах.
Онлайн просмотр документа "5_Факторн"
Текст из документа "5_Факторн"
19
Глава | 5. | ФАКТОРНЫЕ ПЛАНЫ |
В главе рассматриваются методы планирования эксперимента. В отличие от остальных глав, где идет обработка уже полученных числовых данных, в данном случае идет речь о формировании точек плана, в которых будут проводится эксперименты. Дается классификация факторов, с которыми имеет дело исследователь в процессе проведения эксперимента. Рассматриваются вопросы сравнения планов и общий подход к формированию критериев оптимальности планов. Приводятся таблицы полных двухфакторных экспериментов, дробных планов.
5.1 Классификация параметров эксперимента
Общая схема объекта исследования может быть представлена в виде (рис.1.), где используются понятия входных и выходных параметров, управляемых и неуправляемых, контролируемых и неконтролируемых.
Объект исследования
Рис. | 5.1. |
Входные переменные разбиваются на два основных класса:
-
контролируемые (измеряемые)
-
неконтролируемые (неизмеряемые).
Предполагается, что входные переменные измеряются точно.
Контролируемые переменные могут быть управляемыми и неуправляемыми. К управляемым переменным относятся те, с помощью которых происходит целенаправленное изменение режимов исследуемого процесса. Контролируемые переменные могут быть качественными и количественными.
Широкий класс по характеру воздействия на объект образуют неконтролируемые переменные. Наиболее многочисленную группу составляют случайные воздействия. Их особенность состоит в том, что влияние каждого из них на объект является весьма незначительным. Другую группу неконтролируемых переменных, составляют переменные, воздействие которых на объект является значительным и не обязательно случайным. О существовании этих переменных либо ничего неизвестно, либо известно, но по ряду причин их невозможно измерить.
С учетом проведенной классификации введем обозначения:
V=(V1, V2, ... , Vk) - входные контролируемые управляемые;
U=(U1, U2, ... , Uk) - входные контролируемые неуправляемые;
Z=(Z1, Z2, ... , Zk) - входные неконтролируемые;
Y=(Y1, Y2, ... , Yk) - выходные.
В анализе обычно рассматриваются схемы, в которых объединяются входные контролируемые (управляемые и неуправляемые):
X=(V, U).
И схемы анализа предполагают, что Z и Y являются случайными величинами, при этом:
Y=(X, Z)
является некоторой детерминированной функцией, определяемой как:
M(X|Y) = (X,Z)(Z|X)dz,
где (Z|X) - плотность n-мерной случайной величины Z при фиксированном значении X. Величина M(X|Y) как функция от X называется функцией отклика.
Пусть функция отклика задается уравнением:
y=f(X1,X2, ... Xk),
и определена в области GRk. Для ее оценки производится эксперимент с матрицей плана F. В двухуровневом факторном планировании предполагается, что переменная Xi во всех опытах принимает лишь два значения Xi1 и Xi2 (Xi1<Xi2), где Xi1 - нижний уровень фактора; Xi2 - верхний уровень фактора.
Обозначим Xi0 - базовый уровень фактора, значение которого равно среднеарифметическому между верхним и нижним уровнем фактора. Введем переменные xi , которые принимают лишь два значения: -1 и 1, и определяет уровень соответствующего фактора.
При этом введенные переменные принимают значения Xij=Xij+xiSi/2, где Si=Xi2-Xi1 - интервал варьирования.
Dy = 2fT(X)(FTF)-1f(X) где f(X)=(f1(X), ... , fm(X)).
Пусть , где 0, i, ij - неизвестные параметры регрессии. Для приведения представленной модели к модели множественной линейной регрессии необходима следующая замена переменных (в силу линейности модели выпишем коэффициенты при параметрах регрессии, вводя двойную индексацию) .
В двумерном случае возможна графическая интерпретация поверхности отклика, соответствующая функции отклика.
Statistica. Графическое представление функции отклика выполняется в пункте "Graph> 3D Surface Plot". Указывается поверхности и ее параметры. Полиномиальные зависимости XY-полинома предполагают вычисление коэффициентов i и ij. на основании регрессионных соотношений. Строится поверхность для полинома для подогнанных данных, которые являются исходными для аппроксимации. На рис.2. представлен график поверхности полинома.
График поверхности отклика для полинома
Рис. | 5.2. |
Модели факторных планов - это частные случаи общей линейной регрессионной модели. Вектор параметров и содержит суммарное среднее, главные эффекты и взаимодействия. Матрица плана F независимых переменных состоит из значений +1 и -1. Эксперимент планируется - это значит, что F выбирается так, чтобы оценки имели некоторые желательные свойства.
Формирование активных экспериментов не всегда удается реализовать в практике экономической деятельности предприятий. Эти эксперименты могут достаточно дорого стоить.
Поэтому в данной главе воспользуемся модельными данными. Пусть регрессионная зависимость определяется уравнением y=x. Далее рассматриваются следующие наборы значений независимой переменной:
-1, -1,...-1, 0, 0, ..., 0, 1, 1, ... , 1
-1, -1,...-1, 1, ... , 1
В первом наборе каждое значение повторяется по 30 раз, во втором - по 20. Генерируются две независимых выборки случайных величин из нормального распределения. Значения зависимой переменной являются суммой независимой переменной и случайной выборки. Для формирования значений независимых переменных X1 и X2 и зависимой Y используются операторы пакета MathCad, приведенные на рис.3.
Генерация переменных регрессионных моделей
Рис. | 5.3. |
Переменные модели сформированные на экране в таблица соответствующих переменных затем необходимо экспортировать в пакет Statistica.
Сгенерируем трехфакторную модель для полного факторного эксперимента 23 . Имена переменных содержащих значения уровней фактора будут соответственно A, B и C. Стандартный порядок комбинаций уровней факторов предполагает следующее задание значений переменных:
A | -1 | 1 | -1 | 1 | -1 | 1 | -1 | 1 |
B | -1 | -1 | 1 | 1 | -1 | -1 | 1 | 1 |
C | -1 | -1 | -1 | -1 | 1 | 1 | 1 | 1 |
Математическое ожидание отклика формируется на основе соотношения:
Причем, в нашем случаем будем считать, что есть всего одно взаимодействие 12
0 | 1 | 2 | 3 | 12 |
4 | 2 | 4 | 6 | 7 |
Поэтому математическое ожидание отклика MF определяется:
MF = 4+ 2*A + 4*B + 6*C + 7*A*B
Случайный отклик F является суммой среднего MF и ошибки E Вектор данных E формируется процедурой "rnorm", имеет нормальное распределение и длину равную 8.
Программа генерации плана
Рис. | 5.4. |
Программа генерации на MathCAd и пример сгенерированной матрицы плана и соответствующих значений факторов приведены на рис.4.
5.2 Оптимальность планов
В задачах регрессионного и дисперсионного анализа предполагается, что исследователь имеет дело с уже полученными экспериментальными данными. Такие методы анализа относятся к пассивному эксперименту. В данном разделе рассматривается вопрос организации активного эксперимента, т.е. экспериментатор до проведения эксперимента выбирает значения управляемых параметров, при которых он будет проводить измерения.
5.3 Оценивание при ортогональном планировании
С целью получения независимых оценок параметров регрессии необходима специальная структура плана.
Определение. Ортогональным планом называется план, для которого выполняется следующее соотношения между элементами матрицы плана
т.е. столбцы матрицы плана попарно ортогональны.
Утверждение. Дисперсионная матрица параметров регрессии для ортогонального плана диагональная.
Это следует из определения матрицы D=2 (FTF)-1.
Для модели простой линейной регрессии план с матрицей , является ортогональным. Действительно 1(-3)+11+12=0
Для неортогонального планирования с матрицей F=(F1, F2) которая представима в блочной форме и F1T F2 = 0 регрессионная модель примет вид
Y = F+ = F1(1) + F2(2) +
Формула для оценки параметров регрессии будет иметь вид
(1) = (F1T F1 ) F1TY; (2) = (F2T F2 ) F2TY;
т.е. оценка группы параметров (1) выполняется независимо от оценки группы параметров (2).
Полученное соотношение допускает обобщение на произвольное количество независимых групп параметров.
5.4 Сравнение планов
Пусть X множество значений независимых переменных, оно представляет собой n-мерное евклидово пространство, которое также называется множеством планирования. Точки множества называют условиями проведения эксперимента. Результаты измерений могут быть представлены в виде:
где fi(x) - базисные функции, которые задают преобразование независимых переменных x для приведения модели к линейной форме. В схеме измерений функцией регрессии является функция: