Цель статистического моделирования
Глава 2 Введение в статистическое моделирование
В этой главе обсуждаются предварительно некоторые общие вопросы необходимые для понимания теории и практики статистического линейного моделирования. В литературе этот раздел статистики известен под названиями: линейные модели [Searle (1971)], линейный регрессионный анализ [Seber, Lee (2003)], прикладной регрессионный анализ [Draper, Smith (1998)] и методология поверхностей отклика [Box, Draper (2007)].
2.1. Цель статистического моделирования
Сущность многих моделируемых зависимостей теоретически довольно хорошо известна, чтобы построить их полезные математические модели. Эти теоретические модели строятся на основе применения физических, химических и других известных законов, которым, как считается, подчиняются рассматриваемые зависимости. Много важных методологических и статистических проблем возникает в процессе построения и изучения теоретических моделей, но они не являются основным предметом статистического моделирования. Методы статистического моделирования предназначены для описания зависимостей, которые невозможно моделировать с использованием известных законов физики, химии и других наук, а также в тех случаях, когда использование этих законов приводит к получению статистически неадекватных моделей.
Статистическое моделирование включает ряд методов построения моделей на основе эмпирических данных. Эти данные могут быть получены в результате постановки экспериментов. Посредством тщательного планирования, проведения и анализа экспериментов статистическое моделирование даёт описание зависимости выходной переменной отклика от влияющих на неё переменных или факторов. В частности, целью регрессионного анализа является создание математических моделей, которые описывают или объясняют, возможно, существующую зависимость переменной отклика от влияющих на неё переменных [Seber, Lee (2003) стр. 2].
Изучаемые переменные моделируемой зависимости определяются конкретной областью проводимых исследований. Например, в области химии переменной отклика может быть количество получаемой серной кислоты, а влияющими на неё переменными могут быть давление и температура, при которых проводится реакция. Для другой зависимости из области приборостроения необходимо определить как переменная отклика, то есть расход сжатого воздуха через дроссель сопло-заслонка, зависит от величины зазора между соплом и заслонкой (первый фактор) и абсолютного давления сжатого воздуха, поступающего на дроссель (второй фактор). В последнем случае, если случайную переменную отклика обозначить Y и факторы X1 и X2, тоже как случайные переменные, то в терминах статистики предполагаемая функция зависимости имеет вид
Е(Y|X1=ξ1, X2=ξ2)=f(ξ1, ξ2), (2.1.1)
которая представляет ожидаемую величину переменной отклика в функции от двух факторов, при условии, что факторы зазор и давление принимают значения ξ1 и ξ2. В этой книге факторы рассматриваются как влияющие на отклик неслучайные переменные, поэтому, условная часть опускается и, обозначая случайную переменную отклика (у), уравнение (2.1.1) записывается в виде
Е(у)=f(ξ1, ξ2). (2.1.2)
Рекомендуемые материалы
Оба приведенных примера содержат два фактора, но в общем случае могут быть не два, а р факторов ξ1, ξ2, ..., ξр и функция зависимости ожидаемого значения отклика Е(у) от факторов ξ1, ξ2, ..., ξр может быть записана в виде
Е(у)=f(ξ1, ξ2, ..., ξр). (2.1.3)
Рекомендация для Вас - 4 - Структура алфавитного каталога.
В случае присутствия только одного фактора ξ1, переменная отклика зависит только от него и может быть представлена кривой, как показано на Рис.2.1(а). Если имеются два фактора ξ1 и ξ2, то функция отклика f(ξ1, ξ2) изображается в пространстве трех измерений, как показано на Рис.2.1(б). Когда имеются больше двух факторов, то можно также говорить о функции отклика в пространстве р+1 измерений, так как общее число переменных с учётом переменной отклика равно р+1. В этом случае возможно только частичное представление функции отклика в графически доступном пространстве трех измерений.
Рис 2.1. (а) График функции Е(у)=f(ξ1). (б) График функции Е(у)=f(ξ1, ξ2).
Опытом эксперимента является контролируемое испытание изучаемого объекта с целью получения значения переменной отклика, находящейся под влиянием р факторов ξ1, ξ2, ..., ξр, каждый из которых устанавливается при заданном значении. Однако, если проводить повторные опыты при одних и тех же значениях факторов ξ1, ξ2, ..., ξр, то, как обсуждалось в предыдущей главе, получаемые значения отклика будет различными из-за ошибок измерения, ошибок наблюдения, изменений самого изучаемого объекта и ещё по многим другим причинам. Поэтому в статистическом моделировании рассматривается математическое ожидание Е(у) или среднее переменной отклика при заданных значениях факторов ξ1, ξ2, ..., ξр. Эти факторы называются натуральными, так как выражаются в натуральных единицах измерения, таких как килограмм, метр, градус и так далее.
Измеряемая или действительно наблюдаемая случайная переменная (y) отклика будет находиться в некотором статистическом распределении около её среднего Е(у). Для каждого отдельного опыта разность y–E(y) между фактически наблюдаемым значением у переменной отклика и гипотетическим значением ожидаемого её среднего E(y) считается статистической ошибкой и обозначается ε. Таким образом, целью рассматриваемого в данной книге статистического моделирования является математическая формулировка зависимости случайной переменной отклика от влияющих на неё неслучайных факторов. Это включает случайную переменную ε статистической ошибки и выражается в виде модели
y=f(ξ1, ξ2, ..., ξk)+ε. (2.1.4)