Методические указания (1161391), страница 20
Текст из файла (страница 20)
При этом эмпирическая компонента, в свою очередь, вычисляется как линейная комбинация функций, удовлетворяющих определённым требованиям и построенных на реализациях выборки:
где -априорная компонента;
-составляющая эмпирической компоненты, связанной с i -ой
реализации выборки;
- вес априорной компоненты.
Различным методам оценивания соответствуют разные значения коэффициентов из интервала [0:1] и разные виды функции
.
В качестве примера можно привести следующие методы построения оценок по малой выборке:
метод прямоугольных вкладов ;
метод уменьшения неопределенности ;
метод сжатия области существования функций распределения.
Оценка плотности распределения , построенная методом прямоугольных вкладов, определяется следующим выражением:
В качестве дополнительной априорной информации предполагается значение интервала изменения случайной величины Х.
При этом считается , что оцениваемая функция непрерывна , не имеет очень крутых скачков на заданном интервале и
при
и
=0 при
.
Оценка, построенная методом априорно-эмпирических функций , определяется выражением :
(13) ,
где - априорное распределение , построенное по априорным данным;
- эмпирическое распределение ,построенное по выборке ;
- коэффициент достоверности информации об априорном распределении .
3.7. Стратегия экспериментирования.
3.7.1. Классификация экспериментов
Способы накопления информации в процессе экспериментального исследования объекта можно разделить на активные и пассивные. В соответствии с этим выделяются активный и пассивный эксперименты.
Рис.1. Классификация экспериментов
Пассивным называется эксперимент , при котором уровни факторов в каждом опыте регистрируются исследователем , но не задаются.
Активный эксперимент - эксперимент , в котором уровни факторов для каждого опыта задает исследователь.
Пассивный эксперимент заключается в наблюдении и регистрации параметров в режиме нормального функционирования объекта без внесения преднамеренных возмущений .
Активный эксперимент основан на преднамеренных возмущениях , вводимых в исследуемый объект по заранее спланированной программе.
Активно-пассивный эксперимент характеризуется тем, что при его проведении часть данных просто регистрируется ,а другая часть ,кроме того, обрабатывается в процессе эксперимента и участвует в выработке управляющих воздействий.
Различают статистическое и последовательное планирование эксперимента.
Статистическое планирование эксперимента - это априорное планирование всего эксперимента в целом.
Последовательный эксперимент может быть определен как эксперимент ,реализуемый в виде серии опытов , при этом условия проведения каждой серии определяются результатами предыдущей серии.
В настоящее время выделяют два основных направления в математической теории планирования экспериментов : планирование экстремальных экспериментов и планирование экспериментов по выявлению механизма явлений.
Планирование первого типа применяется в тех случаях, когда необходимо найти оптимальные условия протекания процессов в объекте исследования , когда механизм явлений слишком сложен. Экстремальный эксперимент заканчивается определением оптимальных условий протекания процессов в объекте исследования.
Планирование второго типа связано с получением математических моделей исследуемых объектов по экспериментальным данным в виде различных функциональных зависимостей. В этом случае статистические методы планирования эксперимента выступают в качестве одного из эмпирических способов получения математического описания сложных объектов. Математическое описание обычно представляется в виде функции регрессии.
Регрессионная модель устанавливает количественные соотношения между величиной отклика и вектором контролируемых или только управляемых факторов.
Задача нахождения математического описания исследуемого объекта по экспериментальным данным сводится к оценке вида и параметров функции регрессии.
Эксперимент, реализованный для определения оценок неизвестных параметров регрессии или для оценивания значений неизвестной функции отклика в некоторой области факторного пространства, называют регрессивным. Регрессивный анализ применим для обработки результатов наблюдений , получаемых как в результате активного , так и пассивного эксперимента .
3.7.2. Понятие о регрессионном анализе. Регрессионный анализ результатов активного эксперимента
При изучении взаимосвязи между различными величинами , характеризующими исследуемый объект , различают две формы связи : функциональную и стохастическую.
Строго функциональная зависимость характерна тем, что каждому допустимому значению одной переменной соответствует вполне определенное значение другой переменной.
При стохастической связи с изменением одной величины меняется распределение другой.
Полную характеристику стохастической зависимости между двумя величинами и
дает условное распределение зависимой от
случайной величины
.
Однако его отыскание как правило , оказывается весьма трудной задачей. Поэтому на практике обычно рассматривают условное математическое ожидание этой величины . Если каждому значению х величины
соответствует одно значение условного математического ожидания
случайной величины
, то условная средняя есть функция от х. Эту функцию называют функцией регрессии.
Точное уравнение регрессии
можно написать только зная условное математическое ожидание как функцию от х . На практике такая ситуация встречается весьма редко. В связи с этим различают теоретическую функцию регрессии, подразумевая под таковой истинную функциональную зависимость
и эмпирическую функцию регрессии
.
Таким образом , на практике мы можем искать лишь уравнения приближенной регрессии , оценивая тем или иным способом величину и вероятность этой приближенности.
Определение . Регрессивный анализ есть статистический метод анализа и обработки экспериментальных данных, основанный на оценивании параметров заданной функциональной модели объекта и проверке гипотез о ее статистических свойствах.
Пусть переменная зависит от K факторов
и линейна относительно неизвестных параметров
(1) ,
где - вектор с компонентами
,
принадлежащей некоторой области в
факторном пространстве , т.е. области , в
которой возможны наблюдения;
- вектор параметров модели ;
-известные функции, являющиеся компонентами вектора
.
Используя векторные обозначения вместо (1) , можно написать
(2)
Пусть эксперимент состоит из опытов в которых факторы
принимают фиксированные значения
.
В результате действия случайных возмущений при эксперименте наблюдается реализация функции
где - случайная погрешность.
Предположим , что при каждом из данного
опытов значения
- независимые в совокупности случайные величины, независящие от
,
, и распределенные нормально с параметрами
. Выбирая некоторые значения факторов
, получим значения
.
Итак , проведенный эксперимент можно характеризовать совокупность значений
При введенных допущениях результаты наблюдений являются независимыми нормально распределенными случайными величинами с математическим ожиданием
и одинаковой для всех наблюдений дисперсией
.
Задача состоит в нахождении оценок неизвестных параметров
регрессивного уравнения (1).
Поставленная задача наиболее часто в настоящее время решается методом наименьших квадратов. При сделанных предположениях этот метод , при котором оценка находится из условия
(4)
приводит к получению лучших линейных оценок параметров
.
Под наилучшей линейной оценкой здесь понимается оценка , принадлежащая классу оценок , образуемых линейными комбинациями результатов наблюдений , являющаяся несмещенной и имеющая минимальную дисперсию
Введем обозначения :
-
- мерный вектор-столбец наблюдений
- прямоугольная матрица размерности
, задающая значения функций
в
наблюдениях ;
- вектор, определяющий значение функции
в
-ом наблюдении ;
- вектор погрешностей .
Тогда наряду с (3) имеем
(6)
Сопоставим теперь друг с другом экспериментальные результаты
рассчитанные с помощью эмпирической функции регрессии (регрессионной модели исследуемого объекта)
где - вектор оценок параметров модели .
В соответствии с методом наименьших квадратов оценку вектора параметров
выбираем так , чтобы
В силу (8) можно записать или
. (10)
S является расширенной квадратичной формой, которая в случае невырожденной матрицы имеет единственный минимум при
Матрица не вырождена, т.е.
, если матрица
имеет ранг
.
Матрица (информационная матрица Фишера) квадратная, положительно определённая и невырожденная в случае, если
и хотя бы
наблюдение проведено в различных точках факторного пространства (пространства входных переменных)
.
Оценки можно найти путём решения системы нормальных уравнений