Общие задачи статистической идентификации
ЛЕКЦИЯ 10. Общие задачи статистической идентификации.
1. Структурная статистическая идентификация.
2. Организация статистической процедуры идентификации модели..
В практике моделирования систем информатики наиболее часто приходится иметь дело с объектами, которые в процессе своего функционирования содержат элементы стохастичности или подвергаются стохастическим воздействиям внешней среды. Поэтому основным методом получения результатов с помощью имитационных моделей таких стохастических систем является метод статистического моделирования на ЭВМ, использующий в качестве теоретической базы предельные теоремы теории вероятностей. Возможность получения пользователем модели результатов статистического моделирования сложных систем в условиях ограниченности машинных ресурсов существенно зависит от эффективности процедур генерации псевдослучайных последовательностей на ЭВМ, положенных в основу имитации воздействий на элементы моделируемой системы.
Общая характеристика метода статистического моделирования
На этапе исследования и проектирования систем при построении и реализации машинных моделей (аналитических и имитационных) широко используется метод статистических испытаний (Монте-Карло), который базируется на использовании случайных чисел, т. е. возможных значений некоторой случайной величины с заданным распределением вероятностей. Статистическое моделирование представляет собой метод получения с помощью ЭВМ статистических данных о процессах, происходящих в моделируемой системе. Для получения представляющих интерес оценок характеристик моделируемой системы S с учетом воздействий внешней среды Е статистические данные обрабатываются и классифицируются с использованием методов математической статистики [10, 13, 18].
Сущность метода статистического моделирования. Таким образом, сущность метода статистического моделирования сводится к построению для процесса функционирования исследуемой системы S некоторого моделирующего алгоритма, имитирующего поведение и взаимодействие элементов системы с учетом случайных входных воздействий и воздействий внешней среды Е, и реализации этого алгоритма с использованием программно-технических средств ЭВМ.
Различают две области применения метода статистического моделирования: 1) для изучения стохастических систем; 2) для решения детерминированных задач. Основной идеей, которая используется для rrрешения детерминированных задач методом статистического моделирования, является замена детерминированной задачи эквивалентной схемой некоторой стохастической системы, выходные характеристики последней совпадают с результатом решения детерминированной задачи. Естественно, что при такой замене вместо точного решения задачи получается приближенное решение и погрешность уменьшается с увеличением числа испытаний (реализации моделирующего алгоритма) N.
Рекомендуемые материалы
В результате статистического моделирования системы S получается серия частных значений искомых величин или функций, статистическая обработка которых позволяет получить сведения о поведении реального объекта или процесса в произвольные моменты времени. Если количество реализации N достаточно велико, то полученные результаты моделирования системы приобретают статистическую устойчивость и с достаточной точностью могут быть приняты в качестве оценок искомых характеристик процесса функционирования системы S.
Теоретической основой метода статистического моделирования систем на ЭВМ являются предельные теоремы теории вероятностей. Множества случайных явлений (событий, величин) подчиняются определенным закономерностям, позволяющим не только прогнозировать их поведение, но и количественно оценить некоторые средние их характеристики, проявляющие определенную устойчивость. Характерные закономерности наблюдаются также в распределениях случайных величин, которые образуются при сложении множества воздействий. Выражением этих закономерностей и устойчивости средних показателей являются так называемые предельные теоремы теории вероятностей, часть из которых приводится ниже в пригодной для практического использования при статистическом моделировании формулировке. Принципиальное значение предельных теорем состоит в том, что они гарантируют высокое качество статистических оценок при весьма большом числе испытаний (реализации) N. Практически приемлемые при статистическом моделировании количественные оценки характеристик систем часто могут быть получены уже при сравнительно небольших (при использовании ЭВМ) N.
Неравенство Чебышева. Для неотрицательной функции g (x) случайной величины x и любого K>0 выполняется неравенство
P{g(x)>=K}£M[g(x)]/K. (4.1)
В частности, если g(x)=(x—x)2 и К=k2s2 (где х—среднее арифметическое;
s — среднее квадратическое отклонение), то
P{| x-x|>=ks}£ 1/k2). (4.2)
Теорема Бернулли. Если проводится N независимых испытаний, в каждом из которых некоторое событие А осуществляется с вероятностью р, то относительная частота появления события m/N при N®¥ сходится по вероятности к р, т. е. при любом e>0
lim P{|mlN-p|>=e}=0, (4.3)
где т — число положительных исходов испытания.
Теорема Пуассона. Если проводится N независимых испытаний и вероятность осуществления события А в i-м испытании равна рi, то относительная частота появления события m/N при N®¥ сходится по вероятности к среднему из вероятностей рi, т. е. при любом e>0
Теорема Чебышева. Если в N независимых испытаниях наблюдаются значения x1,x2,…,xn случайной величины x, то при N®¥ среднее арифметическое значений случайной величины сходится по вероятности к ее математическому ожиданию а, т. е. при любом e>0
Обобщенная теорема Чебышева. Если x1, … ,xn — независимые случайные величины с математическими ожиданиями а1, ... аn и дисперсиями s12, ..,sn2, ограничен-ными сверху одним и тем же числом, то при N®¥ среднее арифметическое значений случайной величины сходится по вероятности к среднему арифметическому их математических ожиданий:
Теорема Маркова. Выражение (4.6) справедливо и для зависимых случайных величин x1, … ,xn , если только
Совокупность теорем, устанавливающих устойчивость средних показателей, принято называть законом больших чисел.
Центральная предельная теорема. Если x1, … ,xn — независимые одинаково распределенные случайные величины, имеющие математическое ожидание а и дисперсию s2, то при N®¥ закон распределения суммы, неограниченно приближается к нормальному:
N β
lim P{a<(S xi-Na)/√Nσ<β}=1/√2π ∫ e-t*t/2 dt = Ф0(β)- Ф0(α) (4.7)
N®00 i=1 α
Здесь интеграл вероятностей γ
Ф0(γ)=1/2π ∫ e-t*t/2dt.
-¥
Теорема Лапласа. Если в каждом из N независимых испытаний событие А появляется с вероятностью р, то
lim P{a<(m-Np)/√Np(1-p) <β}=Ф0(β)- Ф0(α) (4.8)
N®¥
где m — число появлений события А в N испытаниях. Теорема Лапласа является частным случаем центральной предельной теоремы.
Примеры статистического моделирования. Статистическое моделирование систем на ЭВМ требует формирования значений случайных величин, что реализуется с помощью датчиков (генераторов) случайных чисел. Не останавливаясь пока на способах их реализации для целей моделирования на ЭВМ, поясним сущность метода статистического моделирования следующими примерами.
Пример 4.1. Необходимо методом статистического моделирования найти оценки выходных характеристик некоторой стохастической системы Sr, функционирование которой описывается следующими соотношениями: х = 1 — е - " — входное воздействие, v=1-e-j — воздействие внешней среды, где l и j — случайные величины, для которых известны их функции распределения. Целью моделирования является оценка математического ожидания М[у] величины у. Зависимость последней от входного воздействия х и воздействия внешней среды v имеет вид y= √x2+v2.
Рис. 4.1. Структурная схема системы SR.
В качестве оценки математического ожидания М[у], как следует из приведенных теорем теории вероятностей, может выступать среднее арифметическое, вычисленное по формуле N
y=1/N ∑yi,
i=1
где уi— случайное значение величины у; N — число реализации, необходимое для cстатистической устойчивости результатов.
Структурная схема системы Sr показана на рис. 4.1.
Здесь элементы выполняют следующие функции:
вычисление В1:возведение в квадрат К,:суммирование С:извлечение квадратного корня И:
Схема алгоритма, реализующего метод статистического моделирования для оценки M[y] системы Sr, приведена на рис. 4.2. Здесь LA и FI -- функции распределения случайных величин l и j; N- заданное число реализации; Iºi-номер текущей реализации; LATºli; FIIºji; EXPºe; MYºM[y], SYºSyi- суммирующая ячейка; ВРМ[...], ГЕН[...], ВРМ[...]—процедуры ввода исходных данных, генерации псевдослучайных последовательностей и выдачи результатов моделирования соответственно.
Таким образом, данная модель позволяет получить методом статистического моделирования на ЭВМ статистическую оценку математического ожидания выходной характеристики М[у] рассмотренной стохастической системы Sr. Точность и достоверность результатов взаимодействия в основном будут определяться числом реализации N.
Пример 4.2. Необходимо методом статистического моделирования найти оценку площади фигуры (рис. 4.3), ограниченной осями координат, ординатой a=1 и кривой g =f(a); при этом для определенности предполагается, что 0≤ f(a)≤1 для всех a, 0≤а≤1.
Таким образом, данная задача является чисто детерминированной, и ее аналитическое решение сводится к вычислению определенного интеграла, т. е. искомая площадь фигуры.
Для решения этой детерминированной задачи методом статистического моделирования необходимо предварительно построить адекватную по выходным характеристикам стохастическую систему SD , оценки характеристик которой будут совпадать с искомыми в данной детерминированной задаче.
Система SD функционирует следующим образом: получается пара независимых случайных чисел интервала (0, 1), определяется координата точки (хi хi+1), показанной на рис. 4.3, вычисляется ордината уi =f(xi) и проводится сравнение величин gi и хi+1; причем если точка (хi, хi+1) попала в площадь фигуры (в том числе и на кривую f(x)), то исход испытания считается положительным hi= 1 и в итоге можно получить статистическую оценку площади фигуры Sф по заданному числу реализаций N.
Логическая схема моделирующего алгоритма вероятностной системы SD предcтавлена на рис. 4.5. Здесь Уºу=f(а)—заданная функция (табличная кривая);
N—заданное число реализации; Iºi номер текущей реализации; XIºxi, XIIºxi+1, HIºhi, Sºs, SHºh’- суммирующая ячейка.
Таким образом, построение некоторой стохастической системы SD позволяет методом статистического моделирования получить оценки для детерминированной задачи.
Пример 4.3. Необходимо методом статистического моделирования решить следующую задачу. Проводится s= 10 независимых выстрелов по мишени, причем вероятность попадания при одном выстреле задана и равна р. Требуется оценить вероятность того, что число попаданий в мишень будет четным, т. е. О, 2, 4, 6, 8,10. Данная задача является вероятностью, причем существует ее аналитическое решение.
В качестве объекта статистического моделирования можно рассмотреть следующую вероятностную систему Sp, структура которой представлена где элементы выполняют такие функции.
Выходным воздействием в данной системе Sp является событие четного числа попаданий в мишень в серии из десяти выстрелов. В качестве оценки выходной характеристики необходимо при числе испытаний (серий выстрелов), равном N, найти вероятность четного числа попаданий:
Логическая схема алгоритма статистического моделирования для оценки искомой характеристики такой системы Р(у) приведена на рис. 4.7. Здесь Р=р—заданная вероятность попадания в мишень при одном выстреле; N — заданное число реализации; XIºxi, HJºhj, PYºP(y), SYºS yj- суммирующая ячейка.
В данном моделирующем алгоритме после ввода исходных данных и реализации операторов цикла происходит обращение к генератору случайных чисел, т. е. получаются значения х, случайной величины, равномерно распределенной в интервале (0, 1). Вероятность попадания случайной величины в интервал (0, р), где о< 1, равна длине этого отрезка, т. е. Р {xi<p] == p. Поэтому при каждом моделировании выстрела полученное случайное число х, сравнивается с заданной вероятностью р и при х,<р регистрируется «попадание в мишень», а в противном случае — «промах». Далее моделируются серии из десяти испытаний каждая, подсчитывается четное число «попаданий» в каждой серии и находится статистическая оценка искомой характеристики Р (у).
Таким образом, подход при использовании статистического моделирования независимо от природы объекта исследования (будет ли он детерминированным или стохастическим) является общим, причем при статистическом моделировании детерминированных систем (система 5д в примере 4.2) необходимо предварительно построить стохастическую систему, выходные характеристики которой позволяют оценить искомые.
Отметим, что во всех рассмотренных примерах не требуется запоминания всего множества генерируемых случайных чисел, используемых при статистическом моделировании системы S. Запоминается только накопленная сумма исходов и общее число реализаций. Это немаловажное обстоятельство вообще является характерным при реализации имитационных моделей методом статистического моделирования на ЭВМ.
Псевдослучайные последовательности и процедуры их машинной генерации
При статистическом моделировании систем одним из основных вопросов является учет стохастических воздействий. Количество случайных чисел, используемых для получения статистически устойчивой оценки характеристики процесса функционирования системы S при реализации моделирующего алгоритма на ЭВМ, колеблется в достаточно широких пределах в зависимости от класса объекта моделирования, вида оцениваемых характеристик, необходимой точности и достоверности результатов моделирования. Для метода статистического моделирования на ЭВМ характерно, что большое число операций, а соответственно и большая доля машинного времени расходуются на действия со случайными числами. Кроме того, результаты статистического моделирования существенно зависят от качества исходных (базовых) последовательностей случайных чисел. Поэтому наличие простых и экономичных способов формирования, последовательностей случайных чисел требуемого качества во многом определяет возможность практического использования машинного моделирования систем [31, 37, 46].
Рассмотрим возможности и особенности получения последовательностей случайных чисел при статистическом моделировании систем на ЭВМ. На практике используются три основных способа генерации случайных чисел: аппаратный (физический), табличный (файловый) и алгоритмический (программный).
Аппаратный способ. При этом способе генерации случайные числа вырабатываются специальной электронной приставкой — генератором (датчиком) случайных чисел,— служащей в качестве одного из внешних устройств ЭВМ. Таким образом, реализация этого способа генерации не требует дополнительных вычислительных операций ЭВМ по выработке случайных чисел, а необходима только операция обращения к внешнему устройству (датчику). В качестве физического эффекта, лежащего в основе таких генераторов чисел, чаще всего используются шумы в электронных и полупроводниковых приборах, явления распада радиоактивных элементов и т. д. Рассмотрим принцип получения случайных чисел от приставки, основанный, например, на эффекте шума в полупроводниковых приборах.
Вместе с этой лекцией читают "10. Чем обеспечиваются безопасные и здоровые условия труда".
Структурная схема аппаратного генератора случайных чисел приведена на рис. 4.8, а. Здесь ИШ — источник шума; КС — ключевая схема; ФИ — формирователь импульсов; ПС — пересчетная схема. При усилении шумов на выходе ИШ получается напряжение, которое является случайным процессом, показанным на временной диаграмме рис.4.8, б. Причем отрезок шумовой реализации uk(t), сформированный на интервале времени (0,Т) с помощью КС, содержит случайное число выбросов. Сравнение напряжения uk(t) с пороговым Un позволят сформировать на выходе ФИ серию импульсов uф(t). Тогда на выходе ПС может быть получена последовательность случайных чисел хi(t). Например, если провести масштабирование и принять длину интервала (0,Т) за единицу, то значения интервалов времени Dti=ti+1-ti между соседними импульсами uф(t) будут случайными числами хiÎ(0,1). Возможны и другие схемные решения аппаратных генераторов случайных чисел [29 , 37]. Однако аппаратный способ получения случайных чисел не позволяет гарантировать качество последовательности непосредственно во время моделирования системы S а ЭВМ, а также повторно получать при моделировании одинаковые последовательности чисел.
Табличный способ. Если случайные числа, оформленные в виде таблицы, помещать во внешнюю или оперативную память ЭВМ, предварительно сформировав из них соответствующий файл (массив чисел), то такой способ будет называться табличным. Однако этот способ получения случайных чисел при моделировании систем на ЭВМ обычно рационально использовать при сравнительно небольшом объеме таблицы и соответственно файла чисел, когда для хранения можно применять оперативную память. Хранение файла во внешней памяти при частном обращении в процессе статистического моделирования на рационально, так как вызывает увеличение затрат машинного времени при моделировании системы из-за необходимости обращения к внешнему накопителю. Возможны промежуточные способы организации файла, когда он переписывается в оперативную память периодически по частям. Это уменьшает время на обращение к внешней памяти, но сокращает объем оперативной памяти, который можно использовать для моделирования процесса функционирования системы S.
Л.1 стр.178-194, Л.2,стр. 92-98
Контрольные вопросы
- Структурная статистическая идентификация.
- Статистические аппараты исследования
- Организация статистической процедуры.