Кирьянов Д. - MathCad 11 (1077323), страница 59
Текст из файла (страница 59)
Генерация коррелированныхслучайных чиселДо сих пор мы рассматривали наиболее простой случай применения генераторов независимых случайных чисел. В методах Монте-Карло часто требуется создавать случайные числа с определенной корреляцией. Приведемпример программы, создающей два вектора xl и х2 одинакового размера иодним и тем же распределением, случайные элементы которых попарнокоррелированы с коэффициентом корреляции R (ЛИСТИНГ 14.12),) Листинг 14.12. Генерация попарно коррелированных случайных чисел!а := 3N := 1000R := 0.4xl := rnorm (N , 0 , а)х2 := R • xl + ~Jl - R • rnorm (N , 0 , а)corr (xl , х2 ) = 0 . 415Результат действия программы для R=O.4 показан на рис.
14.13 (слева).Сравните полученную выборку с правым графиком, полученным для высокой корреляции ( R = O . 9 ) И С рис. 14.3 (см. разд. 14.1.1) для независимых данных, т. е. R=O.366Часть III. Численные методыю1+++,£1-н-10+++iо-101010х2Рис. 14.13. Псевдослучайные числас корреляцией R=0 .4 (листинг 14.12) и R=0 .914.2.4. Ковариация и корреляцияФункции, устанавливающие связь между парами двух случайных векторов,называются ковариацией и корреляцией (или, по-другому, коэффициентомкорреляции). Они различаются нормировкой, как следует из их определения(листинг 14.13).Осогг(х) — коэффициент корреляции двух выборок;0cvar(x) — ковариация двух выборок;•xi, х2 — векторы (или матрицы) одинакового размера с выборкамислучайных данных.j Листинг 14.13. Расчет ковариации и корреляции1 (продолжение листинга 14.12)ml •.= mean ( x l )m2 :- mean ( x2 )CT1 := s t d e v ( x l )СГ2 := s t d e v ( x2N-l( x l i - m l ) - ( x 2 i - m 2 ) = 3.823c v a r ( x l , x2) = 3.823c v a r ( xl , x2 )•al'= 0.415-O2c o r r ( x l , x2 ) = 0 .
415|ГiГлава 14. Математическая статистика_ _36714.2.5. Коэффициенты асимметрии и эксцессаКоэффициент асимметрии задает степень асимметричности плотности вероятности относительно оси, проходящий через ее центр тяжести. Коэффициент асимметрии определяется третьим центральным моментом распределения. В любом симметричном распределении с нулевым математическиможиданием, например нормальным, все нечетные моменты, в том числе итретий, равны нулю, поэтому коэффициент асимметрии тоже равен нулю.Степень сглаженности плотности вероятности в окрестности главного максимума задается еще одной величиной — коэффициентом эксцесса. Он показывает, насколько острую вершину имеет плотность вероятности по сравнению с нормальным распределением.
Если коэффициент эксцесса большенуля, то распределение имеет более острую вершину, чем распределениеГаусса, если меньше нуля, то более плоскую.Для расчета коэффициентов асимметрии и эксцесса в Mathcad имеются двевстроенные функции.Оkurt(x) — коэффициент эксцесса (kurtosis) выборки случайных данных х;• skew{x) — коэффициент асимметрии (skewness) выборки случайных данных х.Примеры расчета коэффициентов асимметрии и эксцесса для распределения Вепбулла (см. рис. 14.10) приведены в листинге 14.14.Листинг 14.14.
Расчет выборочных коэффициентовасимметрии и эксцессах := rweibull (1000 ,1.5)skew (x) = 1.216kurt (x) = 1.8914.2.6. Другие статистические характеристикиВ предыдущих разделах были рассмотрены встроенные функции, рассчитывающие наиболее часто используемые статистические характеристики выборок случайных данных. Иногда в статистике встречаются и иные функции,например, помимо арифметического среднего, применяются другие средниезначения.•gmean(x) — геометрическое среднее выборки случайных чисел;О hmean(x) — гармоническое среднее выборки случайных чисел.Математическое определение этих функций и пример их использования вMathcad приведены в листинге 14.15.368Часть III.
Численные методыЛистинг 14.15. Вычисление различных средних значенийN:= 10x := r u n i f (N , 0 , 1)Ы-1—. VXi^O.338Nmean (x) =0.338i = 0fN-lV•i = Xi0N\- 0.012hmean(x) = 0.012N iN-lngmean ( x> = 0 . 1 7 1i = 014.2.7. Действие статистическихфункций на матрицыВсе рассмотренные примеры работы статистических функций относились квекторам, элементы которых были случайными числами. Но точно так жевсе эти функции применяются и по отношению к выборкам случайныхданных, сгруппированных в матрицы. При этом статистические характеристики рассчитываются для совокупности всех элементов матрицы, без разделения ее на строки и столбцы.
Например, если матрица имеет размерность MXN, то и объем выборки будет равен мы.Соответствующий пример вычисления среднего значения приведен в листинге 14.16. В его первой строке определяется матрица данных х размера4x2. Действие встроенной функции mean матричного аргумента (последняястрока листинга) иллюстрируется явным суммированием элементов матрицы х (предпоследняя строка). Действие прочих встроенных функций наматрицы совершенно аналогично действию их на векторы (листинг 14.17).Листинг 14.16.
Вычисление среднего значения элементов матрицы/х :-1.041.570.91.2, 1.212 jм :- rows (х)М= 4N := cols (x)N= 2Глава 14. Математическая статистикаM-l—•M-NI-N369N-lУXj4= 3.6^i = 0 j = 0mean f x )=3.6| Листинг 14.17. Действие различных статистических! функций на матрицу:' • Jmedian (x) = 1.35mode ( х) =1.2var (x) = 14.033Var (x) = 16.037stdev (x) = 3.746Stdev (x) = 4.005(Примечание)Некоторые статистические функции (например, вычисления ковариации) имеютдва аргумента. Они также могут быть матрицами, но, в соответствии со смыслом функции, должны иметь одинаковую размерность.Большинству статистических функций позволяется иметь в качестве аргументов даже не одну матрицу, а любое количество матриц, векторов и скаляров.
Числовые характеристики будут рассчитаны для всей совокупностизначений аргументов функции. Соответствующий пример приведен в листинге 14.18.| Листинг 14.18. Статистически* функции нескольких аргументов-1x:= ( 1I84)1-174 J. У. z ) = 4 .444s t d e v ( x, 5 77) = 29.976m e d i a n (2) = 2z' ~ l 11m e a n (xmode (у , z) = 314.3. Случайные процессыВстроенные функции для генерации случайных чисел создают выборку изслучайных данных Ai. Часто требуется создать непрерывную или дискрет-IЧасть III. Численные методы370ную случайную функцию A(t) одной или нескольких переменных (случайный процесс или случайное поле), значения которой будут упорядоченыотносительно своих переменных.
Создать псевдослучайный процесс можноспособом, представленным в листинге 14.19.) Листинг 14.19. Генераций псевдослучайного процессаN:=20Т :=0.5Ттах := ( N - 1) • гj := 0 „ N - 1Tj := j • тх := rnorm ( N , 0 , 1)KS1 :-cspline (T , х)А ( t) :- interp (KS1 , Т , х , t)В первой строке листинга 14.19 определено количество N независимых случайных чисел, которые будут впоследствии сгенерированы, и радиус временной корреляции т.
В следующих трех строках определяются моментывремени Td, которым будут отвечать случайные значения A(tj). Созданиенормального случайного процесса сводится к генерации обычным способомвектора независимых случайных чисел х и построению интерполяционнойзависимости в промежутках между ними. В листинге 14.19 используетсясплайн-интерполяция (см. гл. 15).Рис.
1 4 . 1 4 . Псевдослучайный процесс {листинг 14.19)Глава 14. Математическая статистика371В результате получается случайный процесс A ( t ) , радиус корреляции которого определяется расстоянием т между точками, для которых строитсяинтерполяция. График случайного процесса A(t) вместе с исходнымислучайными числами показан на рис. 14.14.
Случайное поле можно создать несколько более сложным способом с помощью многомерной интерполяции.К случайным процессам, сгенерированным таким способом, как и к данным эксперимента, применяются любые статистические методы обработки,например корреляционный или спектральный анализ. Приведем в качествепримера листинг 14.20, показывающий, как организовать расчет корреляционной функции случайного процесса.Листинг 14.20. Дискретизация случайного процессаи вычисление корреляционной функции (продолжение листинга 14.19)Д :=0.02n := floorj := 0 .- пf^п = 475\Yj :=А(Д- j)m := mean ( Y)D:= v a r ( Y)D = 0 .785( n - 2 -М)i = МR(0)=1.025Дискретизация интервала (0,ттах) для случайного процесса A(t) произведена с различным элементарным интервалом Д (первая строка листинга).В зависимости от значения Д, получается различный объем п выборки случайных чисел Y b являющихся значениями случайной функции A(t) в точках дискретизации.
В последних четырех строках определяются различныехарактеристики случайной величины Y, являющиеся, по сути, характеристиками случайного процесса A ( t ) . График рассчитанной в 2-м+i точках корреляционной функции R(j) показан на рис. 14.15.Примечание)Внимательному читателю предлагается самостоятельно ответить на вопрос:почему при таком расчете корреляционной функции ее значение R (0) не равно1, как должно быть по определению?Часть III. Численные методы372j:=-H..И1-\-г0.9-,! ';i \.Р1 1 ;;\ 7'it!i'\\•-i ШM—ГJ-0.8••-0.7:i1i -!•••*4О.б-о 4-0.3-0.2-0.100.10.20.30.4Рис. 1 4 . 1 5 . Корреляционная функция (листинги 14.19—14.20)14.4.
Некоторые примерыПриведем два характерных статистических примера, которые легко решаются с помощью Mathcad.14.4.1.ИнтервальнаяоценкадисперсииТребуется определить числовой интервал ( L , U ) , внутри которого будет лежать с вероятностью 1-а=75% дисперсия нормальной случайной величины,исходя из объема выборки в N чисел. Эта задача решается в статистике спомощью ^-распределения (листинг 14.21).Листинг 14.21.
Интервальное оценивание дисперсииN;=50х :- rnorm ( N , 0 , 1)a := 0 . 2 51 - a = 0.75fa:=qchisq —,N-12I:= qchisq 1\,N-1( N - 1) • S t d e v (x)L :=L = 0.662= 60.5322U;=U=( N - 1) • S t d e v (x)1.057Глава 14. Математическая статистика373Указанный интервал называется (i-a)% доверительным интервалом. Обратите внимание на использование при решении данной задачи функции stdev(с прописной буквы) для расчета выборочного стандартного отклонения.В статистике часто встречаются выражения, которые более удобно записывать через функции в такой нормировке, именно для этого они и появилисьв Mathcad.14.4.2.
Проверка статистических гипотезВ статистике рассматривается огромное число задач, связанных с проверкойтех или иных гипотез н. Разберем пример простой гипотезы. Пусть имеетсявыборка N чисел с нормальным законом распределения и неизвестнымидисперсией и математическим ожиданием. Требуется принять или отвергнуть гипотезу н о том, что математическое ожидание закона распределенияравно некоторому числу цо=о .2.Задачи проверки гипотез требуют задания уровня критерия проверки гипотезы а, который описывает вероятность ошибочного отклонения истинной н.Если взять а очень малым, то гипотеза, даже если она ложная, будет почтивсегда приниматься; если, напротив, взять а близким к 1, то критерий будеточень строгим, и гипотеза, даже верная, скорее всего, будет отклонена.В нашем случае гипотеза состоит в том, что цо=о.2, а альтернатива — чтоцо*о.2. Оценка математического ожидания, как следует из курса классической статистики, решается с помощью распределения Стьюдента с параметром кг-1 (этот параметр называется степенью свободы распределения).Для проверки гипотезы (листинг 14.22) рассчитывается (а/2) — квантильраспределения Стьюдента т, который служит критическим значением дляпринятия или отклонения гипотезы.