Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 15
Текст из файла (страница 15)
Положительная случайная величина X имеет показательное распределение с параметром θ > 0, если ее плотностьзадана формулойp(x, θ) = θ e−θxПоказательное распределение часто называют еще экспоненциаль"ным. Параметр θ в ряде прикладных областей именуют «отношениемриска». Иногда вместо параметра θ используют параметр b = 1/θ, тогдафункция плотности записывается в виде:1(x 0).p(x, b) = e−x/bbСвойства.
Математическое ожидание и дисперсия случайной ве"личины X, распределенной по показательному закону с параметромθ, равныm=0M X = 1/θ,В [77] приведены таблицы P (ξ k | λ) для λ = 0.01 (0.01); 1 (0.05);5 (0.1); 10 (0.5); 20 (1); 30 (5); 50 с точностью до 0.5 · 10−4 .2.3. ƒ… …Область применения. Укажем две области применения статисти"ческих методов, в которых показательное распределение играет базо"вую роль.К первой из них относятся задачи связанные с данными типа «вре"мени жизни».
Понимать этот термин следует достаточно широко. Вмедико"биологических исследованиях под ним может подразумеватьсяпродолжительность жизни больных при клинических исследованиях, втехнике — продолжительности безотказной работы устройств, в пси"хологии — время, затраченное испытуемым на выполнение тестовыхзадач, и т.д. Подробное изложение обработки подобных данных да"но в [55].Второй областью активного использования показательного распре"деления являются задачи массового обслуживания.
Здесь речь можетидти об интервалах времени между вызовами «скорой помощи», теле"фонными звонками или обращениями клиентов и т.д. В условиях моде"ли п. 2.2, в которой речь шла о появлении в случайные моменты некихсобытий и которую мы использовали для иллюстрации распределенияПуассона, длина интервала времени между появлениями последователь"ных событий имеет показательное распределение.73(x 0).DX = 1/θ2 .Первое из этих соотношений придает параметру θ ясный вероятностныйсмысл: 1/θ — это среднее время службы изделия, среднее время междувызовами и т.д.На рис. 2.3.
приведен графический вид плотности показательногораспределения с параметром θ.Рис. 2.3. Плотность показательного распределения с параметром θФункция показательного распределения, т.е. P (X < x), равнадля x 0;1 − e−θx ,F (x, θ) =для x < 0.0,Показательное распределение среди всех других выделяется, какиногда говорят, отсутствием «памяти», т.е. отсутствием последействия.74Это подразумевает следующее: для показательно распределенной слу"чайной величины X (и только для такой)P (X s + t | X t) = P (X s)для любых s, t 0.
Поясним смысл этой формулы на примере. ПустьX — время службы некоего изделия, и оно подчиняется экспоненци"альному распределению. Тогда для изделия, прослужившего время t,вероятность прослужить дополнительное время s совпадает с вероятно"стью прослужить то же время s для нового (только начавшего работу)изделия. Как видим, это соотношение как бы исключает износ и старе"ние.
Поэтому в статистических моделях срока службы, если мы хотимучесть старение, приходится привлекать различного рода обобщенияпоказательного распределения.Определение. Случайная величина ξ имеет нормальное распределение вероятностей с параметрами a и σ 2 (краткое обозначение: ξ ∼ N (a, σ 2 )), если ее плотность распределения задаетсяформулой:−(x−a)21ϕ(x) = √e 2σ2 ,2πσ−∞ < x < +∞.Смысл параметров нормального распределения наглядно показан нарис.
2.4.Связь с другими распределениями. Показательное распреде"ление является частным случаем гамма"распределения, распределенияВейбулла и некоторых других. Подробную информацию на эту темуможно получить в [111].Таблицы. Функция показательного распределения достаточно про"ста, поэтому специальные таблицы для этого распределения не нужны.Значения функции показательного распределения можно вычислить спомощью калькулятора.2.4.
!… …Рис. 2.4. Плотность нормального распределения сосредним a и различными значениями дисперсии σ 2Область применения. Нормальное распределение относится к чи"слу наиболее распространенных и важных, оно часто используется дляприближенного описания многих случайных явлений, например, дляслучайного отступления фактического размера изделия от номинально"го, рассеяния снарядов при артиллерийской стрельбе и во многих дру"гих ситуациях, в которых на интересующий нас результат воздействуетбольшое количество независимых случайных факторов, среди которыхнет сильно выделяющихся.Замечание.
Использованию нормального распределения для приближен"ного описания распределений случайных величин не препятствует то обстоя"тельство, что эти величины обычно могут принимать значения только из какого"то ограниченного интервала (скажем, размер изделия должен быть больше нуляи меньше километра), а нормальное распределение не сосредоточено целикомни на каком интервале. Дело в том, что вероятность больших отклоненийнормальной случайной величины от центра распределения настолько мала, чтоее практически можно считать равной нулю.75Отметим, что ϕ(x) стремится к нулю при x → −∞ и x → +∞.График функции ϕ(x) симметричен относительно точки a. При этомв точкеa функция ϕ(x) достигает своего максимума, который равен√1/( 2πσ).Параметр a характеризует положение графика функции на числовойоси (параметр положения).
Параметр σ(σ > 0) характеризует степеньсжатия или растяжения графика плотности (параметр масштаба). Каквидим, вся совокупность нормальных распределений представляет собойдвухпараметрическое семейство.Свойства. Математическое ожидание и дисперсия случайной вели"чины ξ, распределенной как N (a, σ 2 ), равныM ξ = a,Dξ = σ 2 .Медиана нормального распределения равна a, так как плотностьраспределения симметрична относительно точки x = a.76Особую роль играет нормальное распределение с параметрами a = 0и σ = 1, т.е. распределение N (0, 1), которое часто называют стандартным нормальным распределением. Плотность стандартного нормально"го распределения есть21ϕ(x) = √ e−x /2 .2πФункция распределения стандартного нормального распределенияравна x21Φ(x) = √e−y /2 dy.2π −∞Функцию Φ(·) часто называют функцией Лапласа.
Отметим, чтоΦ(x) = 1 − Φ(−x), поэтому достаточно знать значения функции Φ(x)для x 0. Это свойство функции Φ(x) используется при составле"нии таблиц.Функцию произвольного нормального распределения N (a, σ 2 ) мож"но легко выразить через Φ(·). Для этого следует заметить, что если ξраспределена по закону N (a, σ 2 ), то ее линейная функция X = (ξ − a)/σподчиняется стандартному нормальному распределению. Поэтомуx−ax−aP (ξ < x) = P X <=Φ.σσЭта формула позволяет вычислять вероятности событий, связанныхс произвольными нормальными случайными величинами, с помощьютаблиц стандартного нормального распределения.Аналогичным образом, легко показать, что если ξ распределена понормальному закону, скажем, N (a, σ 2 ), то случайная величина kξ + b(линейная функция ξ) имеет нормальное распределение N (a + b, k2 σ 2 ).Напомним, что площадь фигуры, ограниченная графиком функцииплотности распределения, осью абсцисс и отрезками двух вертикальныхпрямых, x = b, x = c, есть вероятность попадания случайной величиныв интервал (b, c).
В связи с этим полезно представить, как распределя"ются доли площадей между кривой ϕ(x) и осью абсцисс (см. рис. 2.5).Более подробный анализ показывает, что случайная величина N (0, 1) свероятностью, примерно равной 0.94 попадает в интервал (−2, 2), и свероятностью, примерно равной 0.9973 — в интервал (−3, 3). Отсюдадля произвольной нормально распределенной случайной величины мож"но сформулировать правило, именуемое в литературе правилом трехсигм. А именно, нормальная случайная величина N (a, σ 2 ) с вероятно"стью 0.9973 попадает в интервал (a − 3σ, a + 3σ).Таблицы.
Для функции Φ(x) и ее производной, т.е. для плотностистандартного нормального распределения, существуют многочисленные77Рис. 2.5. Примерное распределение площадей под кривойфункции плотности стандартного нормального распределениятаблицы разной степени подробности. Так, в [19] указаны значения Φ(x)с шестью значащими цифрами для x = 0.000 (0.001) 3.000 и с пятьюзначащими цифрами для x = 3.00 (0.01) 5.00 (в данном случае знача"щими называются все разряды десятичной дроби начиная с первого,отличного от девятки, например, если Φ(x) = 0.99976737, то значащимицифрами считаются 76737).Для статистических применений часто оказываются полезными та"блицы, представляющие накопленную нормальную вероятность, отсчи"тываемую справа, т.е.
таблицы, в которых в зависимости от x указанызначения P (ξ x) = 1 − Φ(x). Например, в [115] дана таблица P (ξ x)для x = 0.00 (0.01) 3, 5 с четырьмя значащими цифрами. Как будет по"казано в гл. 5, таблицы подобного вида более удобны в статистическойпрактике, чем таблицы для Φ(x).В большинстве сборников также приводятся таблицы квантилейстандартного нормального распределения.