Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 7
Текст из файла (страница 7)
Естьдве эквивалентных формы определения плотности: интегральная и диф"ференциальная. Определение плотности вероятности в интегральнойформе таково.Определение. Функция p(t) называется плотностью вероятности в точке t (иногда — плотностью случайной величины ξ), еслидля любых чисел a, b (пусть a < b) bP (a < ξ < b) =p(x) dx.aВ дифференциальной форме определения плотности данное усло"вие заменяется на следующее: для любого ∆ > 0 и любого1 действи"1 Если говорить точно — любого, за исключением множества меры нуль. Предыдущее(интегральное) определение показывает, что функция плотности может быть произвольноизменена на любом множестве нулевой меры, все равно удовлетворяя определению.28тельного tP (t < ξ < t + ∆) = p(t) ∆ + o(∆),где o(∆) — малая (точнее, бесконечно малая) по сравнению с ∆ ве"личина.Наглядное содержание второго из этих определений состоит в том,что вероятность, приходящаяся на малый отрезок, оказывается прибли"зительно пропорциональной длине этого отрезка, причем коэффициентпропорциональности равен значению функции плотности вероятностив некоторой точке этого отрезка.Функция распределения и плотность связаны соотношениями: xF (x) =p(t) dt ,p(x) = F (x).Рис.
1.3. График функции распределения, сосредоточенного в двух точках.−∞(для почти всех x — с теми же оговорками, что были сделаны выше).Как правило, для приложений достаточно двух вышеописанных ти"пов распределений — дискретного и непрерывного, точнее, имеющегоплотность. Хотя можно встретиться с распределениями, представляю"щими собой смесь двух этих типов, и даже с более сложными. В главе2 мы подробнее познакомимся с некоторыми важными для приложенийзаконами вероятностей на числовой прямой.Примеры. Покажем на примерах различные типы функций распределенияи их свойства. Пусть случайная величина ξ может принимать только значения0 и 1 с вероятностями, соответственно, p и 1 − p (причем 0 p 1). В этомслучае функция распределения имеет вид:еслиx < 0; 0,если0 x < 1;F (x) = p,1,еслиx 1.График этой функции изображен на рис. 1.3.Рассмотрим функцию распределения случайной величины более общего ви"да.
Пусть случайная величина ξпринимает конечноечисло значений a1 , . . . , an ,nпричем P (ξ = ak ) = pk 0,k=1 pk = 1 . График функции этого дискрет"ного распределения изображен на рис. 1.4. (Для удобства предположим, чтовозможные значения занумерованы в порядке возрастания.)Рассмотрим пример непрерывногофункция плотности p(t) равна 0,p(t) = 6t(1 − t),0,распределения вероятностей.еслиеслиеслиПустьt < 0;0 t < 1;t 1.Практически, разумеется, используют наиболее регулярную и простую из возможныхфункций плотности.29Рис. 1.4. График функции дискретного распределения +∞(Легко проверить, что в данном случае −∞ p(t) dt = 1, p(t) 0, так что функ"ция p(t) может быть плотностью случайной величины). Функция распределенияв этом примере равнадляx 0; 0,32для0 x 1;F (x) =− 2x + 3x ,дляx 1.1,График этой функции приведен на рис.
1.5.В приведенных примерах можно заметить, что F (x) → 0 при x →−∞ и F (x) → 1, при x → +∞ , и что F (x) — неубывающая функция.Это общие свойства всех функций распределения.Если в точке x функция распределения y = F (x) имеет скачок, товеличина этого скачка равна вероятности, сосредоточенной в точке x,т.е. вероятности события ξ = x. Если же точка x — точка непрерывностифункции y = F (x), и более того, F (x) имеет производную в этой точке,то график F (x) в точке x имеет касательную, тангенс угла наклонакоторой равен плотности p(x) в этой точке.30Определение. Для непрерывной случайной величины ξ с плотностью p(x), ∞Mξ =x p(x) dx,−∞причем интеграл должен сходиться абсолютно.Как говорилось выше, приведенные определения M ξ не являютсяисчерпывающими, поскольку пригодны не для всех видов случайныхвеличин.
Общее определение математического ожидания выглядитследующим образом:M ξ = x dPξ (x),Рис. 1.5. Пример непрерывной функции распределения1.5. … …Числовые характеристики распределения вероятностей полезнытем, что помогают составить наглядное представление об этом рас"пределении. Наиболее часто употребляемыми характеристиками слу"чайной величины (и соответствующего распределения вероятностей)служат моменты и квантили.
Ниже мы их определим, но надо сделатьоговорку: универсальные (пригодные для любых случайных величин)определения этих характеристик требуют весьма сложного математи"ческого аппарата (они основаны на теории меры, интеграла Лебега"Стилтьеса и т.д.), поэтому мы приводить их не будем. Вместо этого мыдадим более простые определения для дискретных и для непрерывныхслучайных величин.Начнем с так называемого первого момента случайной величины ξ,называемого также математическим ожиданием, или средним значением ξ.
Его обозначают через M ξ или Eξ.где Pξ (x) — распределение вероятностей, порожденное случайной вели"чиной ξ. Приведенные выше формулы для дискретного и непрерывногораспределений являются частными случаями этого выражения. Мы небудем пользоваться общим определением, так как это потребует множе"ства математических знаний (о том, что такое dP (x), в каком смыслепонимается интеграл и т.д.).Заметим, что существуют распределения вероятностей без матема"тического ожидания и с такими случайными величинами иногда прихо"дится сталкиваться на практике. Простой пример: пусть случайная вели"чина ξ принимает значения 11 , 22 , . . .
, nn , . . . с вероятностями 2−1 , 2−2 ит.д. Тогда эта случайная величина не имеет математического ожидания.Свойства математического ожидания. Перечислим без доказа"тельства основные свойства математического ожидания.1. Математическое ожидание постоянной равно этой постоянной.2. Математическое ожидание суммы случайных величин равно сум"ме их математических ожиданий, т.е.M (ξ + η) = M ξ + M η.Определение. Для дискретной случайной величины ξ со значениями x1 , x2 , .
. . , имеющих вероятности p1 , p2 , ...Mξ =xk pk .3. Математическое ожидание произведения случайной величинына константу равно произведению этой константы на математи"ческое ожидание случайной величины, т.е.kM aξ = aM ξ.Если число возможных значений ξ конечно, то M ξ всегда существу"ет и не зависит от способа нумерации этих значений. В том случае,если число возможных значений ξ счетно, необходимо, чтобы суммаряда k xk pk не зависела от нумерации значений x, то есть, чтобы этотряд сходился абсолютно ( k |xk |pk < ∞).31(другими словами, постоянный множитель можно выносить зазнак математического ожидания).Полезно иметь ввиду следующее геометрическое толкование мате"матического ожидания.
Пусть F (x) — функция распределения случай"ной величины ξ. Тогда M ξ равно разности площадей, заключенных ме"32жду осью ординат, прямой y = 1 и кривой y = F (x) в интервале (0, +∞)и между осью абсцисс, кривой y = F (x) и осью ординат в промежут"ке (−∞, 0) (см.
рис. 1.6). Это правило позволяет во многих случаяхнаходить математическое ожидание почти без вычислений, используяразличные свойства функции распределения.2. Для любой неслучайной постоянной aD(ξ + a) = D(ξ),D(aξ) = a2 D(ξ).Моменты. Кроме первого и второго моментов, при описании слу"чайных величин иногда используются и другие моменты: третий, че"твертый и т.д. Мы дадим их определения отдельно для дискретных идля непрерывных случайных величин.Определение. Для дискретной случайной величины ξ со значениями x1 , x2 , . . . , имеющих вероятности k p1 , p2 , ..., kым моментомM ξ k называется величина M ξ k =i xi pi , а kым центральныммоментом называется величина i (xi − M ξ)k pi . Для непрерывнойслучайной величины с плотностью p(x), kым моментом называется∞величина −∞ xk p(x) dx, а kым центральным моментом называется∞величина M (ξ − M ξ)k = −∞ (x − M ξ)k p(x) dx.Чтобы приведенные формулы имели смысл, требуется, чтобы суммыи интегралы сходились абсолютно.
Так же, как математическое ожида"ние и дисперсия, моменты существуют не для всех случайных величин.Рис. 1.6. Геометрическая интерпретация математического ожиданияКроме среднего значения случайной величины, которое в опреде"ленном смысле характеризует центр распределения вероятностей, пред"ставляет интерес и разброс случайной величины относительно этогоцентра. Для характеристики (количественного описания) данного раз"броса в теории вероятностей используют второй центральный момент случайной величины. В русскоязычной литературе его называютдисперсией и обычно обозначают через Dξ.Определение. Дисперсией Dξ случайной величины ξ называетсявеличинаDξ = M (ξ − M ξ)2 ,илиDξ = M ξ 2 − (M ξ)2 .Дисперсия, так же как и математическое ожидание, существует недля всех случайных величин (не для всех распределений вероятностей).Если необходимо, чтобы показатель разброса случайной величинывыражался в тех же единицах, что и значение√ этой случайной вели"чины, то вместо Dξ используют величину Dξ, которая называетсясредним квадратическим отклонением, или стандартным отклонени"ем случайной величины ξ.Свойства дисперсии.
Из свойств дисперсии отметим следующие:1. Дисперсия постоянной равна нулю.33Асимметрия и эксцесс. В отличие от обычных моментов, цен"тральные моменты не меняются при прибавлении к случайной величинепостоянного слагаемого, то есть они не зависят от выбора начала отсче"та в шкале измерения случайной величины. Но от выбранной единицыизмерения зависимость остается: если, скажем, случайную величинуначать измерять не в метрах, а в сантиметрах, то значения центральныхмоментов также изменятся. Иногда это бывает неудобно.
В такихслучаях, чтобы устранить подобное влияние, моменты тем или инымспособом нормируют, например, деля их на соответствующую степеньсреднего квадратического отклонения. В результате получается без"размерная величина, не зависящая от выбора начала отсчета и единицизмерения исходной случайной величины.Чаще всего из нормированных моментов используются асимметрияи эксцесс — соответственно третий и четвертый нормированные цен"тральные моменты.