А.Н. Соболевский - Конкретная теория вероятностей (1119908), страница 9
Текст из файла (страница 9)
Пусть x(n) — решение уравнения1.nБудем называть x(n) типичным наибольшим значением n-элементной выборки из распределения, заданного кумулятивной фукнцией F (ср. определение медианы в п. 2.16).Примем без потери общности, что x(n) > 0.F (x) = 1 −Поскольку P(X > x(n) ) = 1/n, в выборке объема n в среднем будет встречаться одно значение,превышающее x(n) . Если функция F разрывна и не принимает значения 1 − 1/n, то можно положить x(n) = inf{x : F (x) > 1 − 1/n}, что приведет к незначительным изменениям в дальнейшихвыкладках.6.5.
Будем искать предел перемасштабированной кумулятивной функции распределениямаксимума выборки в следующем виде:F(n) (x(n) ξ) = [F (x(n) ξ)]n = [1 − F̃ (x(n) ξ)]n −−−−→ e−ϕ(ξ) ,n→∞причем ϕ(∞) = 0, поскольку F(n) (∞) = 1. Логарифмируя и замечая, что nF̃ (x(n) ξ) ограничена, получим−n log[1 − F̃ (x(n) ξ)] = nF̃ (x(n) ξ) + o(1) −−−−→ ϕ(ξ).n→∞Поскольку nF̃ (x(n) ) = 1, имеемϕ(ξ) = limn→∞nF̃ (x(n) ξ)nF̃ (x(n) )=limx(n) →∞F̃ (x(n) ξ)F̃ (x(n) ).6.6. Заметим, что благодаря монотонности функции F̃ при x(n) 6 t 6 x(n+1) выполненынеравенстваF̃ (x(n+1) ξ)F̃ (x(n) ξ)F̃ (tξ)66.F̃ (x(n) )F̃ (t)F̃ (x(n+1) )Поскольку nF̃ (x(n) ) = (n + 1)F̃ (x(n+1) ) = 1, имеемn F̃ (x(n+1) ξ)F̃ (tξ)n + 1 F̃ (x(n) ξ)66.n + 1 F̃ (x(n+1) )n F̃ (x(n) )F̃ (t)что позволяет переходить к пределу в отношении F̃ (tξ)/F̃ (t) по параметру t → ∞, принимающему не только целые, а произвольные вещественные значения.6.7.
Поскольку при ξ1 , ξ2 > 0ϕ(ξ1 ξ2 ) ←−−−t→∞F̃ (tξ1 ξ2 )F̃ (tξ1 ξ2 ) F̃ (tξ2 )=−−−→ ϕ(ξ1 ) ϕ(ξ2 ),F̃ (t)F̃ (tξ2 ) F̃ (t) t→∞имеем ϕ(ξ1 ξ2 ) = ϕ(ξ1 ) ϕ(ξ2 ). Общим решением этого уравнения, удовлетворяющим условиям ϕ(1) = 1 и ϕ(∞) = 0, является ϕ(ξ) = ξ −α при 0 < α 6 ∞ (считаем x−∞ ≡ 0 приx > 1).Монотонная функция F (x), удовлетворяющая условию limt→+∞ F (tx)/F (t) = x−α при конечном α, по Й. Карамате называется правильно меняющейся с показателем α.
Понятие правильного изменения позволяет грубо выделить основную «степенную» часть в функциях типаx−α log log x/ log x; на этом же языке может быть сформулирован и наиболее широкий вариантобобщенной центральной предельной теоремы для устойчивых распределений (см. предыдущуюлекцию). Подробнее о теории правильно меняющихся функций см. т. 2 учебника Феллера, §§8–9гл. VIII.В пп. 6.5– 6.7 установлено следующее утверждение.6.8. Пусть X1 , X2 , . . . , Xn — совокупность независимых одинаково распределенных случайных величин, характеризуемых последовательностью типичных наибольших значенийx(n) > 0 (п. 6.4).
Тогда распределение случайной величины max(X1 , X2 , . . . .Xn )/x(n) слабосходится к распределению, сосредоточенному на положительной полуоси x > 0 и заданномутам кумулятивной функцией−αFα (x) = e−x,0 < α 6 +∞.При конечных α оно называется распределением Фреше.Заметим, что распределение Фреше характеризуется степенным «хвостом»: F̃α (x) = x−α . Приэтом степенное убывание на бесконечности присуще и исходному распределению случайных величин Xi , а x(n) ∼ n1/α . Если же «хвосты» исходного распределения убывают быстрее, то α = +∞ инетривиальное предельное распределение для максимума возникает при ином преобразовании F(n) .6.9.
Рассмотрим пределF(n) (x(n) + η) = [F (x(n) + η)]n = [1 − F̃ (x(n) + η)]n −−−−−→ e−ψ(η) .n→+∞Действуя аналогично пп. 6.5– 6.7, получим ψ(η) = limt→+∞ F̃ (t + η)/F̃ (t), причем ψ(0) = 1.Отсюда следует функциональное уравнение ψ(η1 + η2 ) = ψ(η1 )ψ(η2 ) с общим решениемψ(η) = exp(−η/η0 ).6.10. При тех же условиях, как в п.
6.8, распределение max(X1 , X2 , . . . , Xn ) − x(n) сточностью до фиксированного масштабного преобразования слабо сходится к распределению, определенному на всей вещественной оси кумулятивной функцией F (x) = e− exp(−x) ,которое называется распределением Гумбеля.Логарифм случайной величины, распределенной по Фреше, распределен по Гумбелю.6.11.
Осталось рассмотреть еще один частный случай, когда исходное распределениеF (x) = 1 при x > x0 , т. е. исходная случайная величина ограничена сверху. Если x0 —наименьшая такая верхняя грань, то преобразование Y = (x0 − X)−1 переводит даннуюзадачу в задачу о распределении Фреше [соответствующее перемасштабирование имеет видF(n) (ζ/y(n) )]. Предельное распределение в исходной задаче сосредоточено на полуоси x 6x0 , задается там кумулятивной функциейβFβ (x) = e−(x0 −x) ,где 0 < β 6 +∞, и называется распределением Вейбулла.Часто распределение Вейбулла пишут для минимума совокупности случайных величины, ограниченных снизу, так что кумулятивная функция принимает вид 1 − Fβ (−x).
При β = 1 это распределение совпадает с показательным.Можно показать, что результаты пп. 6.8, 6.10 и 6.11 вместе с тривиальным распределением п. 6.3исчерпывают возможные предельные формы распределения максимума совокупности независимых одинаково распределенных случайных величин (предельная теорема Фишера–Типпета–Гнеденко).6.12. Пусть X1 , X2 , . . . , Xn — выборка, т. е. набор случайных величин, независимых иодинаково распределенных по некоторому закону.
Отсортируем по возрастанию набор значений, которые приняли эти случайные величины:min{X1 , X2 , . . . , Xn } = X(1) 6 X(2) 6 . . . 6 X(n) = max{X1 , X2 , . . . , Xn }.Отсортированный набор называется вариационным рядом выборки X1 , X2 , . . . , Xn , а егочлены — порядковыми статистиками. При фиксированном n обозначение X(k) для kй порядковой статистики (а также F(k) для ее кумулятивной функции распределения) невызывает путаницы.6.13. Элемент вероятности распределения k-й порядковой статистики имеет видk−1dF(k) (x) = n · Cn−1· [F (x)]k−1 · [1 − F (x)]n−k · dF (x).Смысл каждого из сомножителей в правой части ясен из следующей схемы.k−1zX(1)}|n−k{xx + dx.
. . X(k−1) X(k)z}|X(k+1) . . .{X(n)Одно из значений X1 , X2 , . . . , Xk можно n способами выбрать на роль k-й порядковой стаk−1тистики, лежащей в интервале (x, x+dx). После этого остается Cn−1способов выбрать k −1значение, попадающее левее X(k) = x. Вероятность того, что k − 1 независимых случайныхвеличин все примут значения, не превосходящие x, равна [F (x)]k−1 , а вероятность того,что остальные n − k независимых случайных величин все примут значения, не меньшие x(точнее, x + dx), равна [1 − F (x)]n−k . Наконец, элемент вероятности распределения случайной величины, выбранной на роль k-й порядковой статистики и принимающей значения вотрезке (x, x + dx), есть dF (x).6.14. Если распределение случайных величин Xi не имеет атомов, то замена переменныхY = F (X) переводит их в равномерно распределенные случайные величины на отрезке (0, 1)а элемент вероятности Y(k) принимает видk−1 k−1dF(k) (y) = nCn−1y(1 − y)n−k dy(бета-распределение с параметрами k, n − k + 1, см.
п. П1.12).6.15. В частности, элемент вероятности распределения медианы выборки Y(k+1) при n =2k + 1 имеет видk kkdFmed (y) = (2k + 1)C2ky (1 − y)k dy = (2k + 1)C2k(1 − ξ 2 /2k)k 1√ dξ,4k2 2k√где y = (1 + ξ/ 2k)/2. Нетрудно проверить, что при n, k → ∞ это распределение сходится кнормальному. Поэтому, если dF/dx|xmed = λ > 0, то распределение медианы исходной√ выборки X1 , X2 , . . . , Xn также является асимптотически нормальным с дисперсией (2λ n)−1и сосредотачивается на истинном значении медианы.Следовательно, медиана выборки является хорошей оценкой истинной медианы для любого распределения.
Ср. это с поведением среднего выборки X n , которое может не стремиться ни к какомупределу при n → ∞, если исходное распределение слишком медленно убывает на бесконечности.6.16. Полезное семейство предельных распределений получается, если от переменныхY(k) , распределенных на отрезке (0, 1), перейти к переменным Z(k) = n(1 − Y(k) ), распределенных на положительной полуоси. Переходя к пределу при n → ∞ в формуле п.
6.14 сучетом замены y = 1 − z/n, нетрудно проверить, что предельное распределение Z(k) имеетвид гамма-распределения с параметрами ν = k, α = 1. В частности, Z(1) распределена попоказательному закону (ср. п. 6.11 при β = 1).7. Большие уклонения I: энтропия и теорема СановаВ лекции 5 мы видели, что центральная предельная теорема и ее обобщения уточняют законбольших чисел для сумм независимых числовых случайных величин: они описывают асимптотическое поведение среднего выборки или других нормировок суммы в малой окрестности предельного значения, около которого происходит концентрация вероятности.