Автореферат (1137366), страница 3
Текст из файла (страница 3)
≤ Mˆ 500,500 ( X ).Тогда бумага QQ − квантилей функции распределения K (x) против квантилей эмпирическойˆ i ( X ), i = 1,..., n} примет видфункции распределения нормированных максимумов {M⎧⎪⎛⎫⎪⎛ i ⎞ Mˆ i ,500 ( X ) − b500 ⎞⎟∈;A( Xˆ ) = ⎨⎜ K1← ⎜,iN⎟500 ⎬,⎜⎟501a⎝⎠⎪⎩⎝⎪⎭500⎠Пустьlim P(max{ X i : δ i = 1, i ∈ N n } ≤ a n x + bn ) = K 2 ( x).n →∞Рассмотрим множество пар чисел⎧⎪⎛⎫⎪⎛ i ⎞ Mˆ i ,500 ( X ) − b500 ⎞⎟∈;A( Xˆ ) = ⎨⎜ K 2← ⎜,iN⎟500 ⎬,⎜⎟501a⎝⎠⎪⎩⎝⎪⎭500⎠Одно приближение лучше другого, если QQ − бумага первого расположена ближе к прямой скоэффициентом наклона 1, проходящей через начало координат, чем бумага второго. Хотя врассмотренных примерах преимущество одного приближения над другим будет заметно12визуально, мы численно измерим преимущество одного приближения над другим сиспользованием суммы квадратов отклонений:Measure(t , c) =ˆ500⎛ M∑ ⎜⎜i =c ⎝i ,500 ( X ) − b500a5002⎞− K t← (i/501) ⎟ ,⎟⎠(14)где t = 1,2 , a c – пороговый индекс (мы будем брать c = 1,...,470 ).Во всех рассмотренных случаях видно, что функция распределения K1 ( x) приближаетэмпирическую функцию распределения нормированных максимумов прореженной выборкилучше, чем функция распределения K 2 ( x) .В четвертой главе проведена обработка реальных данных о потреблении электроэнергиив России и температуре воздуха в Центральной Англии.
Полученные результаты такжесравнены с результатами, полученными с помощью классического подхода.В первом параграфе четвертой главы представлены результаты обработки реальныхданных, представляющих собой выборку, состоящую из ежедневных максимумов температурвоздуха в Центральной Англии, взятых за период с 1 января 1878 по 31 декабря 1998 года, длякоторых описана процедура построения функции распределения годовых максимумовтемператур в этом регионе на основании классической теории экстремальных значений, наосновании результатов главы 1 и сравним каждую из полученных функций распределения сэмпирической функцией распределения.Во втором параграфе четвертой главы исследуются данные о почасовом потребленииэлектроэнергии в России за период с 7 июня 2005 года по 22 июля 2005 года. Визуальныйанализ изменения потребления электроэнергии позволяет сделать вывод о периодичностипотребления за сутки.
Более того, можно увидеть, что имеется периодичность, связанная сднями недели, и годичная периодичность (однородность по сезонам). При полном исследованииэкстремальных значений потребления необходимо учитывать и годичный тренд. Задача полногоисследования в работе не ставится.В нашем случае, такой период взят как пример однородности по сезону. Были взятытолько данные со вторника по четверг каждой недели, так как максимумы потребления втечение недели за рассматриваемый период достигаются только в эти дни и для этих днейнаблюдается похожая структура потребления.Для обоих примеров данных схема оценки функции распределения максимумов наоснове результатов главы 1 одна и та же:пусть (Yˆi ) – это выборочные значения случайного ряда (Yi ) , представимого в виде суммынекоторой детерминированной периодической составляющей ( pi ) и стационарного временногоряда ( X i ) , то есть:Yi = X i + pi .Далее,положим, что детерминированная периодическая составляющая имеет периодравный r .В качестве оценки для p j ,1 ≤ j ≤ r мы берем обычное эмпирическое среднее j -ых13наблюдения выборки (Yˆi ) в каждом из последующих K периодов:pˆ k =Yˆk + Yˆk + r ...
+ Yˆi + r ( K −1)K,где 1 ≤ i ≤ r , i ∈ N ( Ν - множество натуральных чисел), а K -количество лет, охватываемыевыборкой.ПустьXˆ i = Tˆi − pˆ i , 1 ≤ i ≤ rK .Возьмем индекс i0 максимального элемента последовательности pˆ 1 ,..., pˆ r и пусть s такое, чтов промежуток времени [i0 − s, i0 + s ] каждого периода попадают все максимумы за периоднашей выборки. Будем рассматривать только такие промежутки (сезон) в каждый из периодов,охватываемых нашей выборкой.
Им будут отвечать следующие элементы последовательностей(Yˆi ) , ( Xˆ i ) , ( p j ) :(Yˆi + r ( m −1) , i ∈ [i0 − s, i0 + s ] ∩ N, m = 1,..., K ),( Xˆ i + r ( m −1) , i ∈ [i0 − s, i0 + s ] ∩ N, m = 1,..., K ),( pˆ j , i ∈ [i0 − s, i0 + s] ∩ N, i = 1,..., r ).j -ый элемент первой и второй подпоследовательностей через Tˆ j* , Xˆ *j(1 ≤ j ≤ (2s + 1) K ) , соответственно, аj -ый элемент (1 ≤ j ≤ 2s + 1) третьейОбозначим*подпоследовательности - pˆ j .Возьмеммаксимумэлементов[(m − 1)(2s + 1), m(2s + 1)] , где m = 1,.., Kнакаждом*для ряда (Yˆ j ) и рядаинтервалеиндексов( Xˆ *j ) , получим:Mˆ 1 ,..., Mˆ K ,Mˆ 1' ,..., Mˆ K' .Пусть последовательность ( Xˆ j ) - это выборка последовательности ( X j ) , тогда (Yˆ j ) - это*выборка последовательности**( X *j + pˆ *j ) .
Положим, что ( X *j ) обладает свойствамистационарности и асимптотической независимости. Тогда, применив результаты главы 1 дляслучая, когда периодический тренд равен нулю, получим предельную функцию распределениядлянормированныхмаксимумовслучайногоряда( X *j )(функциюраспределенияэкстремальных типов). Оценим эту предельную теоретическую функцию распределения.
Дляэтого необходимо оценить экстремальный индекс. Мы будем использовать оценку Пиккандса14для экстремального индекса. Возьмем вариационный ряд последовательности ( Xˆ j )**ˆ*ˆ*Xˆ 101K ,101K ≤ X 101K −1,101K ≤ ... ≤ X 1,101K ,тогда оценка Пикандса для экстремального индекса имеет вид:ξˆi ,nXˆ i*,101K − Xˆ 2*i ,101K1=ln.ln 2 Xˆ 2*i ,101K − Xˆ 4*i ,101KКратко опишем статистические свойства этой оценки (см. [De Haan L., Ferreira A.(2006)]):• Если i (n)/n → 0 при n → ∞ , тогда ξˆi,n по вероятности стремится к• При некоторых дополнительных условияхξ.i (ξˆi ,n − ξ ) имеет ассимптотическое нормальноераспределение с нулевым средним и дисперсиейv(ξ ) =ξ 2 (2 2ξ +1 + 1)(2(2ξ − 1) ln 2) 2.Для того, чтобы выбрать оптимальное значение оценки ξˆi ,n , прибегнем к часто используемойпроцедуре (см.
7):• Изобразим график множества{(i, ξˆi,n ) : i = 1,...,[rK/4]}• Выберем наибольшую область, где график приблизительно горизонтален и в качестве оценкиэкстремального индекса~ξ берут значение соответствующее этому уровню.Для того, чтобы оценить нормирующие коэффициенты a r , br , рассмотрим квантиль − квантильграфик, представляющий собой множество A , элементы которого составлены из пар, имеющихвид (квантиль уровня i/( K + 1) для эмпирической функции распределения G (x ) ; квантильуровня i/( K + 1) для функции распределения экстремальных типов с экстремальным индексом~ξ ), более формально:~−ξ ⎞ ⎞⎧⎛⎫⎛⎪⎜ −1⎪⎛ i ⎞ ⎟⎟⎜A = ⎨ G (i/( K + 1));− − ln⎜: i = 1,..., K ⎬.⎟⎜⎜⎝ K + 1 ⎠ ⎟⎠ ⎟⎪⎩⎝⎪⎭⎝⎠(15)7Embrechts P., Klüppelberg C. , Mikosch T.
(1997). Modelling Extremal Events for Insurance and Finance. Springer, NewYork.15Пусть в линейной регрессии значений {G−1(i/( K + 1)), i = 1,..., K } на соответствующие~−ξ⎧⎪ ⎛⎛ i ⎞⎜значения ⎨− − ln⎜⎟⎜⎝ K + 1⎠⎪⎩ ⎝⎫⎞⎟, i = 1,..., K ⎪ , где b – свободный член, а a – коэффициент при⎬⎟⎪⎭⎠регрессоре.
Тогда в качестве оценок для a r , br берутся равными берутся a и b ,ˆ ,..., Mˆ :соответственно. С помощью этой нормировки пронормируем максимумы MK1( Mˆ 1 − b)/a,..., ( Mˆ K − b)/a.(16)ˆ ,..., MˆОбозначим эмпирическую функцию распределения величин M1K через U (x ) , аˆ 1 ,..., Mˆ K через G (x) .эмпирическую функцию распределения величин MДля сравнения эмпирической функции распределения G (x) и теоретической функции''~распределения экстремального типа с экстремальным индексом ξс учтеннымпсевдостационарным трендом.Далее, воспользуемся результатами главы 1, в соответствии с которыми, приопределенных достаточно общих предположениях, функция распределения⎫⎧~−ξ⎪⎪⎛ pˆ i*⎞ ⎪⎪ 1P( x) = exp⎨−∑ ⎜⎜ a − x ⎟⎟ ⎬101⎪⎝⎠ ⎪pˆ i*i:>x⎪⎪a⎭⎩(17)должна приближать эмпирическую функцию распределения выборки нормированныхмаксимумов (17).
Для того, чтобы увидеть насколько хорошо одна функция распределенияприближается другой функцией распределения, обратимся к множеству{()}B = U −1 (i/( K + 1)); at (i/( K + 1)) + b : i = 0,..., K ,(18)где t (i/( K + 1)) является решением уравнения⎧⎫~−ξ⎪⎪⎛ pˆ i*⎞ ⎪i⎪ 1⎜exp⎨−− t (i/( K + 1)) ⎟ ⎬ =.∑⎜ a⎟101K+1*⎪⎝⎠ ⎪pˆi: i >t (i/( K +1))⎪⎪a⎩⎭(19)Заметим, что это уравнение всегда имеет решение, так как функция, стоящая слева, монотоннапо t (i/( K + 1)) .16Схема оценки функции распределения максимумов на основе результатов классическойтеории экстремумов следующая:ˆ i ) i =1 :Возьмем вариационный ряд последовательности ( MKMˆ K* , K ≤ Mˆ K* −1, K ≤ ...
≤ Mˆ 1,* K .Для оценки экстремального индекса применим оценку Пиккандса:ηˆi ,nMˆ i*, K − Mˆ 2*i , K1=ln.ln 2 Mˆ 2*i , K − Mˆ 4*i , KДля того, чтобы выбрать оптимальное значение оценки(20)η̂ i ,n , прибегнем к уже описаннойпроцедуре:• Построим график функции ηˆi ,n , i = 1,..., K/4{(i,ηˆi,n ) : i = 1,..., K/4}.• Выберем наибольшую область, где график приблизительно горизонтален, и в соответствии созначением функции η̂ i ,n , отвечающем этому уровню, выбираем значение оценки Пикандса.Определим линейную нормировку, построив прямую ( y = ax + b) по методу наименьшихвзвешенных квадратов, приближающую квантиль − квантиль график−η~ ⎞⎫⎪⎧⎪⎛ ⎛⎞i⎛⎞−1⎜⎟⎜⎟C = ⎨ − − ln⎜⎟ ⎟; G (i/( K + 1)) : i = 1,..., K ⎬⎜⎜⎟K1+⎝⎠ ⎠⎪⎭⎪⎩⎝ ⎝⎠(21)на плоскости ( x, y ) .