Среднее и дисперсия линейной комбинации наблюдений

2020-06-032021-03-09zzyxelСтудИзба

1.9. Среднее и дисперсия линейной комбинации наблюдений

Положим, что случайные переменные у₁, у₂, у₃ (распределённые необязательно по нормальному закону) имеют средние y₁, y₂, y₃, дисперсии s₁², s₂², s₃² и коэффициенты корреляции r₁₂, r₁₃, r₂₃. Линейная комбинация этих переменных у=a₁у₁+a₂y₂+a₃y₃, где a₁, a₂, a₃ некоторые действительные числа, имеет среднее

Е(y)=a₁y₁+a₂y₂+a₃y₃

и дисперсию

D(y) =a₁²s₁²+a₂²s₂²+a₃²s₃²+2a₁a₂s₁s₂r₁₂+2a₁a₃s₁s₃r₁₃+2a₂a₃s₂s₃r_23.

Эти формулы обобщаются для п переменных следующим образом. Для линейной комбинации y= из n случайных переменных среднее имеет вид

Е(y)= (1.9.1)

и дисперсия D(y) имеет n членов второй степени вида a_i²s_i² и n(n–1)/2 комбинированных членов вида 2a_ia_js_is_jr_ij. В итоге получаем:

D(y)=+2.

Рекомендуемые материалы

-50%

Теория функций комплексного переменного

Теория функций комплексного переменного (ТФКП)

1380 690 руб.

-50%

Теория функций комплексного переменного

Теория функций комплексного переменного (ТФКП)

1380 690 руб.

-50%

Теория функций комплексного переменного

Теория функций комплексного переменного (ТФКП)

1380 690 руб.

-50%

Теория функций комплексного переменного

Теория функций комплексного переменного (ТФКП)

1380 690 руб.

-50%

Теория функций комплексного переменного

Теория функций комплексного переменного (ТФКП)

1380 690 руб.

Теория функций комплексного переменного

Теория функций комплексного переменного (ТФКП)

690 руб.

Заметим, что s_is_jr_ij является ковариацией C(y_i, y_j). Поэтому, можно также записать

D(y)=+2. (1.9.2)

Дисперсия суммы и разности двух коррелированных случайных переменных

Так как сумма y₁+y₂ может быть представлена в виде (+1)y₁+(+1)y₂, а разность y₁–y₂ может быть записана как (+1)y₁+(–1)y₂, то

D(y₁+y₂)=s₁²+s₂²+2s₁s₂r₁₂

D(y₁–y₂)=s₁²+s₂²–2s₁s₂r₁₂.

Из этих выражений видно, что если корреляция между y₁ и y₂ равна нулю, то дисперсия суммы двух случайных переменных равна дисперсии их разности. Если корреляция между ними положительная, то дисперсия их суммы больше дисперсии их разности, а если отрицательная, то дисперсия их суммы меньше дисперсии их разности.

Отсутствие корреляции случайных переменных

Рассмотрим статистику (y), являющуюся линейной комбинацией n случайных переменных у₁, у₂, ..., у_n,

y=a₁y₁+a₂y₂+...+a_ny_n

и допустим, что каждая из переменных не коррелирована с остальными. Тогда дисперсия линейной комбинации некоррелированных случайных переменных имеет вид

D(y)=a₁²s₁²+a₂²s₂²+...+a_n²s_n². (1.9.3)

Если в добавление к предыдущему все дисперсии равны s², то математическое ожидание линейной комбинации случайных переменных остаётся как прежде Е(y)=, а её дисперсия принимает вид D(y)=(a₁²+a₂²+...+a_n²)s².

Дисперсия усреднённого выборки

Так как усреднённое п значений случайных переменных находится по формуле

==у₁+у₂+...+у_n,

то это усреднённое является линейной комбинацией наблюдений случайных переменных со всеми а=1/n. Тогда, при допущении Е()=y, дисперсия усреднённого , как и дисперсия линейной комбинации некоррелированных случайных переменных, находится в виде

D()=(++...+)s²=ns²/n²=s²/n. (1.9.4)

Если случайная выборка наблюдений осуществляется так, что их ошибки распределены независимо и одинаково, то выборочное усреднённое принимает значения около среднего y популяции с дисперсией s²/n. Таким образом, математическое ожидание усреднённого выборки и его дисперсия определяются выражениями

Е()=y и D()=s²/n.

Однако когда ошибки наблюдений зависимы, то есть коррелированы, то выражение для дисперсии усреднённого содержит фактор G, который зависит от степени их корреляции, то есть D()=Gs²/n. Для независимых данных наблюдений G=1, но для автокоррелированных данных G может очень сильно отличаться от этого значения. Например, если число наблюдений n=10 и только расположенные рядом наблюдения были бы автокоррелированы, то для положительно автокоррелированных наблюдений фактор G может возрасти до 1,9, а для отрицательно коррелированных наблюдений он может уменьшиться до 0,1. Поэтому различные степени отставания автокорреляции могут изменить D() в 19 раз! Пренебрегать обстоятельствами такого рода непростительно.

Дисперсия усреднённого автокоррелированных наблюдений

Как показано выше, статистика у= имеет математическое ожидание (среднее)

Е(у)=

и дисперсию

D(у)=+2.

Теперь допустим, что все наблюдения переменных у₁, у₂, ..., у_n имеют постоянную дисперсию s² и одно и то же отставание 1 автокорреляции r_{i, i+1}=r₁. Далее положим, что при больших, чем 1 отставаниях все корреляции нулевые. Тогда имеем

Люди также интересуются этой лекцией: ГАУТАМА.

у=n=у₁+у₂+...+у_n

и, делая необходимые подстановки, получаем

D()=Gхs²/n

где

G=.

Можно показать, что для рассматриваемого особого случая значение r₁ должно быть между –0,5 и +0,5. Следовательно, G находится между (2n–1)/n и 1/n. Отсюда для n=10 значение G находится между 1,9 и 0,1 (диапазон в 19). Поэтому для осуществляемых последовательно наблюдений зависимость последовательности является почти очевидной. Следовательно, игнорирование этого может привести к плохим последствиям.

Поделитесь ссылкой:

Среднее и дисперсия линейной комбинации наблюдений

Рекомендуемые материалы

Рекомендуемые лекции