В.П. Носко - Эконометрика для начинающих (1160539), страница 11
Текст из файла (страница 11)
Если некоторая случайная величина Y имеетплотность распределения, заданную последним соотношением,то говорят, что случайная величина Y имеет нормальноераспределение с параметрами µ и σ2. Распределение такойслучайной величины симметрично относительно своегосреднего значения µ. Максимальное значение функцииплотности этой случайной величины достигается при y = µ .Таким образом, строго говоря, гауссовское распределение— это нормальное распределение с нулевым среднимзначением. Однако, в современной научной литературетерминынормальноераспределениеигауссовскоераспределение используются как синонимы: нормальноераспределение с параметрами µ и σ2 называют такжегауссовским распределением с параметрами µ и σ2.Важнейшаярольпредположенияонормальном(гауссовском) распределении ошибок в линейной моделинаблюденийyi = α + β xi + ε i , i = 1,K , n ,определяется тем обстоятельством, что при добавлениитакого предположения к стандартному предположению о том,что ошибки ε 1 ,K , ε n — независимые случайные величины,имеющие одинаковое распределение, можно легко найти14точный вид распределения оценок наименьших квадратов длянеизвестных значений параметров модели.Вспомним, в этой связи, полученное ранее выражениеnCov ( y , x )β$ ==Var ( x )∑(yii =1− y )( xi − x )n∑(xii =1− x).2Обозначаяx −xwi = n i,2∑ ( xi − x )i =1мы можем записать выражение для β$ в видеnnnβ$ = ∑ wi ( yi − y ) = ∑ wi yi − y ∑ wii =1i =1i =1nnnni =1i =1i =1i =1= ∑ wi yi − w ∑ yi = ∑ ( wi − w )yi = ∑ ci yi ,гдеci = wi − w .Таким образом,nβ$ = ∑ ci yi ,i =1где c1 ,K , cn — фиксированные величины, а y1 ,K , y n —наблюдаемые значения случайных величин Y1 ,K , Yn .
Поэтомувычисленное по последней формуле значение β$ являетсянаблюдаемым значением случайной величиныnβ$ = ∑ ci Yi ,i =115которая является линейной комбинацией случайныхвеличин Y1 ,K , Yn и имеет некоторое распределениевероятностей, зависящее от распределения последних.В общем случае, аналитическое описание распределения β$как случайной величины довольно затруднительно. Болеепросто эта задача решается в ситуации, когда ε i имеетгауссовское распределение. Если ошибкиε 1 ,K , ε n независимые случайные величины, имеющие одинаковоенормальное распределение с нулевым средним, то тогдаоценка наименьших квадратов β$ параметра β также имеетнормальное распределение.
Чтобы указать параметры этогонормального распределения и иметь возможность проводитьстатистический анализ подобранной модели линейной связимежду переменными факторами, нам придется уделитьвнимание некоторым важным числовым характеристикамслучайных величин и их свойствам.2.3. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХВЕЛИЧИН И ИХ СВОЙСТВАСлучайные величины, с которыми мы имеем дело в данномкурсе, полностью определяются заданием их функцииплотности, указывающей на зоны более вероятных и менеевероятных значений случайной величины.
Часто, однако,интересуютсяболеесжатымихарактеристикамираспределений случайных величин, выраженными отдельнымичислами. К таким характеристикам, в первую очередь,относятся математическое ожидание и дисперсияслучайной величины.Пусть случайная величина X имеет функцию плотностиp( x ) . График функции p( x ) ограничивает вместе с осью16абсцисс Ox полосу переменной ширины.
Если рассматриватьэту полосу как материальный объект определенной(постоянной) толщины, изготовленный из однородногоматериала и имеющий массу, равную единице, то абсциссацентра тяжести этого материального объекта называетсяматематическим ожиданием (expectation) случайнойвеличины X, обозначается E (X) и вычисляется по формулеE( X ) =∞∫ x p( x )dx .−∞Еслиграфикфункцииплотностисимметриченотносительно оси ординат (так что p( x ) — четная функция),то E ( X ) = 0 .Довольно часто о E ( X ) говорят как о среднем значениислучайной величины X. Это связано с тем, что если X 1 ,K , X n— независимые копии случайной величины X (т. е.случайные величины X 1 ,K , X n независимы в совокупности иимеют то же распределение, что и X ), то тогда при большихn для наблюдаемых значений x1 ,K , x n случайных величинX 1 ,K , X n имеет место приближенное равенство1n( x1 +K+ xn ) ≅ E ( X ) ,тем более точное, чем больше значение n .
Инымисловами, с увеличением n значение E ( X ) сколь угодно точноприближаетсязначениемсреднеарифметическогонаблюдаемых величин x1 ,K , x n .Обратимся опять к упомянутому ранее гауссовскому(нормальному) распределению с функцией плотности1− x 2 ( 2σ 2 )p( x ) =eσ 2π17и пусть случайная величина X 1 имеет такое распределениес σ = 1, а случайная величина X 2 имеет такое распределение сσ = 2 . Сравним графики соответствующих функцийплотности (сплошной линией представлен график функцииплотности случайной величины X 1 ):0.50.40.3P_1P_20.20.10.0-4-2024XПоскольку в обоих случаях графики симметричныотносительно нуля, тоE( X1) = E( X 2 ) = 0 ,т. е.
математические ожидания случайных величин X 1 иX 2 совпадают. Однако, распределение случайной величиныX 2 более рассредоточено, и это означает, что для любогоa>0P{ X 1 > a} < P{ X 2 > a} .При этом говорят, что распределение случайнойвеличины X 2 имеет более тяжелые (heavy), или болеедлинные (long) хвосты (tails). Соответственно,P{ X 1 ≤ a} = 1 − P{ X 1 > a} > 1 − P{ X 2 > a} = P{ X 2 ≤ a} .В рассмотренном случае в качестве числовойхарактеристики степени рассредоточенности распределенияможно было бы принять параметр σ : чем больше значение18этого параметра, тем более рассредоточено распределение. Вобщем случае, сравнивать степени рассредоточенностираспределений случайных величин можно, привлекая для этойцели понятие дисперсии.Дисперсией (variance) случайной величины X называютчислоD( X ) = E ( X − E ( X )) 2 ,равное математическому ожиданию квадрата отклоненияслучайной величины X от ее математического ожидания E ( X ) .1Зная функцию плотности p( x ) случайной величины X ,дисперсию этой случайной величины можно вычислить поформулеD( X ) =∞∫ ( x − E ( X ))2p( x )dx .−∞Таким образом, математическое ожидание E ( X ) можноинтерпретировать как взвешенное среднее возможныхзначенийxслучайной величиныX , с весами,пропорциональнымиp( x ) , а дисперсию D( X ) — каквзвешенное среднее (с теми же весами) квадратов отклоненийвозможных значений x случайной величины X от еематематического ожидания.Если случайная величинаXимеет нормальноераспределение с функцией плотности21− ( x − µ ) ( 2σ 2 )p( x ) =e,σ 2πто для нее1В литературе по эконометрике математическое ожидание случайнойвеличины X обозначают иногда символом M(X), а для дисперсиислучайной величины X используют также обозначения Var(X) и V(X).19E ( X ) = µ , D( X ) = σ 2 .Таким образом, случайная величина, имеющая нормальноераспределение, полностью определяется (в отношении еераспределения) заданием значений ее математическогоожидания и дисперсии.В связи с частым использованием нормальнораспределенных случайных величин в дальнейшем изложении,мы будем обозначать нормальное распределение, имеющеематематическое ожидание µ и дисперсию σ 2 , символомN ( µ , σ 2 ) .
В случае, когда µ = 0 , σ 2 = 1 , говорят остандартном нормальном распределении N (0,1) . Имеютсявесьма подробные таблицы значений функции распределенияифункцииплотностистандартногонормальногораспределения.Для дальнейшего нам, в первую очередь, понадобятсяследующие простые свойства математического ожиданияи дисперсии.Если a - некоторая постоянная, отличная от нуля, а X некоторая случайная величина, то тогда сумма X + a ипроизведение aX также являются случайными величинами;при этом,E ( X + a ) = E ( X ) + a D( X + a ) = D( X )E(aX ) = aE ( X )D(aX ) = a 2 D( X ).Два свойства, касающиеся математического ожидания,непосредственно следуют из определения математическогоожидания.
При выводе первого из них учитываем, что посамому определению функции плотности распределения,∞∫ p( x)dx = 1 .−∞20Из этих двух свойств математического ожидания легкополучаем указанные два свойства дисперсии. Действительно,D( X + a ) = E ( ( X + a ) − E ( X + a ) )2= E ( X + a − E ( X ) − a ) 2 = E ( X − E ( X )) 2 = D( X ) ,D(aX ) = E ( aX − E ( aX )) = E ( aX − aE ( X ))2(= E a 2 ( X − E ( X ))22) = a E ( X − E ( X ))22= a 2 D( X ) .Таким образом, изменение случайной величины нанекоторую постоянную вызывает такое же изменениематематического ожидания, но не отражается на дисперсии.Изменение случайной величины в a раз приводит к такому жеизменению математического ожидания и изменяет значениедисперсии в a 2 раз.В применении к линейной модели наблюденийyi = α + β xi + ε i , i = 1,K , n,с фиксированными x1 ,K , x n и взаимно независимымигауссовскими ошибками ε 1 ,K , ε n , мы имеем:ε i ∼ N (0, σ 2 ) ⇒ Yi = α + β xi + ε i ∼ N (α + β xi , σ 2 ) .Соответственно,E (ε i ) = 0, D(ε i ) = σ 2 ; E (Yi ) = α + β xi , D(ε i ) = σ 2 .Заметим, наконец, что есливеличины и Z = Z1 +K+ Z n , тоZ 1 ,K , Z n— случайныеE ( Z ) = E ( Z1 ) +K+ E ( Z n )иеслислучайныенекоррелированы, т.
е.()((величины Z1 ,K , Z n)попарно)Cov Z j , Z k = E Z j − E ( Z j ) ( Z k − E ( Z k )) = 0 ,21то тогдаD( Z ) = D( Z1 ) +K+ D( Z n ).В применении к последней линейной модели наблюденийэто означает, что рассматриваемая как случайная величинаоценка наименьших квадратов β$ , которую мы представилиранее в видеnβ$ = ∑ ci Yi ,i =1гдеci = wi − w ,x −xwi = n i,2∑ ( xi − x )i =1так что c1 ,K , cn — фиксированные величины, имеетнормальное распределение с математическим ожиданиемnE (β$ ) = ∑ ci E (Yi )i =1и дисперсиейnD(β$ ) = ∑ ci2 D(Yi ) .i =12.4.
НОРМАЛЬНЫЕ ЛИНЕЙНЫЕ МОДЕЛИ СНЕСКОЛЬКИМИ ОБЪЯСНЯЮЩИМИ ПЕРЕМЕННЫМИНачиная с этого момента, мы будем предполагать, что(1) Модель наблюдений имеет видyi = θ 1 xi1 +K+θ p xip + ε i , i = 1,K , n, n ≥ p,гдеyi наблюдении;22значение объясняемой переменной в i -мxi j -известноезначение j -ойпеременной в i -м наблюдении;θjнеизвестныйобъясняющейкоэффициентпри j -ойобъясняющей переменной;εj случайная составляющая (“ошибка“) в i -мнаблюдении.(2) ε 1 ,K , ε n - случайные величины, независимые всовокупности,имеющиеодинаковоенормальное2распределениеN (0,σ ) с нулевым математическиможиданием и дисперсией σ 2 > 0.(3)Если не оговорено противное, то в числообъясняющихпеременныхвключаетсяпеременная,тождественно равная единице, которая объявляется первойобъясняющей переменной, так чтоxi1 ≡ 1, i = 1,K , n.При сделанных предположениях y1 ,K , y nявляютсянаблюдаемыми значенияминормально распределенныхслучайных величин Y1 ,K , Yn , которые независимы всовокупности и для которыхE (Yi ) = θ 1 xi1 +K+θ p xip ,D(Yi ) = σ 2 ,так чтоYi ∼ N (θ 1 xi1 +K+θ p xip , σ 2 ), i = 1,K , n.В отличие от ε 1 ,K , ε n , случайные величины Y1 ,K , Ynимеют распределения, отличающиеся сдвигами.Определенную указанным образом модель наблюдений мыбудем называтьнормальной линейной моделью сpобъясняющими переменными.