В.П. Носко - Эконометрика для начинающих (1160539), страница 9
Текст из файла (страница 9)
К окончанию срокапребывания у власти Линдона Джонсона темп инфляции началстремительновозрастать,чтопотребовалосменыэкономической политики.Соответственно, наблюдать кривые Филлипса в указанномвиде удается только на краткосрочных интервалах.1.12. ЛИНЕЙНЫЕ МОДЕЛИ С НЕСКОЛЬКИМИОБЪЯСНЯЮЩИМИ ПЕРЕМЕННЫМИРассмотрим статистические данные о потреблениитекстиля (текстильных изделий) в Голландии в период междудвумя мировыми войнами с 1923 по 1939 годы. В приведеннойниже таблице T — реальное потребление текстиля на душунаселения, DPI — реальный располагаемый доход на душу23населения, P — относительная цена текстиля.
Все показателивыражены в индексной форме, в процентах к 1925 году.Год192319241925192619271928192919301931T99.299.0100.0111.6122.2117.6121.1136.0154.2DPI96.798.1100.0104.9104.9109.5110.8112.3109.3p101.0100.1100.090.686.589.790.682.870.1Год19321933193419351936193719381939T153.6158.5140.6136.2168.0154.3149.0165.5DPI105.3101.795.496.497.6102.4101.6103.8p65.461.362.563.652.659.759.561.3Для объяснения изменчивости потребления текстиля вуказанном периоде мы можем привлечь в качествеобъясняющей переменной как располагаемый доход DPI, так иотносительную цену на текстильные изделия P. Если исходитьиз предположения о постоянстве эластичностей потреблениятекстиля по доходу и цене, то тогда следует подбиратьлинейные модели для логарифмов индексов, а не для самихиндексов. Подбор таких моделей методом наименьшихквадратовприводиткследующимрезультатам(использовались десятичные логарифмы):lg T = 1442.+ 0.348 ⋅ lg DPI , R 2 = 0.0096,ESS = 0.000959, RSS = 0.099185, TSS = 0100144., R 2 = 0.0096;lg T = 3.564 − 0.770 ⋅ lg P , R 2 = 0.8760,ESS = 0.087729, RSS = 0.012415, TSS = 0100144., R 2 = 0.8760.Втораямодель,несомненно,лучшеописываетнаблюдаемую динамику потребления текстиля.
Однако,естественно возникает вопрос о том, нельзя ли для объяснения24изменчивости переменной Т использовать одновременно ирасполагаемый доход и относительную цену текстиля,улучшит ли это объяснение изменчивости потреблениятекстиля.Чтобыпривлечьдляобъясненияизменчивостипотребления текстиля обе переменные DPI и T, мырассматриваем модель линейной связи логарифмов этихвеличинlg T = α + β ⋅ lg DPI + γ ⋅ lg Pи соответствующую ей модель наблюденийlg Ti = α + β ⋅ lg DPI i + γ ⋅ lg Pi + ε i , i = 1,K , n.Оценки параметров α , β , γ можно опять находить методомнаименьших квадратов, путем минимизации по всемвозможным значениям α , β , γ суммы квадратовnQ(α , β , γ ) = ∑ (lg Ti − α − β lgDPI i − γ lg Pi ) .2i =1Минимум этой суммы достигается на некотором набореα = α$ , β = β$ , γ = γ$ , так чтоQ(α$ , β$ , γ$ ) = min Q(α , β , γ ) .α ,β ,γЭто минимальное значение мы опять обозначаемn(RSS = ∑ lg Ti − α$ − β$ lgDPI i − γ$ lg Pii =1)2и называем остаточной суммой квадратов.Коэффициент детерминации R 2 определяется, как и вмодели связи между двумя переменными:RSSR2 = 1−.TSSЗдесь25n(TSS = ∑ lg Ti − lg Ti =1)2,2∧RSS = ∑ lg Ti − lg Ti ,i =1nгдеlg T =n1n∑ lg T ,ii =1∧lg Ti = α$ + β$ ⋅ lg DPI i + γ$ ⋅ lg Pi , i = 1,K , n.При этом,TSS = RSS + ESS ,где2∧ESS = ∑ lg Ti − lg T ,i =1nтак чтоESSR2 =TSS(и опять, разложение TSS = RSS + ESS справедливо толькопри включении постоянной составляющей α в правую частьсоотношения, определяющего линейную модель связи).
Приэтом такжеR2 = r 2 ∧ ,lg T ,lg Tт. е. коффициент детерминации R 2 равен квадрату(обычного) выборочного коэффициента корреляции между∧переменными lg T и lg T .Разностиei = y i − y$ i26называются остатками.По поводу получения явных выражений для оценокнаименьших квадратов мы поговорим несколько позднее, асейчас просто приведем результаты оценивания для нашегопримера:lg T = 1374.+ 1143. ⋅ lg DPI − 0.829 ⋅ lg P ,ESS = 0.097577 , RSS = 0.02567 , R 2 = 0.9744.Мы видим, что в результате привлечения для объясненияизменчивости потребления текстиля сразу двух показателейDPI и P произошло заметное увеличение коэффициентадетерминации по сравнению с лучшей из двух моделей,использовавших только один показатель — от значения0.8760 до значения 0.9744 .Коэффициент 1143.в подобранной модели связиинтерпретируется здесь как эластичность потреблениятекстиляподоходупринеизменномзначенииотносительной цены P на текстиль, а коэффициент−0.829 — как эластичность потребления текстиля поотносительным ценам при неизменном уровне дохода.
Такиезначения коэффициентов говорят в пользу того, чтопотребление текстиля эластично по доходам и неэластично поценам. Вопрос о том, в какой степени можно доверятьподобным заключениям, мы рассмотрим далее в контекстевероятностных моделей.27ЧАСТЬ 2. СТАТИСТИЧЕСКИЕ ВЫВОДЫ ПРИСТАНДАРТНЫХ ПРЕДПОЛОЖЕНИЯХО ВЕРОЯТНОСТНОЙ СТРУКТУРЕ ОШИБОК ВЛИНЕЙНОЙ МОДЕЛИ НАБЛЮДЕНИЙ2.1. ВЕРОЯТНОСТНОЕ МОДЕЛИРОВАНИЕ ОШИБОКМы уже неоднократно сталкивались с вопросом о том,сколь существенно величина коэффициента корреляции(детерминации) должна отличаться от нуля, чтобы можнобыло говорить о действительно существующей линейной связимежду исследуемыми переменными.Если оцененное значение эластичности потреблениянекоторого товара оказалось несколько больше единицы, товозникает вопрос о том, сколь надежным является заключениео том, что потребление этого товара эластично по ценам.Если мы будем использовать подобранную прямуюy = α$ + β$ xдля прогнозирования значений yi для новых наблюденийxi , t= n+1,...,n +k, то сколь надежными будут такие прогнозы?Если у нас нет теоретических (экономических) основанийдля выбора между моделью в уровнях переменных и модельюв логарифмах уровней, то как выбрать одну из этих моделей наосновании одних только наблюдений?Ответы на эти и другие подобные вопросы невозможны,если мы не сделаем некоторых более или менее подробныхпредположений о структуре последовательности ошибокε 1 ,K , ε n , участвующих в определении модели наблюденийyi = α + β xi + ε i , i = 1, K , n .Базовая,инаиболеепростаямодельдляпоследовательности ε 1 ,K , ε n предполагает, что ε 1 ,K , ε n —независимые случайные величины, имеющие одинаковоераспределение (i.
i. d. — independent, identically distributedrandom variables).Для нас (пока!) достаточно представлять случайнуювеличину Z как переменную величину, такую, что донаблюдения ее значения невозможно предсказать это значениеабсолютно точно, и, в то же время, для любого z , −∞ ≤ z ≤ ∞ ,определена вероятностьF ( z ) = P{Z ≤ z}того, что наблюдаемое значение переменной Z непревзойдет z ; 0 ≤ F ( z) ≤ 1 . Функция F ( z) , − ∞ ≤ z ≤ ∞ ,называется функцией распределения случайной величины Z(c. d. f.
— cumulative distribution function).Говоря об ошибках ε 1 ,K , ε n как о случайных величинах,мы, соответственно, понимаем указанную линейную модельнаблюдений таким образом, чтоа) существует (теоретическая, объективная или в видетенденции) линейная зависимость значений переменной y отзначений переменной x с вполне определенными, хотяобычно и не известными исследователю, значениямипараметров α и β ;б) эта линейная связь для реальных статистических данныхне является строгой: наблюдаемые значения yi переменной yотклоняются от значений ~yi , указываемых моделью линейнойсвязи~yi = α + β xi , i = 1, K , n ;4в) при заданных (известных) значениях xi конкретныезначения отклоненийε i = yi − ~y i , i = 1, K , n ,не могут быть точно предсказаны до наблюдения значенийyi даже если значения параметров α и β известны точно;г)длякаждогоz , −∞≤ z≤∞,определенавероятность F ( z) того, что наблюдаемое значение отклоненияε i не превзойдет z , причем эта вероятность не зависит отномера наблюдения;д) вероятность того, что наблюдаемое значениеотклонения ε i в i-м наблюдении не превзойдет z , не зависитот того, какие именно значения принимают отклонения востальных n − 1 наблюдениях.В дальнейшем, говоря о той или иной случайной величинеZ , мы будем предполагать существование функцииp( z) , − ∞ ≤ z ≤ ∞ , принимающей только неотрицательныезначения и такой, что1) площадь под кривойv = p( z )в прямоугольной системе координат zOv (точнее,площадь, ограниченная сверху этой кривой и снизу —горизонтальной осью Oz ) равна 1 ,2) для любой пары значений z1 , z2 с z1 < z2 , вероятностьP{z1 < Z ≤ z 2 }численно равна площади, ограниченной снизу осью Oz ,сверху — кривой v = p ( z ) , слева — вертикальной прямойz = z1 , справа — вертикальной прямой z = z2 (т.