Болч К._ Хуань К.Дж. - Многомерные статистические методы для экономики (1185342), страница 31
Текст из файла (страница 31)
Следовательно, коэффициент детерминации равен отношению линейно-объясненной вар~ац~и к обшей вариации, т. е. К Х»»» А:1'..)' К л» (6.8) Х;» (У'ц — 1'..)' »=1 3 Если обе части (6.6) разделить на общую вариацию, то после поеобразований будем иметь К ,Х ч (у'» — у'»Р яз»2 К и» Ж Х 0'».» — Р-)' з»»=1 Таким образом, отношение Р из (6.7) можно представить как (ч' — "И~ — 4 (1 — т~~)/(и — К) с К вЂ” 2 и п —,К степенями свободы.
Обозначим правое слагаемое в (6.9) через В', т. е. К У вЂ” к;)' у» 1 (6.10) (6.1 1) (6.12) 203 к и» '~~1 ~~~~ (у .. у ) 3 11 $ Этот член представляет собой отношение вариации ошибки спецификации к общей вариации и, будучи отношением сумм квадратов, является всегда неотрицательным. Заметим, что В~ =- "~ аР:0 и, следовательно, В' характеризует ошибку, вызванную линейной спецификацией регрессии, которая в действительности иелинейна. Из соотношения (6.12) ясно, что отношение детерминации всегда больше коэффициента детерминации или равно ему (т.
е. О < г' т)а 1). Аналогична в генеральной совокупности О .с. р" ." Ч' ~~ 1. Таким образом, коэффициент детерминации равен отношению детерминации только в том случае, когда связь между У и Х в точности линейна. Или, говоря иначе, отношение детерминации и коэффициент детерминации равны только тогда, когда линейно-объясненная вариация совпадает с общей вариацией. Рассмотренные в этом разделе критерии хорошо работают лишь при наличии нескольких наблюдений по К для каждого значения Х или же в случае до6таточно большой выборки„когда значение Х можно сгруппировать таким образом, чтобы для каждой группы оказалась по нескольку значений У.
Если эти условия не выполняются, то можно применять другой метод, который рассматривается в разделе 6.3. 6.2. ОЦЕНИВАНИЕ ПРИ ПОМОЩИ ПРОСТЫХ ПРЕОБРАЗОВАНИИ В предыдущем разделе мы пришли к выводу„что связь между себестоимостью и выпускам нелинейная, и теперь стоит задача подобрать соответствующую кривую. Предварительно рассмотрим два различных класса нелинейных ре~рессий.
К первому классу относятся регрессии, для которых возможно непосредственное применение обычного метода наименьших квадратов после выполнения над данными некоторого простого преобразования. Иногда этот класс регрессий называют существенно линейным. Второй класс регрессий, иногда называемый сущесгивеино нелинейным, не допускает применения обычного метода наименьших квадратов без той или иной аппроксимации или привлечения некоторого итерационного метода. Мы рассмотрим два метода анализа такого рода регрессий в последующих разделах'.
~ В этой главе авторы говорят о анелинейной регрессии», не оговаривая специально, ндст ли речь о нелинейности ло независимым лергменным (чему в основном посвящены разделы 6.1 — 6.3), или о нелинейности ао оцениваемым нара~ветрам (раздел 6.4 и, отчасти, 6.5). Общая запись регрессии, нелинейной по независимым переменным, имеет вид К У~="Я Ь ~р (ХД+е;„ т в1 где (~ (Х)~ — заданная система (имев~нных) функпий от векторной переменной я., в Ь„, — неизвестные параметры (частный случай такой регрессии описан далее в виде полиномиальной регрессии).
Читатель легко убедится, что такая анелинейность» не доставляет особых хлопот, так как легко сводится к линейной регрессии вида (6.13а). Основные же вычислительные неприятности возникают при рассмотрении регрессионных зависимостей, нелинейных относительно оцениваемых параметров. Соответственно главное назначение преобразований, выполняемых с исходными данными, именно в лннеаризацин рассматриваемых зависимостей по оцениваемым параметрам (см.
об этом, например, в книге А й в а з я н С. А. Статистическое исследование зависимостей. М., Металлургия, $968, глава УИ). — Примеч. ред. 2С4 где е» вЂ” случайный остаток. Если перейти к логарифмам и обозначить; У» 1п У»; ХЬ=1пХц, й Х~к» = 1п Хко то уравнение (6.15) можно будет записать в линейной форме: У» — -Ь+~~ХЬ+" +~ко»+е».
А = ехр (Ца). (6.16) Однако можно показать, что вычисляемое таким образом значение А является смещенной вверх оценкой А. Улучшения оценки А можно достигнуть путем коррекции этого смещения за счет использованияа где з~ — оценка дисперсии ~„-полученная из (6.15а). Кроме того, поскольку 1'» = 1п У'», то, казалось бы, естественно считать Ф У»=ехр(У7) = АХ~у Х~у ... Х~к з А — аснмнтотнчески несмещенная оценка А. Точнуа несмещенну»о оцен-' ку можно найти в 1421. Рааннца между точной.,оценкой н оценкой (6.16а) на практике обычно мала. где ра = 1п Л и а» = 1п н»„Тотфакт, что(6.15) оказывается возможным записать в линейной форме, взяв логарифмы всех переменных, и приводит к названию,»»огарифмически Линейная регрессия.
Если предположить, что е» (но не е») ведет себя в соответствии с условиями, наложенными в главе 4, то остаются в силе методы этой главы. И в этом случае можно воспользоваться программой из приложения к главе 4, если вводить вместо исходных данных нх логариф« мы. Возможная трудность, связанная с применением логарифмически линейной регрессии, заключается втом, что все исходные наблюдения должны быть положительны, так как логарифм неположительного числа не определен. В экономике это ограничение обычно малосущественно, так как в зкономической практике большинство рядов (цены, количества, значения показателей и т. д.) пол~ж~тел~ны. Оценки наименьших квадратов Ц,, ..., ~к, вычисляемые для уравнения (6.15а), будут несмещенными оценками параметров из (6.15).
Поскольку ра = 1п А, то А = ехр (ра), и может показаться, что мы сможем оценить А простым вычислением величины Оценивание параметров. Пусть матрицы наблюдений завщимых н независимых переменных, подвергнутых степенному преобразованию, имеют вид 1~(х) '1~(ц у (х) Тогда выборочное уравнение регрессии, соответствующее (6.19), для некоторого заданного Х можно записать как где р и е имеют обычный смысл. В предположении, что ошибка является нормалиюй и.
независимо распредел ниой, можно показать, что логарифм функции правдоподобия для (6.20) равен (с точностью до постоянного множителя): 1п 1.(Х) = — — л !и ~ о' (3)~ + (А — 1) ~~» 1и К, . (6.21) Здесь аЩ = е'е/и и п — число наблюдений. Следовательно„о'(Х)— оценка наибольшего правдоподобия для сР приданном Х. Меняя Хв соответствующем диапазоне, можно построить (или просмотреть иным способом) значения 1п А (Х) с целью определения максимума логарифма функции правдоподобия.
Использование найденного значения Х в (6.20) даст оценку наиболыпего правдоподобия для уравнения (6.19). В табл. 6.2 приводятся данные, которыми оперировал Л, Клейн при оценивании функции потребления в рамках модели, которая стала известна как первая модель Клейна ~62). Зададим функцию потребления в следующей форме: Уг =~о+ ~1Х(( + ~,Х~( + Ц,Хз( +а;. ЕЪ) (Х) (Х) (Х) Пользуясь данными Клейна, выберем значения Х в диапазоне от — 2,0 до +1,0, а именно мы допускаем изменения Х шагами по О,О1, начиная от нижней границы — -2,0 до верхней границы +1,О. На каждом шаге для переменных, преобразованных согласно (6,2О), выполним обычную Регрессию методом наименьших квадратов и вычислим значения 1п А(А).
Результаты вычисления 1п Х. (А) показаны на рис. 6.2 и приведены в приложении к данной главе. Видно, что максимум логарифма функции правдоподобия находится в окрестности точки Х =-- — 0,52, Таким образом регрессия, основанная на степенном преобразовании при Х = — 0,52, является оценкой наибольшего правдоподобия для (6.20). Все необходимые здесь вычисления выполняются программой в приложении к этой главе в сочстании с программой, приведенной в приложении в главе 4. Очевидно, что без применения вычислительной машины этот метод оценивании просто неосуществим. 20В $„ 1аблн ца 6.2 Данные о потреблении, доходами н ваработной плате (млрд. дол. 1934 г.) Отложенные доходы Х ~ Заработная паата Х ~ Потребление У~ Номер наблвде- нни Текущие доходы х„ Лля сравнения приведем вычисленную линейную форму функции потребления Клейна (в скобках даны стандартные ошибки): У =- 16,24+ 0,193Х, + 0,09ОХ, + 0,796Ха; к~д„, — — 0,981 (0,091) (0,091) (0,040) и оценку, полученную степенным преобразованием при Х = — 0,52: у(-0,621 0 у15 ~ 0026Л~-о,ая)+0008у~-о,аи 1 0 5 уу~ — о,аэ1.
(0,00001) (0,00001) (0,00003) ~а (1ая) = 0„98У. Надо отметить значительное уменьшение стандартных ошибок при использовании переменных, подвергнутых степенному преобразованию. Доверительный интервал для Х и проверка линейности. Обозначим значение Х, доставляющее максимум 1п Е (Х), через Х. В нашем примере Х = — 0,52. С учетом определения (3.29) мы видим, что отношение правдоподобия п1ах Ео п1ах Х, можно применить для проверки гипотез изадания доверительных пределов для Х. Сделав необходимые предположения о нормальности ошибки, мы увидим, что для больших выборок величина — 2 1п Х.' стремится к распределению ~'с одной степенью свободы. Пользуясьэтой аппрок- 3 5 6 7 8 9 )О 11 12 13 14 15 16 !7 18 19 20 21 41„9 45 0 49,2 50,6 52,6 55,1 56,2 57,3 57,8 55,0 50,9 45„6 46,5 48,7 51,3 57„7 58,7 57„5 61,6 65,0 69,7 12,1 16 9 18,4 19,4 20,1 19,6 19,8 21,1 21,7 15„6 11,4 7,0 11,2 12,3 14,0 17,6 17,3 15,3 19„0 21,1 23р 5 12,7 12,4 16,9 )8,4 19,4 20,1 19,6 19,8 21„1 21,7 15,6 11,4 7,0 11,2 12,3 14,0 17,6 17,3 15,3 19„0 21,1 28,2 32,2 37,0 37,0 38,6 40,7 41,5 42,9 45,3 42,1 39,3 34„3 34,1 36,6 39,3 44,2 47,7 45,9 49,4 53,0 61„8 симацией, можно показать, что 100(1 — к)%-ный доверительный интервал для Х можно найти нз уравнения — 2 1п Х,® = — 2 ~1п 1.
Я вЂ” 1п 1. ~ Х) ~:: Х~а; ~ (6.22) 1пЕ(Х): 1ПХ,~Х) — 1 а.,1. л Для иллюстрации вернемся к нашему примеру — здесь 1п Ь (а— =- — 0,52) м 5,96. Это значение можно найти либо на рис. 6.2, либо с помощью вычислительной программы, приведенной в приложении. Для 95о~~-ного доверительного интер- и~~Ж вала — Д,оа; ~ = 1,92. Следовательно, 1 Е,О согласно (6.22) 1п Е Щ 4„04.