С.С. Валландер - Лекции по статистике и эконометрике (1160549), страница 22
Текст из файла (страница 22)
В случае критерияКолмогорова предельное распределение меняется более сложнымобразом. Проконтролировать это изменение весьма трудно.Перейдем теперь к доказательству теоремы 1, которое представляетсявесьма поучительным, поскольку объясняет само существованиенепараметрических критериев.В основе доказательства лежит простое утверждение, сводящее,в некотором смысле, рассуждения с произвольным непрерывнымраспределением к аналогичным рассуждениям с равномернымраспределением.1Отметим впрочем, что имеются красивые связи этого утверждения с теорией слабой сходимостимер в функциональных пространствах.Проверка статистических гипотез131Лемма.
Пусть X — случайная величина с непрерывной функциейраспределения F . Тогда случайная величина F (X) равномернораспределена на h0, 1i.Доказательство леммы. Предположим сначала, что F (x) строговозрастает в области {x : 0 < F (x) < 1}. Тогда существует обратнаяфункция F −1 , определенная на h0, 1i. С ее помощью получаем (0 < y <1):P(F (X) < y) = P(X < F −1 (y)) = F (F −1 (y)) = y.Мы получили функцию распределения равномерного закона на h0, 1iи лемма доказана. Если же F не является строго монотонной, следуетрассмотреть "обобщенную обратную"функцию F −1, такую, чтообобщ.−1F (Fобобщ.(y)) = y, y ∈]0, 1[,и повторить с ней то же рассуждение. Мы опустим техническиеподробности конструкции такой обобщенной обратной функции.Доказательство теоремы 1. Положим Yi = F (Xi ), i =1, .
. . , N . Тогда Y1 , . . . , YN — выборка, имеющая равномерное на h0, 1iраспределение. Пусть G∗N (y) — ее эмпирическая функция распределения.Докажем, что (с вероятностью единица)FN∗ (x) = G∗N (F (x)).(4.8)Xi < x ⇐⇒ Yi < F (x).(4.9)Действительно,Поэтому количество наблюдений, меньших x, в первой выборкесовпадает с количеством наблюдений, меньших F (x), во второй выборке.Для читателей, стремящихся к полной точности, отметим, что если Fне является строго возрастающей, то события из формулы (4.9) могутне совпадать, однако в любом случае "неразличимы— отличаются насобытие нулевой вероятности.Соотношение (4.8) позволяет сделать вывод, что отклоненияDN = sup |FN∗ (x) − F (x)|xиYDN= sup |G∗N (y) − y|yсовпадают (с вероятностью 1). Действительно, замена переменной y =YF (x) переводит DN в DN.132Глава 4Окончательно получаем, √что распределение величины DN(а также, разумеется, иN DN ) для произвольной выборки,имеющей непрерывное распределение F , совпадает с распределениеманалогичной величины для равномерно распределенной выборки.
Внашем рассуждении равномерно распределенная выборка строиласьспециальным образом, поэтому мы получили более сильное утверждениеY— совпадение самих величин DN и DN, а не совпадение ихраспределений. Теорема 1 доказана.Отметим, что явный вид распределения KN нам не потребовался. Этораспределение некоторым не очень простым, но вполне определеннымобразом конструируется из равномерного (см. [1]).
Для предельногораспределения K, которое затабулировано во всех справочниках, явныйвид также известен:K(z) =∞X(−1)k e−2k2 2z, z > 0,k=−∞хотя требуется лишь в очень редких случаях.4.10Другие непараметрические критерииВ заключительном параграфе этой главы мы перечислим еще нескольконепараметрических критериев. В основном, это делается для того, чтобыкритерий Колмогорова не представлялся чем-то исключительным.Критерий омега-квадрат Мизеса-Смирнова для простойгипотезы H0 = {F = F 0 }.Этот тест несколько напоминает колмогоровский, он основан надругом функционале, измеряющем расхождение эмпирического итеоретического распределенийZ ∞2ωN = N[FN∗ (x) − F (x)]2 dF (x).(4.10)−∞2Аналогично теореме 9.1 проверяется, что распределение величины ωNуниверсально (в классе непрерывных F ).
Доказано, что при N → ∞ этиуниверсальные распределения слабо сходятся к некоторому предельномураспределению Ω. Тест омега-квадрат использует это распределение Ω,2,0как асимптотический шаблон: гипотеза H0 отвергается, если ωN> zε .2,0Здесь zε находится по таблицам распределения Ω, а ωN — величина,аналогичная (4.10), которая получается заменой F на F 0 .Проверка статистических гипотез133Критерий Колмогорова-Смирнова для проверки однородности.Рассматриваетсязадачасравнениядвухтеоретическихраспределений (ср. с критерием знаков в параграфе 3.5).
Имеютсядве независимые между собой выборки: X1 , . . . , XN с непрерывнымтеоретическим распределением F и Y1 , . . . , YN 0 с непрерывнымтеоретическим распределением G. Основная (очевидно, сложная)гипотеза имеет вид H0 = {F = G}. Для ее проверки предлагаетсяиспользовать расхождение между двумя эмпирическими функциямираспределения:DN,N 0 = sup |FN∗ (x) − G∗N 0 (x)|xили+∗∗DN,N0 = sup[FN (x) − GN 0 (x)].xАналогично теореме 9.1 доказывается, что, в предположении+справедливости H0 , распределение величины DN,N 0 (а также DN,N0)0универсально. Кроме того, можно доказать, что при N, N → ∞универсальные распределения величинrNN0DN,N 0N + N0сходятся к распределению Колмогорова K.
На этих результатах основантест Колмогорова-Смирнова, процедура которого вполне аналогичнапроцедурам тестов Колмогорова и омега-квадрат. Она использует Kв качестве асимптотического шаблона. Можно также доказать, чтоуниверсальные распределения величинrNN0+DN,N00N +Nслабо сходятся к распределению с плотностью2p(z) = 4ze−2z , z > 0.Этот результат дает еще один тест проверки однородности.В учебниках по математической статистике ([8], [1], [2] и др.)можно найти много других критериев (как параметрических, так инепараметрических).134Глава 4Глава 5Эконометрика и статистикаЧитатель, впервые открывающий учебник по эконометрике, видимо,прежде всего замечает обилие статистической терминологии.
Здесь ипараметры, которые надлежит оценивать, и гипотезы, которые следуетпроверять, и доверительные интервалы, и корреляция, и прочее, ипрочее, и прочее . . . . Лишь постепенно ему становится ясно, чтоэконометрика — это нечто бо́льшее, чем приложения статистическихметодов к экономическим задачам (хотя и это также имеет место).По-настоящему прочувствовать отличие от статистики можно лишьв процессе изучения эконометрики. В этой главе мы только намечаемнекоторые узловые моменты, отсылая интересующихся читателей кдругим источникам.Довольно нестандартное, хотя отчасти субъективное, описаниепредмета эконометрики можно найти в [9].В книге [22] дано детально структурированное описаниеэконометрического исследования.В [15] традиционная эконометрическая методология сравнивается ссовременными подходами.
Приведены интересные цитаты, выражающиеточки зрения известных специалистов.Большой интерес представляет книга [21], написанная одним изкрупнейших современных эконометристов.5.1Специфика моделей и эмпирических данных вэкономикеКаждое эконометрическое исследование проводится в рамках некотороймодели — умозрительной конструкции, выделяющей главные,существенные стороны интересующего исследователя фрагмента135136Глава 5окружающего экономического мира и отбрасывающей те, которыепредставляются незначимыми. В процессе исследования модель можетпретерпевать определенные изменения. Взаимоотношения модели имоделируемого явления могут быть довольно деликатными, и частоименно в них кроется успех (или неудача) исследования.
Язык описаниямодели чаще всего — математика.Экономическая наука, как одна из наук о человеческом обществе,обладает рядом особенностей, отличающих ее от многих других областейприменения математических методов (в частности, от физики, где такиеметоды развиты в наибольшей степени).Прежде всего следует отметить, что в экономических исследованияхпрактически нет места активному эксперименту. Если, скажем, физикэкспериментатор сам создает условия для проведения опыта — готовитаппаратуру, приводит в нужное состояние изучаемую субстанцию и т.д.,а физик-теоретик старается объяснить или предсказать результат такогоцеленаправленного эксперимента, то экономист-исследователь на первомэтапе лишь наблюдает за ходом событий и фиксирует происходящее.Последующие задачи, конечно, будут, как и в любой другой науке,стандартными — объяснить и предсказать.Далее, человек, как существо, обладающее сознанием, способен втой или иной степени влиять на общественные процессы (неважно,опираясь на экономическую теорию, вопреки ей или же вне связи сней).
Некоторые стороны подобного влияния можно условно обозначитькак "политические"факторы — бо́льшая часть экономических иэконометрических моделей рассматривает их как заданные извне —экзогенно. В других ситуациях возникают так называемые коллективныеэффекты (термин часто используется и в физике). Первый и наиболееизвестный пример такого эффекта в экономической сфере — "теорема оневидимой руке"Адама Смита.Коллективные эффекты постоянно в той или иной формепроявляются в эконометрике.
Обычно это выражается в присутствиистохастических характеристик (подробнее см. ниже). Заметим,впрочем, что это далеко не единственная причина их появления. Здесьследует отметить одну важную особенность. Статистические методы,развивавшиеся в течение многих десятилетий, начиная со второйполовины XIX века (кинетическая теория газов Людвига Больцмана),были ориентированы на использование именно в физике, где масштабы"коллективности"явлений выражаются огромными числами — изЭконометрика и статистика137школьного курса физики известно так называемое число Авогадро:6 · 1023 молекул в одном моле вещества. Соответственно, и физическиезакономерности выполняются с большой точностью.
Мы не можем,например, допустить, что весь воздух в комнате вдруг соберется в однойее половине, хотя теоретические шансы и имеются (пример, конечно,сильно утрированный).Напротив, коллективные эффекты в экономической области связаныс совсем другими числами, в том числе и весьма скромными. Так, числофирм, работающих на рынке, может исчисляться тысячами, сотнямиили быть еще меньше. Число покупателей, принимаемых во внимание врассматриваемой модели, редко будет превышать несколько миллионов(а миллион — это всего лишь 106 ).Поэтомуэкономическиесоотношения,особенновмикроэкономических моделях, выполняются весьма приблизительно,часто даже лучше сказать — в тенденции (скорее качественно, чемколичественно).
В макроэкономике также количество доступныхнаблюдений может исчисляться десятками — как при изучениидвадцатилетнего интервала между двумя мировыми войнами.Сами модели, использующиеся в эконометрических исследованиях,вынужденно (из соображений целесообразности) являются простыми,обычно линейными (см. ниже).