Болч К._ Хуань К.Дж. - Многомерные статистические методы для экономики (Болч К._ Хуань К.Дж. - Многомерные статистические методы для экономики.djvu), страница 10
Описание файла
DJVU-файл из архива "Болч К._ Хуань К.Дж. - Многомерные статистические методы для экономики.djvu", который расположен в категории "". Всё это находится в предмете "(пмса) прикладной многомерный статистический анализ" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 10 - страница
ПриРавнивая первую производную этого выражения по р к нулю, ИМЕЕМ: — "'" = — Л(Х вЂ” р) =О, что приводит к Х ~$=Х— В и вто есть обычное среднее арифметическое т. в История рвввнтня методов оивинвяння виновна в ~331. Подход в втой яня. ге основан на работе [311. Среди других методов оиениваиия можно назвать меток момеитов и метод Байеса, Другим важным методом оценивания является метод наибодьшего правдоподобия, который связан в основном с именем Р.
А. Фишера. Предположим, что каждое наблюдение Х;, ~ 1, 2, ..., п, выбрано из нормальной генеральной совокупности с плотностью 1 1 1Х~ — р)» ПХ) = ехр — — — . (2ло 1'~» 2 о» Для каждого Х; ордината его нормальной плотности задана функцией ~ (Х;). Более того, для данного Х; ордината ~ (Х~) представляет собой функцию р,. Поскольку среднее значение нормальной плотности есть также ее мода, то ордината, связанная со средним, будет максимальной ордииатой плотности. Таким образом, если бы случилось так, что все выбороч- ные значения Х~ имели значения, Х равные среднему, то произведение этих и ординат было бы равно 4 Е=НХ)КХ) ...КХ„) = а (2.26) и было бы максимальным, так как показатель степени обращается в нуль. Однако совершенно невероятг .
з ~,г но, что все Х; будут иметь в точноноиер набладення сти значение, равное р.. Следовательно, мы выбираем значение р, которое максимизирует функцию А, наиеньших квадратов зываемую функцией правдоподобия, т. е. мы оцениваем среднее значение таким образом, чтобы значение Е было больше, чем при любойдругой оценке среднего. Рис.
2.1О показывает, что Е достигает максимума при ц = р,. Чтобы нанти максимум, приравняем первые частные производные 1п А (чтобы облегчить взятие производных) ~ нулю. Натуральный логарифм Ь равен: 1пь =- — л 1п (2п) — л 1цоа — 1 Е(Х вЂ” )в. 2 2 2о» Для вычисления максимума приравниваем первые частные производные 1п Е по р и а» нулю: — = — Х(Х вЂ” р,) =О; д1пХ, 1 ф о» д1пА — н 1 — + — Х (Х вЂ” р)'= О. Яо» 2о» 2~а $ ~ Авторы, специально не оговаривая, используют тот очевидный факт„что любое монотонное преобрааование рассматриваемой функции (в нашем случае преобрааоваиие логарифма от функции Е1 имеет дли широкого класса функций те же точки экстремума, что и исходная функция. — Примеч ~?8д.
Лосле у~ращения н знамены р, и о~ их оценками р и (~~ мы пах и ) ~~~ (Х вЂ” -р,) О Л В предположении нормальности генеральной совокупности оценка наибольшего правдоподобия для р идентична оценке. наименьших кв дРатов. Поэтому обычно мы оцениваем среднее значение генеральной совокупности по выборочному среднему р = Х =- ЖХЪ, Из рис. 2.10 ясно, что максимизация ардинаты Х~ эта то же самое, ч а ое, что минимизация квадрата отклонения Х- ат р,. Именно поэтому пр~ в .~у прн предположении нормальности оценки наименьших квадратов и наиболь по обия ля п д д я р совпадают. Более того, оценкой наибольшего правдо- аи льшего правдоподобия дисперсии генеральной совокупности является также знакомая нам выборочная дисперсия ЯР = ХхЧп = Х (Х вЂ” Х)" . — Х) ~й. Рис.
2,!О. Оценивании литром наибольшего правдоподобия аХорошиеэ оценки. Насколько хороши оценки Х и Ю'7 На этот вопрос можно от о ответить, только задавшись определенной точкой зрения, и статистик тистики заранее установили Различные критерии, которые должны п иним р ниматься во внимание. Никакой перечень таких критериев не может б ет быть исчерпывающим, и, как во многих этических ст~ ктурах в оп ел 'Р, Ределенных ситуациях некоторые критерии могут быть удов- РУ летворены только в ущерб другим. 1. П осело росглота вычисления.
При прочих равных условиях большинство лю,ей п для кото ой д й предпочтет ту оценку, которую легче вычислить тай ) ~ ) ) выбо ок азь рой вычисления будут более сложными. В случае очень мал ых как и более т Р Размах выборки может сработать» почти так же х роша более трудная с вычислительной точки зрения оценка 50 ( в качестве оценки стандартного отклонения генеральной совокупности). днако при увеличении объема выборки размах работает плохо по сравнению с с Ю, а его вычисление на цифровой вычислительной машине вряд ли легче. смВщГнйоаиь.
При прочих равных условиях мы предпочли 2. Несме нм ы опенк к у, которая является ев среднем правильной». Оценка назы- вается несмещенной, если ее математическое ожидание равно значению параметра, оценкой которого она является. Оценка Х вЂ” несмещенная оценка параметра р„так как Е(Х) =Е(Х вЂ” ) — ХЕ(Л) = — ~в=р.
Однако оценка Я)' представляет собой смещенную оценку дисперсии генеральной совокупности аз, так как 1' Е(яЕ)') = —" оа. а В этом случае смещение Ю' известно н может быть скорректировано. Если мы определяем тогда и математическим ожиданием у является о'а. Так как вз — несмещенная оценка дисперсии генеральной совокупности", то обычно предпочитают использовать ее, а не Ю 3. Состоятельность. Оценка называется состоятельной, если при увеличении объема выборки оценка сходится по вероятности к значению оцениваемого параметра.
Пусть О„есть оценка параметра генеральной совокупности О. Оценка базируется на случайной выборке из а наблюдений. Если для любых, сколь угодно малых положительных а и о существует такое Ж, что вероятность того, что ! ΄— О~ с. е больше, чем 1 — о при всех и .: Ж, то О„называется состоятельной оценкой 6, т. е вероятность РгоЬ [ ~ 6„— 6~ < и) > 1 --- о при всех п > Ж. Для краткости мы можем сказать, что предел по вероятности О„равен О, и записать это утверждение в виде рИп1 6„= 6, где рйт обозначает предел по вероятности ".
Как Х, так и У являются состоятельными оценками ц и ав соответственно. 4. Зффеюлнвность. Даже если оценка несмещенная, ее выборочное распределение может обладать такой болыпой дисперсией, прн которой ее достоверность (в силу весьма вероятных слишком бс льющих ее '~ Доказательство этою утверждения достаточно длинное, хоти и не трудное.
Заинтересованный читатель может обратиться к 141, с. 971 или к 167, с. 161. м Однако как а = ~/Ф', так и 80 = ~/У02 представляют собой смещенные оценки стандартного отклонения генеральной совокупности, но зто смещение может быть скорректировано. Таблица поправочных коэффициентов приводится в 1141. " См. также 134, с. 88 и паследукициеК где содержатся дополнительные замечания.
Обратите внимание, что вертикальные линии обозначают здесь абсолютное значение, а не определитель. ветствующих средних значений. Таким образом, преобразуем Х в х, Где Х„Х; .... Х.„ Х~Х ...Х«, Матра«~а ковариации определяется 1см. 11.34)) для выборки в виде Хх~~ Хх,х, ...
Хх~х„ Х Х= Хх~х, Хх', ... Хх х„ Ххр х~ Хх х ~, Ххр оценкой ковариациониой матрицы будет ~и. ~ы "- зц 1 . 8язаа - зал (2.32) а — 1 Э Зр~ Яру... Брр В случае одной переменной ее дисперсия ~«2 оценивается при помощи У согласно (2.29). Следовательно, в случае только одной переменной матрица В соответствует ~' и обладае~ теми же свойствами, что и У. Корреляционную матрицу можно оценить, воспользовавпись уравнением (2.11) и заменяя дисперсии и ковариации генеральной совокупности их оценками согласно (2.32). Если мы обозначим оценку ~ъ.«черкез г««, то Ф У~«« ~н Ь~-""' ~"« и выборочная корреляционная матрица имеет вид: 1 г12 г13 - г1Р г„1 г„...
г,„ г«х газ«рз". В приложении к этой главе приведены программы для вычисления Х, Зий. р б„ПРОВЕРКА ГИПОТЕЗ Статистическая гипотеза обычно представляет собой некоторое редположение об одном или нескольких параметрах генеральной сое вокупности, которое можно подвергнуть сомнению . Мы не выдвигаем гипотезу о том„что все матери — женщины, но мы можем выдвинуть гипотезу о том, что число несчастных случаев среди рабочих на каком-то заводе в дневной смене такое же, как и в ночной смене. Так как в гипотезах заключены только предположения, они нуждаклся в проверках, и в теории статистического вывода мы обычно про' веряем гипотезы на основе выборочной информации и некоторой догопоренности относительно допустимой величины вероятности того, что мы отвергнем проверяемую гипотезу даже в случае, когда она справедлива.
В практике статистической работы мы чаще всего имеем дело с двумя конкурирующими гипотезами: нулевой гипотезой, обозначаемой Н„и альтернативной гипотезой, обозначаемой Н,. Булевая гипотеза — это гипотеза, подлежащая проверке, и если мы отвергаем нулевую гипотезу как неподходящую в каком-то статистическом смысле, то мы принимаем альтернативн~ю гипотезу. Так как мы имеем дело с неизвестной генеральной совокупностью и выносим суждения о ней на основе выборочной информации, то мы можем и не прийти к правильному выводу. Наш вывод окажется правильным в том случае, если мы отвергнем нулевую гипотезу, когда она ошибочна, илй примем нулевую гипотезу, когда она справедлива.
Мы сделаем неправильный вывод, если отвергнем нулевую гипотезу, когда она справедлива (ошибка 1 рода), или примем нулевую гипотезу, когда она ошибочна (ошибка П рода). В большинстве случаев при проведении классической проверки гипотез в экономике мы задаем некоторый допустимый уровень вероятности совершения ошибки 1 рода и выполняем проверку на основе выборочной информации и этого заданного уровня вероятности 1'.
В этой кингс мы обозначим вероятность совершения ошибки 1 рода через а. Так как я обозначает вероятность, ее значения должны находиться в интервале между О и 1. В классическом статистическом выводе существуют два общих правила для определения величины а. Первое: чем больше степень уверенности в нулевой гипотезе, тем меньше должно быть значение сс. Второе: чем больше цена отбрасывания справедливой нулевой гипотезы, тем меньшее значение должно иметь сс. Поясним эти соображения простым примером. Предположим, что мы сформулировали нулевую гипотезу, состоящую в том, что среднее ' Слишком узкое толкование понятия статистической гипотезы. В действительности наряду с гипотезами, определяемыми здесь авторами, существует широкий класс важных с точки зрения зкономических приложений непараметричггких гипотез, таких, как гипотеза об общем виде закона распределения, гипотеза о стационарности или независимости имеющегося ряда наблюдений и т.