Дженкинс, Ваттс - Спектральный анализ и его приложения (выпуск 1) (1044211), страница 20
Текст из файла (страница 20)
4. Введение в теорию статистических выводов Заметим, что (4.2.22) можно переписать в виде является выборочной оценкой максимального правдоподобия коварнации ую между двумя рассматриваемыми случайными величинами; сп и сзз — выборочные оценки максимального правдоподобия для дисперсий о', н о„' соответственно. Так как функция правдоподобия является функцией только О, когда наблюдения известны, то выборочная оценка максимального правдоподобия 0 получается непосредственно как функция этих наблюдений. Обычно в этом месте в статистических работах оставляют функцию правдоподобия и возвращаются к методу выборочных распределений.
При этом с выборочной оценкой 0 связывают оценку О и находят се выборочные свойства. Этот подход совместим с подходом выборочных распределений к оценнванию, но это не совпадает с использованием метода правдоподобия для выводов, о чем будет сказано в разд. 4А. Выборочные свойства оценок максимального правдоподобия приведены в работе [5). Наиболее важное из них заключается в том, что для больших п оценки максимального правдоподобия 'приближенно несмещенные и распределены аснмптотически нормально с дисперсией являющейся наименьшей дисперсией, которую может иметь любая несмещенная оценка.
Поэтому можно построить приближенный доверительный интервал, используя выборочную оценку максимального правдоподобия, дисперсию (4.2.25) и табл. 3.4. Результат (4.2,25) показывает, что дисперсия опенки максимального правдоподобия обратно пропорциональна второй производной (и, следовательно, кривизне) функции правдоподобия в точке ее максимума. Выражение 4.2.
Применение метода выбороеныл распределений называется количеством цнфорлгаг)им Фишера* >. Его интерпретацию мы продолжим в равд. 4.4. Другой вид выводов, включаемый в рамки метода выборочных распределений, представляет собой критерий значимости. Он дает возможность вьшести решение о том, справедлива или нет некоторая гипотеза относительно статистических параметров. Например, иногда нужно проверить, совместима ли некоторая выборка наблюдений хь хз, ..., х„с гипотезой о том, что они получены из нормальной плотности вероятности с некоторыми заданными значениями ре, о', среднего и дисперсии.
Во многих случаях, когда применяют критерии значимости, лучший ответ на задачу можно было бы получить с помощью оценивания параметров и вычисления доверительных интервалов. Вэтом разделе мы приведем простой пример критерия значимости и затем покажем, как можно было бы получить несколько ббльшую информацию, рассматривая нашу задачу как задачу оценивания. Понятие критерия значимости восходит к первым работам по теории вероятностей. Систематическая теория критериев значимости была разработана до некоторой степени независимо, с одной стороны, Фишером, а с другой стороны, совместно Нейманом и Пирсоном. Двое последних включили идею критерия значимости в теорию, названную ими теорией проверки гипотез.
Описание этой теории дается в [4]. Этапы построения критерия значимости. Проиллюстрируем этапы построения критерия значимости на примере с транзисторами из разд. 4.2.2. 1. Выдвигаем нулевую гипотезу Нв, например, что ток коллектора для партии транзисторов распределен нормально со средним значением рв, но с неизвестной дисперсией. 2. Определяем конкурирующие гипотезы. В нашем примере в качестве таких гипотез было бы естественно взять предположение )г))гс, поскольку желательно было бы забраковать партию, если средний ток коллектора был слишком высокий. 3. Решаем вопрос о наилучшей функции от наблюдаемых данных, или статистике, с помощью которой будем проверять гипотезу, Если дисперсия известна, то, как можно показать [4[, наилучшей *1 Точнее было бы в последней формуле и в (4.2.23) брать производную в точке 0 — точке истинного значения параметра.
— 4)рим. лерев. бв 132 133 в виде ) и — 1( 2) т. е. 5т (1 — — ) х) ро+ 1 л /е /п-1(! 2 ) р'л (х — но) или же (1 — о) х) но+ рл х) 8+ 2(3'И) =1!18 2 Гл. 4. Введение в теорию етотнетическик выводов статистикой является среднее Х. Если дисперсия неизвестна, как в нашем примере, то наилучшей статистикой является !уй(х — но) 4. Выводим выборочное распределение этой статистики при условии, что нулевая гипотеза верна. В нашем примере это будет браспределение Стьюдента с т=л — 1 степенями свободы. 5. Пользуясь (4) и (2), можно затем разделить выборочное пространство -9' на две части: критическую область б и область принятия гилотезье,У вЂ” 0, состоящую из всех точек выборочного пространства, ве принадлежащих критической области Ст.
Критическая область выбирается так, что вероятность Рг(хь хь ..., х, лежит в Ст ~ Но верна) =а, где сс мало, скажем 0,05 или 0,0!. Вероятность а называется уровнем значимости критерия. 6. Наконец, критерий значимости заключается в том, что нулевая гипотеза отбрасывается, если наблюденная выборка хь хь ... ..., х попадает в С, н не отбрасывается, если выборка попадает в,У вЂ” 13 Поскольку вероятность попадания выборочной точки в б прн условии, что Но верна, мала, то любой случай, когда она туда попадает, рассматривается как довод против нулевой гипотезы.
В нашем примере в силу того, что Рг(Т,) !,(1 — а)) = сс, критическая область определяется неравенством Пример. Предположим, что л=4, х= 10 и в=2 и нужно проверить гипотезу !хо=8 с уровнем значимости а= 0 025. Из рис. 3.11 находим В(0,975) =3,!8, и, следовательно, критическая область имеет вид Поскольку настоящее х лежит вне критической области, нулевая гипотеза не отвергается с 2,5о/о-ным уровнем значимости. Предположим, что конкурирующие гипотезы р)ро и р<ро одинаково важны. Например, если вес некоторого фасованного товара должен быть равен заданной величине )ео, то могли бы быть одинаково важными случаи недовеса и перевеса в конкретной вы- 4.2.
Применение метода выборочных распределений барке, В таком случае разумно выбрать критическую область вг, (! — — ) х е" ро —,.— . (4.2.27) 1' л Для нашего примера при !то=8 получаем критическую область х) 11,18, х е..4,72. Так как наблюденная величина х=10 не лежит в критической области, то нулевая гипотеза не была бы отвергнута с 5'/о-~ым уровнем значимости. Такой критерий называется двусторонним критерием значимости в противоположность упоминавшемуся выше одностороннему критерию. Доверительные интервалы и критерии значимости.
Чтобы продемонстрировать соотношение между критерием значимости и доверительным интервалом, заметим, что доверительный интервал (4.2.3) дтя 1к имеет вид Поэтому если ро лежит внутри доверительного интервала, то, согласно (4.2.27), нулевая гипотеза не отвергается, а если но лежит вне доверительного интервала, то нулевая гипотеза отвергается. В нашем примере 95'/о-ный доверительный интервал имеет вид 10 -1- ( ' ) =(6,82; 13,18). )т4 Так как но= 8 попадает внутрь этого интервала, то нулевая гипотеза не отвергается с 5'/о-ным уровнем значимости.
На самом деле, никакая нулевая гипотеза из интервала от 6,82 до !3,18 не была бы отвергнута с этим уровнем значимости. Теперь становится очевидной дополнительная информация, содержащаяся в доверительном интервале. Она показывает, что наш эксперимент был настолько неточным, что даже такие большие значения ри как !3, правдоподобны. В этом случае единственное разумное заключение состоит в том, что требуется больше данных для того, чтобы оце. нить р точнее. 134 Гл, 4. Введение в теорию статистических выводов 4.3.
Оценивание с понощвю наименыиил квадратов 135 4.3. ОЦЕНИВАНИЕ С ПОМОЩЬЮ НАИМЕНЬШИХ КВАДРАТОВ 4.3.1. Принцип наименьших квадратов Принцип наименьших квадратов был открыт немецким математиком Карлом Фридрихом Гауссом, который опубликовал свою первую работу по этому вопросу в 1821 г, и затем возращался к нему неоднократно в течение всей своей жизни. Его принцип наименьших квадратов представляет собой одно из первых крупных достижений в статистике, и даже на сегодняшний день он является одним из самых мощных методов, имеющихся в распоряжении статистиков. Предположим, что выход т1 некоторой системы может быть предсказан по и входным переменным хь хг, ..., хд с помощью некоторой предполагаемой линейной модели О=-01х1+Огхг+ ... +О,хд. (4.3.1 ) Например, т1 могло бы быть выходом некоторого химического процесса, х — переменными процесса, такими, как температуры, дав- лениЯ и скоРости потоков, а 01, Оь ..., Од — неизвестными физическими параметрами, такими, как кинетические константы.
Линейная теория наименьших квадратов имеет дело с оцениванием параметров О„по данным, состоящим из одновременных измерений входных и выходных переменных. Значения, полученные в результате оценки параметров, можно подставить в (4.3.1) и полученное при этом выражение использовать для предсказания выхода при тех значениях входных переменных, которые появятся в будущем. Заметим, что уравнение прогноза (4.3.1) не обязательно должно быть линейным по хь х, ..., хм а лишь по параметрам О. Например, если х,=1, х,=х, ..., хи=хи — ', то т) является полиномом по х степени й — 1. Если гке выход является нелинейной функцией параметров, то описываемые в этом разделе методы легко видоизменить [6) для оценивания параметров с помощью итераций линейного метода наименьших квадратов. На практике можно наблюдать лишь отклик т), искаженный некоторой ошибкой г.