Оценивание параметров и метод максимального правдоподобия

2020-06-032021-03-09zzyxelСтудИзба

5. Оценивание параметров и метод максимального правдоподобия

Оценивание параметров является одной из основных задач математической статистики. В наиболее общей постановке предполагается, что распределение случайного элемента зависит от неизвестного параметра , принадлежащего некоторому множеству . Оценка параметра — это произвольная случайная величина со значениями в , измеримая относительно -алгебры, порождённой , или, что то же самое, представимая в виде функции от . Содержательный смысл задача оценивания приобретает после конкретизации модели и дополнительных требований, которые предъявляются к оценке (несмещённость, состоятельность, эффективность, робастность и т. п.).

Пример 1. Пусть — гауссовский случайный вектор с независимыми компонентами, имеющими среднее значение и дисперсию . Эта классическая модель послужила источником для выработки многих понятий и методов теории оценивания. Она допускает несколько вариантов:

1. неизвестно, неизвестно,

2. неизвестно, известно,

3. известно, неизвестно.

Требуется оценить неизвестный параметр .

В классической теории считаются естественными следующие свойства оценки параметра ( указывает длину выборки -число компонент вектора ).

Несмещённость — математическое ожидание оценки совпадает с истинным значением параметра: ; или более слабое свойство: при (асимптотическая несмещённость).

Рекомендуемые материалы

-66%

Колебания линейной системы с одной степенью свободы

Теоретическая механика

999 340 руб.

-41%

Анализ и управление рисками на примере ПАО Лукойл

Экономика и финансы

999 590 руб.

-25%

П. В. Папырин - Лекции - Экономика РКО

Экономика ракетно-космической отрасли (РКО)

400 299 руб.

Вариант 3 - ДЗ - Кривые совокупного спроса и предложения в месяц на картофель в городе

Экономика

340 руб.

Экономика Катара (презентация)

Мировая экономика

119 руб.

Определить оптовую цену изделия и сумму акциза, приходящегося на единицу продукции при следующих данных: полная себестоимость изделия – 150 д.е. Планируемая прибыль – 24% от полной себестоимости. Процент акциза на данный товар – 40%.

Экономика предприятия

99 руб.

Состоятельность — стремится к по вероятности при .

Эффективность — оценка обладает наименьшей мерой случайного уклонения от среди всех оценок. В случае скалярного параметра в качестве меры уклонения оценки часто берут величину , совпадающую для несмещённых оценок с дисперсией. В векторном случае в качестве меры разброса берут определитель или след ковариационной матрицы оценки.

Полезным свойством оценки, более сильным, чем состоятельность, является асимптотическая нормальность — сходимость распределений случайных величин к нормальному закону.

Важнейшим методом получения оценок параметров является максимального правдоподобия метод. Предположим, что (распределение случайного элемента ) при всех имеет плотность относительно некоторой меры . Тогда оценка метода максимума правдоподобия (ОМП) — это случайная величина, доставляющая максимум по функции правдоподобия .

Метод максимального правдоподобия предназначен для нахождения статистических оценок неизвестных параметров распределения, согласно которому в качестве оценок выбираются те значения параметров, при которых данные результаты наблюдения «наиболее вероятны». Обычно предполагается, что результаты наблюдений являются взаимно независимыми случайными величинами с одним и тем же распределением вероятностей, зависящим от одного неизвестного параметра , где — множество допустимых значений . Для придания точного смысла принципу «наибольшей вероятности» поступают следующим образом. Вводят функцию от переменных и

где в случае исходного непрерывного распределения интерпретируется как плотность вероятности случайной величины , а в дискретном случае — как вероятность того, что случайная величина примет значение . Функцию от случайных величин , рассматриваемую как функцию , называют функцией правдоподобия, а оценкой максимального правдоподобия параметра называют такое значение

(само являющееся случайной величиной), при котором функция правдоподобия достигает наибольшего возможного значения. Так как точка максимума для та же, что и для , то для нахождения оценок максимального правдоподобия следует решить т. н. уравнение правдоподобия

Метод максимального правдоподобия в достаточно широком круге практически важных случаев является в известном смысле наилучшим. Так, например, можно утверждать, что если для параметра существует несмещённая оценка * с наилучшей дисперсией при фиксированном , то уравнение правдоподобия имеет единственное решение = *.

Что касается асимптотического поведения оценок максимального правдоподобия при больших , то известно, что при некоторых общих условиях метод максимального правдоподобия приводит к несмещённым оценкам, которые, следовательно, асимптотически нормальны и асимптотически эффективны.

Данные выше определения непосредственно обобщаются и на случай нескольких неизвестных параметров и на случай выборок из многомерных распределений.

Метод максимального правдоподобия в его современном виде был предложен Р. Фишером (Великобритания, 1912), однако в частных формах метод использовался в 19 в. К. Гауссом (Германия), а ещё раньше, в 18 в., к его идее были близки И. Ламберт (Германия) и Д. Бернулли (Швейцария).

Пусть в примере 1 оба параметра неизвестны, . Тогда

и оценка метода максимума правдоподобия (ОМП) имеет вид

, .

Её первая компонента является несмещённой, состоятельной и эффективной оценкой , в то время как оценка дисперсии из этих свойств обладает только вторым. ОМП дисперсии имеет отрицательное смещение, равное и, значит, является асимптотически несмещённой. Можно показать, что в определённом смысле эта оценка асимптотически эффективна.

ОМП обладает хорошими асимптотическими свойствами и для гораздо более широких классов моделей.

Пример 2. Авторегрессионная модель в непрерывном времени. Пусть — случайный процесс, являющийся решением стохастического дифференциального уравнения вида

, ,

где — винеровский процесс, — вещественный параметр. При любом распределение процесса в пространстве непрерывных функций имеет плотность относительно винеровской меры. Функция правдоподобия в рассматриваемой модели имеет вид

Отсюда получается выражение для ОМП

Другим методом статистического оценивания параметров является метод моментов. Пусть компоненты вектора — независимые одинаково распределённые случайные величины, распределение которых зависит от -мерного параметра . Идея метода моментов состоит в нахождении значения параметра, при котором первые теоретических моментов совпадают с выборочными моментами, т. е. оценка метода моментов находится как решение системы уравнений

, .

В задаче стохастического оценивания параметров, вообще говоря, не предполагается, что параметр однозначно определяет распределение и, следовательно, метод максимума правдоподобия и метод моментов применимы не для любых моделей. Кроме того, соответствующие оценки могут не существовать.

Пример 3. Модель линейной регрессии. Вектор , имеет компоненты

, ,

— некоторые наперёд заданные числа, а ошибки наблюдений — независимые случайные величины, имеющие нулевое среднее и конечную дисперсию .

В регрессионных задачах традиционно используется наименьших квадратов метод, когда оценки ищутся из условия минимизации квадратичной формы

Для нормально распределённых ошибок оценки метода наименьших квадратов совпадают с оценкой метода максимального правдоподобия. В практических задачах метод наименьших квадратов получил самое широкое распространение, причём немаловажную роль при этом играет лёгкость его вычислительной реализации.

Бесплатная лекция: "10 Стадия выполнения подготовительных действий" также доступна.

Несмотря на свои достоинства, методы максимума правдоподобия и наименьших квадратов обладают существенным недостатком. Предположим, что при записи наблюдений произошла ошибка, в результате чего в регрессионных данных появилась резко выделяющаяся точка. Линия регрессии, построенная по методу наименьших квадратов, отклонится в сторону ошибочного наблюдения. Удаление выделяющейся точки или исправление ошибки приведёт к совершенно другим значениям коэффициентов. Анализ подобных ситуаций привёл к построению робастных оценок параметров (от английского robust— грубый), обладающих свойством устойчивости по отношению к «загрязнениям», когда с малой вероятностью появляются наблюдения, сильно отличающиеся по своим свойствам.

Например, для получения робастных оценок в задаче регрессии вместо минимизации суммы квадратов уклонений можно минимизировать сумму величин вида , где — функция, растущая медленнее, чем и т. п.). В задачах оценивания параметров робастными оказываются оценки, основанные на порядковых статистиках и рангах (номерах членов вариационного ряда — выборки, упорядоченной по возрастанию значений). Так, в модели с «засорением» нормального распределения выборочная медиана во многих случаях оказывается более эффективной оценкой среднего значения распределения. При построении робастных оценок полезным оказывается приём с отбрасыванием «хвостовых» членов вариационного ряда — цензурирование выборки.

Особую ветвь в теории статистического оценивания параметров составляет бейесовский подход к оцениванию, при котором оценка также считается случайной величиной. Условное математическое ожидание называется бейесовской оценкой . При бейесовском подходе используется следующая терминология: распределение (вероятностная мера на ) называется априорным распределением, условное распределение при условии, что приняло значение , — апостериорным распределением. Таким образом, бейесовская оценка есть среднее значение , вычисленное по апостериорному распределению.

В задачах практики часто важно знать не точное значение параметра, а иметь гарантию, что его истинное значение локализовано в какой-то области с достаточно большой вероятностью. В одномерном случае это означает, что надо указать интервал, границами которого являются случайные величины и , накрывающий истинное значение параметра с вероятностью , близкой к единице. Интервал [] называется интервальной оценкой параметра (в отличие от точечных оценок, рассмотренных выше) или доверительным интервалом с уровнем доверия .

Традиционно оцениваемый параметр принадлежит подмножеству конечномерного евклидова пространства. Это объясняет терминологию, когда задачи, в которых оцениваемый параметр принадлежит какому-нибудь пространству функций, называются непараметрическими задачами оценивания.

В статистике случайных процессов развит подход последовательного оценивания параметров, когда момент окончания наблюдений заранее не фиксирован, а является случайной величиной, зависящей от текущей реализации процесса. Такие моменты называются марковскими или моментами остановки. Методы последовательного анализа позволяют для моделей авторегрессии и скользящего суммирования строить оценки с гарантированной дисперсией.

Поделитесь ссылкой:

Оценивание параметров и метод максимального правдоподобия

Рекомендуемые материалы

Рекомендуемые лекции