Оценивание параметров и метод максимального правдоподобия
5. Оценивание параметров и метод максимального правдоподобия
Оценивание параметров является одной из основных задач математической статистики. В наиболее общей постановке предполагается, что распределение случайного элемента зависит от неизвестного параметра , принадлежащего некоторому множеству . Оценка параметра — это произвольная случайная величина со значениями в , измеримая относительно -алгебры, порождённой , или, что то же самое, представимая в виде функции от . Содержательный смысл задача оценивания приобретает после конкретизации модели и дополнительных требований, которые предъявляются к оценке (несмещённость, состоятельность, эффективность, робастность и т. п.).
Пример 1. Пусть — гауссовский случайный вектор с независимыми компонентами, имеющими среднее значение и дисперсию . Эта классическая модель послужила источником для выработки многих понятий и методов теории оценивания. Она допускает несколько вариантов:
1. неизвестно, неизвестно,
2. неизвестно, известно,
3. известно, неизвестно.
Требуется оценить неизвестный параметр .
В классической теории считаются естественными следующие свойства оценки параметра ( указывает длину выборки -число компонент вектора ).
Несмещённость — математическое ожидание оценки совпадает с истинным значением параметра: ; или более слабое свойство: при (асимптотическая несмещённость).
Рекомендуемые материалы
Состоятельность — стремится к по вероятности при .
Эффективность — оценка обладает наименьшей мерой случайного уклонения от среди всех оценок. В случае скалярного параметра в качестве меры уклонения оценки часто берут величину , совпадающую для несмещённых оценок с дисперсией. В векторном случае в качестве меры разброса берут определитель или след ковариационной матрицы оценки.
Полезным свойством оценки, более сильным, чем состоятельность, является асимптотическая нормальность — сходимость распределений случайных величин к нормальному закону.
Важнейшим методом получения оценок параметров является максимального правдоподобия метод. Предположим, что (распределение случайного элемента ) при всех имеет плотность относительно некоторой меры . Тогда оценка метода максимума правдоподобия (ОМП) — это случайная величина, доставляющая максимум по функции правдоподобия .
Метод максимального правдоподобия предназначен для нахождения статистических оценок неизвестных параметров распределения, согласно которому в качестве оценок выбираются те значения параметров, при которых данные результаты наблюдения «наиболее вероятны». Обычно предполагается, что результаты наблюдений являются взаимно независимыми случайными величинами с одним и тем же распределением вероятностей, зависящим от одного неизвестного параметра , где — множество допустимых значений . Для придания точного смысла принципу «наибольшей вероятности» поступают следующим образом. Вводят функцию от переменных и
,
где в случае исходного непрерывного распределения интерпретируется как плотность вероятности случайной величины , а в дискретном случае — как вероятность того, что случайная величина примет значение . Функцию от случайных величин , рассматриваемую как функцию , называют функцией правдоподобия, а оценкой максимального правдоподобия параметра называют такое значение
(само являющееся случайной величиной), при котором функция правдоподобия достигает наибольшего возможного значения. Так как точка максимума для та же, что и для , то для нахождения оценок максимального правдоподобия следует решить т. н. уравнение правдоподобия
.
Метод максимального правдоподобия в достаточно широком круге практически важных случаев является в известном смысле наилучшим. Так, например, можно утверждать, что если для параметра существует несмещённая оценка * с наилучшей дисперсией при фиксированном , то уравнение правдоподобия имеет единственное решение = *.
Что касается асимптотического поведения оценок максимального правдоподобия при больших , то известно, что при некоторых общих условиях метод максимального правдоподобия приводит к несмещённым оценкам, которые, следовательно, асимптотически нормальны и асимптотически эффективны.
Данные выше определения непосредственно обобщаются и на случай нескольких неизвестных параметров и на случай выборок из многомерных распределений.
Метод максимального правдоподобия в его современном виде был предложен Р. Фишером (Великобритания, 1912), однако в частных формах метод использовался в 19 в. К. Гауссом (Германия), а ещё раньше, в 18 в., к его идее были близки И. Ламберт (Германия) и Д. Бернулли (Швейцария).
Пусть в примере 1 оба параметра неизвестны, . Тогда
и оценка метода максимума правдоподобия (ОМП) имеет вид
, .
Её первая компонента является несмещённой, состоятельной и эффективной оценкой , в то время как оценка дисперсии из этих свойств обладает только вторым. ОМП дисперсии имеет отрицательное смещение, равное и, значит, является асимптотически несмещённой. Можно показать, что в определённом смысле эта оценка асимптотически эффективна.
ОМП обладает хорошими асимптотическими свойствами и для гораздо более широких классов моделей.
Пример 2. Авторегрессионная модель в непрерывном времени. Пусть — случайный процесс, являющийся решением стохастического дифференциального уравнения вида
, ,
где — винеровский процесс, — вещественный параметр. При любом распределение процесса в пространстве непрерывных функций имеет плотность относительно винеровской меры. Функция правдоподобия в рассматриваемой модели имеет вид
.
Отсюда получается выражение для ОМП
.
Другим методом статистического оценивания параметров является метод моментов. Пусть компоненты вектора — независимые одинаково распределённые случайные величины, распределение которых зависит от -мерного параметра . Идея метода моментов состоит в нахождении значения параметра, при котором первые теоретических моментов совпадают с выборочными моментами, т. е. оценка метода моментов находится как решение системы уравнений
, .
В задаче стохастического оценивания параметров, вообще говоря, не предполагается, что параметр однозначно определяет распределение и, следовательно, метод максимума правдоподобия и метод моментов применимы не для любых моделей. Кроме того, соответствующие оценки могут не существовать.
Пример 3. Модель линейной регрессии. Вектор , имеет компоненты
, ,
— некоторые наперёд заданные числа, а ошибки наблюдений — независимые случайные величины, имеющие нулевое среднее и конечную дисперсию .
В регрессионных задачах традиционно используется наименьших квадратов метод, когда оценки ищутся из условия минимизации квадратичной формы
.
Для нормально распределённых ошибок оценки метода наименьших квадратов совпадают с оценкой метода максимального правдоподобия. В практических задачах метод наименьших квадратов получил самое широкое распространение, причём немаловажную роль при этом играет лёгкость его вычислительной реализации.
Бесплатная лекция: "10 Стадия выполнения подготовительных действий" также доступна.
Несмотря на свои достоинства, методы максимума правдоподобия и наименьших квадратов обладают существенным недостатком. Предположим, что при записи наблюдений произошла ошибка, в результате чего в регрессионных данных появилась резко выделяющаяся точка. Линия регрессии, построенная по методу наименьших квадратов, отклонится в сторону ошибочного наблюдения. Удаление выделяющейся точки или исправление ошибки приведёт к совершенно другим значениям коэффициентов. Анализ подобных ситуаций привёл к построению робастных оценок параметров (от английского robust— грубый), обладающих свойством устойчивости по отношению к «загрязнениям», когда с малой вероятностью появляются наблюдения, сильно отличающиеся по своим свойствам.
Например, для получения робастных оценок в задаче регрессии вместо минимизации суммы квадратов уклонений можно минимизировать сумму величин вида , где — функция, растущая медленнее, чем и т. п.). В задачах оценивания параметров робастными оказываются оценки, основанные на порядковых статистиках и рангах (номерах членов вариационного ряда — выборки, упорядоченной по возрастанию значений). Так, в модели с «засорением» нормального распределения выборочная медиана во многих случаях оказывается более эффективной оценкой среднего значения распределения. При построении робастных оценок полезным оказывается приём с отбрасыванием «хвостовых» членов вариационного ряда — цензурирование выборки.
Особую ветвь в теории статистического оценивания параметров составляет бейесовский подход к оцениванию, при котором оценка также считается случайной величиной. Условное математическое ожидание называется бейесовской оценкой . При бейесовском подходе используется следующая терминология: распределение (вероятностная мера на ) называется априорным распределением, условное распределение при условии, что приняло значение , — апостериорным распределением. Таким образом, бейесовская оценка есть среднее значение , вычисленное по апостериорному распределению.
В задачах практики часто важно знать не точное значение параметра, а иметь гарантию, что его истинное значение локализовано в какой-то области с достаточно большой вероятностью. В одномерном случае это означает, что надо указать интервал, границами которого являются случайные величины и , накрывающий истинное значение параметра с вероятностью , близкой к единице. Интервал [] называется интервальной оценкой параметра (в отличие от точечных оценок, рассмотренных выше) или доверительным интервалом с уровнем доверия .
Традиционно оцениваемый параметр принадлежит подмножеству конечномерного евклидова пространства. Это объясняет терминологию, когда задачи, в которых оцениваемый параметр принадлежит какому-нибудь пространству функций, называются непараметрическими задачами оценивания.
В статистике случайных процессов развит подход последовательного оценивания параметров, когда момент окончания наблюдений заранее не фиксирован, а является случайной величиной, зависящей от текущей реализации процесса. Такие моменты называются марковскими или моментами остановки. Методы последовательного анализа позволяют для моделей авторегрессии и скользящего суммирования строить оценки с гарантированной дисперсией.