lr4 (543709), страница 4
Текст из файла (страница 4)
Пусть mk = Mk - момент порядка k. Моменты являются функциями параметра a: mk= fk(a1, ..., aR). Пусть существуют первые R моментов m1, ..., mR. Если бы моменты были известны, можно было бы составить систему уравнений для определения параметров по моментам:
m1 = f1(a1,...,aR),
. . .
mR = fR(a1,...,aR );
пусть эта система разрешима относительно a:
a1 = g1(m1,...,mR),
. . . (1)
aR = gR(m1,...,mR ).
когда решается задача оценивания, значения моментов неизвестны, однако, для моментов имеются несмещенные и состоятельные оценки
Подставив их в (1) вместо mk, получим некоторые оценки для aj:
(x1 ,... xn) = g1 (
1 ,...,
R ),
. . .
( x1 ,... xn) = gR (
1 ,...,
R ),
которые называют моментными оценками.
Несмещенностью они, вообще говоря, не обладают; обычно их исправляют. Справедливы следующие свойства.
1. Если функции gj (), j = 1 ,..., R, непрерывны, то оценки состоятельны.
2. Если функции gj() дифференцируемы, а распределение при любом a имеет 2R моментов, то оценки асимптотически нормальны:
Замечания.
1. В равенствах (1) вместо первых моментов можно взять любые R моментов так, чтобы система была разрешима.
2. Моментные оценки не всегда обладают хорошими характеристиками. Однако, часто они достаточно просты в вычислительном отношении.
Метод наибольшего правдоподобия
-
Определения. Пусть имеется некоторая совокупность x (x1 ,..., xn) наблюдений. Рассмотрим вероятность (или плотность) p(x/a) получить это x при различных a (a1 ,..., aR). в качестве оценки возьмем то значение а, для которого вероятность p(x/a) максимальна; такой способ оценивания называется методом наибольшего (максимального) правдоподобия.
Функция p(x/a), понимаемая как функция от а, называется функцией правдоподобия. Значение а, доставляющее максимум функции правдоподобия, называется оценкой наибольшего (максимального) правдоподобия:
Заметим, что а есть функция наблюдений х: а = а (х). При обычных условиях регулярности максимум находится из системы уравнений
Пример. Пусть х (х1, ..., xn) - независимые наблюдения над случайной величиной, нормально распределенной с параметрами b и 2 (роль двумерного параметра а в определении играет пара b и 2 ). Плотность распределения выборки
p(x/ b, 2) p(x1, ..., xn /b, 2) =
. (3)
Поскольку значения х1 ,..., xn известны, величина p(x1, ..., xn/b,2) является функцией от b и 2. система (3):
Решение этой системы, т.е. оценки наибольшего правдоподобия:
-
Свойства оценок наибольшего правдоподобия.
Пусть - случайная величина с законом распределения q( /a), x(x1,..xn)- n независимых наблюдений, p(x1, ..., xn /a) = - распределение выборки.
При некоторых достаточно широких условиях оценки наибольшего правдоподобия обладают хорошими свойствами, а именно, они состоятельны, асимптотически эффективны и асимптотически нормальны с параметрами (для одномерного случая)
условия таковы: а) независимость множества X = x: q(x/a) = 0 от а; б) существование производных и
; в) существование
. Доказательство можно найти, например, в 2.
Метод порядковых статистик
Пусть x1, ..., xn - n независимых наблюдений над случайная величиной с функцией распределения, зависящей от параметра a, значение которого тебуется оценить; x(1) x(2) ... x(n) - вариационный ряд (наблюдения, упорядоченные по возрастанию), x(k) - порядковая статистика с номером k.
Квантиль xр выбранного уровня р (например, р = 0.5, x0.5 -медиана) является функцией параметра а:
xр = f(a),
выразим а через xр
а = g(xр)
и вместо xр подставим выборочную квантиль = x([np]+1), которой является порядковая статистика с номером [np] +1; получим оценку
= g(x([np]+1))
Известны следующие свойства.
Если функция g непрерывна, то оценка состоятельна. Если распределение наблюдений непрерывно с плотностью q(x) , то
асимптотически нормальна с параметрами
(теорема Крамера).
Ясно, что таким же образом можно построить оценки и для неодномерного параметра. Основное и очень важное преимущество оценок, основанных на порядковых статистиках, - их устойчивость к засорению наблюдений.
приложение 2. операторы пакета STATGRAPHICS
Здесь описываются операторы, использованные в работах.
N TAKE x –Выбирает заданное число значений с начала (N - поло жительно) или конца (N - отрицательно) массива х.
2 TAKE 1 2 3 4 дает 1 2
–2 TAKE 1 2 3 4 дает 3 4
m n RESHAPE x – Преобразует массив х в матрицу из m строк и n столбцов. Если требуется больше значений, чем в массиве х, значения повторяются циклически; если меньше – значения в конце массива опускаются.
2 3 RESHAPE COUNT 4 дает
1 2 3
4 1 2
n RESHAPE x – Расширяет циклически x до размера n.
7 RESHAPE 1 2 3
дает 1 2 3 1 2 3 1
n REP x – Делает n копий каждого элемента в массиве x.
2 REP 3 4 5 дает 3 3 4 4 5 5
2 3 4 REP 3 4 5 дает 3 3 4 4 4 5 5 5 5.
COUNT n – Создает вектор с целыми числами от 1 до n.
SUM x – Суммирует элементы массива. Если массив - матрица, ре-
зультат есть вектор сумм элементов столбцов.
MIN x – Выбирает минимальное (максимальное) значение в массиве.
MAX x Если х – матрица, результат есть вектор минимумов
(максимумов) элементов столбцов.
TAN x – Определяет тангенсы элементов массива х. Этот оператор относится к числу загружаемых. Перед использованием необходимо выполнить загрузку процедурой V. 1. Load Operators and Functions, опциями Mathematical functions и Read (после использования рекомендуется выгрузить (чтобы освободить память) опцией Erase).
SORTUP x – располагает в порядке возрастания элементы массива x; если x-матрица, - сортирует все столбцы. Этот оператор, как и предыдущий, относится к числу загружаемых.
заключение
использование пакетов существенно улучшает процесс изучения основ математической статистики, ускоряя его и вызывая интерес у студентов. Это показал двухлетний опыт применения в МЭИ на АВТФ. Данное учебное пособие является началом работы в этом направлении.
Авторам приятно отметить,что изобретателем и вдохновмтелем этого пособия является Наталья Александровна Сливина, зажигательный и неповторимый энтузиаст применения компьютеров и пакетов в преподавании математики. Хотелось бы также отметить участие в деле освоения пакетов студентов АВТФ - прекрасных программистов Евгения Голода, Дмитрия Горбунова, Петра Комарова.
Литература
-
Севастьянов Б.А. Курс теории вероятностей и математической статистики. М.: Наука, 1982. 256 с.
-
Рао С.Р. Линейные статистические методы и их применение. М.: Наука, 1968. 548 с.
-
Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М.: Наука, 1983. 416 с.
-
Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. М.: ИНФРА-М, Финансы и статистика, 1995. 384 с.
-
Краткое описание пакета STATGRAPHICS. / Э.А. Вуколов, В.В.Лесин, Ю.П. Лисовец др. М.: МГИЭТ. вып. 1, 2. 1993.