Основные понятия по матстату (1120335)
Текст из файла
Осн. понятия.
(,А,Р) –вер. простр.; Р Р<круглое> – класс допустимых вер-тей, = (1,… n) – n испытаний Бернулли. ={}, А – все подмн-ва, Р() = Р = i(1-- )n -- i; вер-ть успеха не известна, определяется на каждом .
ОПР. выборка – сл. вектор (n-мерный) Х = (Х1…Хn), где результаты i-ого испытания
описываются сл. величиной Xi. Эксперимент – n испытаний, n – объём выборки.
Вектор х=(х1…хn) – реализация выборки.
Пусть F<круглое> = {FX} -- мн-во допустимых ф-ий распр. FX (x) = P( X1< x1,…, Xn< xn) = {т.к. Хi – н.о.р.с.в.} = П{i=1 to n} Fi (xi) = П{i=1 to n} P(Xi< xi); все Хi имеют одинаковую ф-ию распр. (неизвестную).
ОПР. Х ~ F X – выборка из генеральной совокупности L(), имеющей F.
ОПР. Пусть х = (х1…хn) – реализация выборки. Упорядочим ее по возрастанию: х(1) … х(n) –
это вариационный ряд (нету независимости, т.к. ). Выпишем все такие упорядоченные
выборки одну под другой if взять k-ый столбец, то получим значения новой сл. вел.
X(k) – k-ая порядковая статистика.
ОПР. Эмпирическая ф-ия распр.: Fn(x) = 1/n {i=1 to n} I( X(i)< x); F(x) не зависит от выборки
– теоретическая ф-ия распр.; Fn – измеримая ф-итя борелевской сл. вел. тоже явл. сл.
вел., м. принимать значения (0; 1/n; 2/n;…;n/n=1). {i=1 to n} I( X(i)< x) – кол-во успехов в
n испытаниях Бернулли Fn имеет биномиальное распр. Bi( n,F(x) ), т.е. Р( Fn(x) = k/n,
где k=0,…,n) = CnkFk(x)(1 – F(x))n-k.
ТЕОРЕМА 1. Пусть Fn – эмп.ф-ия распр., построенная по выборке (X1…Xn) с распределением
L(), т.е. Xi ~ F(x): ~F(x), xRe и >0 lim{n} P( |Fn(x) – F(x)| < ) = 1,
т.е. Fn(x) –P F(x) при n .
ТЕОРЕМА Бернулли.(следствие из ЗБЧ). If n – число успехов в схеме Бернуллиn /n –P p.
ТЕОРЕМА Гливенко. В условиях Т1 выполнено Р( lim{n} sup{xRe}|Fn(x) – F(x)| = 0) = 1.
[ = Dn(x) ]
ТЕОРЕМА Колмогорова. If F(x) непрер фиксир. t >0 {насколько отклоняется от F}
lim{n} P( Dn(x)* n t ) = K(t) = {-- to +} (-1)j *exp(-- 2j2 * t2).
ТЕОРЕМА Смирнова (проверка гипотезы, что 2 выборки одного распределения).
Пусть F1n(x) и F2m(x) – 2 эмпирич. ф-ии распр., постр. на основе 2-х независимых
выборок объемов n и m одного и того же распр. L() и Dn,m = sup{xRe}|F1n(x) – F2m(x)|.
Тогда if F9x) непрер. фиксир. t >0 lim{n,m} P ( Dn * (nm / n+m) t) = K(t).
Частоты.
Пусть -- дискр. сл. вел., приним. знач. 1,2… r /n (кол-во эл-тов в выборке, равных ar;
r = {i=1 to n} I( X(i)= ar);) сх. по вер-ти к P( = ar).
Группировка. Пусть -- непрер. сл. вел. с = f(x). Пусть принимает значения в обл. Е; разобьем ее на интервалы Еr: E = r Er, EiEj = при i j; r = {i=1 to n} I( X(i)Er). r /n сх. по вер-ти к P(Er) =
{по Er}f(x)dx |Er|*f(xr), xrEr. Аналог плотности: r / n|Er| f(xr).
Неравенство: P( |X+Y| x) P( |X| x/2) + P(|Y| x/2).
ОПР. G – эмпирическая (выборочная) хар-ка: G = G(X) = g(x)dFn(x) = {if не фиксировать выборку} =
1/n {i=1 to n} g(Xi), Xi – компонент выборки.\
ОПР. k-ый порядковый момент Ak = 1/n {i=1 to n}Xik. Выборочное среднее (аналог М.О.):
x~ = 1/n {i=1 to n} Xi.
ОПР. Эмпирические центральные моменты Mk = Mk(X) = 1/n {i=1 to n} (Xi – x~)k ; при k=2
выборочная дисперсия. k = Ek, k = E( -- k)k; Mk = {r=0 to k} (-1)r Ckr x~ rAk—r =
{r=0 to k-2} (-1)r Ckr x~ rAk—r + (k-1) x~ k .
ОПР. центральный выборочный момент s2 = M2 = A2 – A1 = A2 – x~ 2;
M3 = A3 – 3 x~A2 + 2x~ 3 ; 1 = Ex~ ; EFn(x) = F(x); Dx~ = D 1/n {i=1 to n}Xi = 1/n2 {i=1 to n} 2 =
= 2 /n; Es2 = 2 -- 2 /n = (n-1)/n 2 , 2 !!!; Ds2 = (n-1)2/n3 [4 – (n-3 / n-1) 22];
ТЕОРЕМА. Пусть сл. вел. 1(n)…r(n) cх. по вер-ти при n к const C1…Cr нерер. ф-ии
(х1…xr) сл. вел. (n) = (1(n)…r(n)) cх. по вер-ти к (C1…Cr).
Замечание. Теорема верна, if непрер. только в некоторой окр-ти вектора С.
ОПР. Коэфф. асиимметрии наз-ся 3= 3 /23/2; коэфф. эксцесса 4 = 4 /32 -- 3;
Асимптотич. нормальность выборочных моментов.
ОПР. if n ~ N(, 2) распр. n асимптотич. норм.: L(n) N(, 2).
ОПР. if V выборки ; посл-ть центральных выборочных моментов Ank = 1/n {i=1 to n}Xik, Xi –н.о.р.с.в.
DAnk = (2k -- k2) /n; по ЦПТ P{ (Ank -- k) / DAnk < x} Ф(х). Рассм. x~ = 1/n {i=1 to n} Xi.
L(x~) = N(, 2/n), n нормально (не асимпт.). E x~ = 1; D x~ = 2 /n;
Порядковые статистики.
Пусть L() абсол. непрер., имеет F(x) и f(x); X=(x1…xn) -- выборка из L; Ф-ия распр. k-ой порядковой статистики FX(k)(x) = P( I (X(k) < x) k) = P(число успехов k) = {m=k to n} Cnm Fm(x) (1—F(x))n—m =
B(F(x), k, n-k+1), где В –неполная В-ф-ия: В(z,a,b)=Г(a+b) / Г(a)Г(b) * {0 to z} xa--1(1-x)b dx, z[0,1].
Плотность k-ой пор. стат.: = gk(x) = F’X(k)(x) = n! /(k-1)!(n-k)! Fk-1(x) (1—F(x))n—k *f(x).
ОПР. up -- р-квантиль – корень ур-ия 1--Ф(up) = p; типа медианы распределения, но не 1/2, а р берем.
р(0,1).– число, для к-рого F()(up--) p и F()(up+) p. {м.б. весь отрезок [up‘ ,up “]}.
ОПР. Выборочная р-квантиль – р-кв-ль эмпирической ф-ии распр., это сл.вел.
ОПР. p = inf up -- левая р-кв-ль.
ТЕОРЕМА. if в некоторой окр-ти p теоретич. плотность f(x) непрер. вместе с 1-ой произв. и f(p) >0
при n левая р-кв-ль Z(n,p) ~ N(p, p(1-p)/ n*f2(p) ). {асимпт. норм.}
ОПР. Выборочная медиана (только одна точка) Mn = (X n / 2 + X n / 2 + 1) / 2, if n = 2m;
X[n / 2] + 1 , if n= 2m+1.
Несмещенные оценки.
ОПР. X – выборка; T(X) – ф-ия от нее -- статистика; t определена ф-ия FT(t) = P( T(x) < t); Т зависит
только от выборки и не зависит от неизвестного параметра распределения. Пусть () – неизвестная
оцениваемая хар-ка. Оцениваем Т(х): Т(х) (), х. Лучше для оц. та ф-ия, у к-рой дисперсия min.
Критерий min-ии среднеквадр. ошибки. E = (T(x) -- () )2 min надо, () – типа М.О.
ОПР. Т(х) – несмещенная оц. для , if ET(x) = (), .
ОПР. Смещение оценки: b() = ET(x) -- .
ОПР. среднеквадр. ошибка: E( Т(x) -- () )2 = DT, if несмещенная, и = DT +b2(), else.
ТЕОРЕМА. Пусть Х – выборка из N(, 2). x~ и s2 – нез. сл. вел., причем L( (x~--)n /) =N(0,1), и
L( n s2/2) = 2n—1 {c n-1 степепнью свободы}. Если Xi ~ N(0,1) {i=1 to n}Xi2 ~ 2n; E=n, D=2n.
Оптимальные оценки.
Х – выборка, F ={F(x, ), } – статистическая модель. Т= Т(х) – несмещ. оц. = () и DT < . Пусть
-- класс несмещенных оценок ф-ии .
ОПР. Пусть Т, Т* ; if DT* DT по критерию среднеквадр. ош. Т* равномерна по
не хуже, чем Т. if хотя бы для одного неравенство строгое T–оптимальная оценка. Опт. оц. ф-ии
обознач. *. * <==> DT = inf{по } DT, .
ТЕОРЕМА.if T1,Т2 – две несмещ. оц. ф-ии =(), T1-П.Н.T2, т.е. опт.оц. единств. с точн. до мн-ва меры 0.
ТЕОРЕМА. Относительная частота произвольн. события в n независ. испыт. Бернулли явл. опт. оц. для
вер-ти этого события (для теоретич. ф-ии распр.).
ТЕОРЕМА. Пусть Т1*, Т2* -- опт. оц. 1 и 2 соотв., статистика Т* = а1Т1* + а2Т2* явл. опт. оц. (с точки
зрения несмещ. и среднеквадр.) для ф-ии () = а11() + а22().
ОПР. Пусть Х – выборка, х – ее реализация, распределение L() F{стат. модель}, f(x, ) – плотность (или
вероятность для дискр. случая). L(x, ) = f(x1, )*…*f(xn, ) – ф-ия правдоподобия -- ф-ия от
при фиксир. х.
ОПР. Пусть -- скаляр; вклад выборки Х – сл. вел. U(Х,) = /{ln L(x,)} = {i=1 to n}/{ln f(Xi,)}.
Предполагается, что 0 < E2 U(x,) < , . {2-ой момент}
ОПР. Регулярные модели – где можно менять порядок интегрирования и дифференцирования.
СВ-ВА РЕУЛЯРНЫХ МОДЕЛЕЙ.
-
L(x, ) dx 1 {как -л по всему от плотности}, dx = dx1*…*dxn;
-
E U(x,) = 0, .
ОПР. Ф-ия информации Фишера о параметре , содержащаяся в выборке Х: in() = D U(x,) = E U2 (x,).
i() = i1() = {информ., сод-ся в одном наблюдении} = E /{ln L(x,)} = /{ln f(x,)}; in() = n*i()
информация во всей выборке, т.е. чем больше V выборки, тем больше в ней информации.
Предположим, что f(x) 2 раза дифф. по инф., сод-ся в одном наблюдении, in() = -- E 2/2{ln f(x,)}.
Чему равна in для некоторых распределений.
М
одель N(,2) N( , 2) Bi(k, ) Pois() Bi--(r, )
i n() 1/2 2/2 k / (1-) 1/ r/ (1-)2
П ричина нерегулярности – выборочное простр-во зависит от неизв. параметра .
Неравенство Рао -- Крамера.
ТЕОРЕМА. оценки Т =Т(X) DT [’()]2 / n*i(). Равенство <==> T – линейная ф-ия вклада
выборки, т.е. {критерий эффективности:} Т() -- () = Q() U(X, ). {тогда оц. Т хороша в смысле
несмещенности; if равенство оц. с min возм. диспересией (оптим.)}
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.