Теория универа (Теория вероятностей и математическая статистика. Теория и примеры решения задач), страница 11
Описание файла
Файл "Теория универа" внутри архива находится в следующих папках: Теория вероятностей и математическая статистика. Теория и примеры решения задач, ТВиМС, Экзамен. PDF-файл из архива "Теория вероятностей и математическая статистика. Теория и примеры решения задач", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из 4 семестр, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. Архив можно найти в разделе "остальное", в предмете "теория вероятности и математическая статистика" в общих файлах.
Просмотр PDF-файла онлайн
Текст 11 страницы из PDF
Если на оси ординат откладывать не абсолютные (ni), аотносительные (wi) частоты, то получим полигон относительных частот (рис.1).Рис. 1.По аналогии с функцией распределения случайной величины можно задать некоторуюфункцию, относительную частоту события X < x.Определение 15.1. Выборочной (эмпирической) функцией распределения называютфункцию F*(x), определяющую для каждого значения х относительную частоту событияX < x. Таким образом,nF * ( x) = x ,(15.1)nгде пх – число вариант, меньших х, п – объем выборки.Замечание.
В отличие от эмпирической функции распределения, найденной опытным путем,функцию распределения F(x) генеральной совокупности называют теоретической функциейраспределения. F(x) определяет вероятность события X < x, а F*(x) – его относительнуючастоту. При достаточно больших п, как следует из теоремы Бернулли, F*(x) стремится повероятности к F(x).Из определения эмпирической функции распределения видно, что ее свойства совпадают сосвойствами F(x), а именно:54PDF created with FinePrint pdfFactory trial version http://www.fineprint.com1) 0 ≤ F*(x) ≤ 1.2) F*(x) – неубывающая функция.3) Если х1 – наименьшая варианта, то F*(x) = 0 при х≤ х1; если хк – наибольшая варианта, тоF*(x) = 1 при х > хк .Для непрерывного признака графической иллюстрацией служит гистограмма, то естьступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичныеинтервалы длиной h, а высотами – отрезки длиной ni /h (гистограмма частот) или wi /h(гистограмма относительных частот).
В первом случае площадь гистограммы равна объемувыборки, во втором – единице (рис.2).Рис.2.Лекция 16.Числовые характеристики статистического распределения: выборочное среднее, оценкидисперсии, оценки моды и медианы, оценки начальных и центральных моментов.Статистическое описание и вычисление оценок параметров двумерного случайноговектора.Одна из задач математической статистики: по имеющейся выборке оценить значениячисловых характеристик исследуемой случайной величины.Определение 16.1. Выборочным средним называется среднее арифметическое значенийслучайной величины, принимаемых в выборке:55PDF created with FinePrint pdfFactory trial version http://www.fineprint.comk∑n xi iх1 + х 2 + ...
+ х п n1 x1 + n 2 x 2 + ... + n k x ki =1==хВ =,(16.1)пnnгде xi – варианты, ni - частоты.Замечание. Выборочное среднее служит для оценки математического ожидания исследуемойслучайной величины. В дальнейшем будет рассмотрен вопрос, насколько точной являетсятакая оценка.Определение 16.2. Выборочной дисперсией называетсяnDB =∑ ( xi − x B ) 2k∑ n (xii− xB ) 2= i =1,(16.2)nnа выборочным средним квадратическим отклонением –σ В = DB .(16.3)Так же, как в теории случайных величин, можно доказать, что справедлива следующаяформула для вычисления выборочной дисперсии:D = x 2 − (x ) 2 .(16.4)Пример 1.
Найдем числовые характеристики выборки, заданной статистическим рядомxi2578ni3872i =12⋅3 + 5⋅8 + 7 ⋅7 + 8⋅ 24 ⋅ 3 + 25 ⋅ 8 + 49 ⋅ 7 + 64 ⋅ 2= 5,55; DB =− 5,55 2 = 3,3475; σ B = 3,3475 = 1,83.2020Другими характеристиками вариационного ряда являются:- мода М0 – варианта, имеющая наибольшую частоту (в предыдущем примере М0 = 5 ).- медиана те - варианта, которая делит вариационный ряд на две части, равные по числувариант. Если число вариант нечетно ( n = 2k + 1 ), то me = xk+1, а при четном n =2kx + x k +15+7= 6.те = k.
В частности, в примере 1 me =22Оценки начальных и центральных моментов (так называемые эмпирические моменты)определяются аналогично соответствующим теоретическим моментам:- начальным эмпирическим моментом порядка k называется∑ ni xik .Mk =(16.5)n∑ ni xi = x , то есть начальный эмпирический момент первого порядкаВ частности, M 1 =Bnравен выборочному среднему.- центральным эмпирическим моментом порядка k называется∑ ni ( xi − х В ) k .тk =(16.6)n∑ ni ( xi − х В ) 2 = D , то есть центральный эмпирический момент второгоВ частности, т2 =Bnпорядка равен выборочной дисперсии.хВ =Статистическое описание и вычисление характеристикдвумерного случайного вектора.При статистическом исследовании двумерных случайных величин основной задачей являетсяобычно выявление связи между составляющими.56PDF created with FinePrint pdfFactory trial version http://www.fineprint.comДвумерная выборка представляет собой набор значений случайного вектора: (х1, у1), (х2, у2),∑ xi ,…, (хп, уп).
Для нее можно определить выборочные средние составляющих: x B =ny∑ i и соответствующие выборочные дисперсии и средние квадратические отклонения.yB =nКроме того, можно вычислить условные средние: у х - среднее арифметическое наблюдавшихся значений Y, соответствующих Х = х, и х у - среднее значение наблюдавшихся значенийХ, соответствующих Y = y.Если существует зависимость между составляющими двумерной случайной величины, онаможет иметь разный вид: функциональная зависимость, если каждому возможному значениюХ соответствует одно значение Y, и статистическая, при которой изменение одной величиныприводит к изменению распределения другой. Если при этом в результате изменения однойвеличины меняется среднее значение другой, то статистическую зависимость между ниминазывают корреляционной.Лекция 17.Основные свойства статистических характеристик параметров распределения: несмещенность, состоятельность, эффективность.
Несмещенность и состоятельностьвыборочного среднего как оценки математического ожидания. Смещенность выборочнойдисперсии. Пример несмещенной оценки дисперсии. Асимптотически несмещенныеоценки. Способы построения оценок: метод наибольшего правдоподобия, метод моментов, метод квантили, метод наименьших квадратов, байесовский подход к получениюоценок.Получив статистические оценки параметров распределения (выборочное среднее, выборочную дисперсию и т.д.), нужно убедиться, что они в достаточной степени служат приближе57PDF created with FinePrint pdfFactory trial version http://www.fineprint.comнием соответствующих характеристик генеральной совокупности.
Определим требования,которые должны при этом выполняться.Пусть Θ* - статистическая оценка неизвестного параметра Θ теоретического распределения.Извлечем из генеральной совокупности несколько выборок одного и того же объема п ивычислим для каждой из них оценку параметра Θ: Θ1* , Θ *2 ,..., Θ *k . Тогда оценку Θ* можнорассматривать как случайную величину, принимающую возможные значения Θ1* , Θ *2 ,..., Θ *k .Если математическое ожидание Θ* не равно оцениваемому параметру, мы будем получатьпри вычислении оценок систематические ошибки одного знака (с избытком, если М( Θ*) >Θ,и с недостатком, если М(Θ*) < Θ).
Следовательно, необходимым условием отсутствия систематических ошибок является требование М(Θ*) = Θ.Определение 17.2. Статистическая оценка Θ* называется несмещенной, если ее математическое ожидание равно оцениваемому параметру Θ при любом объеме выборки:М(Θ*) = Θ.(17.1)Смещенной называют оценку, математическое ожидание которой не равно оцениваемомупараметру.Однако несмещенность не является достаточным условием хорошего приближения к истинному значению оцениваемого параметра. Если при этом возможные значения Θ* могутзначительно отклоняться от среднего значения, то есть дисперсия Θ* велика, то значение,найденное по данным одной выборки, может значительно отличаться от оцениваемогопараметра.
Следовательно, требуется наложить ограничения на дисперсию.Определение 17.2. Статистическая оценка называется эффективной, если она при заданномобъеме выборки п имеет наименьшую возможную дисперсию.При рассмотрении выборок большого объема к статистическим оценкам предъявляется еще итребование состоятельности.Определение 17.3. Состоятельной называется статистическая оценка, которая при п→∞ стремится по вероятности к оцениваемому параметру (если эта оценка несмещенная, то она будетсостоятельной, если при п→∞ ее дисперсия стремится к 0).Убедимся, что х В представляет собой несмещенную оценку математического ожидания М(Х).Будем рассматривать х В как случайную величину, а х1, х2,…, хп, то есть значенияисследуемой случайной величины, составляющие выборку, – как независимые, одинаковораспределенные случайные величины Х1, Х2,…, Хп, имеющие математическое ожидание а. Изсвойств математического ожидания следует, что Х + Х 2 + ...
+ Х п М (Х В ) = М 1 = а.пНо, поскольку каждая из величин Х1, Х2,…, Хп имеет такое же распределение, что игенеральная совокупность, а = М(Х), то есть М( Х В ) = М(Х), что и требовалось доказать.Выборочное среднее является не только несмещенной, но и состоятельной оценкойматематического ожидания. Если предположить, что Х1, Х2,…, Хп имеют ограниченныедисперсии, то из теоремы Чебышева следует, что их среднее арифметическое, то есть Х В ,при увеличении п стремится по вероятности к математическому ожиданию а каждой ихвеличин, то есть к М(Х).
Следовательно, выборочное среднее есть состоятельная оценкаматематического ожидания.В отличие от выборочного среднего, выборочная дисперсия является смещенной оценкойдисперсии генеральной совокупности. Можно доказать, что58PDF created with FinePrint pdfFactory trial version http://www.fineprint.comn −1DГ ,(17.2)nгде DГ – истинное значение дисперсии генеральной совокупности. Можно предложитьдругую оценку дисперсии – исправленную дисперсию s², вычисляемую по формулеМ ( DB ) =k∑ n (xii− xB ) 2nD B = i =1.(17.3)n −1n −1Такая оценка будет являться несмещенной. Ей соответствует исправленное среднееквадратическое отклонениеs2 =ks = s2 =∑ n (xi =1ii− xB ) 2.(17.4)n −1Определение 17.4.
Оценка некоторого признака называется асимптотически несмещенной,если для выборки х1, х2, …, хпx + x 2 + ... + x nlim 1=X,(17.5)n →∞nгде Х – истинное значение исследуемой величины.Способы построения оценок.1. Метод наибольшего правдоподобия.Пусть Х – дискретная случайная величина, которая в результате п испытаний принялазначения х1, х2, …, хп. Предположим, что нам известен закон распределения этой величины,определяемый параметром Θ, но неизвестно численное значение этого параметра. Найдем еготочечную оценку.Пусть р(хi, Θ) – вероятность того, что в результате испытания величина Х примет значение хi.Назовем функцией правдоподобия дискретной случайной величины Х функцию аргументаΘ, определяемую по формуле:L (х1, х2, …, хп; Θ) = p(x1,Θ)p(x2,Θ)…p(xn,Θ).Тогда в качестве точечной оценки параметра Θ принимают такое его значение Θ* = Θ(х1, х2,…, хп), при котором функция правдоподобия достигает максимума.