Корн Г.А., Корн Т.М. - Справочник по математике для ученых и инженеров (947387), страница 141
Текст из файла (страница 141)
п. 19.5-5. 19.1-3. Связь вероятностной модели с опытом: оценка и проверка. (а) Оце н к а п ар а метр он. Статистические методы позволяют учесть данные опыта (выборочные значения) для уточнения деталей вероятностной людгли, например, для оценки плотности вероятностей гр(х) случайной величины х. Знанне же вероятностной модели позволяет прогнозировать будущие события, чю важно для принятия решений. В большинстве приложений относительные частоты (п. 19.2-1) применяются непосредственно только для грубой качгспмгмной оценки распределения генеральной совокупности.
Обычно задмотся определенным типом закона распределения генеральной совокупности (19.1-2) Ф=Ц (хл Ч1. Ч2 ") и по данным случайной выборки (х,, х„..., хя) оценивают лишь неизвестные параметры Чы гЬ, ... В пп. 19.3-1 — 19.3-5 приведено некоторое количество типовых ааконов распределения для подбора их в соответствии с физическими предпосылками. Параметры Ч,, Ч,, ... обычно характеризуют определенное свойство творе. тнческого распределения величины х (например, генеральное среднее, дисперсию, асимметрию, слг.
табл. 18.3-1). Для оценки значений этих парамегров по данным выборки (хы х„ ..., х„) пользуются значениями таках статнстнк ул(хы хв " хл), уз(хы х,, ..., х„), ..., которые характеризуют аналогичные свойства выборкй (например, вйборочное среднее, выборочну1о дисперсюо, пп. 19.2-3 — 19.2-6). Выбор гподходящих» статистик ие обязательно однозначен; предпочитают оценки у(х,, хз, ..., х„), которые сходятся по нероятпостн к Ч при и со (состоятельные оценки), у которых мател1атнческое ожидание равно Ч (иесмещенные оценки) или у которых выборочное распределение имеет наименыпую дисперсию (аффективные оценки) купли которые легче вычислить (пп.
19нР! — 19.4-5). (Ь) Проверка статистических гипотез. Для проверки статистических гипотез, устанавливающих некоторые свойства теоретического РаспРеделениа (напРимеР, значениа паРаметРов Чо Ч,, ...), оценнзаетсЯ правдоподобие (!) испьпываелюй выборки (хл, хз, ..., х„) при условвп, что для вычисления функции Е (х,, х„ ..., хл) прнменяез'ся предполагаемая плотность распределения (2).
Гипотеза отбрасынается, если испытываемая выборка (х„ х», , х„) попадает в область малого правдоподобия, т. е. если найденное из опыта значение статистики у (х,, х,, ..., х„) маловероятно при выбранной гипотетической функции правдоподобия. Выбор вероятности, которую следует считать малой (уровня значимости критерия), зависит от условий задачи. Непараметрнческне критерии проверяют свойства гипотетического распределения, которые не сводятся к значениям параметров (например, идентичность двух распределений, независимость двух случайных величии, пп.
19.6-8 н 19.7.6); эти критерии удобны теи, что не требуют знания типа распределения (2) генеральной совокупности. П р н м е ч в н н е. Некорректное прнмененяе ствтнстнчесннх методов маясег провести к неверным зеклачепням. Все (во»можно, н не выснв»гение явна) превполаженкн, отнасящаеся к теоретннсскому рвспредсленвю, Лалнгны быть нраверенм. Никогда лг сгж)ргт лримтгтн одну и тн жг гыдгркг Дгл оценки и тгл лргггрки Зеве»ам, наконец, чта стлснстн(ескне крнтсрнн не могут лонезгть*нв однао гннотезы; онн могут лнюь указать на «отсутствие онраверженннж 19.2.
СТАТИСТИЧЕСКОЕ ОПИСАНИЕ. ОПРЕДЕЛЕНИЕ И ВЫЧИСЛЕНИЕ СТАТИСТИК СЛУЧАЙНОЙ ВЫБОРКИ 19.2-1. Относительные частоты. (а) О п р еде л е н и е. Пусть событие Е состоит в том, что значение слу- чайной величины х принадлежит некоторому множеству 3 . (обычно некотон рому классовому интервалу, п. 19.2-2, ЬЬ и пусть лапа случайная выборка (х,, хз...., хл) значений величины х. Частотой события Е в данной случал. ной в1гборке казынается количество и, выборочных значений хп, попадающих в 3 , а относительной частотой †отношен и к объему выборки и: Ь(Е) =- —. (!9.2-1) (Ь) Центр распределения н дисперсия.
Тан как случайная выборка ыожет рассматрнваться как результат последовательности и испы- таний по схеме Бернулли (п. 18.7-3), то случайная величина л имеет бнно- мнальное распределение (табл. 18 8-3), где О=Р (Е) = ) йФ (х) есть вероятзе ность события Е и )йй(Е)=Р(Е), Относительная частота А (Е) гснгь несмещенная состоятельная оценка для соотпгаютвующей вероятносгни Р (Е); при и со гта оценка А (Е) агимл- тооытегяи нормальна с ппртнгтрами (2) (пп.
!8.6-4 н 18.6-5, а). !9.2-2. Распоеделеиие выборки. Группированиые данные. (а) Эмпирическая функция распределения, Для данной слу1вйной выборки (к„х„..., х„) эмпирическая функция распределения Г(Х)=А(х.С Х) (19.2-3) есть неубывающая ступенчатая функция с Г ( — со) =-О, Г (+ со)= 1. Она является негмги1енной гоггпотпельной оценкой для функции распределения бл(Х)=Р(х(Х) (п. 18.2-9) и определяет частотное распределение выборки (эмвирическое распределение). (Ь) Классовые интервалы н группированные данные. Пусть размах случайной неличины х разделен на конечное (нли бесконечное) число подходящим образом выбранных классовых интервалов Ху — — АХ(~ 1 1 ~х (Ху+ — АХ( ((=1, 2, ...), длины которых соответственно равны АХ1, АХы ... (середины интервалов суть Хл(Х»(...). Для данной случайной выборки групповая частота лу есть число тех х„, которые попадают в /-й классовой интервал (опнсанке выборки через группироваиные данные).
Относительные частоты 37= пдп попадания в /-й классовой интервал должны в сумме давать единицу; они являются несмещенными состоятельными оцепкамн для соответствующих вероятностей 1 х + — лх р/= 1 йб) (х). х — — ьх 20 Г. Кори н Т, Корм !9Л. СТАТИСТИЧЕСКОЕ ОПИСАНИЕ б!О 19.2-3. ГЛ. 19. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА 611 у Л'у — — Х и! с=! аз=(х — Х)з= — у (х» — Х)', 2— »=1 (19.2-12) л л 5'! =- — 82 = — Р~ (х, — Х) з л — ! л — ) ХЛ »=1 М -'= о"'; М5з= 3, л (!9,2-!3) (!9.2-!4) 05 (рз о ), л 1 ъ-~ » =- 1 Заметим, что Пе — П„ 3 Во = л Мог — от (!9.2-16) Мш,=р,+О®, (19.2-8) г У) э' (19.2-10) (19.2-!1) Накопленные частоть! Л) н накопленные относнтельиые частоты Гг определяются формулами 1 Е) — ~ й(= х' и(= — У=В (Ху+2 ЛХ().
(!9.2-4) 1=1 1=1 Для выборок достаточно большою обтема при достаточно малых классовых питер. авлэх все выборочные статистики могут быть вычислены по относительяыгл чзстатэи». = —.-.л )л, точно твк же «як соотэетствуию(ие параметры генеральной созокупноств вычис- ляются по вероятностям. Применение группнровзнных данных дает экономию з»оэсче. г' тах, если объем выборни л больше, чем 25. Кроме того, статистики Г(Х), л,, )г к Р. дают различные грэфическке представления выборочного рэспределенкя и, слсдовэ- тельно, оцениваемого рэспределения генеральной совокупности (гнстогрвмл1э, полигон 1 распределения н т.
д), (с) Выборочные кваитили Кр определяются формулой (см тэнже табл. 18,3-1 и п. 19.5.2), »(х<ХР) Р(ХР)=Р (0<Р<1). (19,2-8) Вта формула определяет Хр неоднозначно, онэ лишь указывает границы выборочных значений л»', ХтЛ называется выборочной медианой, Х у, ХП в Х,у — выборочными ивзртнлйми( аналогично определяются выборочные децилн н процеитилн, 19.2-3. Выборочные средние (см. также пп. 18.3-3, 19.2-5 н 19.5-3). (а) Выборочное среднее значение величины х.
Пусть дана случайная выборка (х„хз, ..., хк); выборочным средним значеннем велвчнны х называется л 1 1 Х= — л(хг+хз+ ... +х„)= — „~ ! х». »=! Для выборочного распределения, заданного классовыми интервалами с центрами х=Х,, Хю ..., Хш (и. 19.2-2), выборочное среднее Х аппрокснмнруется значением ш 1 1 чч Х„= — (п,Х,+п,Х,-1-... +пшХш)= — ~, п)Х! ) 1 (выборочное среднее прп груипированных донных). х есть характеристика полохсеяия для выборочного распределения.
Отме. кнм моменты распределения величины Х: МХ= 9, ОХ= —, о* л' М(Х вЂ” 5)з=р-„', М(Х вЂ” й)з="" ""+", (!9.2.9) если величины справа существуют (р, н р,— центральные моменты теоретиче- ского распределения величины х). Выборочное среднее х есть ыесмещенлвя состоятельная оценка для генерального среднего 8=Мх. Если ол сун(гспмугт, пю Х имеет осимлтотически нормальное распределение с парпмгтрпми (8) при и со (пп. !8.6-4 и 19.5-2).
(Ь) Выбор оч н ое ср еды ее дл я у(х). Вмборочное среднее для функ- ции у(х) случайной величины хесть л у= — [у(х,)+у(х,)+...+у(х„)) = — „~~ у(х») »=1 илн, прн группнрованпых данных, ра= 1 Х п)'у(Х() 2=1 Оценки, основанные на формуле (11), иногда можно улучшить введениен поправочного члена (в. 19.2-5). 19,2-4. Выборочные днсперснн н моменты (см. также пп. 18 З-З, 18,3.2, 19.2-5, 19.4-2 н !9.5.2). (а) Выборочные дисперсии явдяются харокшгрисп)иком!! Рвссвякил выборочного распределения; 3 назы- вается выборочным стандартным отклонением.
Отметим формулы если велнчнны справа существуют. 52 есть несмещенная состоятельная оценка для генеральной дисперсии ох=Ох, н потому она чаще применяется, чем 35 (Ь) Моне н ты выбор к и. Выборочные начальные моменты а, и выборочные центральные моменты т порядка г определяются формуламй — 1 =(х — х)"= — „~ (х» — Х)'. (19.2-!5) »=1 Оглг= — (р „— 2гр р „- — р,'+г р рт,) ! О (г ) (!д 2.!у) 1 ! 11 если величины справа существуют. пг есть мщмещеклоя сосглолтельяпя оценка длл сооомгтсглвующего теоретического лочплького моменгло сг,=МА"" генеральной совокупное!ли. Если сугцесглвуея пзг, то и имеет при и-ь со осилглтоти. чески нормальное распределение с параметрами (16). тг есть состоятельная, но смещенная оценка для теоретического центрального момента р,= М (х — 5)», Несмешеннымн и сштоятельными оценками для и, и р, будут соответственно л («' — 2л + 3) ю — Зл (2п — 3) лез -т, и 3 (л — 1)(л — 2) (л — 1) (л — 2) (л — 3) (с) Характеристики всимиетрин н эксцесса (см.