М.В. Козлов, А.В. Прохоров - Введение в математическую статистику (1115302), страница 2
Текст из файла (страница 2)
Достаточно детально изучается линейная статистическая модель. Эта модель, во-первых, служит хорошим источником материала для педагогической практики, во-вторых, открывает подход к теоретическим н прикладным аспектам регрессионного и диоперсионного анализа. В настоящей книге линейная модель должна еще и подготовить читателя к воспряятяю теоретических осыов статястякн, которым уделяется серьезное вяяманяе в последующих разделах. Вопросах нспользоваяяя яяформацяя, содержащейся в статистяческях данных, для построеяня статистических выводов н формалнзацвя самого понятия информации в статястнке посвящена гл. 111, содержащая разделы: достаточность, несмещенное оценываыые, яяформацяя в статистике, яяжяне граяяцы дисперсия оценох Гл. 1Ч объедяяяег некоторые приемы построеяяя статнстяческнх оценок ы крнтернев, основанных яа понятны правдоподобяя.
Гл. Ч посвящеяа асяиптотяческни свойствам оценок максямального правдоподобня я критерия отяошеяяя правдоподобяй. Ограянчеяный объем кяягя не позволнл включать некоторые важные статистические процедуры я затронуть другие разделы современной математической статястякя. Вместо етого авторы более детально, с болъшяи колячеством примеров я повышенным внямаянем к логической стороне вопроса разобрали таяне фундамеытальные пояятяя статистики, как статлстяческая модель, достаточность, правдоподобие. Авторы надеются, что тщательная проработка матеряала кяягя поможет читателю самостоятельно разобрать темы, затронутые наин лншь частнчяо, по другяи нсточыякам, среди которых иы выделим капнталъяый труд М. Дж.
Кеядалла, А. Стьюарта 124 — 261. Бябляографяческый список в конце кяягн включает в основном издания яа русском языке я ня в какой хере яе претендует яа полноту. Авторы пользуются возможностью выразить благодарность свопм учнтеляи я коллегам — сотрудяякам кафедры теории вероятностей я кафедры математяческой статистики я случайыых процессов механнко-математыческого факультета МГУ.
Авторы благодарны сотрудникам факультета Й. Н. Марчук, Т. В. Ннстратовой, Т. В. Козъияяой, О. В. Фысуыенко, а также студентам ы аспяраятам кафедры математяческой статнстякн я случайяых процессов за помощь в офорилеяяя рукопясн. Рассматривая княгу как очередной шаг в разработке методякя преподавания иатематнческой статистики, авторы отдают себе ясный отчет в несовершенстве своего труда я будут благодарны всем, кто выскажет своп заиечаняя я предложеяяя. М.
В. Козлов, А. В. Прохоров ГДАВЛ 1 СТАТИСТИЧЕСКИЕ МОДЕЛИ И МЕТОДЫ: НАЧАЛЬНЫЕ ПОНЯТИЯ й н ви одтность и чдстотл 1. Введевне. Процесс познания окружающего мвра включает наблюдение в эксперимент. Результаты наблюдений во многях случаях можно представить последовательностьв действительных чисел (щ, хв,...,х ) х.
Для того чтобы нз ряда наблюдений можно было ювиечь полезную информацню, необходнмо нметь модель явления. Вероятюетные модели оказывавтея чрезвычайно плодотворными прн авалюе явленнй, всходы хенЖ юторых обладают некоторой етепеньв неопределенности. Понятие неопределенностн в теорнн вероятностей формалнзуетея путем введеиня раенределення вероятностей на множестве Ф всех возможных наблюдений х. В простейшем случае, когда Ж вЂ” конечное нля счетное множеетво, задавтея вероятности р(х) всех его элементов х, так что Ь~р(х)~ ~1 н ~~, р(х) 1.
»ем Любое подмножество А~Ж называют в этом случае собыгнем, а его вероятность определяют формулой Р(А)= Яр(х). П р н и е р 1 (случайный выбор с еоззращеиим). Представнм себе урну с У шарами, занумерованными числами от 0 до У вЂ” $, н рассмотрим опыт, который заключается в л-кратном ювлеченнн шара «наугад» с последующим его возвращеннем в урну.
Все возможные всходы опыта могут быть представлены множеством ю У" последовательностей: Ж-(х* (хь...,х„);щ 0,.1, „У вЂ” 1; 1 1,...,л). На Ф задается равномерное распределеняе вероятностей: р(х) У для всех хвиЖ, что отражает равную степень неопределенности каждого возможного исхода. Пример 2 (случайный выбор без возвращения). Если из урны с э7 шарами последовательно извлекаются «наугад» л шаров без возвращения, п~У, то возможные исходы описываются множеством нз л!(У вЂ” 1) ... (М вЂ” и+1) И/(У вЂ” и)! последовательностей: Ф (х (хь хь...,х„):я~=О, 1,...У вЂ” 1, я~чья~ при !чь1; 1,1* 1,...,п), а распределение вероятностей на Ф снова равномерное: для любого х р (х) (й! — и) 1/й7! ° Взаимоотношение явления и его вероятностной модели имеет статистнческнй характер, т.
е. обнаруживается прн повторных наблюдениях за явлением. Частоты исходов в длинном ряду нспытаынй стабилизируются, их колебания с ростом числа испыта-- ний уменьшаются. Этот эмпирический факт, ыазывэемнй законом устойчивости частот, наблюдается в самых различных ситуациях. Уже виходя за пределы реэльыого опыта, полагают, что прн неогранычеыном повторении частоты стремятся к пределам, которые н принимают за вероятности соответствующих исходов нлн событий.
2. Таблица случайных чисел. Обратимся к табл. 7.1,а книги Л. Н. Большева я Н. В. Смирнова (1), содержащей 12500 «случайных цифр», которые можно представлять себе как реализацию опыта, описанного в примере 1 прн Ф 10, и 12500. Проследим за изменчивостью частот появления цифры «0» с ростом числа наблюдений. Для облегчения анализа сгруппируем первые 100 цифр таблицы (считываемой по строкам) по 10 цифр, последующие 900 — по 100 цифр, следующие 9000 — по 1000.
Йаблюдэемие числа и частоты нулей по группам и суммарно собраны в табл. !. Йетрудно подметить, глядя на последний столбец таблыцы 1, что колебания частоты ш/и с ростом и затухают, 3. Парадокс де Мере. Рассмотрим задачу, которая, кэк утверждают, возникла за игорным столом и была предложена в 1654 г. Паскалю. Игрок де Мере полагал, что вероятность р~ получить хотя бы одну единицу при бросании четырех игральных костей (событие А) меньше вероятности рз выпадения одновременно двух единиц хотя бы раз при 24 бросаниях двух костей (событие В), и ставил в нгрена собитяе В. Таблица 1 Квлвбаиив частоты иааалвииа аула а 10 060 елучааама цибтр Члетота пулей На'~ е группе тлело "валге" паапа, в Навоплепвеп еае тога валей.
лов Навоплеввое аулеа. гл Чвело арлей ° группе Чпело ваааге. люппа в группе Однако зтн вероятности легко вычисляются: Р(А) -р,=1 — (5/6)а=05177... Р(В) -р,-1 — (35/36)во- =0,4914... Поскольку де Мере не были доступны зтн вычнслення, то своя заключения он мог бы основывать на опытных даняых. Представнм себе, что опыт с броеаннем четырех игральных костей н опыт нз 24 бросаний двух нгральных костей повторяются л раз. Результат 1'-го испытания, 1=!, 2, ..., л, опншем парой (хь уг), полагая х;=1 (ут-1), если пронзошло событие А (В), н полагая хг=0 (у;=О), если событие А (В) не произошло. Обозначим через и и тл'/Лао — лт х„т, 7л= — ~~~уо л и ( 1 Естественный вопрос заключаетея в том, насколько основательным является сравнение вероятностей р! н рв по нх частотам !О 10 10 10 10 го 10 10 10 10 10 100 100 100 100 100 100 100 100 100 1000 1ООО 1000 1000 1000 1000 1000 ЫОО 1000 2 1 0 2 0 2 0 2 3 2 И 9 13 8 16 14 6 9 8 97 !06 99 91 97 91 100 117 89 0,2 0,1 0,0 0,2 0,0 0,2 0,0 0,2 0,3 0,2 0,14 0,09 0,13 0,08 О,!6 0,14 0,06 0,09 0,08 0,097 0,106 0,099 0,091 0,097 0,091 0,100 0,117 0,89 10 20 30 40 50 60 70 80 90 100 йЮ 300 400 600 600 800 900 1 000 2 000 3 ООО 4 000 5 000 6 000 7 000 8 000 9 000 10 000 2 3 3 5 5 7 7 9 12 14 28 37 50 68 74 86 94 103 1!1 208 314 413 504 60! 692 792 909 998 0,2 0,15 0,10 0,15 0,16 0,116 0,100 0,112 0,133 0,140 0,140 О,!23 0,125 О,!16 0,123 0,125 0,117 0,114 0,1ПО О,! 040 0,1046 0,1032 О, 1008 О, 100! 0,1лгбз 0,0990 О, 1010 0.0998 ю4'~л и щ7/л.
Ниже приводятся результаты моделираваяия игры с помошью таблицы случайных цифр нз [1). Как видно, хотя р~>рь но при я=250 нам «не повезло»вЂ” и4~/я < ш« /и. Остановив «агру» на этом а, мы могли бы сделать ошибочное заключение, что р~<рь В теорни описанному опыту соответствуют две независимые последовательности испытаний Бернулли с вероятностямн положительного исхода («успеха») в одном случае рь в другом -рь Введем случайные величины (сл. в.) т~ н ть равные числу успехов в каждой из этих последовательностей.
Вероятность события (т~<тт) для больших л рассчитаем приближенно, пользуясь теоремой Муавра-Лапласа. Сл. в. ч~ =(»,— лр)Памиру„д, = 1 — р„(= 1, 2, (1) независимы н приближенно нормально распределены с нулевым математическим ожиданием и единичной дисперсией. Неравенство т~<т» после подстановки в него (1) запишем в виде ~~„;, У,~.;,,~-„(„„ < (2) т»»%+Раза ~Уж+я»ч» Так как разность независимых нормальных сл. в. распределена нормально, то левая часть (2) прн больших а имеет распределение, близкое к нормальному, с математическим ожиданием и дисперсией, равными гй(УР ~1 ч — УР Р 4) = ~ГР и Π— УР ~) О=О Уйз» ч~ )/Р»Ч» т»~ раз~ 1-4-р Ч ° 1 » Рвй+ Р»9» РВь+ Ръч» Таким образом, имеем приближенное равенство (обозначение яв) «7 р,— р,)+аз 3 х«тм где Ф(х)= — ( е й— т/йя,) 11 функция распределения стакдартного юрмального закона, а слагаемое 0,5 — поправка на дискретность.
Используя таблицу нормального распределения, для различных а получаем Итак, даже прн а- 1000 приблизительно 12 шансов из 100 за то, что ч~ окажется меньше тз и будет сделан неправильный вывод, что р1<рь 4. Общая вероятностная модель. В современной теории вероятюетей под вероятностной моделью понимают тройку объектов (Я, Ф, У), называемую вероятностным лространстеом. Здесь И вЂ” яекоторое множество, элементы которого в называются элементарными событиями, .Ф— система подмножество множества Я, называемых событиями, У— вероятностная функция, ставящая в соответствие каждому событию А число У(А), Оя.У(А)(~1, называемое его вероятностью.