А.Н. Бородин - Элементарный курс теории вероятностей и математической статистики (DJVU) (1115320), страница 26
Текст из файла (страница 26)
Можно считать, что неотрит цательная полуось разбита на 8 интервалов Ь| = [1,1+1),1= ыт = 0,1,...,6 и Ьт = [т,со). Тогда и = ~ 3а,(Х1) — число 1ж1 моментов времени, когда регистрируется ровно 1 микробов. 23, ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ ЪТТ Значения и приведены в условии задачи. Пусть Х4 — слу- чайная величина, распределенная по закону Пуассона с па- раметром А = 1.5: Ре Р(Х' = 1) = —, ! = О, 1, 2,... 1 Используя вту формулу, найдем теоретические вероятности попадания числа микробов в поле зрения микроскопа Рдд - -Р(Хд =4) дз 00471 рзд = Р(Х' = 5) Ад 0.0141; р3 = Р(Х' = 6) ж 0.0035; рт = Р(Х > 7) гв 0.0010.
р$ = Р(Х' = О) рз 0.2231; р1 — — Р(Х' = 1) ж 0.3347; рдз = Р(Х' = 2) дз 0.2510; Рзд = Р(Х' = 3) ж 0.1255; Вероятность рдт является вероятностью того, что наблюдается не менее семи микробов, так как теоретически в поле зрения микроскопа за выбранный промежуток времени может наблюдаться любое их количество. Значение Ь„статистики Пирсона вычисляем по формуле Т Ь„ = ~~ "' дз 4.3. ар~ ~=о 3 ЗАДАЧИ Задача 23.1. В городе 17036 семей имеют двоих детей. В 4529 семьях — два мальчика, в 4019 — две девочки, в 8488 семьях — мальчик и девочка. Можно ли с уровнем значимости 0.05 считать, что количество мальчиков в семьях с двумя детьми имеет биномиальное распределение с вероятностью рождения мальчика 0.515? Задача 23.2. Латчик случайных чисел выдает независимые значения случайной величины, которая должна иметь По таблицам для квантилей распределения Пирсона Р, 1(з) с г = 8 найдем критическое значение г1 о при а = 0.05.
Имеем зд дз 14.07. Так как Ь„< г1, то мы принимаем гипотезу о том, что число микробов, попадающих в поле зрения микроскопа, распределено по закону Пуассона с математическим ожиданием Л = 1.54. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА 1тв равномерное распределение на 10, 1). Получены слелующие 20 значений: 0.100, 0.253, 0.520, 0.863, 0.354, 0.809, 0.911, 0.292, 0.453, 0.204, 0.648, 0.429, 0.805, 0.372, 0.610, 0.008, 0.166, 0.422, 0,531, 0,509. С помощью критерия Колмогорова с уровнем значимости 0.1 проверить гипотезу о том, что датчик действительно генерирует значения случайной величины с равномерным распределением на [0,1). Задача 23.3.
Результаты подсчета частот появления цифр О, 1,...,9 в 10002 знаках десятичной записи числа т-3 приведены в таблице: 0 1 2 3 4 5 6 7 8 9 968 1026 1021 974 1014 1046 1021 970 948 1014 С помощью критерии Пирсона с вероятностью ошибки первого рода 0.2 проверить гипотезу о равновероятности появления в данной записи каждой из цифр 0,1,...,9. 124. Оценка ПАРАМетгов ОВщей линейной модели (МЕТОД НАИМЕНЬШИХ КВАДРАТОВ) Рассматривается следующая линейная модель. Имеется вектор неизвестных параметров, который нужно определить.
Однако наблюдаесл не сам вектор параметров, а другой вектор, который получается из искомого вектора применением линейного преобразования. Кроме того, наблюдения (измерения) осуществляются с некоторыми случайными ошибками, Предполагается, что эти ошибки не лвллютсл систематическими, т. е.
среднее этих ошибок равно нулю. Математически эта модель описывается следующим образом. Обозначим д = (Уы дз,..., Ож) — вектор неизвестных параметров, подлежащих оценке. Пусть А = (аб)РД„1- матрица известных коэффициентов, а оысм...,5„- случайные величины с математическими ожиданиями Е(б,) = О, с дисперсиями 11(4) = ат < оо и с ковариациями Е(Щ) = 0 при 1 ф у. Наблюдаются величины Х<.
(24.1) 24. ОЦЕНКА ПАРАМЕТРОВ ОБЩЕЙ ЛИНЕЙНОЙ МОДЕЛИ 179 Если бы случайных ошибок измерения не было, то значения параметров 0 по известным ау и Х1 определялись бы как решение системы в алгебраических линейных уравнений. В случае, когда есть случайные ошибки 8;, предлагается поступать следующим образом. Поскольку мы не знаем истинных значений параметров, выберем какие-нибудь значения параметров д1, дт,..., д„и рассмотрим сумму квадратичных отклонений «« т ««(01«02« ° ° ° «От) — ~~~ (Х« ~~1 а«101) «=1 Определим, при каких значениях 01 математическое ожидание Н(д1«01«...,От) будет минимальным.
Имеем «« п« Е(й(01,6з,...,дт)) = ЕЕ(Х; — Еа;,6,) ° =1 1=1 Е(~~ аб(01. — 01)+61) ° =1 1=1 — «((~~ а1 (6« — 01)) + 2~ау(01 — д1)Е(8;)+Е(ЕО)) = «т1 1=1 1=1 =Я((Д. 'вц1(61 — 01)) +а1)т~Я а11(01 — 01)) +~~1,аО «=! 1=1 ° =1 1т1 ° =1 «« т ав Щд" 01' 'д'") 2Е,(Х1 Еа "61)( "1) ° т1 1т1 В = 1,..., «л. Мы видим, что ето математическое ожидание будет минна т " т мальным при 2 1 1Я ° 1а11(д1 — 06)) = О, в частности, при 6 = О, т.
е. при истинных значениях параметров. Поетому в качестве оценки для неизвестных параметров 01 разумно взять такие значения параметров 01, при которых функция й(д1, дз,..., От) принимает минимальное значение. Такая оценка называется оценкой по методу наименьших квадратов. Функция Е(61, 61,..., От) — функция многих переменных и минимума она достигает в той точке, в которой все частные производные етой функции по каждой из переменных равны нулю.
Частные производные имеют вид МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Найдем такие значения ри Ог,..., Р„„которые обращают эти производные в ноль. Отсюда получим систему пг линейных уравнений относительно неизвестных Ои уг,..., р,„: «з е е Д» аца;г)д = ~~ амХ;, 1 = 1,2,...,вг, (24.2) 1=1 гэп гат Матрица этой системы состоит из коэффициентов Егг е = ~', айам, а вектор свободных коэффициентов У состоит гэп из компонент Уг = Д' а,гХг. Если определитель матрицы В = (01гЦДг г отличен от нуля, то вта система имеет единственное решение Уг,ег,...,д . Решение это можно найти либо методом Гаусса, либо методом определителей, либо вычисляя обратную матрицу к В, Исходная линейная модель (24.1) и система уравнений (24.2) могут быть записаны в краткой форме с использованием матриц и некторов. Обозначим х аы агг ...
аг Хг ем егг . ег Х= .,А= ее1 елг ° ° еапз х„ в бг дг бг д= Тогда (24.1) переписывается в виде Х =Ад+б. Лалее, полагая Ь Ьг ... Ь Ьм Ьгг .. Ьг, 1 рг га оцвнкл плрлмбтров общей линейной модели 1в1 а11 а21 агз а22 а„1 апз Ат— а1,„азе1 ... а„,„ где матрица Ат является транспонированной (отраженной) по отношению к матрице А, систему уравнений (24.2) представим в виде ВВ АтХ В = В(Х1, Хз,...,Х„) = (АтА) 'А Х.
(24.3) Пример 1. Пусть есть полипом Р(у) = В~у~ '+В~ 1у~ 2+ ° .+В, степени 1п — 1 с неизвестными коаффициентами. Предположим, что у нас есть результаты измерений значений етого полинома в различных точках у1,уз,...,у„. Но измерения в каждой точке у; производятся со случайной ошибкой 81, т. е. мы в качестве измерениИ имеем лишь значения величин Х;, Х; = Р(у;)+8;, 1= 1,2,...,и. (24.4) Еак определить коеффнциенты В1? Оказывается, можно применить метод наименьших квадратов. Положим аб = у,' тогда Р(у1) = ~~ у2 В1 = ~~1 а; В., 1=1 Рен1еяие атой системы можно записать так: В = В 'А" Х, где В 1 — матрица, обратная к В.
Таким образом, искомая оценка В, которая является оценкой для вектора неизвестных параметров В, равна произведению матрицы В 1 на вектор АтХ. В силу определения коеффициентов 6„.1 матрица В представима в виде произведения В = А "А, что позволяет выразить оценку В, построенную по методу наименьших квадратов, в терминах исходной матрицы коеффициентов А и вектора наблюдений Х: МАТЕМАТИЧЕСКАЯ СТАТИСТИКА и равенства (24А) переходят в равенства (24.1).
Но для такой линейной модели мы уже умеем строить оценку параметров В», Вм..., В,„, и вта оценка определяется по ковффициентам аб системой уравнений (24.2), которая в данном случае имеет вид ~п о о С» у»+ь ~)В = ~~» ув Х», Й =1,2,...,»в. »ач 1»м »м1 6 3 7 5 10 Х 33 27 32 28 42 На величину прибыли влияют случайные факторы. Пред- полагается, что всегда имеет место линейнзл зависимость между затратами у и прибылью Х вида (24.5) х=в,у+в,+г с неизменными параметрами В», Вт и величиной случайного влияния с со средним ноль и конечной дисперсией. Каждый год случайное влияние некоррелировано с предыдущими годами. Оценить параметры В» и Вз.
Р е ш ели е. Зависимость (24.5), представленная по годам » = 1,2,3,4,5, имеет вид (24.6) Х» =В И+В +з». Таким образом, она описывается моделью типа (24.1). Оце- ним параметры В» и Вз по методу наименыпих квадратов. Имеем и = 5, ти = 2, аи = 1, а»т = у;. Система уравнений (24.2) в етом случае следующая пВ»+ ~ ИВз = ~', Х;, нм »»м з о „и ~ив,+у;у,.в,= ~:дх;, 5=1, (24.7) Решение етой системы не обязательно выписывыть формулой (24.3).
Его можно получать различными известными методами. Задача 1. Затраты у на развитие производства и Х величина годовой прибыли фирмы в течение 5 лет представлены в условных единицах следующей таблицей т4. ОЦЕН»Я ПДРЯМ»1РОН 081Ц»И Д»»4ЕИНОИ МОДКДМ Вычисляя значение Рз методом определителей, получим у:их,— ~: и 1-,х; р »о ~=1»о 3— зх„- р»х. (24.8) » Е э',-(Е и)' »н (24.9) М» У» Лля имеющихся данных 01 в 18.843, дз ж 2.187.