Lektsia_7_Odnorodvyb_sredvelich (Лекции)
Описание файла
PDF-файл из архива "Лекции", который расположен в категории "". Всё это находится в предмете "прикладная статистика" из 4 семестр, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст из PDF
Лекция 7Проверка однородности двух биномиальных выборок (Пр.стат разд 1.3.3)(в лекции более кратко)Проверка однородности – одна из базовых проблем прикладной статистики.В маркетинге это важно для сегментации рынка. Если две группы неотличаются по ответам, значит, их можно объединить в один сегмент ипроводить по отношению к ним одну и ту же маркетинговую политику.Обсуждаемая далее постановка задачи в терминах прикладнойстатистики такова. Рассматривается вопрос с двумя возможными ответами,например, "да" и "нет". В первой группе из n1 опрошенных m1 человексказали "да", а во второй группе из n2 опрошенных m2 сказали "да".
Ввероятностной модели предполагается, что m1 и m2 - биномиальныеслучайные величины B(n1 , p1 ) и B(n2 , p2 ) соответственно. (Запись B(n , p)означает, что случайная величина m, имеющая биномиальное распределениеB(n , p) с параметрами n - объем выборки и p - вероятность определенногоответа (скажем, ответа "да"), может быть представлена в виде m = X1 + X2+…+Xn , где случайные величины X1 , X2 ,…,Xn независимы, одинаковораспределены, принимают два значения1 и 0, причем Р(Xi = 1) = р, Р(Xi = 0)=1-р, i=1,2,…,n.)Однородностьдвухгруппозначает,чтосоответствующиеимвероятности равны, неоднородность - что эти вероятности отличаются.
Втерминах прикладной математической статистики: необходимо проверитьгипотезу однородностиH0 : p1 = p2при альтернативной гипотезеH1 : p1 p2 .(Иногда представляют интерес односторонние альтернативные гипотезыH 1' : p1 p 2 и H 1" : p1 p 2 .)Оценкой вероятности р1 является частота р1*=m1/n1, а оценкойвероятности р2 является частота р2*=m2/n2 . Даже при совпадениивероятностей р1 и р2 частоты, как правило, различаются.
Как говорят, "почисто случайным причинам". Рассмотрим случайную величину р1* - р2*.ТогдаM(р1* - р2*) = р1 - р2 , D(р1* - р2*) = р1 (1 - р1 )/ n1 + р2 (1-р2 )/ n2 .Из теоремы Муавра-Лапласа и теоремы о наследовании сходимости (глава1.4 и [4, п.2.4]) следует, чтоlimn1 , n2 где (z ) -функцияматематическимP{p1* p 2* M ( p1* p 2* )D( p1* p 2* )стандартногоожиданием z} ( z ),нормального0 и дисперсией 1.распределенияДляспрактическогоприменения этого соотношения следует заменить неизвестную статистикудисперсию разности частот на оценку этой дисперсии:D*(р1* - р2*) = р*1 (1 - р*1 )/ n1 + р*2 (1-р*2 )/ n2 .(Могут использоваться и другие оценки рассматриваемой дисперсии,например, по объединенной выборке).
С помощью указанной вышематематической техники можно показать, чтоlimn1 , n2 P{p1* p 2* M ( p1* p 2* )D * ( p1* p 2* ) x} ( x).При справедливости гипотезы однородности M(р1* - р2*) = 0. Поэтомуправило принятия решения при проверке однородности двух выбороквыглядит так:1. Вычислить статистикуQp1* p2*p1* (1 p1* ) p2* (1 p2* )n1n2.2.
Сравнить значение модуля статистика |Q| с граничным значением K.Если |Q|<K, то принять гипотезу однородности H0 . Если же |Q|>K, тозаявить об отсутствии однородности и принять альтернативную гипотезу H1 .Граничное значение К определяется выбором уровня значимостистатистического критерия проверки однородности. Из приведенных вышепредельных соотношений следует, что при справедливости гипотезыоднородностиH0дляуровнязначимости P(| Q | K ) имеем(приn1 , n2 ) ( K ) ( K ) 2( K ) 1.Следовательно, граничное значение в зависимости от уровня значимостицелесообразно выбирать из условия1 K K ( ) 1 . 2 Здесь 1 () - функция, обратная к функции стандартного нормальногораспределения.Всоциально-экономическихисследованияхнаиболеераспространен 5% уровень значимости, т.е. 0,05.
Для него К = 1,96.Пример.n1=400n2=300p1*=200/400=0.5x1=200x2=180p2*=180/300=0.6Вычислим статистикуQ0,5 0,60,5 0,5 0,6 0,4400300 2,649.Поскольку |Q| = 2.649 > 1,96, то необходимо отклонить нулевую гипотезу ипринять альтернативную. Таким образом, мужчины и женщины отличаютсяпо рассматриваемому признаку - любви к пепси-коле.Теория среднихОбщее определение средней величины (типичное значение)Наиболее распространенные виды средних.Далее:.