Lektsia_7_Odnorodvyb_sredvelich (818910)
Текст из файла
Лекция 7Проверка однородности двух биномиальных выборок (Пр.стат разд 1.3.3)(в лекции более кратко)Проверка однородности – одна из базовых проблем прикладной статистики.В маркетинге это важно для сегментации рынка. Если две группы неотличаются по ответам, значит, их можно объединить в один сегмент ипроводить по отношению к ним одну и ту же маркетинговую политику.Обсуждаемая далее постановка задачи в терминах прикладнойстатистики такова. Рассматривается вопрос с двумя возможными ответами,например, "да" и "нет". В первой группе из n1 опрошенных m1 человексказали "да", а во второй группе из n2 опрошенных m2 сказали "да".
Ввероятностной модели предполагается, что m1 и m2 - биномиальныеслучайные величины B(n1 , p1 ) и B(n2 , p2 ) соответственно. (Запись B(n , p)означает, что случайная величина m, имеющая биномиальное распределениеB(n , p) с параметрами n - объем выборки и p - вероятность определенногоответа (скажем, ответа "да"), может быть представлена в виде m = X1 + X2+…+Xn , где случайные величины X1 , X2 ,…,Xn независимы, одинаковораспределены, принимают два значения1 и 0, причем Р(Xi = 1) = р, Р(Xi = 0)=1-р, i=1,2,…,n.)Однородностьдвухгруппозначает,чтосоответствующиеимвероятности равны, неоднородность - что эти вероятности отличаются.
Втерминах прикладной математической статистики: необходимо проверитьгипотезу однородностиH0 : p1 = p2при альтернативной гипотезеH1 : p1 p2 .(Иногда представляют интерес односторонние альтернативные гипотезыH 1' : p1 p 2 и H 1" : p1 p 2 .)Оценкой вероятности р1 является частота р1*=m1/n1, а оценкойвероятности р2 является частота р2*=m2/n2 . Даже при совпадениивероятностей р1 и р2 частоты, как правило, различаются.
Как говорят, "почисто случайным причинам". Рассмотрим случайную величину р1* - р2*.ТогдаM(р1* - р2*) = р1 - р2 , D(р1* - р2*) = р1 (1 - р1 )/ n1 + р2 (1-р2 )/ n2 .Из теоремы Муавра-Лапласа и теоремы о наследовании сходимости (глава1.4 и [4, п.2.4]) следует, чтоlimn1 , n2 где (z ) -функцияматематическимP{p1* p 2* M ( p1* p 2* )D( p1* p 2* )стандартногоожиданием z} ( z ),нормального0 и дисперсией 1.распределенияДляспрактическогоприменения этого соотношения следует заменить неизвестную статистикудисперсию разности частот на оценку этой дисперсии:D*(р1* - р2*) = р*1 (1 - р*1 )/ n1 + р*2 (1-р*2 )/ n2 .(Могут использоваться и другие оценки рассматриваемой дисперсии,например, по объединенной выборке).
С помощью указанной вышематематической техники можно показать, чтоlimn1 , n2 P{p1* p 2* M ( p1* p 2* )D * ( p1* p 2* ) x} ( x).При справедливости гипотезы однородности M(р1* - р2*) = 0. Поэтомуправило принятия решения при проверке однородности двух выбороквыглядит так:1. Вычислить статистикуQp1* p2*p1* (1 p1* ) p2* (1 p2* )n1n2.2.
Сравнить значение модуля статистика |Q| с граничным значением K.Если |Q|<K, то принять гипотезу однородности H0 . Если же |Q|>K, тозаявить об отсутствии однородности и принять альтернативную гипотезу H1 .Граничное значение К определяется выбором уровня значимостистатистического критерия проверки однородности. Из приведенных вышепредельных соотношений следует, что при справедливости гипотезыоднородностиH0дляуровнязначимости P(| Q | K ) имеем(приn1 , n2 ) ( K ) ( K ) 2( K ) 1.Следовательно, граничное значение в зависимости от уровня значимостицелесообразно выбирать из условия1 K K ( ) 1 . 2 Здесь 1 () - функция, обратная к функции стандартного нормальногораспределения.Всоциально-экономическихисследованияхнаиболеераспространен 5% уровень значимости, т.е. 0,05.
Для него К = 1,96.Пример.n1=400n2=300p1*=200/400=0.5x1=200x2=180p2*=180/300=0.6Вычислим статистикуQ0,5 0,60,5 0,5 0,6 0,4400300 2,649.Поскольку |Q| = 2.649 > 1,96, то необходимо отклонить нулевую гипотезу ипринять альтернативную. Таким образом, мужчины и женщины отличаютсяпо рассматриваемому признаку - любви к пепси-коле.Теория среднихОбщее определение средней величины (типичное значение)Наиболее распространенные виды средних.Далее:.
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.