metodicheskie_ukazania_prikladnaya_stati stika_06_04_17 (818945), страница 4
Текст из файла (страница 4)
И тогда: если Dn≤1,36, принимаем гипотезу H0, если Dn>1,36, принимаем гипотезу H1.Задачи4.1 По заданной выборке построитьфункцию распределения выборки*.xi2456fi5345нfi58 12 17piн 5/20=0,25 0,4 0,6 0,85эмпирическую73201,0*Примечание: Черным цветом – исходные данные, серымцветом – решение.Ответ:fiн-накопленные частоты; piн – накопленные частости (ЭФР).0; ≤ 20,25; 2 < ≤ 40,4; 4 < ≤ 520 () =0,6; 5 < ≤ 60,85; 6 < ≤ 7{1; > 7.̅̅̅̅31__________________________________________________________Fn(x)хРис. 8. Эмпирическая функция распределения, построенная поданным задачи 4.14.2 Даны результаты измеренийРассчитать ЭФР, построить график.Рост, см143-146146-149149-152152-155155-158158-161161-164164-167167-170170-173173-176176-179179-182182-185185-188Числомужчин128266512018120117012064281031Σ1000Накопленнаячастота1311371022224036047748949589869969991000̅̅̅̅32ростамужчин*.Накопленнаячастость0,0010,0030,0110,0370,1020,2220,4030,6040,7740,8940,9580,9860,9960,9991__________________________________________________________*Примечание: Черным цветом – исходные данные, серымцветом – решение.4.3 (Продолжение задачи 4.2) Известны теоретическиенакопленные частости.
Найти статистику Колмогорова,сделать вывод.*0 ()| () − 0 ()|0,00040,00280,01170,03900,10430,2440,39920,59710,77270,89390,96010,98800,99710,999510,00060,00020,00070,00200,00230,00240,00380,00690,00130,00010,00210,00200,00110,00050* Примечание: Черным цветом – исходные данные, серымцветом – решение.Решение:0,0069 – максимальное расхождение | () − 0 ()|.Критическое значение квантили: 0,895 (доверительнаявероятность γ=0,95). Dn = √1000 × 0,0069=0,217.Dn =0,217<0,895, следовательно, отклонения случайны.̅̅̅̅33__________________________________________________________Функция спросаСпрос – желание и способность покупателей купить какоелибо количество товара по определенной цене.Зависимость спроса от каких-либо факторов – функцияспроса.
В наиболее простом случае функцию спросавыражают исключительно от цены на товар как от основногофактора, влияющего на спрос.Задача4.4 Цена за кофе (стакан/чашку). Опрос: «Сколько готовызаплатить?» Издержки = 30 рублей на единицу. Назватьмаксимальную прибыль и оптимальную цену*. Построитьграфик функции (ожидаемого) спроса.ЧислоПрибыль, приЦена,назвавшихСпрос,p0=30:№D(pi)piданную цену,(pi-30)*D(pi)fi(50-30)×50 == 10004814402602462070375838228049043423805100151917106120712144071505798081703460091802234010 2002*Примечание: Черным цветом – исходные данные, серымцветом – решение.150250̅̅̅̅34__________________________________________________________Dp(i)505048463840343019201210705060754290 100 120 150 170 180 200piРис.
9. График оцениваемой функции спроса по даннымзадачи 4.4̅̅̅̅35__________________________________________________________Тема 5. Доверительное оценивание выборочной долиПусть объем выборки равен n. Тогда ответы опрашиваемых:x1, x2, …, xn, где xi = 1, если i-й респондент ответил «да», иxi = 0, если i-й респондент ответил «нет».Ситуация описывается одним параметром p – долейвыбирающих «да» во всей генеральной совокупности.Пусть n = 200, а «да» ответило 50 человек (х = 50). Оценкойвероятности p (доли говорящих «да» в генеральнойсовокупности) является частота p* = x/n.
Таким образом,p* = 50/200 = 0,25 (25% респондентов ответили «да»).По ЗБЧ теории вероятностей частота p* сходится (т.е.безгранично приближается) к вероятности p при ростеобъема выборки: → .→∞Значит, с фиксированной точностью можно указатьдоверительные границы интервала для доли р в генеральнойсовокупности.Доверительный интервал: (рниж; рверх).Зададим характеристику надежности переноса выводов,сделанных при рассмотрении выборки, на генеральнуюсовокупность – доверительную вероятность γ, близкую кединице.
{ниж ≤ ≤ верх } = γ – доверительная вероятность, обычно принимается γ=0,95.Тогда:ниж = ∗ − С()√∗ ( − ∗ )верх = ∗ + С()̅̅̅̅36;√√∗ ( − ∗ )√__________________________________________________________Вспомогательная таблица:γ0,950,90,99Величина С()√∗ (1−∗ )√С(γ)1,961,642,58называется ошибкой выборки.Задачи5.1 Фирма, занимающаяся рыночными исследованиями,устанавливает степень известности своей продукции. 80 из400 опрошенных жителей города сказали, что знакомы спродукцией фирмы. Найти 90%-ную интервальную оценкустепени известности продукции фирмы среди жителейгорода.Ответ: (0,17; 0,23).5.2 Опрос 300 случайно отобранных жителей городапоказал, что 55% из них довольны деятельностью вновьизбранного мэра.
Построить 95%-ный доверительныйинтервал доли жителей всего города, которые такжедоверяют мэру.5.3 Опрос студентов университета показал, что из 500опрошенных 350 ответили, что им нравятся новыеучебные помещения. Оценить долю студентов, которымпонравится новое учебное здание. Построить 90%-ныйдоверительный интервал.Проверка однородности двух биномиальных выборокОдна из базовых проблем прикладной статистики. Вмаркетинге это важно для сегментации рынка. Если двегруппы не отличаются по ответам, значит, их можно̅̅̅̅37__________________________________________________________объединить в один сегмент и проводить по отношению к нимодну и ту же маркетинговую политику.Рассматривается вопрос с двумя возможными ответами,например, «да» и «нет».
В первой группе из n1 опрошенныхx1 человек сказали «да», а во второй группе из n2опрошенных x2 сказали «да». В вероятностной моделипредполагается, что x1 и x2 – биномиальные случайныевеличины B(n1; p1) и B(n2; p2) соответственно.Однородность двух групп означает, что соответствующие имвероятности равны, неоднородность – что эти вероятностиотличаются. В терминах прикладной статистики: необходимопроверить гипотезу однородности H0 при альтернативнойгипотезе H1.
: = : ≠ Оценкой вероятности p1 является частота 1 ∗ = 1 , а оценкойвероятностиp2является частота∗212 = . Даже при2совпадении р1 и р2 частоты, как правило, различаются.Рассмотримслучайнуювеличинуp1*-p2*.Тогда**математическое ожидание М(p1 -p2 ) = p1-p2; дисперсия(1 ∗ − 2 ∗ ) =1 (1−1 )1−2 (1−2 )2.На основании теоремы Муавра-Лапласа имеем:1 ∗ − 2 ∗ − (1 ∗ − 2 ∗ )lim {≤ } = Ф()1 →∞,∗ ( ∗ − ∗ )√12 →∞2Ф(х) – функция стандартного нормального распределения смат. ожиданием 0 и дисперсией 1.Заменяем дисперсию (1 ∗ − 2 ∗ ) на ∗ (1 ∗ − 2 ∗ ) - оценкуэтой дисперсии.̅̅̅̅38__________________________________________________________При справедливости гипотезы однородности М(p1*-p2*)=0.Поэтому правило принятия решения при проверкеоднородности двух выборок выглядит так:1) Вычислить статистику: ∗ − ∗= ∗ ( − ∗ ) ∗ ( − ∗ )√ +2) Сравнить значение модуля статистики |Q| с граничнымзначением К.|| ≤ => || > => Гипотеза Н0 – гипотеза однородности.
Альтернативнаягипотеза H1 говорит об отсутствии однородности.К определяется выбором уровня значимости статистическогокритерия проверки однородности. Из приведенных вышепредельных соотношений следует, что при справедливостигипотезы однородности Н0 для уровня значимостиα=P(|Q|>K) имеем (при n1→∞, n2→∞) α→Ф(К)-Ф(-К)=2Ф(К)1.Следовательно, граничное значение в зависимости от уровнязначимости целесообразно выбирать из условия = () =Ф−1 (1+2);Ф-1(∙)–функция,обратнаякфункциистандартного нормального распределения.В социально-экономических исследованиях наиболеераспространен 5% уровень значимости, т.е.
α=0,05. Для негоК=1,96.̅̅̅̅39__________________________________________________________Задачи5.4 Пусть из 400 опрошенных мужчин 150 ответили, чтолюбят кофе, а из 600 опрошенных женщин, что любяткофе сказали 300. Проверить однородность.Решение:n1 = 400, p1 = 150/400 = 0,375; n2 = 600, p2 = 300/600 = 0,5.0,375 − 0,5−0,125−0,125Q===√0,001002√0,375 × 0,625 + 0,5 × 0,5 √0,234 + 0,25400600400600−0,125== −3,950,03165Т.к.
|Q|=3,95>1,96, необходимо отклонить нулевую гипотезу ипринять альтернативную. Таким образом, Ж и М отличаются порассматриваемому признаку – любви к кофе.5.5 Было опрошено 2700 человек. Из них 1400 – мужчиныи 1300 – женщины. На интересующий вопросположительно ответили 1000 мужчин и 900 женщин.Проверить однородность.̅̅̅̅40__________________________________________________________Тема 6. Показатели разбросаВеличина вариации признака в статистической совокупностихарактеризует ее однородность.
Для ее изучения и измеренияиспользуются различные показатели:1) Размах вариации R = () − ()где x(n) – максимальное (наибольшее) значение варьирующегопризнака, x(1) – минимальное (наименьшее значение)варьирующего признака.2) Среднее линейное отклонение ̅ = − ̅ – линейное отклонение̅ = ∑| −̅| – простое; ̅ = ∑| −̅|× – взвешенное∑ 3) Дисперсия S2Дисперсия – средний квадрат отклонений индивидуальныхзначений признака от их средней величины. = =∑̅)=( −∑( −̅) ×∑ – простая;– взвешенная.4) Среднее квадратическое отклонение = √ Часто бывает необходимо проследить количественныеизменения признака по группам, на которые разделяетсясовокупность, а также между группами. Для статистическойсовокупности, сгруппированной по изучаемому признаку,возможно вычисление трёх видов дисперсий:̅̅̅̅41__________________________________________________________I.