Главная » Просмотр файлов » Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере

Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 88

Файл №1115311 Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере) 88 страницаЮ.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311) страница 882019-05-09СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 88)

В этом случае приближенный (1 − 2α) – доверительныйинтервал для θ имеет вид6 6 Xz1−αXXXz1−αXX− √ ×1−<θ<+ √ ×1−.nnnnnnnnЧто влияет на точность оценки? Выражение (15.8) позволяетуказать факторы, непосредственно влияющие на точность оценки:4501) Чем больше число наблюдений в выборке, тем точнее выбороч"ная оценка.2) Для увеличения точности оценки вдвое необходимо увеличитьобъем выборки вчетверо, так как точность оценки обратно про"порциональна квадратному корню из объема выборки.3) Чем больше величина θ(1 − θ), тем ниже точность.

Чем ближеθ к нулю или к 1, тем меньшим может быть объем выборки,необходимый для оценки θ с заданной точностью. Это обсто"ятельство часто используют для сокращения объема выборок,путем предварительного "расслаивания" генеральной совокуп"ности на непересекающиеся слои, в которых исследуемый при"знак выражен либо очень сильно (θ близко к единице) либо,наоборот, очень слабо (θ близко к нулю). Подробнее об этомбудет сказано ниже.4) В общем случае, когда на базе простой случайной выборки оце"нивается не доля совокупности, а некоторые произвольные па"раметры, например величина среднего дохода, средние затратына определенный тип продукции или услуг и т.п., точность оцен"ки обратно пропорциональна квадратному корню из дисперсииоценки.5) Точность оценивания при простом случайном отборе можно оце"нить по самой выборке.6) Простой случайный выбор при достаточном объеме выборкиобеспечивает ее репрезентативность, т.е.

доставляет выборку,правильно представляющую генеральную совокупность.7) Если механизм случайного выбора не обеспечивает равных шан"сов быть выбранными для всех элементов генеральной совокуп"ности, возникающих из"за этого смещений невозможно устра"нить никаким увеличением объема выборки.Необходимый объем выборки.

Мы уже знаем, что простой слу"чайный выбор обеспечивает репрезентативность выборок лишь в стати"стическом смысле. Поэтому о достигаемой при этом точности выводовследует говорить тоже в статистических терминах, задавшись, в част"ности, доверительной вероятностью. Положим, например, доверитель"ную вероятность равной 0.95.

Такой уровень доверия (статистическаянадежность вывода) считается умеренным. Посмотрим, каков долженбыть объем выборки, который обеспечивает с доверительной вероятно"стью 0.95 точность в оценивании θ не ниже, скажем, 0.03. (То есть451точность не ниже 3%, если в процентах исчислять долю объектов синтересующим нас свойством.)Мы отмечали выше, что достигаемая точность в оценивании θ за"висит от величины θ. Так как величина θ нам не известна, задача напервый взгляд кажется неразрешимой. Мы, впрочем, знаем, что наи"больший объем выборки требуется для θ = 12 .

Это наиболее труднаяситуация. Объем выборки, который обеспечивает требуемые точность инадежность при θ = 12 , обеспечивает эти требования и при других зна"чениях θ. Сказанное означает, что при расчетах объемов выборок, т.е.при планировании выборочного обследования, нам следует обратиьсяк формуле (15.9).При 1 − 2α = 0.95 квантиль z1−α = z0.975 = 1.96. Согласно (15.9),точность в 3% будет обеспечена при n таких, чтоz1−α√ 0.03.2 nОтсюда√z1−α1n∗,20.03поэтому наименьший необходимый объем выборки оказывается равнымn = 107.Для достижения точности в 1%, т.е. втрое лучшей, объем выборкидолжен быть увеличен в девять раз (квадрат числа три).

Поэтомунеобходимое n = 963.Объем простой случайной выборки n = 2000 (примерно с такимиобъемами работают социологические агентства) обеспечивает:точность 3% с надежностью 0.996,точность 1% с надежностью 0.814, и т.д.Расслоенный выбор, который будет описан ниже, обеспечивает притех же объемах выборок еще более высокую точность.Требование к точности оценивания в пределах 0.01 – 0.02 вполнеразумны, когда речь идет о доле популяции, обладающей определеннымпризнаком.

Например, в текущих электоральных исследованиях шан"сов различных претендентов на пост президента, проводимых фондом"Общественное мнение", доли избирателей, поддерживающих того илииного политика, часто отличаются на 2 – 3 процента. Поэтому дляопределения более популярного кандидата требуется точность не менее1%. В маркетинговых исследованиях требования к точности оценокмогут быть и не такими высокими и находиться в пределах 5 или даже10 процентов. Подставляя выбранные значения точности в выраже"ние (15.8), нетрудно получить представление о необходимом объемеслучайной выборки.452Таблица 15.1Примерные объемы выборок для обеспечения точности оценкив пределах 0.01 с доверительной вероятностью α = 0.95 и α = 0.99в зависимости от выраженности признака θв генеральной совокупностиα\θ0.950.990.05182531620.1345759910.26147106500.38067139780.49220159750.5960416641Таблица 15.2Примерные объемы выборок для обеспечения точности оценкив пределах 0.02 с доверительной вероятностью α = 0.95 и α = 0.99в зависимости от выраженности признака θв генеральной совокупностиα\θ0.950.990.054567900.186414980.2153726630.3201734950.4230539940.524014160В тех случаях, когда θ превышает 0.5, (например, равно 0.6) объемвыборки также можно определить из приведенных выще таблиц.

Дляэтого надо обратиться к данным таблицам для θ = (1 − θ), т.е. дляθ = 0.4 в упомянутом примере. Необходимые объемы выборок дляоценки параметров θ и (1 − θ) совпадают.Числа в таблицах показывают, сколь существенно можно сократитьобъем выборки в зависимости от меры выраженности признака в со"вокупности. Эту особенность случайного выбора можно использоватьдля расслоенных генеральных совокупностей.

Так говорят о популяции,разделенной на части. В некоторых из этих частей признак можетбыть выражен более, а в других – менее ярко, чем в совокупности вцелом. Проводя случайный выбор необходимого объема из каждой ча"сти отдельно, можно либо уменьшить суммарный необходимый объем,либо увеличить точность конечного результата. Об этом будет сказанов следующем разделе.совокупность составляет все взрослое население Москвы; признак B –годовой доход взрослого москвича в денежном выражении. Уровнямиэтого признака могут быть, например, такие:B1 – годовой доход до 30 тысяч рублей;B2 – годовой доход от 30 до 50 тысяч рублей;B3 – годовой доход от 50 до 100 тысяч рублей;и т.д.Признак B может быть и составным; его уровнями могут бытькомбинации уровней нескольких признаков. Произвольно занумеруемуровни признака. В дальнейших обсуждениях удобнее говорить о но"мерах уровней, чем об их названиях.

Пусть B1 , B2 , . . . Bl , . . . BL –уровни признака B, L – их общее число, l – текущий номер уровня.Признак B разделяет генеральную совокупность на непересекающиесямножества. Каждое такое множество составляют элементы генеральнойсовокупности, обладающие признаком B на определенном уровне.

Этимножества называются слоями, или стратами. О признаке B говорят,что своими уровнями он расслаивает (стратифицирует) генеральнуюсовокупность. Мы будем называть слоем l совокупность элементов,обладающих признаком B на уровне l, l = 1, . . . , L.Обозначим через wl ту долю, которую в генеральной совокупностисоставляют элементы из слоя l, т.е. те элементы, которые обладаютсвойством Bl . Иногда wl называют весом слоя l.

Ясно, чтоLθ=453(15.9)При простом случайном выборе wl – это вероятность того, что мывыберем элемент со свойством Bl .В каждом слое некоторая часть элементов обладает признаком A.Обозначим долю таких элементов в слое l через θl , 0 θl 1. Припростом случайном выборе θl – это условная вероятность того, чтовыбранный элемент обладает свойством A при условии, что он обладаетсвойством Bl . Ясно, что15.4. ".

›… …Расслоенные совокупности. Предположим, что помимо признакаA, каждый объект генеральной совокупности обладает еще и другимпризнаком, который мы назовем признаком B. Предположим, что этотпризнак имеет несколько различных уровней. Например, если элементыгенеральной совокупности – это люди, то признаком B может быть,например, цвет глаз. Тогда его уровни – это те цвета глаз, которые мыразличаем: серые, карие, голубые и т.д. Другой пример: генеральнуюwl = 1l=1Lwl ∗ θl(15.10)l=1При простом случайном выборе эта формула выражает вероятностьвыбора элемента со свойством A через условные вероятности A приусловии Bl и вероятности выбора Bl .

В теории вероятностей равенство(15.10) известно как формула полной вероятности.Стратифицированный выбор. Предположим, что веса слоевw1 , . . . , wl , . . . , wL нам известны. В социологии, где расслоение ча"454сто идет по возрастным, географическим, профессиональным, и т.д.признакам, веса этих групп могут быть извлечены из официальныхстатистических данных.Предположим далее, что из каждого слоя мы можем произвестипростой случайный выбор элементов в нужном числе, независимый отрезультатов других выборов.

Как и в предыдущих разделах, это выбормы будем описывать с помощью испытаний Бернулли. Как мы отмечали,эта схема дает правильные результаты для больших совокупностей(в данном случае слоев) и объемов выборок, малых по сравнению счисленностью совокупностей.Пусть nl обозначет объем простой случайной выборки, извлеченнойиз слоя l; пусть N =l nl – суммарный объем всех выборок.

Вдальнейшем мы положимnl = N ∗ wl ,т.е. положим объем выборки из каждого слоя пропорциональным егочисленности (его весу). Такой выбор называется пропорциональным.Пусть Xl обозначает число элементов со свойством A в выборкеиз слоя l. Как мы уже знаем, частота (относительная) события A визвестной выборке несмещенно оценивает θl , т.е.:θˆl = Xl /nlMXl= θl .nlПреимущества стратифицированного выбора. Остается отве"тить на вопрос, имеет ли стратифицированный выбор какие"либо пре"имущества перед простым случайным выбором, и если да, то когда этипреимущества проявляются? Понятно, что сравнение надо проводитьв равных условиях – в данном случае при одинаковом количестве об"следованных элементов N .

Так как обе оценки для θ – несмещенные,для их сравнения надо обратиться к дисперсиям. Та оценка окажетсялучше (точнее), чья дисперсия меньше.Для простой случайной выборки объема N дисперсия несмещеннойоценки θ равнаθ ∗ (1 − θ).NЭту величину надо сравнить с (15.11). Заметим, что выражение θ∗(1−θ)можно представить как:θ ∗ (1 − θ) =wl ∗ θl ∗ (1 − θl ) +wl ∗ (θl − θ)2 .(15.12)ll(Проверьте!) Отсюда следует, что дисперсия оценки при простом слу"чайном выборе превосходит дисперсию оценки при стратифицированномвыборе на неотрицательную величину, пропорциональную2wl ∗ (θl − θ) .lДисперсия этой оценкиDθˆl =Величина эта положительна, исключая случайθl ∗ (1 − θl ).nlθ1 = θ2 = · · · = θL = θ.Из оценок θˆ1 , θˆ2 , .

. . , θˆL можно составить несмещенную оцен"ку для θ:wl ∗ θˆl .θ̂ =Если вспомнить вероятностый смысл чисел θ, θ1 , . . . ,θL , мы увидим,что пропорциональный выбор лишь тогда не имеет преимуществ передпростым случайным выбором, когдаP (A) = P (A/B1 ) = P (A/B2 ) = · · · = P (A/BL ).lДисперсия этой оценки равна θl ∗ (1 − θl )Dθ̂ =wl2.nllДля пропорционального выбора1 wl ∗ θl ∗ (1 − θl ).Dθ̂ =N(15.11)Эти равенства, когда условные вероятности события A не зависят отусловий, означает независимость признаков A и B.

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6375
Авторов
на СтудИзбе
309
Средний доход
с одного платного файла
Обучение Подробнее