Популярные услуги

Главная » Лекции » Менеджмент и маркетинг » Маркетинг » Статистические методы определения объема выборки

Статистические методы определения объема выборки

2021-03-09СтудИзба

Лекция 10. статистические методы определения объема выборки.

¢ Для выборок того объема, который обычно встречается на практике, часто есть все основания полагать, что выборочные оценки имеют приблизительно нормальное распределение.

¢ Для нормально распределенных оценок вид распределения частот полностью известен, если известны среднее значение и среднее квадратичное отклонение (или дисперсия) и обозначается как  δ. Часто его называют также стандартной ошибкой!

¢ Значительная часть теории выборочного метода посвящена нахождению формул для таких средних и дисперсий.

При выборке в 100 единиц стандартная ошибка составляет 5 процентов,

При выборке в 1000 элементов – 1.6 %

Выборка 2000 элементов – ошибка 1.1%

СТАТИСТИЧЕСКИЕ МЕТОДЫ ОПРЕДЕЛЕНИЯ ОБЪЕМА ВЫБОРКИ

¢ Массовый опрос, анкетирование (количественный метод) основан на применении теории вероятности

Рекомендуемые материалы

¢ Можно оценить достоверность и допустимые погрешности любого исследования

Определения.

¢ Достоверность (validity), уровень достоверности – показатель вероятности того, что истинное значение изучаемого параметра генеральной совокупности попадет в доверительный интервал

¢ Доверительный интервал (confidence level) – диапазон, в который попадает истинное значение изучаемого параметра генеральной совокупности при данном уровне достоверности. Чем он меньше, тем больше должна быть выборка

Пример.

¢ Общероссийская выборка (14-65 лет) в 1200 респондентов имеет доверительный интервал 4 процентных пункта при уровне достоверности 95% (0.95)

¢ 15% участников опроса заявили, что за последние 3 месяца были в кинотеатре хотя бы один раз

¢ Вывод : эти данные позволяют утверждать с заданным уровнем достоверности, что от 11 до 19% жителей российских городов в возрасте от 14-65 лет были в кинотеатре хотя бы один раз за последние три месяца.

¢ Все значения между 11 и 19% находятся в пределах допустимой статистической погрешности

¢ Если бы нужно было увеличить доверительный интервал в 2 процентных пункта, то выборку (при прочих равных условиях) пришлось бы увеличить в четыре раза

¢ Если бы было проведено 100 опросов по 1200 респондентов в каждом, то в 95 из них значение доли ответов на вопрос о посещении кинотеатра не вышло бы за пределы доверительного интервала (11-19%)

Оптимальный размер выборки

¢ На основе известного среднего отклонения (дисперсии) и заданных уровнях достоверности и точности

N – искомый объем выборки

δ – дисперсия признака, ожидаемое среднее отклонение получаемых результатов от ожидаемого среднего значения

z- коэффициент уровня достоверности (1.96– для 0.95, 2.58 – 0.99),

d – уровень точности

¢ Изучается поведение покупателей в продовольственном магазине. Определяется средняя сумма чека. Директор магазина говорит, что средний чек составляет 500-700 руб., среднее отклонение (δ) может составить 200 руб. В ходе опроса нужно определить среднее значение с точностью (d) до 20 руб., при уровне достоверности (z) в 0.95

¢ 40000 х  4: 400 = 400 (респондентов)

¢ Если нужно рассчитать среднюю сумму чека с точностью до 10 руб., то количество респондентов возрастет до 1600.

¢ Если нужно увеличить достоверность до 0.99, то количество респондентов будет 3500 человек

Как происходит на практике

  1. Определяют количество респондентов, которые должны быть опрошены с учетом временных и финансовых ограничений
  2. Задают уровень достоверности (обычно 0.95)
  3. Рассчитывают доверительный интервал

— Считается, что 30-50 респондентов в каждой узкой социально-демографической группе будет распространено на всю эту группу и допустимая ошибка (доверительный интервал) не превысит 4 процентных пункта при уровне достоверности 0.95

— Узкая социальная группа: Замужние москвички в возрасте 30-45 лет, имеющих одного ребенка, высшее образование и совокупный доход в пределах от 700 до 1500 долларов в месяц

— Проведение исследования всех московских женщин, где все факторы являются значимыми, выборка будет построена так: (две группы по семейному положению, три доходные, две образовательные, три – по наличию и количеству детей. Итого: 108 групп ( в каждой – не менее 30 представительниц) – всего – более 3000 респондентов

Как работать с таблицей случайных чисел

¢ Из совокупности заранее пронумерованных 300 единиц нужно выбрать 7 единиц наблюдения.

¢ N - 300 – трехзначное число, а в таблице даны 5-тизначные числа, будем использовать только три последние цифры.

97, 297, 209, 13, 157, 147, 32 – это и есть номера наблюдения, попавшие в формируемую выборку.

РАСЧЕТ ХАРАКТЕРИСТИК ПРОСТОЙ СЛУЧАЙНОЙ ВЫБОРКИ

¢ Наиболее распространенной задачей является оценка среднего значения признака в генеральной совокупности. Предположим, что оценивается среднее число газет и журналов, выписываемых сотрудниками РЭА.

                               1. Составляется основа выборки,

                               т.е. Список всех единиц отбора.

                               Алфавитный список всех сотрудников,    пронумерованный последовательно

2. Номер        Число выписываемых газет

        1                      2

        2                      2

        3                      0

        50                    2

N- 50                                     = 150

¢ Общая сумма выписываемых газет и журналов равна µ =150/50=3

¢ Среднее квадратическое отклонение ( стандартная ошибка) равно

¢ Предположим, что каждый респондент выписывает несколько газет и журналов и что количество выписываемых газет не слишком варьируется.

¢ Исходя из этих соображений, полагаем достаточным выборку из 5 респондентов.

Понятие вариации

¢ Характеризует величину несхожести (схожести) ответов на определенный вопрос. 

¢ В качестве меры вариации принимается среднее квадратическое отклонение. 

¢ Определение исследуемых величин для совокупности в целом определяется на основе выборочной статистики, поэтому следует установить диапазон (доверительный интервал)

Доверительный интервал

¢ Диапазон, крайним точкам которого соответствует определенный % определенных ответов на вопрос.

¢ Конечные точки доверительного интервала, равного 95%, определяются как произведение 1,96 на среднее квадратическое отклонение.

¢ Числа 1,96 (для 95%) и 2,58 (для 99% доверительного интервала) обозначаются как z.

¢ В учебнике имеются таблицы «Значение Интеграла вероятностей», которые дают возможность определить величины z для различных доверительных интервалов.

¢ Доверительный интервал, равный 95% или 99%, является стандартным при проведении маркетинговых исследований.

ОПРЕДЕЛЕНИЕ ОБЪЕМА ВЫБОРКИ МЕТОДОМ ДОВЕРИТЕЛЬНЫХ ИНТЕРВАЛОВ

¢ основано на их создании вокруг выборочного среднего или выборочной доли с использованием формулы стандартной ошибки.

— Пример:  предположим, что исследователь с помощью простого случайного отбора сформировал выборку из 300 семей для того, чтобы оценить ежемесячные расходы семьи на покупки в универмаге, и определил, что средний ежемесячный расход семьи в выборке равен 182 долл. Предыдущие исследования показали, что среднеквадратичное отклонение (δ) расходов в исследуемой совокупности равно 55 долл.

АЛГОРИТМ НАХОЖДЕНИЯ ИНТЕРВАЛА

  1. Предположим, мы хотим определить интервал вокруг среднего значения совокупности, который включал бы 95% выборочных средних, опираясь на выборку из 300 семей;
  2.  95% выборочных средних можно разделить на две равные части, половина меньше и половина больше среднего, (0.95/2=0.475)
  3. Вычисление доверительного интервала включает определение области меньше

                 (X lower)(XL) и больше (ХU) (X Up)среднего значения (X) величины расходов.

95% доверительный интервал (0.95/2=0.475)

Описание: 13

Описание: 14 Значения коэффициента z, соответствующие XL и ХU, можно рассчитать следующим образом: Описание: 15

Где  Описание: 16 Следовательно, минимальное значение X определяется как Описание: 17 а максимальное значение  Описание: 18

Доверительный интервал устанавливается как Описание: 19

Теперь установим 95%-ный доверительный интервал вокруг выборочного среднего, равного 182 долл.

Для начала мы вычислим стандартную ошибку среднего Описание: 20

Центральные 95% нормального распределения находятся в пределах 1,96 значений коэффициента z;

95%-ный доверительный интервал определяется как

Таким образом, 95%-ный доверительный интервал простирается от 175,77 до 188,23 долл.

 Вероятность нахождения истинного среднего значения наблюдаемой совокупности в пределах от 175,77 до 188,23 долл. составляет 95%.

Расчет выборки на основе средних показателей

¢ Метод, использованный для создания доверительного интервала, можно модифицировать так, чтобы определить объем выборки с учетом желательного доверительного интервала.

¢ Предположим, что вы хотите рассчитать ежемесячный расход семьи на покупки в универмаге более точно — так, чтобы полученный результат находился в пределах 5,0 долл. от истинного среднего значения исследуемой совокупности.

Каким должен быть объем выборки?

1. Определите степень точности. Это максимально допустимое различие (D) между выборочным средним и генеральным средним. В нашем примере D = +5,0 долл.

2. 2. Укажите уровень достоверности. Предположим, желательный уровень достоверности 95%.

3. 3. Определите значение нормированного отклонения z, связанное с данным уровнем достоверности. При 95%-ном уровне достоверности вероятность того, что среднее значение генеральной совокупности выйдет за пределы одностороннего интервала, равна 0,025 (0,05/2). Соответствующее значение z составляет 1,96.

4. 4. Определите стандартное отклонение среднего генеральной совокупности. Его можно получить из вторичных источников или рассчитать, проведя пилотное исследование. Кроме того, стандартное отклонение можно установить на основе мнения исследователя. Например, диапазон нормально распределенной переменной примерно укладывается в шесть стандартных отклонений (по три слева и справа от среднего значения). Таким образом, можно рассчитать среднеквадратичное отклонение, разделив величину всего диапазона на 6.

Исследователь часто может определить размеры диапазона исходя из собственного понимания анализируемых явлений.

5.Определите объем выборки, воспользовавшись формулой стандартной ошибки среднего Описание: 23

Описание: 24

В нашем примере Описание: 25

Предположим, что значение 55,00 использовалось в качестве предположительного значения , потому что истинное значение было неизвестно.  Получена выборка, в которой n = 465. На основе данных исследования рассчитывается среднее X, равное 180,00, и среднеквадратичное отклонение выборки s (δ), равное 50,00. Тогда исправленный доверительный интервал составит:

Описание: 27 Описание: 28

Расчет объема выборки

Задача: Предположим, что, кроме средней величины ежемесячных расходов семьи в универмаге, решено также рассчитать среднюю величину ежемесячных расходов на одежду и подарки.

 Объемы выборок, необходимые для расчета каждой из трех величин средних ежемесячных расходов,  составляют 465 для покупок в универмаге, 246 — для одежды, 217 — для подарков.

Если бы все три переменные были одинаково важны, в соответствии с наиболее консервативным подходом следовало бы определить объем выборки как наибольшее значение n = 465. Тогда каждая переменная рассчитывалась бы по меньшей мере с заданной точностью.

Однако, если исследователя больше интересовал средний ежемесячный расход семьи на одежду, в качестве объема выборки можно выбрать n = 246.

Объем выборки с учетом оценки нескольких параметров

Переменная

Средний ежемесячный расход семьи на

покупки в универмагах

одежду

подарки

Уровень достоверности

95%

95%

95%

Нормированное отклонение, z

1,96

1,96

1,96

Степень точности, D

5 долл.

5 долл.

4 долл.

Генеральное среднеквадратичное отклонение, Q

55 долл.

40 долл.

30 долл.

Требуемый объем выборки, n

465

246

217

Определение объема выборки с помощью среднего и доли

Описание: 22

Репрезентативная выборка населения России

¢ Состоит из 3600-9000 человек и 180 групп (страт)

¢ (два пола, три возраста, два образовательных уровня, три доходные группы, пять типов поселений)

¢ Доверительный интервал будет в пределах + 3 процентных пункта

¢ Это значит, что если 30% (12% или 45%) респондентов заявили, что регулярно употребляют майонез, то долю потребителей майонеза в России можно оценить в 27-33 % (или 9-15 или 42-48% соответственно)

Размер выборки практически не зависит от размера генеральной совокупности. В мегаполисе с населением более 1 млн. чел. и в уездном городе с 35 тыс. чел, при построении выборки, репрезентативной по одинаковому числу параметров, потребуется опросить одинаковое количество человек.

Объем выборки зависит только от числа параметров, по которым мы желаем добиться репрезентативности. (если только пол и возраст, достаточно 400 чел., если параметров три – кол-во респондентов должно увеличится до 600 чел.)

Добиться репрезентативности по пяти параметрам: полу, возрасту, доходу, образованию, сфере профессиональной деятельности – можно лишь на выборке из 1000 – 1200 чел. в одном населенно пункте

Примеры расчета выборки

¢ На основании средних значений:

¢ Формула                          , где

¢ N- размер выборки.

¢ Z – стандартная ошибка

¢ δ – дисперсия признака в генеральной совокупности

¢ Е – допустимое максимальное значение признака

¢ Если исследователи известно, что в средние траты на одежду составляют 30 $ в 95% случаев ( значение z – 1.96) с допустимым интервалом в + 2 $, то

Пример расчета выборки на основании доли

 Где Z – доверительный интервал (стандартная ошибка)

Е –  допустимая ошибка выборки

P – пропорции генеральной совокупности

Т.О. из всего населения города, где функционирует компания, примерно 25% (данные предыдущих исследований или опыта). Являются потребителями продукции компании.

Необходимо рассчитать с точностью 3% (0.03), что в 95% случаев (доверительный интервал) респонденты являются потребителями Т.О. объем выборки:

Вам также может быть полезна лекция "28 Линейные однородные дифференциальные уравнения с постоянными коэффициентами".

Opinion Place основывает результаты на опросах 1000 респондентов

Агентства маркетинговых исследований начинают широко использовать Web для проведения исследований online.

DMS и AOL будут проводить online опросы AOL's Opinion Place, средний расчет объема выборки 1,000 респондентов. 

Такой Объем выборки был рассчитан на основе статистического анализа, также как объемы выборки для других исследований, проводимых традиционными методами. В качестве мотивации AOL будет предлагать респондентам баллы, которые затем будут разыграны для розыгрыша призов.

 Основные цели исследования – определить отношение респондентов и другую субъективную информацию от них для разработки и планирования рекламной кампании в Интернет, ориентированной на пользователей.

Другое преимущество опросов online  контроль параметров выборки, представляющей целевую аудиторию, а также то, что опросы могут быть проведены гораздо быстрее традиционных. Они также гораздо дешевле (DMS запрашивает $2000 за online опросы, в то время как опросы методом перехвата в торговых рядах такого же количества респондентов могут стоить $3000 and $4000)

Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5168
Авторов
на СтудИзбе
438
Средний доход
с одного платного файла
Обучение Подробнее