80854 (597675), страница 18
Текст из файла (страница 18)
Цільова вибірка полягає у систематичному відборі елементів з метою залучення до дослідження достатньої кількості елементів кожного основного типу. Але використання результатів такої вибірки обмежується неможливістю оцінити помилку вибірки, якимось об'єктивним способом. Вона використовується при вивченні реакції ринку на новий виріб або на модернізацію старого, коли ймовірнісна вибірка потребує великих витрат. При цьому робиться припущення, що смаки споживачів більш-менш ідентичні, принаймні усередині однієї групи.
8.3 Помилка вибірки
Після проведення певного кількох спостережень отримують розподілення результатів (вибіркових оцінок) одного й того ж істинного рівня. Це вибіркове розподілення підкоряється закону нормального розподілення, якщо вибірка достатньо велика. У зв'язку із тим, що істинний рівень може не збігтися з рівнем вибіркових характеристик, необхідно брати до уваги похибку вибірки. У цьому разі можна знайти ступінь вірогідності вибіркових характеристик.
Значення середньої похибки у математичній статистиці визначається за формулою:
де — дисперсія вибіркової сукупності;
n — чисельність одиниць вибіркової сукупності;
k — коефіцієнт, який для повторного відбору дорівнює одиниці, а для безповторного (1-n/N), де N — чисельність генеральної сукупності.
Середня похибка вибірки використовується для визначення межі відхилень характеристик вибірки від характеристик генеральної сукупності. Суттєвим є твердження, що ці відхилення не будуть більші за значення, яке в статистиці називається граничною помилкою вибірки, лише з певним ступенем імовірності.
Гранична помилка вибірки пов'язана із середньою похибкою вибірки співвідношенням:
×t,
де t— коефіцієнт кратності помилки.
Значення коефіцієнта кратності помилки залежить від того, з якою довірчою ймовірністю (надійністю) потрібно гарантувати результати вибіркового обстеження. Для його визначення користуються таблицею значень інтеграла ймовірностей нормального закону розподілення. В економічних дослідженнях звичайно обмежуються значеннями t що не перевищують двох — трьох одиниць:
Кратність помилки | Імовірність (надійність) | Кратність помилки | Імовірність (надійність) | Кратність помилки | Імовірність (надійність) |
0,1 | 0,0797 | 1,5 | 0,8664 | 2,6 | 0,9907 |
0,5 | 0,3829 | 2,0 | 0,9545 | 3,0 | 0,9973 |
1,0 | 0,6827 | 2,5 | 0,9876 | 4,0 | 0,999937 |
При цьому вибір тієї чи іншої довірчої ймовірності залежить від того, з яким ступенем вірогідності потрібно гарантувати результати
вибіркового обстеження (найчастіше спираються на ймовірність 0,9545, при якій і дорівнює 2).
Якщо в формулу для визначення підставити конкретний вміст , то для обчислення граничної помилки використовуються:
-
у разі альтернативної ознаки вираз:
де w —вибіркова частка, яка визначається з відношення одиниць, що мають досліджувану ознаку, до загальної чисельності одиниць вибіркової сукупності;
- у разі кількісної ознаки вираз:
,
де — дисперсія кількісної ознаки у вибірці.
8.4 Визначення розміру вибірки
Витрати на проведення вибіркового дослідження, витрати на отримання наближених оцінок, ступінь мінливості процесу та надійності результатів, необхідний для прийняття подальших рішень – питання, відповіді на які необхідні для визначення обсягу вибірки, при організації вибіркових досліджень.
Обминаючи вартісні фактори, розмір оптимальної вибірки можна визначити, базуючись на формулі граничної похибки. Приміром, при безповторному відборі для середньої величини кількісної ознаки необхідна чисельність обчислюється так:
де n— чисельність одиниць вибірки, N — обсяг генеральної сукупності; і — коефіцієнт кратності помилки (або коефіцієнт довіри); —дисперсія,
— гранична (задана) помилка середньої (звичайно вибирається рівною 10 % від значення середньої).
Наприклад, для обстеження, що проводиться з метою виявлення потреби у певному товарі тривалого використання, в регіоні, де мешкає 10 тис. сімей, необхідно провести анкетування. Умовно приймаємо, що у кожній квартирі проживає одна сім'я і на неї виділяється одна анкета. Припустимо, що попередні дослідження встановили, що середній розмір покупки та дисперсія становлять відповідно 17 та 150 гривень. Виходячи з того, що гранична помилка не повинна перевищувати 10 % середньої і що результати обстеження необхідно гарантувати з довірчою ймовірністю не меншою 0,954, чисельність вибірки становитиме:
Звичайно деяка частина анкет не повертається (враховуючи досвід проведених опитувань, практика показує, що не повернеться приблизно кожна п'ята), тому потрібно збільшити кількість анкет до 255. Звідси можна зробити висновок, що необхідно включити у вибірку щонайменше кожну 40-у квартиру.
Технологію визначення розміру типової вибірки можна розглянути на прикладі вибору магазинів для вивчення на деякій території споживацького попиту на певний товар.
Для цього на робочому листі Excel потрібно створити список усіх магазинів, що торгують товаром, попит на який вивчається. Заголовок списку має мати такі поля: номер магазину, тип магазину (наприклад, універмаг і культтовари), місцезнаходження, загальний товарообіг, товарообіг по товару, частка продажу товару в загальному товарообігу (рис.8.1).
A | B | C | D | E | F | |
1 | ВИЗНАЧЕННЯ ОБСЯГУ ВИБІРКИ | |||||
2 | Номер магазину | Тип магазину | Адреса | Загальний товарообіг | Товарообіг по товару | Частка продажу товару (%) |
3 |
Рис.8.1 Оформлення заголовка списку магазинів
У даний список у перші п'ять стовпців (А, В, С, Д Е) заноситься інформація по кожному магазину. У клітину FЗ заводиться формула =D3/E3×100 і копіюється на всі рядки списку.
Відбір конкретних магазинів бажано проводити окремо для кожного типу магазинів, оскільки типова вибірка порівняно з іншими способами відбору одиниць у вибіркову сукупність дає найбільш точні результати. Тому список магазинів упорядковується за типом магазинів, а в межах цієї упорядкованості — за часткою продажу товару (команда Дані/Сортування). Нехай повний список магазинів, що торгують товаром, попит на який вивчається, займає 52 рядки робочого аркуша. У такому разі в клітину С53 треба завести формулу = СЧЕТ(С3:С52), а у клітину F53 — формулу = ДИСПР (FЗ:F52).
Перша формула дасть змогу обчислити загальну кількість магазинів, а друга — дисперсію розподілення частки продажу товару в цій сукупності магазинів. Слід звернути увагу на те, що використання функції ДИСПР передбачає, що її параметри представляють усю генеральну сукупність. Якщо дані представляють тільки вибірку з генеральної сукупності, то дисперсію слід обчислювати, використовуючи функцію ДИСП.
Для полегшення подальшого використання у формулах значень клітин С53 і Е53 (кількості магазинів і дисперсії), цим клітинам і робочому аркушу слід надати імена. Для того, щоб дати ім'я клітині, можна завести курсор у цю клітину, клацнути мишею в полі імені, набрати там нове ім'я та обов'язково натиснути клавішу Enter. Можна також надавати імена клітинам, використовуючи діалогове вікно Надати ім'я. Для цього необхідно виконати таку послідовність дій:
-
розташувати курсор у клітині, якій потрібно надати ім'я;
-
вибрати команду Вставка/ Ім’я / Надати;
-
в діалоговому вікні Надати ім'я, що з'явиться після цього, набрати нове ім'я у текстовому полі Ім’я;
-
натиснути на кнопку Додати, а потім — на кнопку ОК.
Для того, щоб надати нове ім'я робочому аркушу, треба клацнути правою кнопкою миші на ярлику відповідного робочого аркуша, у контекстному меню вибрати команду Перейменувати, увести потрібне ім'я і натиснути клавішу Enter.
Для проведення розрахунків на окремому робочому аркуші створюється окрема таблиця, яка заповнюється відповідно до рис 8.2.
Коефіцієнт граничної помилки вибираємо, виходячи з 10 % рівня помилки, середньої від її значення. Сьомий та восьмий рядки робочої таблиці показують межі вибірки, дотримання яких з вибраною ймовірністю гарантуватиме вірогідність результатів вибіркового обстеження. Останній показник у цій таблиці — частка магазинів (n/N), які мають потрапити у вибірку.
А | В | С | D | |
1 | ВИЗНАЧЕННЯ ОБСЯГУ ВИБІРКИ | |||
2 | Середня вибірки (середня частки продажу) | = СРЗНАЧ (СписокМ! FЗ:F52) | ||
3 | Гранична помилка середньої | = 0,1*В2 | ||
4 | Довірча ймовірність (надійність) | 0,9545 | 0,9876 | 0,9973 |
5 | Коефіцієнт кратності помилки (?) | 2 | 2,5 | 3 |
б | Обсяг вибірки (п) | = В4^2*D*N / ($В3^2*N + В4^2*D) | = С4^2*D*N / ($В3^2*N + С4^2*D) | =D4^2*D*N / ($В3^2*N + D4^2*D) |
7 | Нижня межа вибірки | = В6-$ВЗ | = С6-$ВЗ | =D6-$ВЗ |
8 | Верхня межа вибірки | = В6+$ВЗ | = С6+$ВЗ | =D6+$ВЗ |
9 | Частка вибірки | = В6/N | = С4/N | =D6/N |
Рис. 8.2 Формули у робочому аркуші для обчислення обсягу вибірки
На рис. 8.3 наведені результати обчислень при значенні середньої, що дорівнює 16, і трьох значеннях коефіцієнта довірчої ймовірності (0.9545, 0.9876, 0.9973). Після аналізу отриманих результатів потрібно вибрати значення довірчої ймовірності і надати відповідній клітині дев'ятого рядка робочого аркуша ім'я ЧасткаВ.
A | В | С | D | |
1 | ВИЗНАЧЕННЯ ОБСЯГУ ВИБІРКИ | |||
2 | Середня вибірки (середня частки продажу) | 16 | ||
3 | Гранична помилка середньої | 1,6 | ||
4 | Довірча ймовірність | 0,9545 | 0,9876 | 0,9973 |
5 | Коефіцієнт кратності помилки (t) | 2 | 2,5 | 3 |
6 | Обсяг вибірки (n) | 33,74 | 38,21 | 41,18 |
7 | Нижня межа вибірки | 32,14 | 36,61 | 39,58 |
8 | Верхня межа вибірки | 35,34 | 39,81 | 42,78 |
9 | Частка вибірки | 0,67 | 0,76 | 0,82 |
Рис. 8.3 Результати обчислення обсягу вибірки