80728 (574258), страница 2
Текст из файла (страница 2)
У математичній статистиці значення середньої похибки визначається за формулою
,
де 2 — дисперсія вибіркової сукупності;
n — чисельність одиниць вибіркової сукупності;
k — коефіцієнт, який для повторного відбору дорівнює одиниці, а для безповторного — 1 – n/N, де N — чисельність генеральної сукупності.
Середня похибка вибірки використовується для визначення межі відхилень характеристик вибірки від характеристик генеральної сукупності. Суттєвим є твердження, що ці відхилення не будуть більші за значення, яке в статистиці називається граничною помилкою вибірки, лише з певним ступенем імовірності.
Гранична помилка вибірки пов’язана із середньою похибкою вибірки співвідношенням
= t,
де t — коефіцієнт кратності помилки.
Значення коефіцієнта кратності помилки залежить від того, з якою довірчою ймовірністю (надійністю) слід гарантувати результати вибіркового обстеження. Для його визначення користуються таблицею значень інтеграла ймовірностей нормального закону розподілення. В економічних дослідженнях звичайно обмежуються значеннями t, що не перевищують двох-трьох одиниць:
| Кратність помилки | Імовірність (надійність) | Кратність | Імовірність (надійність) | Кратність | Імовірність (надійність) |
| 0,1 | 0,0797 | 1,5 | 0,8664 | 2,6 | 0,9907 |
| 0,5 | 0,3829 | 2,0 | 0,9545 | 3,0 | 0,9973 |
| 1,0 | 0,6827 | 2,5 | 0,9876 | 4,0 | 0,999937 |
При цьому вибір тієї чи іншої довірчої імовірності залежить від того, з яким ступенем вірогідності слід гарантувати результати вибіркового обстеження (найчастіше спираються на ймовірність 0,9545, за якої t дорівнює 2).
Якщо в формулу для визначення підставити конкретний вміст , то для обчислення граничної помилки можна буде використати такі вирази:
-
у разі альтернативної ознаки
,
де w — вибіркова частка, яка визначається з відношення одиниць, які мають досліджувану ознаку, до загальної чисельності одиниць вибіркової сукупності;
-
у разі кількісної ознаки
,
де 2 — дисперсія кількісної ознаки у вибірці.
Визначення розміру вибірки
У разі організації вибіркових досліджень важливо визначити, наскільки великим має бути обсяг вибірки. Для загальної відповіді на це питання слід знати:
-
витрати на проведення вибіркового дослідження;
-
витрати на отримання наближених оцінок;
-
ступінь мінливості процесу;
-
ступінь надійності результатів, необхідний для прийняття подальших рішень.
Обминаючи вартісні фактори, розмір оптимальної вибірки можна визначити, базуючись на формулі граничної похибки. Приміром, за безповторного відбору для середньої кількісної ознаки необхідна чисельність обчислюється так:
,
де n — чисельність одиниць вибірки;
N — обсяг генеральної сукупності;
t — коефіцієнт кратності помилки (або коефіцієнт довіри);
2 — дисперсія;
— гранична (задана) помилка середньої (звичайно вибирається рівною 10 % від значення середньої).
Нехай для обстеження, що має на меті виявити потреби у певному товарі тривалого використання в регіоні, де мешкає 10 тис. сімей, необхідно провести анкетування.
Умовно приймаємо, що в кожній квартирі проживає одна сім’я і на неї виділяється одна анкета. Припустимо, що попередніми дослідженнями встановлено, що середній розмір покупки та дисперсія становлять відповідно 17 і 150 грн. Виходячи з того, що гранична помилка не повинна перевищувати 10 % від середньої і що результати обстеження необхідно гарантувати з довірчою імовірністю, не меншою 0,954, чисельність вибірки має становити
.
Ясна річ, деяка частина анкет не повертається (припустимо, практика показує, що приблизно кожна п’ята), тому треба збільшити кількість анкет до 255. Отже, можемо зробити висновок, що необхідно включити у вибірку щонайменше кожну 40-у квартиру.
Технологію визначення розміру вибірки pозглянемо на прикладі вибору магазинів для вивчення на деякій території споживацького попиту на певний товар.
Для цього на окремому робочому листі Excel слід створити список усіх магазинів, що торгують товаром, попит на який вивчається (рис. 2.3.7).
Заголовок списку мусить мати такі поля: номер магазину, тип (наприклад, універмаг і культтовари), місцезнаходження, загальний товарообіг, товарообіг по товару, частка продажу товару в товарообігу магазину.
Оформлення заголовка списку магазинів
| A | B | C | D | E | F | ||||||
| 1 | ВИЗНАЧЕННЯ ОБСЯГУ ВИБІРКИ | ||||||||||
| 2 | Номер магазину | Тип магазину | Адреса | Загальний товарообіг | Товарообіг по товару | Частка продажу товару ( %) | |||||
| 3 | |||||||||||
У цей список щодо кожного магазину заноситься інформація у перші п’ять стовпців (A, B, C, D, E). У клітину F3 заводиться формула =D3/E3*100 і копіюється на всі рядки списку.
Оскільки типова вибірка дає найточніші, порівняно з іншими способами відбору одиниць у вибіркову сукупність, результати, то відбір конкретних магазинів бажано проводити окремо для кожного типу магазинів. Тому список магазинів треба відразу впорядкувати за типом магазинів, а всередині цієї впорядкованості — за часткою продажу товару (команда Дані/Сортування).
Нехай повний список магазинів, що торгують товаром, попит на який вивчається, займає 52 рядки робочого аркуша. У такому разі в клітину С53 треба завести формулу =СЧЕТ(С3:С52), а у клітину F53 — формулу =ДИСПР(F3:F52). Перша формула дасть змогу обчислити загальну кількість магазинів, а друга — дисперсію розподілення частки продажу товару в цій сукупності магазинів. Слід звернути увагу на те, що використання функції ДИСПР передбачає, що її параметри представляють усю генеральну
сукупність. Якщо дані представляють тільки вибірку з генеральної сукупності, то дисперсію слід обчислювати, використовуючи функцію ДИСП.
Для полегшення подальшого використання у формулах значень клітин С53 і Е53 (кількості магазинів і дисперсії), цим клітинам і робочому аркушу слід надати імена (наприклад, N, D і СписокМ відповідно). Щоб дати ім’я клітині, можна завести курсор у цю клітину, клацнути мишею в полі імені, набрати там нове ім’я й обов’язково натиснути клавішу Enter. Можна також надавати імена клітинам, використовуючи діалогове вікно Надати ім’я. Для цього необхідно виконати таку послідовність дій:
-
розташувати курсор в клітині, якій треба надати ім’я;
-
вибрати команду Вставка/Ім’я/Надати;
-
у діалоговому вікні Надати ім’я, що з’явиться після цього, набрати нове ім’я у текстовому полі Ім’я;
-
натиснути на кнопку Додати, а потім — на кнопку ОК.
Для того щоб надати нове ім’я робочому аркушу, треба клацнути правою кнопкою миші на ярлику відповідного робочого аркуша, у контекстному меню вибрати команду Перейменувати, ввести потрібне ім’я і натиснути клавішу Enter.
Для проведення розрахунків на окремому робочому аркуші створюється таблиця.
Коефіцієнт граничної помилки вибираємо виходячи з 10 % рівня помилки середньої від її значення. Сьомий та восьмий рядки робочої таблиці показують межі вибірки, дотримання яких з вибраною ймовірністю гарантуватиме вірогідність результатів вибіркового обстеження. Останній показник у цій таблиці — це частка магазинів (n/N), що мають потрапити у вибірку.
Формули у робочому аркуші для обчислення обсягу вибірки
| A | B | C | D | ||||||
| 1 | ВИЗНАЧЕННЯ ОБСЯГУ ВИБІРКИ | ||||||||
| 2 | Середня вибірки (середня частка продажу) | = СРЗНАЧ (СписокМ! F3:F52) | |||||||
| 3 | Гранична помилка середньої | = 0,1*B2 | |||||||
| 4 | Довірча ймовірність (надійність) | 0,9545 | 0,9876 | 0,9973 | |||||
| 5 | Коефіцієнт кратностi помилки (t) | 2 | 2,5 | 3 | |||||
| 6 | Обсяг вибiрки (n) | = B4^2*D*N / ($B3^2 *N + B4^2*D) | = C4^2*D*N / ($B3^2*N + C4^2*D) | = D4^2*D*N / ($B3^2*N + D4^2*D) | |||||
| 7 | Нижня межа вибірки | = B6-$B3 | = C6-$B3 | =D6-$B3 | |||||
| 8 | Верхня межа вибірки | = B6+$B3 | = C6+$B3 | =D6+$B3 | |||||
| 9 | Частка вибірки | = B6/N | = C4/N | =D6/N | |||||
У табл. наведено результати обчислень за середньої 16 і трьох значень коефіцієнта довірчої ймовірності (0,9545; 0,9876; 0,9973). Після аналізу отриманих результатів слід вибрати значення довірчої ймовірності та надати відповідній клітині дев’ятого рядка робочого аркуша ім’я ЧасткаВ.
Результати обчислення обсягу вибірки
| A | B | C | D | |
| 1 | ВИЗНАЧЕННЯ ОБСЯГУ ВИБІРКИ | |||
| 2 | Середня вибірки (середня частка продажу) | 16 | ||
| 3 | Гранична помилка середньої | 1,6 | ||
| 4 | Довірча ймовірність | 0,9545 | 0,9876 | 0,9973 |
| 5 | Коефіцієнт кратностi помилки (t) | 2 | 2,5 | 3 |
| 6 | Обсяг вибiрки (n) | 33,74 | 38,21 | 41,18 |
| 7 | Нижня межа вибірки | 32,14 | 36,61 | 39,58 |
| 8 | Верхня межа вибірки | 35,34 | 39,81 | 42,78 |
| 9 | Частка вибірки | 0,67 | 0,76 | 0,82 |
Найпростіший спосіб підрахувати кількість магазинів кожного типу полягає у створенні на новому робочому аркуші зведеної таблиці, для чого слід виконати такі дії:
-
Установити курсор на будь-якій клітині списку магазинів.
-
Вибрати з меню команду Дані/Зведена таблиця.
-
На першому кроці Майстра зведених таблиць вибрати режим «у списку або базі даних Microsoft Excel».
-
На другому кроці просто клацнути по кнопці Далі.
-
На третьому кроці:
-
перетягнути поле Тип магазину в область діаграми Колонка;
-
ще раз перетягнути поле Тип магазину в область діаграми Дані і подвійно клацнути по ньому лівою кнопкою миші;
-
у діалоговому вікні Обчислення поля зведеної таблиці вибрати операцію Кількість значень і клацнути по кнопці ОК;
-
завершити формування зведеної таблиці натисканням кнопки Готово.
Таблиця, створювана Майстром зведених таблиць займатиме лише перші три рядки (на рисунку їх подано жирним курсивом).















