183944 (Оцінювання параметрів розподілів)
Описание файла
Документ из архива "Оцінювання параметрів розподілів", который расположен в категории "". Всё это находится в предмете "экономико-математическое моделирование" из , которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "рефераты, доклады и презентации", в предмете "экономико-математическое моделирование" в общих файлах.
Онлайн просмотр документа "183944"
Текст из документа "183944"
Размещено на http://www.allbest.ru/
ОЦІНЮВАННЯ ПАРАМЕТРІВ РОЗПОДІЛІВ
Задача оцінювання параметрів розподілів полягає в побудові на основі статистичної інформації, отриманої за даними вибірки, статистичних висновків про істинне значення невідомого параметра , в знаходженні величини , яку можна буде взяти в якості його оцінки, і в визначенні припустимих меж їхньої розбіжності.
1. Загальні положення теорії оцінювання параметрів розподілів
Оскільки існує велика кількість функцій від вибіркових значень, які можна використати як оцінки параметрів, для вибору найкращої оцінки необхідно ввести критерій порівняння якості оцінок, вибрати міру, яка характеризує близькість оцінки до істинного значення параметра , який оцінюється. Проблема полягає в тому, що будь-яка оцінка, є величиною випадковою, тому що вона подає, собою функцію від вибірки обмеженого обсягу. Тому судити про її якість з реалізації тільки у даній вибірці не можна. Необхідно за законом розподілу оцінки, за формою кривої розподілу, з її розташування на числовій осі щодо оцінюваного параметра розсудити про те, або добре, чи незадовільно її підібрано.
Наприклад, на рис. 1 продемонстровано три криві розподілу оцінок різної якості під номерами 1- Очевидно, що розподіл типу 3 є дуже незадовільним, тому що середнє значення цієї оцінки є зміщеним вправо щодо істинного значення і, отже, значення буде оцінюватися із систематичною похибкою убік завищення. У розподілу цієї оцінки порівняно великим є і розсіювання.
Рисунок 1 – Криві розподілу оцінок
Подібність розподілів оцінок 1 і 2 між собою полягає в тому, що їхні середні значення оцінок знаходяться біля істинного значення параметра а, тобто зміщення в оцінці параметра при цьому відсутні чи є незначними. Однак розподіл типу 2 має істотно меншу дисперсію в порівнянні з розподілом 1. Тобто розсіювання значень оцінки 2, отриманої за даними вибірки, щодо істинного значення параметра у цьому разі буде меншим, ніж для оцінки 1, тому її слід вважати кращою.
Функції результатів спостережень (вибірки), що використовують для оцінки параметрів розподілів, називаються статистиками. У цій термінології оцінкою параметра є статистика ; реалізація якої, отримана по даній вибірці, приймається за невідоме значення параметра .
.
Взагалі, відповідно до узагальненої теореми великих чисел у вигляді границі ибіркова оцінка називається обґрунтованою, якщо під час збільшення обсягу вибірки вона збігається за ймовірністю до оцінюваного параметра .
Оцінка параметра називається незміщеною, якщо математичне сподівання оцінки дорівнює оцінюваному параметру :
.
У противному випадку оцінка називається зміщеною.
Оцінка параметра називається ефективною, якщо її дисперсія є мінімальною з усіх можливих дисперсій його оцінок:
Якщо зі збільшенням обсягу вибірки дисперсія оцінки прагне до будь-якого граничного (мінімального) значення, наприклад, як на рис. 2, оцінка називається асимптотично ефективною.
Рисунок 2 – Дисперсія асимптотично ефективної оцінки
Задовольнити всім трьом вимогам оцінки параметра розподілу (обґрунтованості, незміщеності та ефективності) разом звичайно не вдається. Насамперед це стосується спільного виконання останніх двох вимог.
Оцінювання параметра традиційно проводять у два етапи. На першому етапі визначають статистику , значення якої при даній реалізації вибірки приймають за наближене значення оцінюваного параметра : .
Цю процедуру в математичній статистиці називають точковим оцінюванням, а величину – точковою оцінкою.
На другому етапі оцінюють точність і надійність точкової оцінки, яка за своєю природою є величиною випадковою. Ця процедура полягає в знаходженні інтервалу, де із заданою ймовірністю міститься невідоме значення параметра, що оцінюється. Цей етап звичайно називають інтервальним оцінюванням.
Далі розглянемо основні методи, що дозволяють провести точкове і інтервальне оцінювання параметрів.
2. Точкове оцінювання параметрів
Головними методами одержання точкових оцінок параметрів є метод моментів і метод максимальної правдоподібності.
Метод моментів. Цей метод (Пірсона) полягає в порівнюванні визначеної кількості вибіркових моментів, що співпадає з числом підлягаючих оцінці параметрів, з відповідними теоретичними моментами розподілу, що є функціями від невідомих параметрів. При розв’язанні системи рівнянь, що при цьому одержують, знаходять точкові оцінки параметрів.
Задля прикладу застосуємо метод моментів для визначення параметрів рівномірного закону розподілу випадкової величини зі щільністю ймовірності, що задано функцією
(1)
Обчислимо математичне сподівання і дисперсію величини :
, (2)
(3)
Для визначення оцінок параметрів і , тобто визначення і замінимо в рівняннях (2) і (3) і їхніми оцінками і (1),(2). Одержимо систему рівнянь для точкових оцінок , , звідки знаходимо:
.
Відомо, що метод моментів при досить загальних умовах дозволяє знайти оцінки, для яких виконується вимога асимптотичної ефективності. Однак, як доведено Фішером, отримані цим методом оцінки з погляду їхньої ефективності не є найкращими з можливих, тобто при великих вибірках вони мають не найменшу можливу дисперсію. Тому отримані цим методом оцінки слід розглядати лише як перше наближення.
Метод максимальної правдоподібності. Найбільш поширеним методом точкового оцінювання є метод максимальної правдоподібності (Фішера). Оцінки, отримані цим методом при досить великих вибірках, звичайно задовольняють усім перерахованим вище вимогам обґрунтованості, незміщеності та ефективності.
Сутність цього методу полягає у наступному. Нехай дана вибірка обсягу з генеральної сукупності з неперервно розподіленою випадковою величиною . Нехай щільність ймовірності має вигляд , тобто містить невідомий параметр , який треба оцінити за вибіркою.
Функцією правдоподібності називають функцію параметра , що визначається формулою:
. (4)
У разі дискретної випадкової величини з можливими значеннями та ймовірностями позначимо через найбільше з можливих значень, що зустрічається у вибірці, а через абсолютні частоти, з якими з'являються значення , ,... у вибірці . У цьому випадку функцією правдоподібності називають функцію параметра , що задана співвідношенням
. (5)
Метод найбільшої правдоподібності полягає в тому, що за оцінку параметра береться таке його значення, при якому функція правдоподібності досягає свого максимуму.
Параметр знаходять, розв’язуючи відносно нього рівняння
. (6)
Часто для зручності функцію правдоподібності заміняють її логарифмом і замість (6) розв’язують рівняння вигляду
, . (7)
Якщо щільність ймовірності або ймовірність можливого значення залежать від параметрів, то найбільш правдоподібну оцінку системи параметрів одержують під час розв’язання системи рівнянь
(8)
або
. (9)
Найбільш правдоподібні оцінки при досить загальних умовах мають такі важливі властивості:
– вони є обґрунтованими,
– асимптотично нормально розподіленими, однак не завжди незміщеними,
– серед усіх асимптотично нормально розподілених оцінок вони мають найбільшу ефективність.
Має місце також наступне положення: якщо взагалі є ефективна оцінка, її можна отримати методом найбільшої правдоподібності.
3. Інтервальне оцінювання параметрів
Інтервальною називають оцінку, що визначається двома числами – кінцями інтервалу. Інтервальні оцінки дозволяють визначити точність і надійність точкових оцінок.
Надійністю (довірчою ймовірністю) оцінки невідомого параметра за допомогою знайденої за даними вибірки статистичної характеристики називають ймовірність , з якою виконується нерівність :
чи, що те ж саме
.
Звичайно використовують рівень надійності, що має значення: 0,95; 0,99 і 0,999.
Довірчим називають інтервал ( ), який покриває невідомий параметр із заданою надійністю .
1 Довірчі інтервали для оцінки математичного сподівання нормального розподілу при відомому . Розглянемо задачу інтервальної оцінки невідомого математичного сподівання кількісної ознаки по вибірковій
середній нормально розподіленої сукупності з відомим середньо квадратичним відхиленням . Знайдемо довірчий інтервал, що покриває параметр з надійністю .
Вибіркова середня змінюється від вибірки до вибірки. Тому її можна розглядати, як випадкову величину , а вибіркові значення ознаки , , ... , (ці числа також змінюються від вибірки до вибірки) – як однаково розподілені незалежні випадкові величини , , ... , . Тобто, математичне сподівання кожної з цих величин дорівнює і середнє квадратичне відхилення – .
Можна показати, що у разі нормального розподілення випадкової величина вибіркова середня , знайдена за незалежними спостереженнями, також розподілена нормально з параметрами:
, . (12)
Поставимо вимогу, щоб було виконано співвідношення
, (13)
де – задана надійність.
Застосуємо до нормально розподіленої випадкової величини відому з теорії ймовірностей формулу про ймовірність відхилення нормально розподіленої випадкової величини зі середньоквадратичним відхиленням від його математичного сподівання не більше ніж на
, (14)