183841 (Параметричні і непараметричні критерії для перевірки гіпотез)

2016-07-30СтудИзба

Описание файла

Документ из архива "Параметричні і непараметричні критерії для перевірки гіпотез", который расположен в категории "". Всё это находится в предмете "экономико-математическое моделирование" из , которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "курсовые/домашние работы", в предмете "экономико-математическое моделирование" в общих файлах.

Онлайн просмотр документа "183841"

Текст из документа "183841"

Параметричні і непараметричні критерії для перевірки гіпотез

1. Відомості про деякі відомі розподіли

Дискретна випадкова величина (біноміальний розподіл) описується схемою Бернуллі: якщо випадкова подія А в n незалежних іспитах зустрілася m разів, то р – імовірність появи події А у кожному іспиті. Формула Бернуллі (дозволяє оцінити імовірність того, що серед n взятих навмання елементів виявиться m очікуваних. Даний розподіл характеризується двома параметрами: середнім числом очікуваного результату (математичне очікування) і дисперсією частоти події А в n незалежних іспитах

і має вигляд

Граничним випадком біноміального розподілу є формула Пуассона:

Випадкова величина розподілена за законом Пуассона, якщо вона приймає рахункову множину можливих значень 0, 1, 2, з імовірностями . Коли у схемі Бернуллі імовірність появи події А (величина p = соті чи тисячні частини одиниці), тобто частина успіхів дуже мала, розподіл частот таких рідких подій у n іспитах стає несиметричним і зазвичай описується формулою Пуассона. Розподіл характеризується одним параметром – середньою величиною, рівною a, середнє квадратичне відхилення в даному випадку також дорівнює а. Для такого розподілу характерна висока варіація. Зі зростанням значень а розподіл прагне до нормального закону. Розподіл Пуассона є моделлю, яку можна використовувати для опису випадкового числа появи визначених подій у фіксованому проміжку часу.

Безперервний розподіл – це рівномірний розподіл на відрізку 0,1:

Безперервний розподіл можна розповсюджувати на випадок відрізка 0,1, тоді імовірність приймати значення в будь-якій точці відрізка дорівнює . Математичне очікування розподілу дорівнює , дисперсія дорівнює .

Безперервний експонентний (показовий) розподіл має вигляд:

де – параметр експонентного розподілу.

Математичне очікування дорівнює , а дисперсія – .

5. Розподіл Максвелла (безперервний розподіл) має вигляд:

і описує асиметричні розподіли. У цій формулі параметр а дорівнює середньому арифметичному, помноженому на величину 0,6267. Характерною ознакою розподілу Максвелла є рівність середнього квадратичного відхилення величини 0,674а. Крива розподілу за формулою нагадує нормальний розподіл, але починається від нуля, крутіше піднімається з боку малих значень випадкової величини і потім, досягши максимуму, більш полого спадає убік великих значень. Такий розподіл виникає, наприклад, при побудові розподілу осіб і популяції за їхніми відстанями до оптимального фенотипу, що зворотньопропорційні їх фенотиповій цінності.

Розподіл Шарльє (безперервний) має вигляд:

де р(x) – щільність нормального розподілу;

р(x) – похідна відповідного порядку щільності нормального
розподілу р(х);

Ах – асиметрія;

Ех – ексцес.

Розподіл Шарльє описує асиметричний розподіл з вираженим ексцесом, що виникає при порушенні форми кривої, характерної для нормального розподілу. Така крива розподілу є асиметричною, її звоноподібна вершина стає пікоподібною, чи трапецієподібною. За допомогою розподілу такого виду «конструюються» порушення нормальної форми розподілу.

Гамма-розподіл (безперервний) має вигляд:

де Г() – гамма-функція. Її визначення за Ейлером задається співвідношенням:

Основні властивості гамма-функції: Г(1)=1, Г (х+1)=хГ(х).

Гамма-функція являє собою двопараметричний розподіл, де – параметр форми, а – параметр масштабу. Математичне очікування дорівнює , дисперсія задається співвідношенням: 2, мода дорівнює (-1) при 1. Гамма-функція є безперервним аналогом негативного біноміального розподілу. При =1 гамма-розподіл збігається з показовим, при =n, =1/(n гамма-розподіл називається ерлангівським розподілом з параметрами (n,) і описує розподіл тривалості інтервалу часу до появи n подій процесу Пуассона з параметром .

2. Параметричні критерії для перевірки гіпотези про відмінність (або схожість) між середніми значеннями

Отже, якщо ваші вибірки мають нормальний розподіл, для перевірки статистичних гіпотез на їх основі можна користуватися параметричними критеріями. Найпоширенішим параметричним методом оцінки відмінностей між порівнюваними середніми значеннями незалежних вибірок є критерій Стьюдента, або t-критерий. Нульова гіпотеза полягає в рівності генеральних середніх М1 і М2, (М1 – М2) = 0 сукупностей, з яких були взяті вибірки, або, іншими словами, перевіряється нульова гіпотеза про приналежність двох порівнюваних вибірок однієї і тієї самої генеральної сукупності. T-критерій, що перевіряється, виражається у вигляді відношення різниці відповідних вибіркових середніх до помилки такої різниці, тобто

або

де σd стандартна помилка різниці вибіркових середніх значень, σх1, σх2стандартні помилки середніх значень порівнюваних вибірок.

Треба звернути увагу, що дисперсія різниці (так само, як і дисперсія суми) двох середніх значень дорівнює сумі дисперсій цих середніх значень.

Для перевірки критерію знак різниці середніх значень не відіграє ролі, тому у формулі для розрахунку тестової статистики береться модуль різниці. Проте знак різниці важливий для інтерпретації результатів порівняння і висновку про перевагу одного з порівнюваних методів. Надалі при порівнянні параметрів у формулах для тестових статистик ми опускатимемо знак модуля.

Гіпотезу про рівність математичних очікувань відкидають, якщо фактично отримана величина t-критерію перевершить або виявиться рівною табличному значенню для прийнятого рівня значимості і числа ступенів свободи. При цьому робиться висновок про наявність статистично значимих відмінностей між середніми значеннями на відповідному рівні значимості.

Формули для розрахунку тестової статистики і числа ступенів свободи дещо розрізняються залежно від рівності або нерівності дисперсій порівнюваних сукупностей. Це питання вимагає уважного розгляду, особливо для вибірок малого об'єму (n < 20).

У разі рівності дисперсій або вибірок достатньо великого об'єму помилка різниці середніх σd визначається за такими формулами:

для нерівночисельних вибірок при n1≠n2

для рівночисельних вибірок при n1= n2 формула дещо спрощується:

Число ступенів свободи для випадку рівних дисперсій дорівнює . Якщо хоча б одна з порівнювальних вибірок мала, то спочатку слід перевірити гіпотезу про рівність дисперсій вибірок. Залежно від відповіді на це запитання подальше порівняння середніх арифметичних проводять двома різними способами.

Для перевірки гіпотези про рівність генеральних дисперсій користуються критерієм Фішера. При цьому обчислюють показник Фішера, що дорівнює відношенню більшої вибіркової дисперсії до меншої: Показник Фішера завжди F> 1, а при рівності дисперсій F=1. Чим значніше нерівність, тим більше значення показника і навпаки. Функція F табульована і залежить від чисел ступенів свободи. Якщо обчислене значення F перевищить відповідне табличне значення і гіпотеза про рівність дисперсій буде знехтувана, то це означає, що вибірки були взяті з сукупностей з різними дисперсіями.

Для порівняння двох залежних вибірок або вибірок з попарно пов'язаними варіантами перевіряють гіпотезу про рівність нулю середнього значення їх попарних різниць. Така задача виникає, коли є дані про зміну ознаки, що нас цікавить, у кожного пацієнта. Наприклад, якщо група пацієнтів одержувала метод лікування, що вивчається, і у кожного пацієнта вимірювалося значення ознаки до і після лікування. В даному випадку належить перевірити нульову гіпотезу про рівність нулю змін цієї ознаки в результаті отримання терапії.

3. Непараметричні критерії для перевірки гіпотези про відмінність (або схожість) між середніми значеннями

Для порівняння середніх значень може застосовуватися і цілий ряд непараметричних критеріїв, серед яких важливе місце займають так звані рангові критерії. Використання цих критеріїв було засновано на ранжируванні членів порівнювальних груп. При цьому порівнюються не самі члени ранжированого ряду, а їх порядкові номери або ранги. Під час розв’язання конкретної задачі дуже важливо правильно обрати критерій.

Наведемо U-критерий Уїлкоксона (Манна–Уітні) для перевірки гіпотези про приналежність порівнюваних незалежних вибірок до однієї і тієї самої генеральної сукупності. Гіпотезу перевіряють, розташувавши в узагальнений ряд значення порівнювальних вибірок у зростаючому порядку. Всім значенням отриманого узагальненого ряду привласнюються ранги від 1 до N=n1+n2. Для кожної вибірки знаходяться суми рангів R і розраховуються статистики: для та - номер вибірки.

Якщо нульова гіпотеза вірна і вибірки були взяті з однієї і тієї самої генеральної сукупності, ми не повинні очікувати переважання спостережень з однієї вибірки на одному з кінців з'єднаного варіаційного ряду, їх значення мають бути достатньо рівномірно розсіяні по всьому узагальненому ряду. Таким чином, дуже великі або дуже малі значення статистики R мають примусити нас засумніватися у справедливості нульової гіпотези. Як тестову статистику вибирають мінімальну величину U і порівнюють її з табличним значенням для прийнятого рівня значимості. Гіпотеза приймається, і відмінності вважаються недостовірними, якщо розраховане значення більше відповідного табличного.

Зазвичай у таблицях наводяться критичні значення даного критерію для об'єму вибірок 20 або 40. У разі вибірок більшого об'єму для перевірки даного критерію застосовується нормальна апроксимація. Тоді критичні значення для критерію U можна розрахувати за формулою:

де критичні значення стандартного нормального розподілу, визначені за таблицями. Треба звернути увагу, що якщо є однакові варіанти, їм привласнюється середній ранг, проте значення останнього рангу має дорівнювати n1+n2. Це правило використовують для перевірки правильності ранжирування.

У разі попарно зв'язаних вибірок застосовується Т-критерій Уїлкоксона. При цьому попарні різниці – позитивні і негативні (окрім нульових) в один ряд так, щоб найменша абсолютна різниця (без урахування знака) отримала перший ранг, однаковим величинам привласнюють один ранг. Окремо обчислюють суму рангів позитивних (T+) і негативних різниць (Т-), меншу з двох таких сум без урахування знака вважають тестовою статистикою даного критерію. Нульову гіпотезу приймають на даному рівні значимості, якщо обчислена статистика перевершить табличне значення (число парних спостережень зменшують на число виключених нульових різниць). Таким чином, можна сказати, що якщо нульова гіпотеза вірна, статистики T+ і T – приблизно рівні, порівняно малі або великі значення T-статистик примусять нас відхилити нульову гіпотезу про відсутність відмінностей.

Приклад. Припустимо, в результаті проведення дослідження був обчислений ряд попарних різниць між показником ефекту в двох попарно пов'язаних групах (n1 = n2 = 10) (наприклад, так звана задача «до і після»): 0,2 -0,4 0,7 -0,9 1,3 1,5 -0,1 0,8 -1,0 1,1. Ранжируємо попарні різниці в один ряд, незалежно від знака різниці, одержуємо такий ранжирований ряд: -0,1 0,2 -0,4 0,7 0,8 -0,9 -1,0 1,1 1,3 1,5.

Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5167
Авторов
на СтудИзбе
437
Средний доход
с одного платного файла
Обучение Подробнее