Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 26
Текст из файла (страница 26)
Далее мы будем использовать критерий знаковпротив этой односторонней альтернативы.В табл. 3.5 приведены соответствующие расчеты для данного примера.Обозначим число положительных значений zi через Sнабл. Из таблицы 3.5видно, что Sнабл. равно трем, а среди zi есть одно значение, равное 0. В такихслучаях необходимо уменьшить число наблюдений zi на число значений zi ,равных 0, т.е. перейти от n = 17 к n = 16.Вычислим вероятность P (S Sнабл. | H). Для этого воспользуемся табли"цами биномиального распределения при p = 1/2, n = 16 (см. [19], [77]). Учиты"вая, что в силу симметрии при p = 1/2 P (S Sнабл. | H) = P (S nSнабл. | H),получаем:P (S Sнабл. | H) = P (S 16 − 3 | H) = P (S 13 | H) = 0.0106.То есть минимальный уровень значимости, на котором можно отвергнутьгипотезу о том, что θ = 0 против односторонних альтернатив, равен 0.0106.Учитывая малость этого числа, заключаем, что гипотезу следует отвергнуть впользу альтернативы θ < 0.125ixiyiziS(xi )1234567891011121314151617223104209183180168215172200191197183174176155115163181194173153168176163152155156178160164169155122144−4290−36−30−128−52−20−45−35−19−23−10−70+7−19−+−−−+−−−−−−−−0+−Обсуждение.
Одно из главных достоинств критерия знаков —его простота. Другой важной особенностью этого критерия являютсяскромные требования к первоначальному статистическому материалу.Эти требования описываются с помощью модели парных наблюдений.3.6.2. :…ƒ … … …'… *' ƒ… … (ƒ… … 0…)Если можно дополнительно предположить, что случайные величиныz1 , .
. . , zn из предыдущего пункта непрерывны и одинаково распределе"ны, то для проверки гипотезы однородности можно применить болеемощный критерий, основанный на статистике T знаковых ранговыхсумм Уилкоксона.Метод. 1. Вычислим абсолютные разности |z1 |, . . . , |zn |. Пусть Riобозначает ранг zi в совместном упорядочении |z1 |, . . . , |zn | от меньшегок большему.2. Определим переменные ψi , i = 1, . . . , n, где1, если zi > 0 ;ψi =0, если zi < 0 .3.
Вычислим наблюденное значение T = ni=1 ψi Ri , далее мы будемназывать его Tнабл. .1264. Для одностороннего критерия для проверки H : P (zi < 0) =P (zi > 0) против правосторонней альтернативы P (zi < 0) < P (zi > 0)на уровне значимости α:••отклонить H, если Tнабл.
t(α, n);принять H, если Tнабл. < t(α, n),где критическое значение t(α, n) удовлетворяет уравнению P (T t(α, n) | H) = α. Таблицу критических значений можно найти в [115].Для одностороннего критерия для проверки той же гипотезы про"тив левосторонней альтернативы P (zi < 0) > P (zi > 0) на уровнезначимости α:n(n+1)− t(α, n);2n(n+1)−t(α, n).2•отклонить H, если Tнабл. •принять H, если Tнабл. >Для двустороннего критерия для проверки той же гипотезы H про"тив двусторонних альтернатив P (zi < 0) = P (zi > 0) на уровне зна"чимости 2α:••отклонить H, если Tнабл. t(α, n) или Tнабл.
принять H, еслиn(n+1)2n(n+1)2далее использовать те же методы, что и без совпадений. Для прибли"жения для больших выборок рекомендуется в формуле для вычисленияT ∗ значение DT заменить наg11 n(n + 1)(2n + 1) −tj (tj − 1)(tj + 1) ,242 j=1где g — число связок, t1 , . . . , tg — их размеры. Определение связоксмотри в разделе 3.5.2 при обсуждении статистики W ∗ .3.7.
ƒ STADIA SPSSНиже будет рассмотрено, как на компьютерах реализуются методыпроверки гипотез в схеме испытаний Бернулли, как можно проверятьгипотезы о равенстве медианы выборки заданному значению, а такжеприменять критерии знаков и знаковых рангов Уилкоксона для парныхсравнений.− t(α, n);3.7.1. STADIA− t(α, n) < Tнабл. < t(α, n).Замечание.
Поскольку распределение статистики T дискретно, уравнение,определяющее t(α, n): (P (T t(α, n)) = α) имеет точное решение не для всехзначений α (при фиксированном n). Поэтому либо в качестве t(α, n) придетсявзять приближенное решение, либо изменить α так, чтобы уравнение можнобыло решить точно.Приближение для большой выборки. При выполнении гипотезыH статистикаT − MTT − n(n + 1)/4T∗ = √=DTn(n + 1)(2n + 1)/24имеет асимптотическое (при n → ∞) распределение N (0, 1).
Приведемприближение нормальной теории для проверки H, для определенности,против правосторонней альтернативы: H отклоняется, если Tнабл. zα ,в противном случае H принимается. Здесь zα — квантиль уровня (1−α)стандартного нормального распределения N (0, 1). Остальные правилатрансформируются аналогично.Совпадения. Если среди значений zi есть нулевые, то их следуетотбросить, соответственно уменьшив n до количества ненулевых значе"ний zi . Если среди ненулевых значений |zi | есть равные, то для вычи"сления T надо использовать средние ранги для величин |z1 |, . . . , |zn | и127Пример 3.1к. Используя данные тройного теста, найдем мини"мальный уровень значимости критерия, основанного на значении числа«успехов» в схеме испытаний Бернулли для проверки гипотезы о значе"нии вероятности успеха против односторонних альтернатив.Для решения этой задачи следует использовать процедуру вычи"сления значений функции заданного распределения вероятностей.
Ееработа подробно рассмотрена в примере 2.1к. Здесь мы приведем диалогобщения с ней для биномиального распределения.Âûáîð ïðîöåäóðû. В меню блока Статистические методы (рис. 1.17)выберем пункт T = Вычисление вероятностей. В открывшемся при этом менюФункция вероятности распределения (рис. 2.9) выберем 1 = биномиальное илинажмем его клавишу «1».Çàïîëíåíèå ïîëåé ââîäà äàííûõ. На экране появится окно вво"да параметров распределения (рис.
3.2). Укажем в нем вероятность Pуспеха 0.333, число опытов N = 10, как показано на рис. 3.2, и нажмемкнопку Óòâåðäèòü. Затем последует запрос о числе вычисляемых значе"ний функции распределения (рис. 3.3). Здесь подразумевается заданиевсех или части возможных значений, которые принимает рассматривае"мая случайная величина. По умолчанию система указывает в этом полевведенное число испытаний.128Рис. 3.2. Ввод параметровбиномиального распределенияРис. 3.3. Ввод числа вычисляемыхзначений распределенияÐåçóëüòàòû.
После нажатия кнопки Óòâåðäèòü на экране в ок"не результатов появятся результаты работы процедуры (рис. 3.4). Вграфическое окно также будет выведен график вероятностей исходови функции распределения.ВЫЧИСЛЕНИЕ ВЕРОЯТНОСТЕЙ.Файл: Распределение биномиальное: 0.333, 10Среднее=3.33, Дисперсия=2.22, Ст.отклонение=1.49Функция распределения вероятностейrP(=r)P(X<=r)00.01740.017410.0870.10420.1950.330.260.5640.2270.78850.1360.92460.05670.9870.01620.99780.00303190.0003361Рис. 3.5. Данные для проверки гипотезо скорости реакций на свет и звукРис. 3.6. ВыборпеременныхÂûáîð ïðîöåäóðû. В меню блока Статистические методы в разделеНепараметрические тесты выберем пункт 6 = Сдвига/положения (для этого можнонажать клавишу «6»).Рис.
3.4. Результаты расчетов вероятностей дискретного распределенияДля получения минимального уровня значимости критерия для зна"чения Sнабл. = 7 против односторонних (правосторонних) альтернативнеобходимо вычислить величину 1 − P (X Sнабл. − 1). В данном случаеполучаем 1 − 0.9805 = 0.0195.Çàïîëíåíèå ïîëåé ââîäà äàííûõ. В появившемся окне Анализпеременных (рис. 3.6) выделим с помощью мыши переменные light и median.Нажав кнопку со стрелкой вправо, перенесем их из поля Переменные вполе Для анализа и затем нажмем кнопку Óòâåðäèòü.КРИТЕРИИ СДВИГА (ПОЛОЖЕНИЯ).Пример 3.2к.
В задаче о скорости реакции на звук и на светпроверим гипотезу о том, что медиана распределения скорости реакциина свет равна 155 мс.Ïîäãîòîâêà äàííûõ. В электронную таблицу пакета следуетввести данные таблицы 3.1 в соответствующие переменные, назовем ихsound и light (см. рис. 3.5). Кроме того в переменную median надо ввестизначения гипотетической медианы (это можно сделать с помощью блокапреобразования данных пакета).Замечание. Последнее требование связано с тем, что процедура критериязнаков реализована в пакете таким образом, что на ее вход всегда должныподаваться две парные выборки.
Поэтому для проверки гипотезы о равенствемедианы выборки заданной величине необходимо сформировать переменнуютакой же длины, что и у анализируемой выборки, все значения которой равныгипотетическому значению медианы.129Файл: sound.stdПеременные: light, medianВилкоксон=357, Z=;2.2552, Значимость=0.012, степ.своб = 17,17Гипотеза 1: <Есть различия между медианами выборок>Ван дер Варден=4.797, Z=1.784, Значимость=0.0372, степ.своб = 17,17Гипотеза 1: <Есть различия между медианами выборок>Для парных данных:Вилкоксон=116, Z=3.1812, Значимость=0.0007, степ.своб = 2,15Гипотеза 1: <Есть различия между медианами выборок>Знаков=11, Z=2.3240, Значимость=0.0101, степ.своб = 2,15Гипотеза 1: <Есть различия между медианами выборок>Рис.