Лекционный курс в ПДФ (1119925), страница 12
Текст из файла (страница 12)
Если значение Kв попадает в область принятия гипотезы, тогипотеза H0 принимается.Рисунок 1. иллюстрирует решениеуравнения (1). Здесь pK(x) – известнаяплотностьраспределенияслучайнойвеличины K при условии справедливостигипотезы H0.Пусть выбрано некоторое малоезначение вероятности a, по нему определено значение Kкр и повыборочным данным определено значение Kв, которое попало вкритическую область. В этом случае гипотеза H0 отвергается, но онаможет оказаться справедливой, просто случайно произошло событие,которое имеет очень малую вероятность a.
В этом смысле a естьвероятность отвержения правильной гипотезы H0.Отвержение правильной гипотезы называется ошибкой первогорода. Вероятность a называется уровнем значимости. Таким образомуровень значимости – это вероятность совершения ошибки первогорода.Критическая область, полученнаядля уравнения (1) и приведенная нарисунке 1., называется правосторонней.Уравнение(2)определяетлевосторонюю критическую область.71Лекция 13.Ее изображение приводится на рисунке 2.Отметим, что каждая из заштрихованных фигур на рисунках 1. и 2.имеет площадь, равную a.Уравнение(3)определяетдвусторонюю критическую область.Такая область изображена на рисунке 3.Здесь критическая область состоит из двухчастей.Вслучаедвустороннейкритической области границы ее частейKкр1 и Kкр2 определяются таким образом, чтобы выполнялось условие:P(K £ Kкр) = P(K ³ Kкр) = a / 2.На рисунке 3.
площадь каждой из заштрихованных фигур равна a / 2.Вид критической области зависит от того, какая гипотеза выдвинутав качестве конкурирующей.Чем меньше уровень значимости, тем меньше вероятностьотвергнуть проверяемую гипотезу H0, когда она верна, то естьсовершить ошибку первого рода. Но с уменьшением уровнязначимости расширяется область принятия гипотезы H0 иувеличивается вероятность принятия проверяемой гипотезы, когдаона неверна, то есть когда предпочтение должно быть отданоконкурирующей гипотезе.Пусть при справедливости гипотезы H0 статистический критерий Kимеет плотность распределения p0(x), а при справедливостиконкурирующей гипотезы H1 – плотность распределения p1(x).
Графикиэтих функций приведены на рисунке 4. При некотором уровне значимостинаходится критическое значение Kкр и правостороняя критическаяобласть. Если значение Kв, определенное по выборочным данным,оказывается меньше, чем Kкр, то гипотеза H0 принимается. Предположим,что справедлива на самом деле конкурирующая гипотеза H1. Тогдавероятность попадания критерия в область принятия гипотезы H0 естьнекоторое число b, равное площади фигуры, образованной графикомфункции p1(x) и полубесконечной частью горизонтальной координатной72Лекция 13.оси, лежащей слева от точки Kкр.Очевидно, что b – это вероятностьтого, что будет принята невернаягипотеза H0.Принятиеневернойгипотезы называется ошибкойвторого рода. В рассмотренном случае число b – это вероятность ошибкивторого рода. Число 1 – b, равное вероятности того, что не совершаетсяошибка второго рода, называется мощностью критерия. На рисунке 4мощность критерия равна площади фигуры, образованной графикомфункции p1(x).и полубесконечной частью горизонтальной координатнойоси, лежащей справа от точки Kкр.Выбор статистического критерия и вида критической областиосуществляется таким образом, чтобы мощность критерия быламаксимальной.73Лекция 14.Проверка статистической гипотезы о математическоможидании нормального распределения при известнойдисперсии.Пусть имеется нормально распределенная случайная величина x,,определенная на множестве объектов некоторой генеральнойсовокупности.
Известно, что Dx = s 2. Математическое ожидание Mxнеизвестно. Допустим, что имеются основания предполагать, что Mx = a,где a – некоторое число (такими основаниями могут быть ограниченныесведения об объектах генеральной совокупности, опыт исследованияподобных совокупностей и т. д.). Будем считать также, что имеется другаяинформация, указывающая на то, что Mx = a1, где a1 > a.I. Выдвигаем нулевую гипотезу H0: Mx = a;при конкурирующей гипотезе H1: Mx = a1.Делаем выборку объема n: x1, x2,..., xn .
В основе проверки лежит тотфакт, что случайная величина x (выборочная средняя) распределена понормальному закону с дисперсией s 2/n и математическим ожиданием,равным a в случае справедливости H0, и равным a1 в случаесправедливости H1.Очевидно, что если величина x оказывается достаточно малой, тоэто дает основание предпочесть гипотезу H0 гипотезе H1. При достаточнобольшом значении x более вероятна справедливость гипотезы H1.
Задачуможно было бы поставить так: требуется найти некоторое критическоечисло, которое разбивало бы все возможные значения выборочнойсредней ( в условиях данной задачи это все действительные числа ) на дваполубесконечных промежутка. При попадании x в левый промежутокследовало бы принимать гипотезу H0, а при попадании x в правыйпромежуток предпочтение следовало бы оказать гипотезе H1. Однако насамом деле поступают несколько иначе.В качестве статистического критерия выбирается случайнаявеличинаz=x - a In,74Лекция 14.распределенная по нормальному закону , причем Mz = 0 и Dz = 1 ( этоследует из свойств математического ожидания и дисперсии ) в случаесправедливости гипотезы H0.
Если справедлива гипотеза H1, тоMz = a* = ( a1 – a ) n /s, Dz = 1.На рисунке 1. изображены графикиp0(z) и p1(z) – функций плотности распределения случайной величины z при справедливостигипотезH0иH1,соответственно.Если величина x , полученная извыборочных данных, относительно велика, то и величина z велика, чтоявляется свидетельством в пользу гипотезы H1. Относительно малыезначения x приводят к малым значениям z, что свидетельствует в пользугипотезы H0. Отсюда следует, что должна быть выбрана правосторонняякритическая область. По принятому уровню значимости = (например = =0,05), используя то, что случайная величина z распределена понормальному закону, определим значение Kкр из формулыa = P(Kкр < z <¥) = F(¥) – F(Kкр) = 0,5 – F(Kкр).1 - 2=, и осталось воспользоваться таблицей функции2Лапласа для нахождения числа Kкр.Если величина z, полученная при выборочном значении x , попадаетв область принятия гипотезы (z < Kкр), то гипотеза H0 принимается(делается вывод, что выборочные данные не противоречат гипотезе H0).Если величина z попадает в критическую область, то гипотеза H0отвергается.В данной задаче может быть подсчитана мощность критерия:Отсюда F( K кр ) =1 - > = F(¥) - F( K ђ р -a1 - a In)Мощность критерия тем больше, чем больше разность a1– a.75Лекция 14.II.
Если в предыдущей задаче поставить другое условие:H0: Mx = a;H1: Mx = a1 , a1 < a,то сохранив смысл всех рассуждений, здесьпридется рассматривать левостороннююкритическую область, как изображено нарисунке 2. Здесь, как и в предыдущемслучае, a* = ( a1 – a ) n /s, а величина Kкропределяется из формулыa = P(–¥ < z < Kкр) = F( Kкр) – F(–¥) = F( Kкр) +1.2Используя формулу –F( Kкр) = F( –Kкр), получаем:F( –Kкр) =1 - 2=.2Отметим, что по смыслу задачи здесь Kкр – отрицательное число.Значения z, вычисленные по выборочным данным, превышающиеKкр, согласуются с гипотезой H0.
Если величина z попадает в критическуюобласть (z < Kкр), то гипотезу H0 следует отвергнуть, считаяпредпочтительной гипотезу H1.III. Рассмотрим теперь такую задачу:H0: Mx = a;H1: Mx ¹ a.В данном случае большие отклонениявеличины z от нуля в положительную илиотрицательную сторону должны приводить кзаключению о ложности гипотезы H0, то естьздесь следует рассматривать двустороннююкритическую область, как изображено на рисунке 3.Критическое значение Kкр определяется с помощью соотношенияP(–Kкр < z < Kкр) = 1 – = = F( Kкр) – F( – Kкр) = 2F( Kкр) .76Лекция 14.Из этого соотношения следует:F( Kкр) =1-=.2Проверка гипотезы о равенстве дисперсий.Гипотезы о дисперсии играют очень важную роль в экономико–математическом моделировании, так как величина рассеянияэкспериментальных выборочных данных относительно рассчитанныхтеоретическихзначенийсоответствующихпараметров,характеризующаяся дисперсией, дает возможность судить о пригодности(адекватности) теории или модели, на основании которой строится теория.Пусть нормально распределенная случайная величина x определенана некотором множестве, образующем генеральную совокупность, анормально распределенная случайная величина h определена на другоммножестве, которое тоже составляет генеральную совокупность.
Из обеихсовокупностей делаются выборки: из первой – объема n1, а из второй –объема n2 (отметим, что объем выборки не всегда можно определитьзаранее, как например в случае, если он равен количеству рыб, попавших всеть). По каждой выборке рассчитывается исправленная выборочнаядисперсия: s12 для выборки из первой совокупности и s22 для выборки извторой совокупности.Поставим задачу: с помощью выборочных данных проверитьстатистическую гипотезу H0: Dx = Dh. В качестве конкурирующейгипотезы будем рассматривать идею, заключающуюся в том, чтодисперсия той совокупности, для которой исправленная выборочнаядисперсия оказалась наибольшей, больше дисперсии другой совокупности.Критерий берется в следующем виде:F=S **.S*Здесь S**– наибольшая из двух оценок s12 и s22, а S*– наименьшая из техже двух оценок.77Лекция 14.Критерий F распределен по закону Фишера с k1 и k2 степенямисвободы.
Здесьk1 = n1–1, k2 = n2–1, если S**= s12;k1 = n2–1, k2 = n1–1, если S**= s22.В этой задаче естественно рассматривать правостороннююкритическую область, так как достаточно большие выборочные значениякритерия F свидетельствуют в пользу конкурирующей гипотезы.При заданном уровне значимости q (обычно q =0,05 или q =0,01)критическое значение Fкр определяется из таблицы распределенияФишера. В случае F > Fкр гипотеза H0 отвергается, а в случае F < Fкр –принимается.Пусть два множества некоторых объектов, обладающихколичественным признаком, подвергнуты выборочному контролю.Значения количественного признака есть распределенные по нормальномузакону случайные величины, которые мы обозначим x1 и x2,соответственно, для первого и для второго множеств. Из первогомножества сделана выборка объема n1=21 и подсчитана исправленнаявыборочная дисперсия, оказавшаяся равной 0,75.
Из второго множествасделана выборка объема n2=11. Эта выборка дала значение исправленнойвыборочной дисперсии, равное 0,25. Выдвигаем гипотезу H0: Dx1=Dx2.Конкурирующая гипотеза H1 заключается в том, что Dx1>Dx2. В данномслучае выборочное значение Fв критерия Фишера равно 3. При выбранномуровне значимости q = 0,05 по числам степеней свободы k1=20, k2=10находим по таблице распределения Фишера Fкр=2,77.
Так как Fв > Fкр,гипотеза о равенстве дисперсий должна быть отвергнута.Проверка статистической значимости выборочногокоэффициента корреляции.Проверкой статистической значимости выборочной оценки dпараметра D генеральной совокупности называется проверкастатистической гипотезы H0: D = 0, при конкурирующей гипотезеH1: D ¹ 0.