Распределения хи-квадрат и F
1.13. Распределения хи-квадрат и F
Два важных распределения, полученных также на основе допущения случайной выборки из распределённой по нормальному закону популяции, являются распределение хи- квадрат, которое является также распределением выборочной дисперсии s2, и распределение F, которое получается на основе отношения двух выборочных дисперсий.
Распределение хи-квадрат
Положим, что z1, z2, …, zn является набором n случайных переменных, распределённых независимо по стандартному нормальному закону, то есть, каждая из них имеет нулевое среднее и дисперсию равную единице. Тогда сумма их квадратов =z12+z22+…+zn2 имеет распределение особой важности, называемое распределением хи-квадрат c2. Число возводимых в квадрат независимых и нормально распределённых случайных переменных определяет важный параметр распределения – число n степеней свободы. Если использовать символ ~ для выражения имеет распределение, то можно записать
~c2(n), (1.13.1)
что означает, имеет распределение c2 с n степенями свободы. Таким образом, сумма квадратов n независимых случайных переменных, распределённых по стандартному нормальному закону, имеет распределением c2 с n степенями свободы.
Случайная переменная (х) с распределением c2(n) имеет среднее n и дисперсию 2n. На Рис.1.13.1 показан ассиметричный график её функции плотности вероятности, но с увеличением n асимметрия становится меньше и для n >50 график функции плотности вероятности распределения c2 приблизительно такой же, как график функции плотности вероятности нормального распределения.
Рис.1.13.1. Изображение интегральной вероятности случайной переменной (х) с распределением c2(n) на графике её функции плотности вероятности.
Рекомендуемые материалы
Представленная на Рис.1.13.1 интегральная вероятность Prх(х<х0) случайной переменной с распределением c2 находится с использованием встроенной функции pchisq(x,v) компьютерной программы Mathcad или по соответствующей таблице [Box с соавт. (2005) стр. 615]. Кривая на Рис.1.10.2(а) изображает функцию плотности вероятности случайной переменной с распределением c2(3).
Распределение выборочных дисперсий распределённых нормально данных
Изложенные ниже результаты являются верными при допущении независимого и одинакового распределения данных по нормальному закону. Более точно считается, что случайные переменные у1, у2, …, уn распределены независимо и одинаково по нормальному закону и имеют среднее y и дисперсию s2. Так как случайные переменные zu=(уu–y)/s, при u=1, 2, …, v, каждая распределена по стандартному нормальному закону с нулевым средним и единичной дисперсией, то сумма квадратов имеет распределение c2 с v степенями свободы, то есть,
~c2(v). (1.13.2)
Для оценки «натуральной» дисперсии характерно, что среднее популяции известно, и её оценка находится по формуле
=.
Отсюда следует
~c2(n),
что равносильно
~c2(n).
Однако обычно среднее y популяции неизвестно и вместо него используется усреднённое . Нормированная сумма квадратов разностей (yu–) имеет распределение c2 с n–1 степенями свободы. Поэтому имеем
~c2(n–1) (1.13.3)
и, так как оценка дисперсии s2=, то =(n–1)s2 и
(n–1)s2/s2~c2(n–1),
что эквивалентно
s2~ [s2/(n–1)] c2(n–1). (1.13.4)
В этом случае распределением оценки s2 дисперсии является нормированное распределение c2(n–1) с коэффициентом нормирования s2/(n–1).
Распределение отношения двух независимых выборочных дисперсий
Положим, что выборка размером n1 наблюдений случайно извлекается из популяции, распределённой по нормальному закону и имеющей дисперсию s12. Вторая выборка числом n2 наблюдений случайно извлекается из второй популяции, распределённой по нормальному закону и имеющей дисперсию s22. Оценки s12 и s22 дисперсий этих двух популяций имеют степени свободы соответственно n1=n1–1 и n2=n2–1. Тогда, в силу (1.13.4), из выражения (n–1)s2/s2~c2(n–1) отношение s12/s12 имеет распределение c2(n1)/n1 и отношение s22/s22 имеет распределение c2(n2)/n2, а отношение [c2(n1)/n1]/[c2(n2)/n2] имеет распределение F со степенями свободы n1 и n2. Следовательно, получаем
~F(n1, n2). (1.13.5)
Остатки
Когда среднее y и дисперсия s2 известны, то они полностью определяют нормальное распределение. Нормированные остатки (у1–)/s, (у2–)/s, …, (уn–)/s или равносильно сами остатки разностей у1–, у2–, …, уn–не содержат информации о нормальном распределения. Но, если гипотеза случайной выборки из распределённой по нормальному закону популяции становится ложной, то эти остатки могут дать подсказку о причине этого.
Толерантность статистических методов
Допущения независимого и одинакового распределения по нормальному закону рассматриваемых случайных переменных или, равносильно, допущение их случайной выборки из распределённой по нормальному закону популяции в действительности никогда точно не соблюдаются. Однако, для многих статистических методов результаты, полученные при допущениях независимого и одинакового распределения по нормальному закону, часто могут быть приемлемы, даже если эти допущения в некоторой мере не соблюдаются. Методы нечувствительные к строгому соблюдению отдельных допущений называются толерантными к отклонениям от этих допущений. Так, методы сравнения средних значений обычно толерантны к умеренному отклонению от распределения по нормальному закону и неравенству дисперсий. Однако большинство статистических методов к автокорреляции ошибок не толерантны.
Упражнение 1.13.1. В таблице приведены 10 результатов измерений удельного веса sg одного и того же образца сплава в разное время.
Дата | 8 октября | 9 октября | 10 октября | 11 октября | 12 октября | |||||
Время | Утро | Вечер | Утро | Вечер | Утро | Вечер | Утро | Вечер | Утро | Вечер |
sg | 0,36721 | 0,36473 | 0,36680 | 0,36487 | 0,36802 | 0,36396 | 0,36758 | "19 Построение общего решения линейного неоднородного уравнения методом степенных рядов" - тут тоже много полезного для Вас. 0,36425 | 0,36719 | 0,36333 |
(а) Вычислите усреднённое и стандартное отклонение для этой выборки из 10 измерений.
(б) Постройте график остатков в зависимости от времени.
(с) Проведите анализ, допуская, что 10 измерений являются случайной выборкой из популяции с нормальным распределением. Есть ли сомнения в правильности этого допущения?