Распределение и критерий хи-квадрат
3. Распределение и критерий хи-квадрат
Распределение Хи-квадрат (-распределение с
степенями свободы), это распределение вероятностей, заданное плотностью вероятностей
(*)
где - гамма-функция. При
-распределение имеет моду в точке
. Характеристическая функция
-распределения имеет вид
,
математическое ожидание и дисперсия -распределения равны, соответственно,
и
.
-распределение с
степенями свободы может быть выведено как распределение суммы квадратов
независимых случайных величин
, имеющих стандартное нормальное распределение с параметрами 0 и 1. Сумма независимых случайных величин
с
степенями свободы, соответственно, подчиняется
-распределению с
степенями свободы.
Благодаря тесной связи с нормальным распределением -распределение играет важную роль в теории вероятностей и математической статистике.
-распределение и многие другие распределения, которые определяются посредством
-распределения (например, Стьюдента распределение), описывают выборочные распределения различных функций от нормально распределённых результатов наблюдений и используются для построения доверительных интервалов и статистических критериев. Так, например, для независимых случайных величин
с одинаковым нормальным распределением с математическим ожиданием
и дисперсией
отношение
, где
,
,
подчиняется -распределению с
степенями свободы при любых значениях
и
. Этот результат положен в основу построения доверительных интервалов и критерия для проверки гипотезы о неизвестном значении
в случае, когда
также неизвестно. Особую известность в связи с
-распределением получил
-критерий, основанный на так называемой
-статистике Пирсона.
Рекомендуемые материалы
Имеются подробные таблицы -распределения, удобные для статистических расчётов. При больших объёмах выборок используют аппроксимацию посредством нормального распределения. При
согласно центральной предельной теореме распределение нормированной величины (
стремится к стандартному нормальному распределению:
,
;
более точная аппроксимация:
,
(здесь - функция распределения стандартного нормального закона).
Впервые -распределение было рассмотрено немецким математиком Р. Хельмертом (1876) и английским математиком К. Пирсоном (1900).
Хи-квадрат критерий (-критерий) это критерий проверки различных статистических гипотез, основанный на
-квадрат распределении. Пусть, например, результаты наблюдений
являются взаимно независимыми случайными величинами, подчиняющимися одному и тому же нормальному распределению с неизвестными параметрами
и
. Для проверки гипотезы
, пользуются
-критерием в следующей форме: если для заранее выбранных значений
,
где
,
то полагают, что результаты наблюдений не противоречат гипотезе . Если же одно из этих неравенств нарушается, то считают расхождение значимым с уровнем значимости
и гипотезу
отклоняют. Пределы
и х2 выбираются по заданному
на основании того, что при гипотезе
статистика
имеет распределение с
степенями свободы, т. е.
и х2 находятся из уравнений
,
.
Наиболее известно применение критерия как критерия согласия Пирсона в следующей задаче. Пусть в серии п повторных независимых испытаний с исходами
получен результат (
), где
— случайное число осуществлении исхода
так, что
. Проверяется гипотеза о том, что вектор (
) имеет полиномиальное распределение с соответственными вероятностями
(
,
;
).
критерий для этой гипотезы основан на
статистике Пирсона
,
Обратите внимание на лекцию "9 Тепловой расчёт регенератора".
которая в пределе при имеет
распределение с
степенями свободы. Согласно
критерию с уровнем значимости, приближённо равным
, гипотезу согласия отвергают, если
, где
находится из соотношения
( - плотность
распределения с
степенями свободы). Та же статистика
используется для проверки гипотезы о неизвестной функции распределения
независимых одинаково распределённых результатов наблюдений
. Критерий для проверки гипотезы о том, что
, где
— заданная функция распределения, строится следующим образом. Область значений каждой из величин
разбивается на конечное число
непересекающихся интервалов
,
, и вычисляются
- — число
,
,
и
— вероятности
в предположешш, что проверяемая гипотеза верна. Проверка гипотезы соответствия частот
вероятностям
основана на статистике
,
которая в случае, если , имеет асимптотическое распределение
с
степенями свободы.
-критерий используется также как критерий однородности, критерий независимости в таблицах сопряжённости признаков и т. д.