Распределение и критерий хи-квадрат
3. Распределение и критерий хи-квадрат
Распределение Хи-квадрат (-распределение с степенями свободы), это распределение вероятностей, заданное плотностью вероятностей
(*)
где - гамма-функция. При -распределение имеет моду в точке . Характеристическая функция -распределения имеет вид
,
математическое ожидание и дисперсия -распределения равны, соответственно, и . -распределение с степенями свободы может быть выведено как распределение суммы квадратов независимых случайных величин , имеющих стандартное нормальное распределение с параметрами 0 и 1. Сумма независимых случайных величин с степенями свободы, соответственно, подчиняется -распределению с степенями свободы.
Благодаря тесной связи с нормальным распределением -распределение играет важную роль в теории вероятностей и математической статистике. -распределение и многие другие распределения, которые определяются посредством -распределения (например, Стьюдента распределение), описывают выборочные распределения различных функций от нормально распределённых результатов наблюдений и используются для построения доверительных интервалов и статистических критериев. Так, например, для независимых случайных величин с одинаковым нормальным распределением с математическим ожиданием и дисперсией отношение , где
, ,
подчиняется -распределению с степенями свободы при любых значениях и . Этот результат положен в основу построения доверительных интервалов и критерия для проверки гипотезы о неизвестном значении в случае, когда также неизвестно. Особую известность в связи с -распределением получил -критерий, основанный на так называемой -статистике Пирсона.
Рекомендуемые материалы
Имеются подробные таблицы -распределения, удобные для статистических расчётов. При больших объёмах выборок используют аппроксимацию посредством нормального распределения. При согласно центральной предельной теореме распределение нормированной величины ( стремится к стандартному нормальному распределению:
, ;
более точная аппроксимация:
,
(здесь - функция распределения стандартного нормального закона).
Впервые -распределение было рассмотрено немецким математиком Р. Хельмертом (1876) и английским математиком К. Пирсоном (1900).
Хи-квадрат критерий (-критерий) это критерий проверки различных статистических гипотез, основанный на -квадрат распределении. Пусть, например, результаты наблюдений являются взаимно независимыми случайными величинами, подчиняющимися одному и тому же нормальному распределению с неизвестными параметрами и . Для проверки гипотезы , пользуются -критерием в следующей форме: если для заранее выбранных значений
,
где
,
то полагают, что результаты наблюдений не противоречат гипотезе . Если же одно из этих неравенств нарушается, то считают расхождение значимым с уровнем значимости и гипотезу отклоняют. Пределы и х2 выбираются по заданному на основании того, что при гипотезе статистика
имеет распределение с степенями свободы, т. е. и х2 находятся из уравнений
, .
Наиболее известно применение критерия как критерия согласия Пирсона в следующей задаче. Пусть в серии п повторных независимых испытаний с исходами получен результат (), где — случайное число осуществлении исхода так, что . Проверяется гипотеза о том, что вектор () имеет полиномиальное распределение с соответственными вероятностями (, ; ). критерий для этой гипотезы основан на статистике Пирсона
,
Обратите внимание на лекцию "9 Тепловой расчёт регенератора".
которая в пределе при имеет распределение с степенями свободы. Согласно критерию с уровнем значимости, приближённо равным , гипотезу согласия отвергают, если , где находится из соотношения
( - плотность распределения с степенями свободы). Та же статистика используется для проверки гипотезы о неизвестной функции распределения независимых одинаково распределённых результатов наблюдений . Критерий для проверки гипотезы о том, что , где — заданная функция распределения, строится следующим образом. Область значений каждой из величин разбивается на конечное число непересекающихся интервалов , , и вычисляются - — число , , и — вероятности в предположешш, что проверяемая гипотеза верна. Проверка гипотезы соответствия частот вероятностям основана на статистике
,
которая в случае, если , имеет асимптотическое распределение с степенями свободы.
-критерий используется также как критерий однородности, критерий независимости в таблицах сопряжённости признаков и т. д.