Распределения хи-квадрат и F

2020-06-032021-03-09zzyxelСтудИзба

1.13. Распределения хи-квадрат и F

Два важных распределения, полученных также на основе допущения случайной выборки из распределённой по нормальному закону популяции, являются распределение хи- квадрат, которое является также распределением выборочной дисперсии s², и распределение F, которое получается на основе отношения двух выборочных дисперсий.

Распределение хи-квадрат

Положим, что z₁, z₂, …, z_n является набором n случайных переменных, распределённых независимо по стандартному нормальному закону, то есть, каждая из них имеет нулевое среднее и дисперсию равную единице. Тогда сумма их квадратов =z₁²+z₂²+…+z_n² имеет распределение особой важности, называемое распределением хи-квадрат c². Число возводимых в квадрат независимых и нормально распределённых случайных переменных определяет важный параметр распределения – число n степеней свободы. Если использовать символ ~ для выражения имеет распределение, то можно записать

~c²(n), (1.13.1)

что означает, имеет распределение c² с n степенями свободы. Таким образом, сумма квадратов n независимых случайных переменных, распределённых по стандартному нормальному закону, имеет распределением c² с n степенями свободы.

Случайная переменная (х) с распределением c²(n) имеет среднее n и дисперсию 2n. На Рис.1.13.1 показан ассиметричный график её функции плотности вероятности, но с увеличением n асимметрия становится меньше и для n >50 график функции плотности вероятности распределения c² приблизительно такой же, как график функции плотности вероятности нормального распределения.

Рис.1.13.1. Изображение интегральной вероятности случайной переменной (х) с распределением c²(n) на графике её функции плотности вероятности.

Рекомендуемые материалы

-43%

Кратные интегралы

Кратные интегралы и ряды

600 340 руб.

Теория функций комплексного переменного

Теория функций комплексного переменного (ТФКП)

340 руб.

Теория поля

Кратные интегралы и ряды

340 руб.

-43%

Кратные и криволинейные интегралы

Кратные интегралы и ряды

600 340 руб.

-66%

Практика

Интегралы и дифференциальные уравнения (ИиДУ)

699 240 руб.

FREE

Бараненков Г. С., Демидович Б. П., Ефименко В. А. - Задачи и упражнения по математическому анализу для втузов - 2004

Математический анализ

Представленная на Рис.1.13.1 интегральная вероятность Pr_х(х<х₀) случайной переменной с распределением c² находится с использованием встроенной функции pchisq(x,v) компьютерной программы Mathcad или по соответствующей таблице [Box с соавт. (2005) стр. 615]. Кривая на Рис.1.10.2(а) изображает функцию плотности вероятности случайной переменной с распределением c²(3).

Распределение выборочных дисперсий распределённых нормально данных

Изложенные ниже результаты являются верными при допущении независимого и одинакового распределения данных по нормальному закону. Более точно считается, что случайные переменные у₁, у₂, …, у_n распределены независимо и одинаково по нормальному закону и имеют среднее y и дисперсию s². Так как случайные переменные z_u=(у_u–y)/s, при u=1, 2, …, v, каждая распределена по стандартному нормальному закону с нулевым средним и единичной дисперсией, то сумма квадратов имеет распределение c² с v степенями свободы, то есть,

~c²(v). (1.13.2)

Для оценки «натуральной» дисперсии характерно, что среднее популяции известно, и её оценка находится по формуле

Отсюда следует

~c²(n),

что равносильно

~c²(n).

Однако обычно среднее y популяции неизвестно и вместо него используется усреднённое . Нормированная сумма квадратов разностей (y_u–) имеет распределение c² с n–1 степенями свободы. Поэтому имеем

~c²(n–1) (1.13.3)

и, так как оценка дисперсии s²=, то =(n–1)s² и

(n–1)s²/s²~c²(n–1),

что эквивалентно

s²~ [s²/(n–1)] c²(n–1). (1.13.4)

В этом случае распределением оценки s² дисперсии является нормированное распределение c²(n–1) с коэффициентом нормирования s²/(n–1).

Распределение отношения двух независимых выборочных дисперсий

Положим, что выборка размером n₁ наблюдений случайно извлекается из популяции, распределённой по нормальному закону и имеющей дисперсию s₁². Вторая выборка числом n₂ наблюдений случайно извлекается из второй популяции, распределённой по нормальному закону и имеющей дисперсию s₂². Оценки s₁² и s₂² дисперсий этих двух популяций имеют степени свободы соответственно n₁=n₁–1 и n₂=n₂–1. Тогда, в силу (1.13.4), из выражения (n–1)s²/s²~c²(n–1) отношение s₁²/s₁² имеет распределение c²(n₁)/n₁ и отношение s₂²/s₂² имеет распределение c²(n₂)/n₂, а отношение [c²(n₁)/n₁]/[c²(n₂)/n₂] имеет распределение F со степенями свободы n₁ и n₂. Следовательно, получаем

~F(n₁, n₂). (1.13.5)

Остатки

Когда среднее y и дисперсия s² известны, то они полностью определяют нормальное распределение. Нормированные остатки (у₁–)/s, (у₂–)/s, …, (у_n–)/s или равносильно сами остатки разностей у₁–, у₂–, …, у_n–не содержат информации о нормальном распределения. Но, если гипотеза случайной выборки из распределённой по нормальному закону популяции становится ложной, то эти остатки могут дать подсказку о причине этого.

Толерантность статистических методов

Допущения независимого и одинакового распределения по нормальному закону рассматриваемых случайных переменных или, равносильно, допущение их случайной выборки из распределённой по нормальному закону популяции в действительности никогда точно не соблюдаются. Однако, для многих статистических методов результаты, полученные при допущениях независимого и одинакового распределения по нормальному закону, часто могут быть приемлемы, даже если эти допущения в некоторой мере не соблюдаются. Методы нечувствительные к строгому соблюдению отдельных допущений называются толерантными к отклонениям от этих допущений. Так, методы сравнения средних значений обычно толерантны к умеренному отклонению от распределения по нормальному закону и неравенству дисперсий. Однако большинство статистических методов к автокорреляции ошибок не толерантны.

Упражнение 1.13.1. В таблице приведены 10 результатов измерений удельного веса s_g одного и того же образца сплава в разное время.

Дата

8 октября

9 октября

10 октября

11 октября

12 октября

Время

Утро

Вечер

Утро

Вечер

Утро

Вечер

Утро

Вечер

Утро

Вечер

s_g

0,36721

0,36473

0,36680

0,36487

0,36802

0,36396

0,36758

"19 Построение общего решения линейного неоднородного уравнения методом степенных рядов" - тут тоже много полезного для Вас.

0,36425

0,36719

0,36333

(а) Вычислите усреднённое и стандартное отклонение для этой выборки из 10 измерений.

(б) Постройте график остатков в зависимости от времени.

(с) Проведите анализ, допуская, что 10 измерений являются случайной выборкой из популяции с нормальным распределением. Есть ли сомнения в правильности этого допущения?

Поделитесь ссылкой:

Распределения хи-квадрат и F

Рекомендуемые материалы

Рекомендуемые лекции