Автоматихация производства ЭВА (1075779), страница 27
Текст из файла (страница 27)
Пусть далее проведены две серии наблюдений, в результате которых получены два вариационных ряда m1 и m2. На основании m1 вычислим оценку ^X1, а основании m2 - оценку ^X2. Ясно, что (^X1 ^X1), так как эти величины рассчитаны по (1.7) и поэтому являются случайными величинами. Распределение оценки ^X так же является нормальным. Определим его математическое ожидание M(^X):
{ | N | } = | N | ||||||
M{^X} = M | 1 | | Xi | 1 | | M{Xi} | |||
N | N | ||||||||
i=1 | i=1 |
Так как наблюдения распределены по нормальному закону, то, согласно рисунку 1, имеем: M{Xi} = XИСТ, откуда: M{^X} =XИСТ. Следовательно, оценка ^X является несмещенной, поскольку ее среднее значение совпадает с истинным значением.
Находим дисперсию D(^X) оценки наблюдений:
{ | N | } = | N | |||||||
D{^X} = (^X)2 = D | 1 | | Xi | 1 | | D{Xi} = | 1 | N(X)2 | ||
N | N2 | N2 | ||||||||
i=1 | i=1 |
откуда:
D{^X} = (^X)2 = | (X)2 | (1.8) |
N |
В полученном выражении величина (X) представляет среднеквадратическое отклонение (СКО) наблюдений. Формула (1.8) показывает, что при N дисперсия оценки наблюдений стремится к нулю, то есть ^X ХИСТ. Следовательно, оценка ^X является состоятельной.
На практике необходимо ответить на вопрос, – с какой вероятностью (РД) оценка ^X не выходит за пределы интервала ХИСТ Хд. Для ответа на него запишем выражение для плотности распределения оценки ^X, изображенного на рисунке 1:
Искомая вероятность отмечена штрихованной площадью на рисунке 1 и оче видно равна следующему интегралу: (^X-Хд)
ХИСТ +Хд | |||||||||
РД = | | f(^X)d(^X) = | P[ХИСТ -Хд< ^X < ХИСТ +Хд] | ||||||
ХИСТ -Хд |
Делая в полученном выражении замену переменных: t = (^X – XИСТ)/^X, получим:
+Хд/^X | |||||||
РД = | | exp{-t2/2} | dt = 2Ф | [ | Хд | ] - 1 | (1.9) |
| ^X | ||||||
-Хд/^X |
Формула (1.9) непосредственно вытекает из графика на рисунке 1 после следующих расчетов. Обозначим z=(Хд /^X). Тогда доверительная вероятность равна: РД = Ф(z) – Ф(–z). Учитывая, что Ф(–z) = 1 – Ф(z), имеем: РД = Ф(z) –1 + Ф(z), что совпадает с (1.9). Функция Лапласа Ф(z) – табулированная функция, некоторые значения которой приведены в таблице 1.
Таблица 1.
z | 0.0 | 0.6 | 1.0 | 1.6 | 2.3 | 3.0 | 3.6 | 4.2 |
Ф(z) | 0.5000 | 0.7257 | 0.8413 | 0.9452 | 0.9890 | 0.9980 | 0.9998 | 0.99998 |
Выполнение условий (ХИСТ -Хд)< ^X < (ХИСТ +Хд) эквивалентно выполнению условий: (^X -Хд)< ХИСТ < (^X +Хд), то есть, вероятность Рд является искомой. Вероятность Рд называется доверительной вероятностью или надежностью интервальной оценки, а интервал значений (^X Хд) – доверительным интервалом.
Выражение (1.9) позволяет определить доверительную вероятность по заданному доверительному интервалу, если известна дисперсия (^X)2 оценки наблюдений ^X. Дисперсия (^X)2, в свою очередь, связана с дисперсией наблюдений (X)2 выражением (1.8). Из опыта, однако, и эта величина не известна. Что же известно из опыта из того, что бы нам пригодилось? На этот вопрос ответил Бессель и ответ такой: «из опыта нам известна оценка дисперсии (^^X)2 оценки наблюдений ^X.». При вычислении этой величины Бессель рассуждал так. Очевидно, что по результатам наблюдений может быть вычислена сумма:
N | N | ||||||||
| (Xi – ^X )2 = | | (Xi – XИСТ + XИСТ – ^X )2 = … | ||||||
i=1 | i=1 |
Учитывая (1.7) и то, что (Xi – XИСТ) = Xi , имеем:
N | N | ||||||||||
… = | { | Xi ,+ XИСТ - | 1 | | (Xj – XИСТ + XИСТ ) | } | 2 | ||||
N | |||||||||||
i=1 | j=1 |
Проводя суммирование и заменяя (Xj – XИСТ) на Xj имеем:
N | N | |||||||||||
… = | { | Xi ,+ XИСТ -(N XИСТ)/ XИСТ - | 1 | | Xj | } | 2 | |||||
N | ||||||||||||
i=1 | j=1 |
Сокращаем на члены, содержащие XИСТ, и возводим результат в квадрат:
Проводя суммирование и заменяя (Xj – XИСТ) на Xj имеем:
N | N | N | N | ||||||||||
… = | | (Xi )2 - | 2 | | Xi | | Xj + | { | 1 | | (Xj)2 | } | 2 |
N | N | ||||||||||||
i=1 | i=1 | j=1 | i=1 |
Группируем члены:
N | N | N | N | |||||
| (Xi – ^X )2 = | (N – 1) | | (Xi) 2 – | 1 | | | (Xj) (Xj) = (N-1)(^X)2 |
N | N | |||||||
i=1 | i=1 | i=1 | j=1 |
Двойная сумма в полученном равенстве равна нулю, так как в ней сгруппированы члены (XjXj), и члены (XjXj) в случайном сочетании при сложении компенсируют друг друга. С учетом сказанного приходим к формуле расчета оценки дисперсии наблюдений:
N | |||
(^X)2 = | 1 | | (Xi – ^X )2 |
(N – 1) | |||
i=1 |
Учитывая далее формулу (1.8) получим окончательную формулу оценки дисперсии оценки наблюдений ^X, полученную Бесселем: t - tд +tд
N | ||||
(^^X)2 = | 1 | | (Xi – ^X )2 | (1.10) |
N(N – 1) | ||||
i=1 |
При этом, пользуясь при вычислении доверительной вероятности Рд формулой (1.10) – другой все равно нет, – не следует забывать, что величина Рд, как и (^^X)2 является случайной и завышенной, особенно при N<20, то есть формулой (1.10) можно эффективно пользоваться только при N>20. Тем не менее, существует строгий метод определения Рд без замены (^X) на (^^X). В его основе лежит использование распределения s(t) случайной величины t вида:
t = | ^X– XИСТ | (1.11) | |||||||||
(^^X) |
Это распределение находится по известным правилам с помощью двумерного закона распределения Р(^X,^^X) = Р(^X) )Р(^^X). Все необходимые расчеты были выполнены бухгалтером Госсетом, который публиковал свои работы под псевдонимом Student. В результате полученное им распределение получило название распределения Стьюдента. Данное распределение табулировано и имеет приблизительный вид, показанный на рисунке 2.
Выделим на оси t интервал tд, величина которого равна:
tд = | Xд | (1.12) | |||||||||
(^^X) |
Тогда: P{ – tд < t < tд } = s(t)dt. С учетом (1.11) и (1.12) искомую доверительную вероятность можно переписать в виде: