Шушерина О.А. - Математическая статистика для психологов (1092915), страница 5
Текст из файла (страница 5)
Доверительный интервал – интервал значений, в пределах которого, как можно надеяться, находится параметр генеральной совокупности.
Наша надежда выражается доверительной вероятностью – вероятность, с которой доверительный интервал «захватит» истинное значение параметра генеральной совокупности. Чем выше доверительная вероятность, тем шире доверительный интервал. Значение доверительной вероятности выбирает сам исследователь. Обычно это 0,9; 0,95; 0,99.
Если статистическая оценка параметра закона распределения случайной величины характеризуется двумя числами – концами интервала, то такая оценка называется интервальной.
Интервал , в который попадает оцениваемый параметр
с заданной надежностью
(вероятностью), называется доверительным интервалом, а вероятность
- доверительной вероятностью или уровнем надежности. Число
называется уровнем значимости.
Вычисление доверительных интервалов основывается на предположении нормальности наблюдаемых величин. Если это предположение не выполнено, то оценка может оказаться плохой, особенно для малых выборок. При увеличении объема выборки, скажем, до 100 или более, качество оценки улучшается и без предположения нормальности выборки.
Например, если среднее выборки равно 23, а нижняя и верхняя границы доверительного интервала с уровнем p=.95 равны 19 и 27 соответственно, то можно заключить, что с вероятностью 95% интервал с границами 19 и 27 накрывает среднее популяции. Если мы установим больший уровень доверия, то интервал станет шире, поэтому возрастает вероятность, с которой он "накрывает" неизвестное среднее популяции, и наоборот.
Доверительный интервал применяется в случае сравнительно небольшого объема выборки, когда предполагается, что надежность точечной оценки может быть невысокой.
Доверительный интервал симметричен относительно оценки истинного значения параметра
и имеет вид
, где
- предельная ошибка выборки (наибольшее отклонение выборочного значения параметра от его истинного значения). Это означает, что неравенства
выполняются с вероятностью
.
Для доверительного интервала половина его длины
называется точностью интервального оценивания.
Если выполняется соотношение , то число
называется точностью, а число
- надежностью оценки
генеральной числовой характеристики
.
2. Доверительный интервал для оценки генеральной средней
Рассмотрим построение доверительного интервала для оценки математического ожидания.
Пусть - выборка объема
из генеральной совокупности объема
;
- выборочное среднее;
- выборочное среднее квадратическое отклонение.
Доверительный интервал уровня надежности для математического ожидания (генеральной средней)
имеет вид
где - предельная ошибка выборки, которая зависит от объема выборки
, доверительной вероятности
и равна половине доверительного интервала.
Интервальной оценкой с надежностью генеральной средней
в случае нормального распределения генеральной совокупности при неизвестном среднем квадратическом отклонении
служит доверительный интервал:
где - выборочное среднее;
- исправленное выборочное среднее квадратическое отклонение;
- параметр, который находится по таблице распределения Стьюдента для (
) степеней свободы и доверительной вероятности
.
Интервальной оценкой с надежностью генеральной средней
в случае нормального распределения генеральной совокупности при известном среднем квадратическом отклонении
служит доверительный интервал:
где - выборочное среднее;
- выборочное среднее квадратическое отклонение;
- значение аргумента функции Лапласа
, при котором
;
- объем выборки.
Выводы. Доверительный интервал для среднего представляет интервал значений вокруг оценки, где с данным уровнем доверия, находится "истинное" (неизвестное) среднее значение признака.
Хорошо известно, например, что чем «неопределенней» прогноз погоды (т.е. шире доверительный интервал), тем вероятнее он будет верным.
Пример. Найти доверительный интервал с надежностью 0,95 для оценки математического ожидания нормально распределенной случайной величины, если известны ее среднее квадратическое отклонение , выборочная средняя
и объем выборки
.
Воспользуемся формулой . Значение
найдем по таблице значений функции Лапласа
, с учетом того, что
, т.е.
. Находим по таблице для значения функции
значение аргумента
. Получим доверительный интервал:
Тестовые задания
1. Длина доверительного интервала уменьшается с увеличением:
1) выборочных значений 2) объема выборки
3) доверительной вероятности 4) выборочного среднего
2. Длина доверительного интервала с увеличением объема выборки:
1) уменьшается; 2) увеличивается;
3) не изменяется; 4) колеблется.
3. Длина доверительного интервала с увеличением доверительной вероятности:
1) изменяется, 2) уменьшается,
3) увеличивается, 4) постоянна.
4. Отметьте два правильных ответа. Символы и
в формуле доверительного интервала означают:
1) оценка параметра; 2) доверительный интервал;
3) объем выборки; 4) доверительная вероятность.
Ответы. 1. 2). 2. 1 3. 2). 4. 4) и 3).
контрольные Вопросы
-
Что понимается под термином «интервальная оценка параметра распределения»?
-
Дайте определение доверительного интервала.
-
Что такое точность оценки и надежность оценки?
-
Что называется доверительной вероятностью? Какие значения она принимает?
-
Как изменится длина доверительного интервала, если увеличить: 1) объем выборки, 2) доверительную вероятность? Ответ обоснуйте.
-
Запишите формулу для нахождения доверительного интервала математического ожидания нормально распределенной случайной величины, если генеральная дисперсия: 1) известна; 2) неизвестна.
Часть 3. проверка статистических гипотез
Тема 1. Основные понятия теории принятия статистического решения
1. Нулевая и альтернативная статистические гипотезы
Статистической гипотезой называется такое предположение о виде или свойствах генерального или выборочного распределений, которое можно проверить статистическими методами на основе имеющейся выборки.
Сущность проверки статистической гипотезы заключается в том, чтобы установить:
-
согласуются ли экспериментальные данные и выдвинутая гипотеза;
-
допустимо ли отнести расхождение между гипотезой и результатом статистического анализа экспериментальных данных за счет случайных причин.
По содержанию статистические гипотезы подразделяются на виды:
-
о законе распределения генеральной совокупности (например, гипотеза о том, что количество ошибок внимания у младших школьников имеет равномерное распределение);
-
о числовых значениях параметров случайной величины (например, гипотеза о том, что среднее количество правильных ответов студентов контрольной группы на десять тестовых вопросов по теме равно восьми);
-
об однородности выборок (т.е. принадлежности их одной и той же генеральной совокупности);
-
о виде модели, описывающей статистическую зависимость между несколькими признаками (например, предположение о том, что связь между успешностью обучения математики
и показателем невербального интеллекта учащихся
линейная, прямо пропорциональная).
Проверяемую гипотезу обычно называют нулевой гипотезой и обозначают . В психологии принято считать, что
– это гипотеза о сходстве, т.е. об отсутствии различий. Другими словами, это предположение о том, что все события, интересующие исследователя, произошли случайно, естественным образом. Обозначается нулевая гипотеза как
.
Пример. Пусть исследователь сопоставляет значения некоторого признака развитости интеллекта (например, уровень вербального мышления) у двух групп подростков - из полных семей (первая группа) и неполных семей (вторая группа). Обозначим через и
случайные величины, показывающие значения признака (уровня вербального мышления). Тогда нулевая гипотеза означает предположение, что различий в показателе интеллекта у двух групп подростков.
Гипотезе может быть противопоставлена альтернативная, или конкурирующая, гипотеза
, являющаяся логическим отрицанием
. В паре они составляют две возможности выбора, осуществляемого в задачах проверки статистических гипотез. В альтернативной гипотезе
предполагается, что события, интересующие исследователя, случайным образом произойти не могли, и имело место воздействие некоторого фактора.
Если нулевая гипотеза говорит о «сходстве», то альтернативная гипотеза
– гипотеза «о различии », точнее, о значимости различий. Например, альтернативная гипотеза о том, что контрольные и экспериментальные группы различаются между собой по каким-либо значимым характеристикам.