ТВиМС (Теория вероятностей и математическая статистика. Теория и примеры решения задач), страница 10
Описание файла
Файл "ТВиМС" внутри архива находится в следующих папках: Теория вероятностей и математическая статистика. Теория и примеры решения задач, ТВиМС, Экзамен, Неплохая теория и примеры решения задач. Документ из архива "Теория вероятностей и математическая статистика. Теория и примеры решения задач", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из 4 семестр, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. Архив можно найти в разделе "остальное", в предмете "теория вероятности и математическая статистика" в общих файлах.
Онлайн просмотр документа "ТВиМС"
Текст 10 страницы из документа "ТВиМС"
– доверительная вероятность (мы предполагаем, что оценка является непрерывной случайной величиной).
Интервальное оценивание состоит, например, в вычислении доверительной вероятности для заданной предельной ошибки выборки.
Решение задачи интервального оценивания связано с определением характера закона распределения используемой оценки .
Рассмотрим теперь некоторые свойства оценок.
Определение. Оценка параметра называется несмещенной, если математическое ожидание этой оценки равно оцениваемому параметру, т.е.
Определение. Оценка параметра называется состоятельной, если для произвольного выполняется следующее предельное соотношение
Другими словами, оценка параметра состоятельна, если эта оценка сходится по вероятности к данному параметру. (Напомним, что примеры сходимости такого рода дают теоремы Бернулли и Чебышёва, см. § 6.2.)
Определение. Несмещенная оценка некоторого параметра называется эффективной, если она обладает наименьшей дисперсией среди всех несмещенных оценок, найденных по выборке заданного объема.
Пример. Частость наступления некоторого события является несмещенной, состоятельной и эффективной оценкой вероятности этого события. Заметим, что свойства несмещенности и состоятельности частости были фактически рассмотрены нами ранее в несколько ином контексте. Действительно, несмещенность частости – равенство – является одним из свойств биномиально распределенной случайной величины (см. § 3.3). Состоятельность частости утверждается теоремой Бернулли (см. § 6.2).
Пример. Среднее арифметическое некоторого числа независимых и одинаково распределенных случайных величин является несмещенной и состоятельной оценкой общего математического ожидания этих случайных величин. Действительно, несмещенность – есть свойство 5 математического ожидания (см. § 3.3). Состоятельность утверждается теоремой Чебышёва (см. § 6.2).
7.2. Первичная обработка результатов эксперимента. Характеристики вариационных рядов
Пусть произведено независимых измерений некоторой случайной величины : – результат первого измерения, – результат второго измерения, … , – результат -го измерения. Тогда через обозначим среднее арифметическое результатов измерений рассматриваемой случайной величины , то есть
Заметим, что, поскольку – случайные величины, то также является случайной величиной.
Пример. Детали некоторого вида расфасованы по ящикам. Результаты обследования шести из этих ящиков (на предмет наличия в них бракованных деталей) представлены в таблице:
1 | 2 | 3 | 4 | 5 | 6 | |
0 | 1 | 0 | 1 | 2 | 1 |
где – номер ящика, – число бракованных деталей в -ом ящике.
Тогда
Приведенное вычисление подсказывает возможность более компактного представления результатов обследования, а именно – использование таблицы следующего вида:
0 | 1 | 2 | ||
2 | 3 | 1 | 6 |
Такая таблица называется вариационным рядом. Аналогично, в общем случае имеем
Определение. Вариационным рядом признака называется таблица вида
… | |||||
… |
Отметим, что величины , значения которых заполняют нижнюю строку вариационного ряда, называются эмпирическими частотами.
Очевидно, что признак , для которого строится вариационный ряд, есть случайная величина.
В том случае, когда результаты обследования представлены вариационным рядом, формула для вычисления имеет вид
Сама величина в этом случае называется средней вариационного ряда или выборочной средней. Появление в данном случае дополнительного эпитета выборочный связано с тем, что обследованные объекты выбираются из некоторой объемлющей (так называемой генеральной) совокупности объектов.
Напомним, что есть случайная величина. В тех случаях, когда данные эксперимента представлены вариационным рядом, а вычисляется по формуле (1), случайными являются эмпирические частоты .
Вариационный ряд является оценкой закона распределения случайной величины (признака) . Поясним, почему это так. По вариационному ряду построим равнозначную ему таблицу, заменяя строку эмпирических частот частостями . В результате имеем:
… | |||||
… | 1 |
Принимая во внимание последнее замечание, получаем
Таким образом, средняя вариационного ряда (выборочная средняя) является оценкой математического ожидания той случайной величины (признака) , для которой построен данный вариационный ряд. Можно доказать, что эта оценка является несмещенной и состоятельной.
Учитывая полученные результаты, аналогично построим оценку для дисперсии случайной величины :
Выражение, стоящее в правой части последнего равенства называется выборочной дисперсией и обозначается , то есть
Выборочная дисперсия – оценка для дисперсии случайной величины . Можно доказать, что выборочная дисперсия является смещенной оценкой для , то есть Несмещенная оценка для определяется равенством
Заметим, что для вычисления выборочной дисперсии удобно использовать формулу – аналог свойства 3 дисперсии (см. § 3.3):
Определение. Вариационный ряд называется дискретным, если число возможных значений признака – конечно, и непрерывным (интервальным), если возможные значения признака полностью заполняют некоторый интервал.
Вариационные ряды, которые встречались нам до сих пор в данном параграфе, являются дискретными. Рассмотрим пример интервального вариационного ряда.
Пример. По результатам обследования некоторого малого предприятия получены следующие данные о ежемесячной заработной плате его сотрудников:
5 – 15 | 15 – 25 | 25 – 35 | ||
3 | 5 | 2 | 10 |
Для нахождения параметров непрерывного вариационного ряда – выборочной средней, выборочной дисперсии – этот вариационный ряд сначала сводится к дискретному (в результате выбора середины для каждого из рассматриваемых интервалов), после чего и вычисляются по приведенным выше формулам.
Например, данный интервальный вариационный ряд сводится к следующему дискретному:
10 | 20 | 30 | ||
3 | 5 | 2 | 10 |
Тогда
или
7.3. Сплошное и выборочное наблюдения
Пусть дана некоторая (генеральная) совокупность объектов и требуется оценить значение некоторого параметра этой совокупности (например, среднее значение прибыли для малых предприятий некоторого региона или долю выборщиков, проголосовавших за данного кандидата на выборах).
Предположим, что от полного обследования всей генеральной совокупности решили отказаться. Среди возможных причин здесь можно указать разрушение объекта в результате обследования (в том случае, когда, например, требуется узнать средний срок службы лампочек в партии, изготовленной на некотором заводе, полное обследование, конечно, даст исчерпывающую информацию, но сама совокупность перестанет существовать). Другая возможная причина – высокая стоимость полного обследования или его чрезмерная продолжительность (например, выводы экспресс-анализа результатов голосования на некоторых выборах требуется получить в кротчайшие сроки, что невозможно при тотальном обследовании). Наконец, генеральная совокупность может обладать таким свойством как «необозримость» (например, рыба некоторого вида в данном море).
Тогда из генеральной совокупности выделяют часть (выборку). Обследуя ее, находят значение исследуемого параметра в выборке. На основании этих результатов делают вывод о значении этого параметра во всей генеральной совокупности (см. ниже §§ 7.4, 7.5).