А.Н. Матвеев, Д.Ф. Киселёв - Общий физический практикум (механика) (1108542), страница 12
Текст из файла (страница 12)
рис. 5, кривые 2 и 1). Для каждой вероятности Р =а можно найти такое число 1< „называемое коэффициентом Стьюдента, что случайная величина 1, имеющая распределение Стьюдента, не будет отличаться по модулю от своего математического ожидания р больше, чем на Г, „т. е. г,» можно определить из следующего соотношения (см.
$18): э+~а.ю Рв=Р(н — 1д„а~(1~(р+~ал)= ~ зд(х)Их=а. (23.4) э сал Величина а выражается либо в долях единицы, либо в процентах. Значения коэффициентов 1... для разных а и гз приведены в табл. П приложения Б. ГЛАВА б НЕКОТОРЫЕ ЭЛЕМЕНТАРНЫЕ ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ $ 24.
ПОНЯТИЕ О ВЫБОРКЕ Предположим, что нужно измерить некоторую величину 14, например длину стержня. Можно выполнить одно измерение, два, трн и т. д. Так как в результате каждого измерения получается некоторое число, то в итоге реализуется некоторый набор чисел хь хз, хм .... Возникает вопрос: какое из полученных чисел или какую функцию этих чисел следует принять за значение величи,ны 1«? Результат произвольного измерения из-за влияния разных погрешностей измерений (см. $4) является случайной величиной $ (см.
$16), которая имеет некоторую функцию распределения. Если бы мы знали эту функцию распределения, то мы могли бы условиться принимать за значение величины 1, «центр функции плотности случайной величины $, например математическое ожидание (см. $19). Однако в реальных условиях эксперимента функция распределения, как правило, не известна.
В лучшем случае можно только догадываться о виде функции распределения. Например, могут быть основания предполагать, что $ имеет нормальное распределание, ио параметры нормального распределения и и о (см. $20.2) при этом, как правило, все равно не известны.
Если бы мы могли проводить измерения неограниченное число раз, то в результате получили :бы бесконечный набор чисел хь хь ..., который образовал бы множество (бесконечное) всех возможных значений величины $. В этом случае для 'любого интервала х —:х+ дх мы могли бы определить частоту и вероятность (см. $17) того, что случайная величина заключена в этом интервале, т.
е. определили бы функцию плотности (см,. $18), а следовательно, и математическое ожидание. В реальных условиях число измерений конечно. В этом случае из бесконечного множества возможных значений величины 5 мы располагаем только несколькими случайно выбранными значениями этой величины. Если проделано и измерений~ (т. е. некоторый эксперимент независимо повторен и раз (см. $16), то мы имеем и значений х„хь..., х», которые будем называть случайной выборкой объема и из множества всех возможных значений величинц $. В математической статистике (см. 1121, гл. 27) показывается, что по результатам каждой выборки х~, 58 ння). Есдн функция. плотности асимметрична (напрнмер,, дмеех длинный «хвост»,с одной стороны), то «центр» группировання случанны»х величин лучше определяет медиана, ее оценка х!!з определяется как значение абсциссы, слева н справа от которого реализуется по половине всей выборки.
Кроме того, математическое ожидание в некоторых случаях может вообще не существовать. В' практике физических измерений используется 'почти исключительно велнчкна х. Однако оценка медианы х!м в некоторых случаях является более предпочтительной величиной, так как по заданной выборке оценивается с большой точностью [131. Рассмотзпим теперь математическое ожидание случайной величины з . Оно определяется формулой »» л М(з!) = — '7~М((х! — х)') = — Р (о' — — ) =о', (25.5) л — 1 л»»« л — 144»» л / ! ! ! ! т. е. среднее значение случайной величины з' равно и».
Дисперсия же з» выражается довольно сложным образом. Однако если вели- чина $ имеет нормальное распределение, то дисперсия величи- ны зз выражается простой формулой 1) (з') =— зл« л (25.6) т. е. стандартное отклонение 12о91л может быть как угодно малым прн больших объемах выборки. В общем случае формула для дисперсии з' громоздка, однако н в этом случае нз-за л в знаменателе следует аналогичный вывод о величине стандартного отклонения прн больших и.
Поэтому, используя как н выше, неравенство Чебышева, можно утверждать, что прн достаточно больших л случайная величина з» будет как угодна мало (в статистическом смысле) отличаться от математического ожидания о'. Это н является основанием для выбора величины з', определяемой формулой (25.2) в качестве оценки значения о'. Если в качестве оценки величины о» использовать з', то для оценки стандартного отклонения величины х, которую обозначим как з„мы будем иметь формулу (см.
(25.2) н (25.4)) 2 и ~ч»', (х! — л) ° ! ! л (л — 1) (25.7) 60 Формулы (25.1) н (25.7) позволяют ответить на поставленный в начале параграфа $24 вопрос. Используя результаты выборки хь хм ...., х„можно по формуле (25.7) вычислить оценку математического ожидания )!, т. е. величину х, а по формуле (25.7)— выборочное стандартное отклонение этой оценки, которая позволяет судить о том, как сильно величина У может отличаться от ' математического ожидання )!. Математическое ожидание величины И равно )о, а дисперсия определяется формулой (25.4).
Что касается функции распределения величины У, то она, как правило, не известна. В .чЕстном, случае, если величина $ имеет нормальное распределение с параметрами )о и а' (см. $20.2), то выборочное среднее И также будет иметь нормальное распределение с математическим ожиданием р. и с дисперсией ао/и [121. $26. дОВеРительные интеРВАлы. кРитеРий ЭИАчииОсти. КОЭФФИЦИЕНТ ДОВЕРИЯ (НАДЕЖНОСТИ) В результате измерений некоторой величины ' можно найти оценку значения )о, вычислив У 'по формуле '(25.1). Такая'оценка называется то ч е ч н о й. Знание одной только точечной оценкн не дает достаточно полного представления о величине )о. Если. еще вычислить з„по формуле (25.7), то появятся основания предполагать, как сильно величина У может отличаться от )о. Однако* предпочтительнее более точная, количественная характеристика того, как сильно И может отличаться от )о. Такой характеристи-.
кой может служить интервал, для которого известно, с какой вероятностью значение р может находиться внутри этого интервала. Из имеющихся в нашем распоряжении величин У и з (илк У и а,) можно построить интервал И + Даз», (26.1)~ где К вЂ” положительное число, зависящее от параметра а. Назовем статистической гипотезой утверждение о том, что неизвестное значение )о заключено внутри интервала (26.1).
Возникает вопрос, на основании какого критерия можно сделать- заключение о справедливости или об ошибочности этой гипотезыР Допустим, нам удалось вычислить, что вероятность того, что р заключено внутри интервала (26Л), равна а. Выберем произвольно некоторое число ао= 1 — з, где е — малое положительное число. Тогда в качестве критерия можно использовать следующее неравенство: а)ао (26,2~ Если неравенство (26.2) выполняется, то мы должны принять гипотезу, а если нет, то отвергнуть.
Критерий (26.2) называется к р и те р не м з н а ч и м о с т и гипотезы, а число ао, которое выступает в роли предельной вероятности, называется уровнем значимости критерия. Величины а и ао можно выражать в долях единицы нли в процентах. Если величина ао выражена в процентах, то она называется ао-п р о ц е н т н ы м у р о в н е м з н а ч и м о с т и. Величину ао называют также коэффициентом доверия (надежностн), или просто вероятностью, а интервал (26.1) — доверительным интервалом. Конкретные значения аз выбираются из следующих соображеаий. Во-первых, естественно, чем больше ао, тем более сильное утверждение делается о величине и, к чему и надо стремиться. Однако, с другой стороны, если при этом длина интервала (26.1) становится слишком большой, то может потеряться представление даже о порядке величины и. Поэтому в условиях работы в лабораториях физического практикума разумно выбирать ач из условия (26.3) Ка~ — и~ 0,1.
х Нужно заметить, что вывод о том, верна или нет рассматриваемая гипотеза, носйт статистический характер. Это значит, что в случае, если мы принимаем гипотезу .на основании критерия (26.2), то это не означает безусловной справедливости гипотезы. Это только означает следующее. Допустим, что много раз проделана серия из п измерений и для каждой серии вычислилн х и з, и построили интервал (26.1); используя число К',.
Тогда величина и оказалась бы внутри лишь, некоторой части всех лостроенных интервалов, приблизительно равной аз от их полного количества. Иными словами, рассматриваемая гипотеза будет выполняться (в среднем) в а~ проценте случаев. Если аз достаточно близка к единице, то это будет практически достоверным событием (см. 5 17). Но в е=1 — аз проценте случаев гипотеза не будет выполняться, т.е.
с вероятностью е=;1 — а~ она может быть .и ие верной. Однако, если з мало, то это будет практически недостоверным событием (см. $17). И наоборот, если гипотеза отвергается на основании критерия (26.2), то это не означает, что гипо.теза просто не верна. Это только означает, что если в е= 1 — а проценте случаев (где е ие очень мало, так как а(аз) гипотеза не будет выполняться.