Дж. Тейлор - Введение в теорию ошибок (1108329), страница 37
Текст из файла (страница 37)
Если измерения х и у независимы, то легко видеть, что после многих измерений смешанный второй момент оьа должен стремиться к нулю '). Вне зависимости от значения йч ве. личина х; — х с равной вероятностью может быть как положительной, так и отрицательной. Таким образом, после многих измерений положительные и отрицательные члены в (9.8) должны примерно скомпенсироваться, и в пределе бесконечного числа измерений множитель 1/У в (9.8) обеспечит равенство а„а нулю. (После конечного числа измерений величина а „не будет точно равна нулю, но должна быть мала, если ошибки в х и р действительно независимы и случайны.) Прн и,„= 0 выражение для оа сводится к па ( о) пз 1 ( ч) тз (9.10) знакомому результату для независимых и случайных погрешностей. Если измерения х и у не независимы, то смешанный второй момент аьа не должен равняться нулю.
Например, легко представить себе ситуацию, когда переоценка х всегда влечет за собой переоценку р н наоборот. В этом случае числа (х; — х) и (йч — у) будут всегда иметь один и тот же знак (положительный или отрицательный), а их произведение будет всегда положительно. Поскольку все члены в сумме (9.8) положительны, то пса не должна исчезать даже в пределе„ когда мы делаем бесконечно много измерений.
Когда смешанный второй момент п„а отличен от нуля (даже в пределе бесконечно большого числа измерений), мы говорим, что ошибки в х и у коррелированы. В этом случае погрешность ае в су(х, р), определяемая (9,9), это не то же самое, что мы получили бы в соответствии с формулой (9.10) для независимых и случайных ошибок. ') В случае конечного числа измерений Ф в литературе на русском языке для о„„используется понятие выборочный смешанный второй моменг по аналогии с выборочным средним, выборочным стандартным отклонением н т. д, — Прим, верее. 194 Глава 9 С помощью формулы (9.9) мы можем получить верхний предел для пу, который всегда справедлив. С помощью простых алгебраических преобразований (задача 9.1) можно показать, что смешанный второй момент о„у удовлетворяет так .называемому неравенству Шварца ! иву ! в олпу (9.11) Если подставить (9.11) в выражение (9.9) для погрешности ау, то получим, что =~! ~: !ох+! —." ! "1 т, е.
"- ! —." !" +!У!оу (9. 12) 9.3. Коэффициент линейной корреляции Понятие смешанного второго момента а„у, введенное в равд. 9.2, позволяет нам о~ветить на вопрос, поставленный .в гл. 8 о том, насколько хорошо набор результатов измерений Этим результатом мы окончательно установили точный смысл нашего первоначального простого выражения ' -! — "!"+!~~!' (9.13) для погрешности бд. Если рассматривать стандартное отклонение оу как нашу меру погрешности в д, то (9.!2) показывает, что старое выражение (9.13) в действительности есть верхний предел погрешности.
Вне зависимости от того, независимы ли ошибки в х и у и нормально ли они распределены, погрешность в д никогда не больше правой части (9.!3), Если измерения х и у коррелированы таким образом, что (а.у! = о оу, т. е. (п„у( достигает максимально возможного значения в соответствии с (9.11), то погрешность в д может быть действительно такой, как она дается (9.13), но она никогда не может быть больше.
Роль смешанного второго момента о у в нашем обсуждении расчета ошибок в косвенных измерениях является чисто теоретической, и практически понятие смешанного второго момента обычно не имеет существенного значения при расчете ошибок в косвенных измерениях. Теперь мы обсудим проблему, в которой зто понятие действительно играет центральную роль и имеет практическое значение.
! 85. Смешанный второй момент и корреляция уу и дд аду Отметка еа дамашнее еадаиие Рис. 9Л. «График рассеяния», показывавший отметки студентов за акзамены и домашние задании. Каждая из десяти точен 1ка у~) указывает отметку студента за домашнее задание к, и за зкзамен рн (хь у~), ..., (хи, уи) для двух переменных подтверждает гипотезу о линейной зависимости х и у. Предположим, что мы получили М пар измеренных значений (х„у1), ..., (хи,уи) двух переменных, которые, как мы ожидаем, должны быть связаны линейной зависимостью вида у=А+Вх. Важно заметить, что хи ..., хк в данном случае не результаты измерений лишь одной величины, как это было в случае двух последних разделов; на самом деле это результаты измерений М различных значений одной переменной (например, У различных высот, с которых мы бросали камень).
То же самое относится и к уь ..., уш С помощью метода наименьших квадратов мы можем найти значения А и 8 для линии, которая наилучшим образом аппроксимирует точки (хм у,), ..., (хм, ук). Если у иас есть надежные оценки погрешностей в измерениях, то мы можем видеть, действительно ли измеренные точки лежат разумно близко к линии (по сравнению с известными погрешностями). Если это так, то измерения подтверждают наше предположение, что х и у связаны линейно. К сожалению, во многих экспериментах трудно определить надежные оценки погрешностей заранее, и поэтому мы должны использовать исходные данные, чтобы судить, связаны ли две переменные линейно.
В частности, имеется такой при- )вв Глава 9 ггхе г о„ои (9.)4) где смешанный второй момент и,е и стандартные отклонения о„и ие определяются точно так же, как и ранее, формулами (9.8) и (9.4)'). Подставляя эти определения в (9.14), мы ') На рис. 9Л приведены отметки по !00-балльной системе.
— Прям. перев. а) В принципе, ввиду того что трудно абсолютно точно и объективно выставить оценку (например, отметки между тройкой н четверкой в случае нашей системы оценок), можно ввести в рассмотрение погрешность оценки. — Прим.
перев. ') Заметьте, однако, что нх значения слегка различны. Например, в равд. 9.2 х„..., хе были результатамп измерений оояого числа, и если бы эгн измерения были точнымн, то величина о„была бы малой. В дан. мер эксперимента, когда невозможно определить величину погрешностей заранее. Этот эксперимент, который более подходит к социальным, чем к физическим, наукам, лучше пояснить на примере.
Представим себе, что профессор, желаюший убедить своих студентов в том, что выполнение домашних заданий поможет им хорошо сдать экзамены, собирает сведения об их отметках за домашнее задание и за экзамен и изображает их на «графике разбросов», как показано на рис. 9.). На этом графике отметки за домашнее задаегие отложены по горизонтальной оси, а за экзамен — по вертикальной '). Каждая точка (хь уг) показывает оценку одного студента за домашнее задание хг и за экзамен уь Профессор надеется показать, что высокие оценки за экзамен коррелируюг с высокими отметками за домашнее задание и наоборот (и его график разбросов определенно подтверждает, что это приблизительно так).
В этом примере эксперимента нет никаких погрешностей в точках; две отметки каждого студента известны точно'). Погрешность будет скорее в степени, до которой коррелированы отметки, и именно это должно быть определено из данных. Две переменные х и у (в случае любого типичного физического эксперимента или такого, как описанный выше) могут быть, конечно, связаны и более сложной зависимостью, чем простая линейная связь вида у = А+ Вх. Например, множество физических законов приводит к квадратичной зависимости типа у = А+ Вх+ Схз. Тем не менее мы ограничим наше рассмотрение случаем более простой задачи, когда надо решить, подтверждает ли данный набор точек гипотезу о линейной связи у = А+ Вх.
Степень, до которой набор точек (хь у|), ..., (хл„ув) подтверждает линейную зависимость между х и у, измеряется коэффициентом линейной корреляции, или просто коэффициентом корреляции Смешанный второй момент н корреляции можем переписать выражение для коэффициента корреляции в виде (9.15) Как мы скоро увидим, число г показывает, насколько хорошо точки (хь у,) аппроксимируются прямой линией. Это число принимает значения между — 1 н 1. Если г близко к ~1, то точки лежат вблизи некоторой прямой линии; если г близко к О, то точки ие коррелированы и либо незначительно, либо совсем не группируются около прямой линии.
Чтобы доказать эти утверждения, сначала заметим, что из неравенства Шварца (9.1!) )о,е! ( о„о, сразу же следует, что )г((! или — 1 » (г » (1, как и утверждалось. Далее, предположим, что все точки (х;,у;) лежат точно на линии у= А+Вх. В этом случае рд = А+ Вх, для всех 1 и, следовательно, у = А+ Вх. Вычитая этн два равенства, мы видим, что у; — у= В(х; — х) для каждого Б Подставляя полученное выражение в (9.15), находим В Х (х,— х)2 В г — з' у — — 3- 1, (9.16) (х — х)з Нз ~ (х,.
— хя'~' ~ д ~ т. е. если точки (хь у1), ..., (хм, рл) лежат точно на прямой, то г = -+1, причем знак г определяется наклоном линии (г =! для положительного В и г = — ! для отрицательного В)'). Даже если переменные х и у действительно связаны линейной зависимостью, мы не должны ожидать, что экспериментальные точки будут лежать точно на линии. Таким образом, не следует ожидать, что г точно равно .=Ь1. С другой стороны, мы действительно должны ожидать, что г близко к -~ 1, если считаем, что х и у связаны линейно. ном случае хь ..., хе — результаты измерений различных значений переменной, н даже если бы измерения были точными, то все равно не было бы основания думать, что величина о будет малой.
Заметим также, что некоторые авторы используют число гз называя его козфициентом точности измерений. ') Если линия строго горизонтальна, то В О, н (9.16) дает г=о/О„ т, е, г — неопределенная величина. К счастью, зтот частный случай ие важен для практики, так как он соответствует ситуации, когда у — постоии- иая, ве зависящая от х. 188 Глава 9 Предположим, что нет никакой связи между переменными х и у. Тогда вне зависимости от значения у, каждое х! с одинаковой вероятностью может быть как больше, так и меньше х.
Таким образом, члены в сумме ~ (х, — х)(у, — у) в числителе выражения (9.18) для г с одинаковой вероятностью могут быть как положительными, так и отрицательными. В то же время члены в знаменателе выражения для г всегда положительны. Таким образом, в пределе, когда число измерений Ж стремится к бесконечности, коэффициент корреляции г будет равен нулю.
В случае конечного числа экспериментальных точек мы ие должны ожидать, что коэффициент г будет точно равен нулю, но мы действительно ожидаем, что он должен быть леал (еслн две переменные действительно пе связаны линейной зависимостью). Если две переменные х и у таковы, что в пределе бесконечно большого числа измерений их смешанный второй момент равен нулю (и, следовательно, г = О), то мы говорим, что перемсннью иекоррелированны.