К. Доерфель - Статистика в аналитической химии (1969) (1109659), страница 27
Текст из файла (страница 27)
Нередко константы калибровочной функции имеют тот или иной физико-химический смысл. Полученные для них числовые значения затем следует дополнить соответствующим доверительным интервалом. Все эти проблемы можно решить при помощи регрессионного анализа. Этот ме1од применим всегда, если требуется лучше оценить известную заранее зависимость между двумя (или несколькими) переменными. При этом числовые значения независимых переменных х уже заданы перед опытом, а числовые значения зависимых переменных у получаются в ходе опыта. Ошибка значений х несравнимо меныле о1пибки значений у.
Для каждого значения независимой переменной х должна быть нормально распределена зависимая случайная переменная у (рис. 9.1, а). Поэтому для каждого значения х возможно много значений у, а из функции, найденной подсчетом регрессии, нельзя непосредственно получить обратную зависимость. Не всегда известно заранее, имеется ли связь между двумя случайными переменными. Это необходимо проверить подсчетом корреляции. В противоположность регрессионному анализу при вычислении корреляции обе переменные связаны одинаковым образом с ошибками. Различные значения у могут принадлежать одному значению х, и наоборот.
Поэтому каждая полученная пара значений принадлежит двумерному распределению (рис. 9.1, б). (76 Гле«п 9 177 Стати«тики прямых лилий к« ка к — ~ к к« к- — ~ 9И. Определение констант В аналитической химии преимущественно имеют место линейные связи. Более сложные зависимости встречаются редко, и часто подходящими преобразованиями их можно Р и с. 9Л. Задача регрессии (вверху) и аадача кор- реляции (вниау). привести к линейному виду. Поэтому дальнейшее изло- жение будет ограничено изучением линейных зависи- мостей.
При намерении нашли л» пар значений (х;, р;) (л« ) 2). Известно, что между обеими переменными существует линейная зависимость У = а + Ьх и константы этой функции а и Ь надо определить численно. При этом требуется, чтобы разность между измеренным уг и значениями, вычис- ленными из уравнения Уг, была возможно меньше, т. е. ищут «оптимальнейшую» функцию.
Для решения атой задачи используют графические способы приближения и счетные методы. При графическом определении результаты измерений в виде точек наносят на координатную сетку. Через эти точки проводят прямую. При этом отдельные точки должны Р и с. 9.2. Графическое сравнение авачепий для примера [9Л [ в проекционно-искаженной сетке [3). быть равномерно распределены выше и ниже прямой.
Константу а находят как отрезок ординаты у при х = О, величина Ь представляет собой тангенс угла наклона прямой. Непосредственное отыскание констант а и Ь позволяет проекционно-искаженная сетка е (рис. 9.2). При сильном разбросе вначений измерений графическое выравнивание описанным способом часто неосуществимо. Тогда довольствуются тем, что соединяют точки прямыми линиями попарно. 11ерез середины полученных отрезков проводят прямую. Этот метод применяют до тех пор, пока не получат несколько точек, через которые можно провести сглаживающую прямую (рис.
9.3). Однако * Проекционно-искаженная бумага по Фишеру. Поставляется фирмой «Зсйа(ега Ре1нрар«егеги Плауэн (Фогтланд). 12 — 438 179 Статистика прямых дикий Глава и 178 т ~~~~ (у; — а — Ьхс) =- О 1 т ~~~~ хс(у; — а — Ьх;) = О 1 Ь= т ~ хсу; — ~Ч~ ~х; ~ у; (9.2) т ~ч', х,'.— (~, х;) ~~~~~ ус — ь ~~ хс ~~ (у — у)' 3 с 1 а т 2 (9.4) у, = а+Ьх, уз = а+ Ьхг у =- а+ Ьх,„ этот метод нельчя применять в проекционной сетке. В этом случае возвращаются к простому расчетно-графическому методу ИЗ). При большом числе «результатов» измерений можно вернуться к выравниванию, так называемым «канальным» методом по Вернеру (16). Через Р и с.
9.3. Построение линии Р к с. 9.4. Построение линии регрессии ярв сильно разбросан- регрессии прв очень многих пмх значениях измерений. точках взмереявй. крайние верхние и нижние точки проводят прямые. В середине этого «канала» лежит сглаживающая прямая (рис. 9.4). Константы а и Ь могут быть вычислены методом регрессионного анализа. Вели имеется т взаимосвязанных пар значений (х;, у;), то это можно записать следующим образом: В левой части этих выражений стоят измеренные значения ум в правой части — вычисленные значения У, = а + Ьх;.
Разность между обеими величинами дает ошибку. Совпадение между измеренными и вычисленными значениями является наилучшим, если сумма квадратов ~'. (у; — Ус)з = ~ (у; — а — Ьх;)' (9Л) будет минимальной. Это выполняется, если т ~ ~ 'Я (у, — а — Ьх;)з ) =-- — 2 1 у г ~'~~', (у,— а — Ьх;)'1= — 2 1 Решая эти уравнения относительно а и Ь, получим Константы а и Ь являются случайными величинами, при помощи которых оцениваются теоретические параметры а и (). Можно найти доверительный интервал для а и Ь, так как это сделано для отдельного значения измерения (уравнение (3,7)). Для этого прежде всего определяют дисперсию, характеризующую разброс измеренных значений (у;) относительно вычисленных (У,) со степенями свободы 1" =- т — 2.
Здесь имеется число степеней свободы т — 2, так как проведение прямых требует по меньшей мере двух точек. (Однако, если для каждой из т проб проводят по и; параллельных определений, так что имеется ти; = и результатов измерений, то с уравнением (9.4), естественно, будет связано 1 = и — 2.) Сумму квадратов в уравнении (9.4) удобнее определять, пользуясь следующим выражением: ~', (у; — У;)'= з,'(т — 2) = ~; у'; — а ~~' у; — Ь ~;. х;у, (9.5) При проведении вычислений по уравнению (9.5) сле- дует обратить внимание на то, что расчеты нужно делать 12* Глпвл у 181 Стптигтипа притих линий ат.=~у. и у б ( — „'т '*' — ").— чl, Г1 т(лп — з)з ='(") ~ "~=+-Х*э-(~ )'~ (9ЛО) при достаточно большом чисце знаков после запятой, так как искомую сумму квадратов часто ищут для весьма близких значений. Поэтому на этой ступени даже незначительная ошибка в вычислениях приводит к большим погрешностям.
Дисперсии для констант а и Ь можно найти, пользуясь законом распространения ошибок. Получают (9.6) Х (* — )' Х*( — (Х.)' га ~~ зз га ~~ лт гг т ~~ (л; — х)з т ~~ ла — (~~ з;) "' со степенями свободы / = лз — 2. Для константы Ь дисперсия з'„тем меньше, чем дальше значение х лежит от его среднего значения х, т. е. чем шире была выбрана рассматриваемая область (например, область концентраций). Доверительный интервал для Ь и для а находят, вычисляя ошибки при помощи равенств (9.6) и (9.7) ЛЬ=1(Р, Г) з„ (9.8) йа41(Р, Лзь (9.9) Зная ЛЬ и Ла, определяют число необходимых знаков после запятой для Ь и а.
Полученную функцию у = а + Ьх можно использовать, чтобы из заданных, следовательно, почти безошибочных значений х вычислить значения зависимых переменных. Для одного заданного значения хп находят одно значение Уп. Вследствие неизбежной ошибки при определении констант а и Ь необходимо рассматривать Уп также как случайную величину. Зная частные ошибки з, и за, находят доверительный интервал для вычисленного значения Уп Следовательно, доверительный интервал зависит от равности (хп — х) и становится тем больше, чем дальше х„лежит от среднего значения х. Таким образом, акстраполяция даже при наличии линейной связи может сопровождаться очень большими ошибками. Поэтому к ней прибегают только в вынужденных случаях в малой,'области.
При экстраполяции к значению х = О необходимо было бы Концентра- ции х, г бензелагл Энетннн- цня, и~ кзнестного ссдержапнн, Полученные значения приведены н таблице. Для понучення градунроночной прямой пронзнодят следующие вычисления: прежде всего определяют Еле= 22г79 (Ел~)з=114г.йа9 Еу; = 8,4298 Ел~у~ = 13,850 Хх; =-10,7 Еу~ =6,66 т=7 7 13,850 — 10,7 6,66 7 22,79 †1,49 6,66 — 0,570337 10,7 7 1 Сумму ннадратон для днсперснн, характеризующей отклонение изморенных значений относительно нычнслевпых, находят по соотношению (9.5) Е (у~ — У~) з =.= 8,429800 — О, 079628 6.
66 — О, 570337. 13,850 = 0,0003И О 0000622 5 попытаться получить дополнительные измерения вблизи х = О, если зто еще можно сделать с достаточной точностью. Подобные акстраполяции нозможны, если фактор Ь не слишком большая величина. [9.1.) Длн понучепня градунроночного графина прн фотометрвчесном определенен бензола н зтаполе н УФ-областн были намерены знстяпкцнн семи проб По уравнениям (9.2) н (9,3) находят 0,2 0,5 1,0 1,5 2,0 2,5 3,0 0,20 0,37 0,64 0,93 1,22 1,50 1,80 182 Статистика прямых линий Глава у Сумма квадратов Степень свебеиы Функнии Дисперсия в'и =(>5'/т — 1 вв =-(Ю(т — 2 у =Ь'х у=а Ь Ьх т — 1 т — 2 Разность (9.12) с )=т — 1 Х (у* — У;)' ве Х'1 с )'=т — 1 (9 14) степеней свободы. ЛЬ=1(Р, 1)ее=1(Р, ~)в l (9.15) 0,4682 0,4107 у=Ь'х у = а+Ьх 18 17 О, 0242 0,0575 Разность 0,0575 Р= 0 0242 ~~38 Дисперсии для констант Ь и а получают из равенств (9.6) и (9.7) 7.0,0000622 вь = 7 22 79 114 49 =0 00000967 вь = 0 ООЗП (с ( = 5) 0,0000622 22,79 с= 7,22 79 114 49 — — -0,00003147 ва=0,00561 (с (= 5) = О, При Р = 0,95 1 (Р, П будет равно 2,57.
Отсюда 1 (Р, 1] вь = ,00799 и 1 (Р, )) в„= 0,014. Искомые константы грвдуировочной прямой при Р = 0,95 Ъ=0,570 -~- 0,008 а =0,079 е- 0,014 При связи вида у — Ьх вычисление регрессии значительно упрощается. Тогда получают ~~~~ хею е (9.11) ~~ (у — у)е ве т — 1 степеней свободы (ср. стр. 181 внизу). =г,'(т — 1) = ~ ут — Ь ~х;у~ (9.13) 9.2.
Проверка констант Если для прямой у = а + Ьх при расчете констант для а получается очень неболыпое значение, то воэникает подоэрение, что уравнение может иметь вид у = Ь'х. Это всегда возможно в том случае, когда обе величины хе и х,' отличаются друг от друга только случайно. Для проверки вычисляют суммы квадратов ~)Я !равенство (9.5)) и 1)о' (уравнение (9.13)) с 7' = т — 2 и соответственно Г'=- т — 1 степенями свободы, При этом сумма квадратов, относящаяся к у = а + Ьх, никогда не будет больше, чем подсчитанная для у = Ь'х. Соотношение между обеими суммами квадратов приведено ниже: Затем находят соотношение ОЯ' — (>Я (9 16) и сравнивают, как обычно, с Р (Р, 7', = 1; ) и = т — 2).
Для перехода к уравнению у = Ь)х имеются основания только тогда когда Р ( Р (Р ~е Гв) (9.2). Для определения следов СОЯ в синтетическом газе [8) ивмеряли зкстиницию ИК-вбсорбционной полосы при 2054 см Ц В области 0,003 — 0,05 об.еее СОЯ между концентрацией и акстинкцией существует связь, определяемая уравнением у = а -(- Ьх. Вследствие незначительности члене а следует проверить, возможно ли уравнение у = Ь'х.