Г. Кристиан - Аналитическая химия, том 1 (1108737), страница 32
Текст из файла (страница 32)
Если предполагается, что зависимость между переменными х и у линейна, то данные должны удовлетворять уравнению у — тх+ Ь (3.19) Символом у обозначена зависимая переменная, символом х — независимая иеременная, а параметры т и Ь называются, соответственно, угловым коэффиниентом (тангенсом угла наклона) и свободным членом. Последний представляет собой длину отрезка, отсекаемого прямой на оси ординат у. Как правило, у является результатом какого-либо измерения, соответствующего переменной величине х (рис. 3.7).так, при построении градуировочного графика в спектрофотометрическом анализе у — это измеренное значение оптической плотности, соответствующее концентрации стандартного раствора х.
Нашей задачей является нахождение параметров т и Ь. 3.1б. ЛИНЕЙНЫЙ МЕТОД НАИМЕНЬШИХ КВАДРАТОВ; КАК ПРОВЕСТИ ПРЯМУЮ? а Ф з з Ф я Ф Ф о с е е я я с а Ф Ф е — (тх, е Ь) ау у-о иент = — = т =— ех х х, к (независимая переменная) РИС. 3.7. Прямая, построенная по методу наименьших квадратов Метод наименьших квадратов Наилучшей прямой является та, для которой величина о минимальна. Для нахождения соответствующих параметров следует продифференцировать выражение для 5 по т и Ь, приравнять производные нулю и решить полученную систему из двух уравнений относительно т и Ь.
Решениями являются: (3.21) (3.22) где х — среднее из всех значений хе а у — среднее из всех значений ус Выраже- ние (3.21) можно преобразовать в форму, более удобную для вычислений (осо- бенно на калькуляторе): Статистическими методами можно показать, что экспериментальный набор данных наилучшим образом описывает та прямая, для которой сумма квадратов отклонений экспериментальных значений от рассчитанных (эти отклонения называются остатками) минимальна.
Способ построения таких прямых называется методом наименьших квадратов. Если х — заданная величина (например, концентрация), а у — измеряемая величина (оптическая плотность при спектрофотометрических измерениях, плоШадь пика при хроматографических измерениях и т. д.), то отклонения рассчитывают вдоль вертикальной оси у. В этом случае предполагают, что значения независимой переменной х, не содержат погрешностей. Обозначим экспериментальное значение у, соответствующее заданному значению хп как уе а рассчитанное значение у (т.
е. лежащее на прямой) — как ус Очевидно, величина у~ в точности равна тх, + Ь. Тогда сумма квадратов отклонений Ь' равна: б-,)' (у; — у~) -~~'.,Ь; -(~;+Ь)1 1БВ ОБРАБОТКА ДАННЫХ И ЭЛЕКТРОННЫЕ ТАБЛИЦЫ (3.23) где н — общее число точек (пар значений хл у,.). Значения углового коэффициента и свободного члена, рассчитанные по методу наименьших квадратов, характеризуют наиболее вероятное прохождение прямолинейной зависимости.
Пример 3.21 В образце зерна определяли рибофлавин (витамин Вз) путем измерения интенсивности флуоресценции вытяжки в 5%-й уксусной кислоте. Для построения градуировочной зависимости были измерены интенсивности флуоресценции серии стандартных растворов рибофлавина возрастающей концентрации. По полученным данным при помощи метода наименьших квадратов рассчитайте параметры наилучшей прямолинейной градуировочной зависимости и определите концентрацию рибофлавина в анализируемом растворе (интенсивность его флуоресценции равна 15,4).
хз х,у; 0,0000 0,0100 0,0400 0,00 0,100 5,8 0,58 0,200 12,2 2,44 0,400 0,800 22,3 0,160о 0 640о 8,92 43,3 34,6л ,) х, =1,500 (,) х,) =2,250 у,. =836 ,)' х,.у, = 46,5з )' х~ =0850о '~ ' =О,ЗОО у= ' =16,7з н Решение При помощи уравнений (3.23) и (3.22) получаем: Концентрация рибофлавина, мкгlмл = ррт (х,) 0,000 Интенсивность флуоресценции, уел. ед. (у,) 0,00 46,5з — Щ500 83,6)75] т= ' ' =53,7з (усл.
едУррш) 0 850о 2 250~5 Ь = 16,7з — (53,7з 0,300о) = О,бо (уел. ед.) 3.16. ЛИНЕЙНЫЙ МЕТОД НАИМЕНЬШИХ КВАДРАТОВ: КАК ПРОВЕСТИ ПРЯМУЮ? 50,0 45,0 40,0 о 55,0 о зо,о о л 25,0 4. 8 Ф 200 о 15,0 о 10,0 5,0 0,0 0,0 О,! 0,2 0,3 0,4 0,5 0,6 0,7 О,В 0,9 Концентрация рибофяаеина, ррт РИС. 3.8. Градуированный график, построенный методом наименьших квадратов по данным примера 3.21 В ходе вычислений мы сохраняли максимальное число значащих цифр. Поскольку экспериментальные данные ( у) получены с точностью до одного знака после запятой, величины ш и Ь также округлим до одного знака после запятой. Таким образом, уравнение градуировочной прямой имеет вид (ррщ = мкг/мл): у (уел.
ед.) = 53,8 (уел. едУррпт) х (ррщ) + О,б (уел. ед.) Рассчитаем концентрацию в анализируемой пробе: 15,4 = 53,8х + О,б х = 0,275 мкг!мл Для построения градуировочного графика достаточно взять два произвольных значения х, отстоящих далеко друг от друга, рассчитать соответствующие им значения у (или наоборот) и провести прямую через эти точки. На рис, 3.8 изображены экспериментальные точки и градуировочный график. Этот рисунок был построен при помощи программы Ехсе1, позволяющей также вывести уравнение прямой линии и значение квадрата коэффициента корреляции. Оно является мерой близости экспериментальных и рассчитанных значений (см.
далее). Приведенные значения имеют дополнительные десятичные цифры, поскольку их число определяется программой автоматически. 1ВО ОБРАБОТКА ДАННЫХ И ЭЛЕКТРОННЫЕ ТАБЛИЦЫ Стандартные отклонения углового коэффициента и свободного члена: они характеризуют неопределенность результата Будем исходить из допущения, что для каждой точки градуировочного графика значениеу, представляет собой случайную величину, распределенную по нормальному [гауссовому) закону.
В соответствии с уравнением (3.20) отклонение ординаты точки от градуировочной прямой равно у, — уг = у — (лзх ь Ь). Из этих значений можно рассчитать стандартное отклонение величин у. Расчет проводится по аналогии с уравнением (3.2) за исключением того, что число степеней свободы равно тт'- 2 [две степени свободы затрачены на нахождение двух параметров — углового коэффициента и свободного члена): (3.24) Эта величина называется стандартным отклонением относительно линии регрессии. Неопределенности (стандартные отклонения) параметров т и Ь определяются величиной л и могут быть из нее рассчитаны. Стандартное отклонение углового коэффициента гл равно (3.25) Здесь х, как и ранее, есть среднее из всех значений хг Стандартное отклонение свободного члена равно (3.26) Из стандартных отклонений, характеризующих неопределенности значенийу, гл и Ь„можно рассчитать стандартное отклонение содержания вещества в анализируемой пробе х, пользуясь уравнением (3.19) и известным нам законом наложения [распространения) погрешностей*.
Указанный способ оценки неопределенности значения х достаточно приближенный. Закон наложения погрегпностей в той его форме, которая приведена в книге, справедлив только в том случае, если все аргументы взаимно некоррелированы. В то же время параметры гралуировочной зависимости т и Ь, как правило, связаны между собой отрицательной корреляцией. Это обстоятельство можно учесть и получить более реалистнчнуто оценку стандартного отклонения х.
См., например, [Аналитическая химия. Проблемы и подходы. Т. 2! Под ред. Р. Кельнера и др. Мз Мир, 000 кИздательсгао АСТ», 2004, с. 4701. — Прим. перев. 3.16. ЛИНЕЙНЫЙ МЕТОД НАИМЕНЬШИХ КВАДРАТОВ: КАК ПРОВЕСТИ ПРЯМУЮ? Пример 3.22 Оцените неопределенности значений углового коэффициента, свободного члена и величин у для данных из примера 3.21, а также неопределенность найденного значения концентрации рибофлавина. Решение Чтобы рассчитать все требуемые величины неопределенностей, необходимы значения~ уз, (~уз)з,,) х,з, (,)„х,т)з илзз.дляданных,приведенныхвпримере 3.21, (~ ~у,.) = (83,6)з = 6989,0, (,)„х~) = 0,850, (~ х,) = 2,250 и лзз=(53,7 )з = 2„88 10з.
Значения (у,)з равны 0,0, 33,6, 148,8, 497,3 и 1874,9. Отсюда,) у, = 2554,6 (значение приводим с запасными цифрами). Из уравнения (3.24): (25546 69890~5) (537з) (0850о 2250~5) 5 — 2 Из уравнения (3.25): (О,бз)' з„= ' з =+1,0 уел. едУррш 0,850о -2,250/'5 Из уравнения (3.26): 0,850о зь =Обз о о0,4, уел. ед. 5(01850о) 2~250 Отсюда т = 53,о + 1, и Ь = 0,6+ 0,4. Концентрацию рибофлавина в пробе рассчитаем как (у+ оу ) — (Ь + зь ) (1 5 4+ О 6) — (О 6 ь О 4) гп+з„, 53 о+1,о Используя общие принципы наложения погрешностей (при сложении — вычитании суммируются абсолютные дисперсии, при умножении — делении — относительные), получим оценку неопределенности величины х: х = 0,27з + 0,014 мкг/мл (ррш). О расчетах стандартного отклонения относительно линии регрессии и стандартного отклонения х при помощи электронных таблиц см.
в гл. 16. 162 ОБРАБОТКА ДАННЫХ И ЭЛЕКТРОННЫЕ ТАБЛИЦЫ ЗЛ7. Коэффициент корреляции и коэффициент детерминации Коэффициент корреляции служит мерой корреляции (взаимной зависимости) между двумя величинами.* Если связь между переменными х и у не является строго функциональной, то нет смысла говорить о «наилучшем» значении у, соответствующем данному х. Можно говорить лишь о «наиболее вероятном» значении у. Чем ближе экспериментальные значения к наиболее вероятным, тем более определенной является зависимость между х и у. Это положение служит основой для вычисления различных величин, характеризующих степень корреляции между переменными.