книга 2 (1110135), страница 74
Текст из файла (страница 74)
Новосибирск). Заметим, что алгоритмы поиска инбюрмации в базах данных составлякэт самоссоятсльный раздел компьютерной науки и довольно непросты Применение информационно-поисковых систем, однако, ограничивается рядом факторов Во-первых, оно имеет смысл лишь по стношениго к уже иавестным веществам, лап то не всем. Во-вторых, гоаданке н пополнение банка ленных — ню~егкое доло,осложняющееся нм>бхадимостью испольаования стандартных условий аналитического нэмЧх ния. Наконец, в большом банке поиск может продолжаться гголго, н это тем более вероятно, чем мощнее банк. Поэтому очень часто прибегагот к соотношениям "элемент структуры — аналитические признаки" типа уже упомннугых спектргжтруктурных югрреляций. Так называемые компьютерные мгсшсжм нсху~ согесккош нюлгллскгле (СИИ) способны, испольауя математически" аппарат формальной логики (булевой алгебры), по присутствию спектре характеристических признаков делать выводы о наличии э молекулах вещества соответствующих фрагментоа и в конечном счете" структуре, т.е.
илентифицировать вещество Особенна широко измчт ны снгтема дВНдРАЛ, ориентированная на масс-спектроскопию (США, Станфордский университет), и отечественная система искусст" шг „ного интюшекта РАСТР, предназначенная для идентификации ,ле«ул по данным ИК- н ЯМР--спектроскопи. Надо заметить, что СИИ представляют собой весьма сложные программы, моделирующие брэз действий специалиста-химика. Определение строения веществ» лЮчает как минимум три этапа: 1) структурно-групповой анализ,т.е. логическаа процедУра поиска молекУзшРиых фРагментов, пРоЯалЯюихся в спектре; 2) построение возможных структур иа отобранных фрагмыпов пРи помощи математической теоРии гРафов; 3) выбоР „аиболсе веРоатной стРУктУРы посРедством сРвэненин пРедскааанных спектров с экспериментальными.
В последнее время все чаще польвуются термином эксасрглныс гзсж,ив, имея в виду развитые СИИ, обладающие расширенной базой знаний. Такие бэлы включают наряду с формализованными соотношениями фрагмент — признак многочисленные эмпирические правила, касающиеся и спектроскопии и мюбще химической теории (представления о ввлевтности, правило Зльтекова — Зрлеимейера и т,н.) Предполагается, что со временем экспертные системы, оснащенные обсцехимическими ананиями и правилами рассуждения, принятыИн в конкретных методах анализа, существенно потеснят химика-аналитика.
Задачей идентификации является также отнесение вепсества к тому или иному классу. Под классом можно понимать совокупность соединений, имеющих некоторую функциональную группу, или определенаое сочетание фрагментов структуры и тд. Зта, по сунгеству приблизвтсльнаа, грубая, ндеитнфикаци» не столь проста в случае анализа сложных органическнх соединений при помощи таких информативных катодов, как, например, обычная или ниролитическая масс-спектроскопил Лля решения атой задачи применякп группу методов расноэнаеааал образов. В сласжсрно,е аналаэс набор веществ, представленный сечками в многомерном вространстее анюппических признаков (признаком может быть, например, поглощение при определенной длине волны или ионный ток при некотором отношении ж/2), разбивают п те утем специального итерационного процесса на кластеры.
Имеется в ьа ДУ, что кластер обьедипяет вещества, сходные по аналитичесним ароа ." Явлениям, т.е, принадлежащие с высокой вероятностью к некоторо- "У общему структурному классу. другой «ыкный прием — Рахюорнме аяалеэ — состоит з уменьшезав Размерности пространства признаков-фанторов. Зто достигвегся М сч "ет переход» от исходных факторов к их линейным комбинациям, завоз аящимся новыми координатными осями.
Вся процедура провоззтся л твк, чтобы изменчивость, "дисперсия" ланных в кпама коорди- 393 натах была ие меньше или почти не меныпе, чем е исходных. П, Ри этом добиваются минимальной коррелированнскти новых коордиц» (их эртасокажсэуюос).
все цовторнющиеся, етаатологическиеэ ис, ные фвктоРы эвпитываютсЯ" той или иной новой кооРдинатной осью Смысл таких действий становится понятен, если >чегсь, что один и тат же структурньй фрагмент часто проявляется в анвлитичсско сигнале (спектре) несколько раз, скажем, прн разных отнашею,„х т/8 Таким образом, в сложном сигнале вылеляются подструктуры отвечающие различным фрагментам. А зто существенно упрощае классификацию. Наконец, говоря о математическом моделировании аналитичесчюго процесса, следует упомянуть и а меюдвх, не предназначенных лдя интерпретации данных.
Рнд приемов и«пользуется с целью эи е езепов аяалеэа, т.е. для поиска условий, обеспечнвыощих макснмвльнып аналитический сигнал, минимальное мепэаюнгее влияние, наилучшее разрешение хроматографических пиков н т.п. Конечно, чыце всего оптимальные условия определяют, искодя из физико-химических закономерностей того или иного метода анализа и возможного состава объекта анализа. Оливка существует н другой путь, основанный на представлении (моделировании) аналитического процесса в виде кибернетическою "черного ящика", о способе функционирования которого ничего не иввестио.
Известны лишь ею входные параметры — условия проведения вналиаа (а хроматографии эта могут быть, наориыер, скорость потока, РН и концентрации элюента), иаменение которЫх влияет на выходной сигнал Под последним ппнимзют произвольно сконструированную функцию акачсства", критерий оптимальности, кснорый пытвются максимизировать. Вообще говоря, задаче поиска экстремума вычисляемой функпян посвящен целый раздел прикладной математики.
В аналитической же химии пока расщюстранены лишь два основных подхода. Пераып щ них составляют методы типа "«ругаго восхождения" по Боксу — унлсану, тесно связанныа со статистическим планированием эксперимента В сущности, этот подход сводится к последовательному движению э сторону максимума по поверхности отклика (критерия), которую для простоты аппроксимируют полиномом второго порядка. Статнстнчж кий план эксперимента слуэсит для выбора такого варианта движения по точкам (отображающим различные наборы значений фактор'з условий), чтобы при минимальных затратах труда качество аппроко' мвцин было высоким.
Второй подход — зто симплекс-алгоритм. В его рамках поиск опт" мума сводится к мгшематической процедуре двиясения пекет"Р" 394 м9ормируемого многогранника по поверхности отклика. Наиболее аспраггранена симплекс-оптимизация в хроматографии. С точки ения пользователя оба подхода сходны: компьютер (точнее, соответгеугощая программа) периодически предлагает провести анализ в тех яли иных условиях и ввести получающееся значение критерия, после „го сообщщт условия следующего эксперимента и т.д., вплоть до гостижения оптимума.
Нетрудно видеть, что па долю человека при юм остаются чисто механические операции типа приготовления растворов и установления РН. Очевидная перспектива ааключается в автоматизации таких действий. Действительно, в !985 — !999 гг. появились первые сообщения об использовании лабораторного робота, гоединенного с микроЗВМ, для полностъю автоматической оптимизации аналитических Методик. Мвтематичесинв модели обьеигов анализа. В результате анализа хшвно найти «одержание в объекте некоторых компонентов, интерес гсв представлянж другие, концентрации «пгорык зависят от концентрапий определяемых.
Непосредственное апрелеление целевых компоненшв почему-либо затрулнительио Простой пример: г помощью атомноабсорбпионной спектрометрии и ион-селективного алектрода устанавливают содержание в объекте иона меди и хлорид-иана; потребителю же аналитической информации требуются данные о концентрации шаридных ксыплексав меди. Такая аадача в практике анализа очень распространена, особенно в шдицинских приложениях. Наиболее важный случай — определение некоторых компонентов по их мвтаболитам. Ее решение и требует наличия модели, определяющей связь между концентрапияыи определяемых и целевых компонентов. Соответствующие модели также делятся иа дегерминистские и эмпирические. Простейший вид первых — равновесные: предпжвгает'л, что химический обьекг находится во внутреннем равновесии п все эпиюжные реакции между интересующими аналитика компонентами заметны. В таком случае математической моделью служит просто с~иокупность уравнений закона действующих масс для каждой реакЦаи и система уравнений материального баланса.