К. Дёрффель - Статистика в аналитической химии (1994) (1037704), страница 3
Текст из файла (страница 3)
Рандомизация! Центральное место среди предпосылок занимает требование нормальности Распределения измеряемых случайных величин. Как быть с этим жестким условием? Есть несколько вариантов, о которых нам уже приходилось неоднократно писать [54). Упомянем их здесь вкратце. Итак, самое спокойное — верить предпосылкам и действовать так, как будто они всегда выполняются Применение статистики пои этом становится догма- Знак качества наглядно проявляется почему-то в медицинских приложениях статистики.
Создается впечатление, что от такого "применения" все-таки больше вреда, чем пользы. Экспериментальные проверки предпосылок, как правило, лежат в области прекраснодушных мечтаний (хотя бывают редкие приятные исключения) и рассмотрения не заслуживают. Самым радикальным средством представляются полный или почти полный отказ от предпосылок и попытка получения результатов и их интерпретации в такой новой обстановке. Как ни странно, этот подход оказался вполне конструктивным и привел к созданию непараметрической статистики [55]. Меясцу прочим, в книге [55) читатель найдет более десятка примеров обработки аналитических данных, Непараметрические методы оказались проще классических, н только трудности внедрения все еше сохраняют преимущества за классикой. Есть основания думать, что ситуация уже начала меняться.
Сторонники непараметрического подхода платят за потерю информации о предпосылках некоторой потерей эффективности экспериментов. Поскольку каждый эксперимент дается потом и кровью, всякой даже незначительной потери жалко. Ну что ж, тогда надо искать компромисс. Один из возможных компромиссов — ослабленные предпосылки — ведет к робастным методам [56], т. е. к таким процедурам, которые способны "сопротивляться" некоторым нарушениям предпосылок, Если вы располагаете компьютером, то можно переложить часть ваших проблем на машинное моделирование в духе бутстреп-процедуры [57].
Отрадно, что на эту процедуру обращено внимание в интересной работе [58), открываюшей очень важный для нашей темы сборник. Еслп же вы никуда не спешите и согласны терпеливо накапливать данные, то можно обратиться к байесовскому подходу [59), где предпосылки рассматриваются как априорная информация, подлежащая уточнению в ходе накопления данных. Есть, наконец, и еше один радикальный путь — это поиск таких преобразований исходных данных, при которых выполнялись бы все предпосылки [34, гл. 5]. Технически это не так уж и сложно, но камнем преткновения служит интерпретация полученных преобразованных данных. Если она удается, результат может претендовать на Нобелевскую премию, как это было, например, с Аррениусом в 1903 году.
В последовательности анализов часто нарушается "незаметная" предпосылка о статистической независимости результатов. Есть масса причин, мешающих ее выполнению. Для многих химических процессов характерны регулярные дрейфы. А коррелированность результатов во времени или в пространстве сушественно усложняет обработку данных, что важно иметь в виду.
К сказанному можно еше добавить, что и при представлении или визуализации данных мы сталкиваемся с аналогичными трудностями: плохой интерпретируемостью и сложностью процедур, граничашей с их практической недоступностью для аналитика. Это относится почти ко всем методам многомерного статистического анализа, таким, как кластерный анализ, факторный анализ и т. п. И далеко не всегда статистик может посоветовать что-либо более сушественное, чем бросить все дела и заняться самообразованием в области статистических методов. Поэтому так соблазнительно выглядит идея собрать вместе все статистиче- 12 Предяелояяе редактора перевода вообще и аналитику в частности, и изложить их без математического садизма химиками для химиков.
Эта идея и привела в начале 70-х к созданию хемометрии [60 — 61]. Надо признать, что появление хемометрии было встречено с энтузиазмом, и работа сразу закипела. Об этом свидетельствуют многие факты. Так, в наиболее престижном американском журнале по аналитической химии с периодичностью раз в два года опубликовано уже 8 больших обзоров, причем последние семь из них назывались "Хемометрия". Вот ссылки на два последних [62, 63). В 1993 гоцу выходит уже 7-й том специального журнала [64], редколлегия которого в США группируется вокруг авторов книги [60]. Вполне сложившиеся школы существуют теперь и в Японии, и в ряде стран Европы. Отметим, например, интересную школу, сложившуюся в университете Умео в Швеции вокруг С. Волда и Р.
Карлсона [65, 66). Приведем несколько ссылок на диссертации, выполненные в этом коллективе [67 — 69). На первых порах становление хемометрии поддержала такая мощная организация, как НАТО [70]. Можно было бы указать еще на французский коллектив, возглавляемый Фан-Тан-Лу, и на его тесные связи со шведскими коллегами. Да и в Германии тоже ведется интенсивная работа, Отметим лишь работы О. Гроссман [71] и Дерффеля [72].
Представляемую в русском переводе книгу Дерффеля можно рассматривать как логическое основание книги [72]. Развитие хемометрии в значительной степени способствовало приобщению химиков к статистическим методам и особенно к методам планирования эксперимента. И одно из ее главных достижений — это, несомненно, изменение стиля мышления химиков. Парадигмы в наше время сменяются очень быстро. И вот уже появилась как бы из хемометрии н как бы независимо новое образование — компьютерная химия. Здесь все как прежде и все чуть-чуть не так. Нам же не уклониться от обсуждения этого нового монстра.
Ясно, что многие достижения последних лет непосредственно связаны с использованием вычислительной техники. Верно это и для аналитической химии. Достаточно вспомнить впечатляющие успехи в данном направлении известной фирмы "Хьюлетт-Паккард" [73]. Если обратиться к рекламе Американского химического общества [74], то хорошо видно, что распространяемое этим обществом программное обеспечение охватывает как все методы анализа, так и основные статистические процедуры. В химии потребляются самые разнообразные программные продукты, от классических средств обработки данных и управления производством [75], до современных сложных систем [76].
Остановимся на них несколько подробнее. Во многих случаях аналитик может ограничиться самыми простыми статистическими пакетами [77, 78), часто даже никак не связанными с химической спецификой. В более сложных случаях приходится покупать или заказывать специальныв Разработки [79 — 81).
Есть осторожные сообщения о полностью автоматизированных аналитических системах [82]. Одна из ключевых проблем химии — поиск информации в больших массивах — приводит к широкому использованию баз данных как для традиционного библиографического или фактографического поиска, так и специально для аналитических целей, когда речь идет, например, о библиотеках спектров н т. п. [83, 84). 13 Знак качества ний день главного детища теории искусствениого интеллекта. Исторически первой такой системой была знаменитая систежа ДЕНДРАЛ [85].
А дальше они посыпались как из рога изобилия [86]. Все эт.о сулит аналитике новые горизонты. 3. Проблемы внедрения Все это огромное многообразие идей, методов, процедур, приемов, конечно, не войдет в повседневную жизнь анолитпков симо по себе. Нужны специальные целенаправленные усилия. Давай.ге обсудим их в общих чертах. Области приложения аналитической химии столь разнообразны, что нет надежды на унифицированные подполы ж внедрению наших статистикохемометрических идей. Возьмем, например, острейшую современную проблему мониторинга окружающей срсгды, где анагтитика играет решающую роль при прослеживании за изменением концентраций десятков веществ в трех средах н сравнении получаемых данных с ПДК.
Ясио, что тут не обойтись без глубокой компьютеризации и максимально возмонсной автоматизации всех операций. При этом важно еще следить и ва соответствующими стандартами, например, [87]. На это и надо будет делать уптор. Кстати, недавно возникла еще одна новая наука "инвайронметрия", т. е. наука о применении статистических методов при изучении окружающей среды н ушравлении ею. Уже четвертый год выходит и соответствующий журнал [88]. Совсем иная ситуация в научных исследованиях многокомпонентных систем, где ключевую роль играют экспериментальные планы [89, 90] и методы разделения смесей.
Понятно, что приходится менятг стратегию внедрения. Можно, видимо, уже и не гово рить, какие требования предъявляет нам клиническая аналитика, анализ луншого грунта, оценка содержания нитратов в пищевых продуктахи многие другие практичесгсие ситуации. Всякий раз меняются обстоятельства и критерии, что н е облегчает нашу задачу. Но есть и еще одна трудность, о которой надо упомянуть. Речь идет об анализе информационных потоков в анэлитичеюкой химии, да и в химии вообще. А это, как известно, весьма трудоемко. Не»даром реферативный журнал аХимия" выходит чаще, чем любые другие реферативные журналы, Облегчить дело призваны некоторые справочники, например, [91, 92], и широко ведущиеся в последние годы наукометрические и сследовани.я — еще одна область интенсивного приложения статистических матс»дев, кстати, есть и соответствующий журнал [93], а также публикации [94 — 96].
Большую пользу может пришвстп "Индеыс научных цитат". Так, например, с его помощью мы можем узнать, что замечательная книга В. В. Налимова [36] к 1990 году цитировалась более 955 раз, Такое с»громное число цитирований делает эту книгу классической [97]. Есть две вещи, которые друг другу противоречат, но друг без друга существовать не могут. Это рутина и згворчество. Рутина фиксируется в стандартах, например, [98 — 99], а творчеству п освящаютси руководства, например, [100].
Обратимся, наконец, к проблемам обучеиия. Что нужно для хорошего обучения (кроме желания учиться, конечно)? Нужны программы и учебники. В программах недостатка нет. Так,, в существа»вавшем до недавнего времени Московском институте повышения ксвалпфикагхии руководящих работников и специалистов химической промышле нносги много лет велось обучение по 240- и 360- Предяелояяе редактора яерезода 14 тистические методы контроля в аналитической химии" [101]. Есть, конечно, н другие программы в вузах и институтах повышения квалификации, направленные на аналогичные цели.