Этапы моделирования
2.4. Этапы моделирования
В рамках рассмотренного выше итеративного процесса познания и моделирования проанализируем теперь некоторые специальные классы научных проблем и характеристики моделей, используемых при их решении.
Теоретическая и статистическая модели
В нашем обсуждении полезно различать статистические и теоретические модели. Сначала рассмотрим то, что понимается под чисто теоретической моделью. Положим, что при моделировании некоторой зависимости известно достаточно о её физической природе чтобы получить функцию ожидаемого значения E(y) переменной отклика от влияющих на неё факторов ξ1, ξ2, ..., ξр в виде выражения
E(y)=f(ξ1, ξ2, ..., ξр, b1, b2,…, bт), (2.4.1)
где ξ1, ξ2, ..., ξр – набор факторов, представляющих, например, начальные концентрации составляющих реакции, температуру, давление и так далее, а b1, b2,…, bт - ряд физических параметров, определяющих такие величины, как энергии активации, коэффициенты диффузии и температурные проводимости и так далее. В этом случае считается, что выражение (2.4.1) представляет теоретическую функцию моделируемой зависимости.
На практике, некоторые или все физические параметры должны оцениваться на основе экспериментальных данных отклика. Наиболее естественно теоретические знания в виде чисто теоретической модели могут представляться системами дифференциальных или интегральных уравнений, для которых выражение (2.4.1) является решением.
Однако часто для изучаемого объекта необходимые знания о моделируемой зависимости отсутствуют или являются неполными. Поэтому получение теоретической функции становится невозможным. В этих условиях можно предположить и проверить экспериментально, что зависимость E(y) от ξ1, ξ2, ..., ξр является непрерывной и, поэтому, в ограниченной области значений факторов ξ1, ξ2, ..., ξр может быть аппроксимирована интерполирующей функцией g(ξ1, ξ2, ..., ξр, b1, b2,…, bq), например, в виде полинома. В полиноме коэффициенты b1, b2,…, bq являются коэффициентами интерполирующей функции. Они отличаются от физических параметров b1, b2,…, bт теоретической функции. Интерполирующая функция g(ξ1, ξ2, ..., ξр, b1, b2,…, bq) может рассматриваться в качестве функции статистической модели моделируемой зависимости и справедлива только в ограниченной области значений факторов ξ1, ξ2, ..., ξр.
Теоретическая функция f(ξ1, ξ2, ..., ξр, b1, b2,…, bт) и чисто статистическая функция g(ξ1, ξ2, ..., ξр, b1, b2,…, bq) выражают две крайности использования и неиспользования общих законов, которым подчиняется моделируемая зависимость. Теоретическая функция является уместной в том случае, когда точно известны законы, которым подчиняется рассматриваемая зависимость. А статистическая функция уместна в другом крайнем случае, когда о моделируемой зависимости известно только то, что она непрерывна в исследуемой ограниченной области значений факторов ξ1, ξ2, ..., ξр. Однако в большинстве реальных случаев моделирования существуют некоторые предварительные знания о законах, которым подчиняется рассматриваемая зависимость. Поэтому в той или иной форме теоретическая функция может быть получена. Следовательно, реальная ситуация моделирования всегда находится где-то между этими крайностями и по мере того, как проводятся эксперименты и приобретается новая информация, ситуация может меняться. Так как реальные ситуации моделирования случаются почти во всех пунктах между упомянутыми выше крайними случаями, то для этого необходимо большое разнообразие статистических методов.
Рекомендуемые материалы
Недостаток знаний об изучаемой зависимости, при котором начинается исследование, вместе с содержанием тех знаний, которые желательно получить, будут определять подход к моделированию. Должно быть также ясно, что ни одна реальная проблема моделирования никогда всецело и точно не соответствует некоторой заранее определённой категории. Тем не менее, с этой оговоркой в таблице 2.4.1 показаны основные этапы моделирования [Box, Draper (2007) стр. 10]. Они разделены на основе того, что неизвестно об истинной теоретической модели. Для удобства ссылок каждому этапу даётся короткое название, а также описание и преследуемые на каждом этапе цели, что делает ясным, какой используется этап моделирования. Конечной целью ставится получение истинной теоретической модели. Однако при этом не указывается, какая теоретическая модель является истинной и что по этим понимается.
Таблица 2.4.1. Возможные этапы моделирования
Этап | Цель | Полагаются неизвестными | Описание |
КОТОРЫЕ | Определить подмножество ξ1, ξ2, ..., ξk важных факторов из всего множества потенциально важных. | f ξ1, ξ2, ..., ξk b1, b2,…, bq | Отбор факторов |
КАК | Определить некоторую локальную интерполирующую функцию g(ξ1, ξ2, ..., ξk, b1, b2,…, bq) | f b1, b2,…, bq | Построение статистической модели |
ПОЧЕМУ | Определить f(ξ1, ξ2, ..., ξk, b1, b2,…, bр) Определить b1, b2,…, bр | f b1, b2,…, bр b1, b2,…, bр | Построение теоретической модели Нахождение параметров |
На этапе «КОТОРЫЕ» цель заключается в том, чтобы определить которые из всех возможных факторов имеют существенное и важное влияние на отклик. На этапе «КАК» желательно больше узнать о характере поведения отклика при изменении значений выбранных факторов. На этапе «ПОЧЕМУ» делается попытка найти теоретические причины поведения отклика, наблюдавшегося на предыдущем этапе. (На практике эти этапы обычно перекрываются).
Далее сделан краткий набросок тех процедур, которые могут использоваться на указанных этапах моделирования.
Отбор факторов и построение статистической модели
В начале статистического моделирования, на этапе «КОТОРЫЕ» часто бывает так, что имеется длинный список факторов, которые могут оказывать влияние на отклик. Один из возможных путей сокращения этого списка заключается в том, чтобы попросить исследователя (химика, физика, инженера и т.д.) отобрать те факторы, которые, как он считает, оказывают наибольшее влияние на отклик. Этот отбор должен проводиться со знанием дела. В нём может случиться, что некоторый фактор, считавшийся в начале неважным, затем становится важным и имеет сильное воздействие на отклик. Хорошей заменой такого экспертного подхода для отбора заслуживающих дальнейшего изучения факторов является постановка пробного эксперимента выполняемого по специальному плану, называемому дробным факторным планом.
Когда факторы являются числовыми переменными и ошибка эксперимента не очень велика по сравнению с величиной диапазона изменения значений отклика, то в этом случае имеет смысл попытаться найти функцию отклика изучаемой зависимости в пределах представляющей наибольший интерес области значений факторов. Для многих моделируемых зависимостей форма действительной функции отклика неизвестна и возможно непознаваема, но может быть подвергнута локальной аппроксимации полиномом или некоторой другой аппроксимирующей функцией, скажем, g(ξ1, ξ2, ..., ξр, b1, b2,…, bq). Это осуществляется на этапе «КАК» и для выполнения такой аппроксимации разработаны соответствующие планы экспериментов. По существу, итеративная сущность статистического моделирования может гарантировать, что во время исследования можно узнать:
1. Количество необходимых повторений для достижения достаточной точности,
2. Местонахождение области экспериментирования, которая представляет наибольший интерес,
3. Подходящие области значений и преобразования факторов и отклика,
4. Степень сложности аппроксимирующей функции и, следовательно, планы экспериментов необходимые на разных этапах.
Построение теоретической модели
Если возможно, то в моделировании использовалась бы истинная функция f(ξ1, ξ2, ..., ξр, b1, b2,…, bт) отклика изучаемой зависимости, а не её аппроксимация приближенной функцией. В некоторых случаях моделирования можно надеяться построить полезные работающие теоретические функции моделей, которые, по меньшей мере, принимают во внимание принципиальные особенности изучаемой зависимости. Эти функции часто наиболее естественно выражаются посредством дифференциальных уравнений или других неявных форм, а современные достижения вычислительной техники и теории нелинейных планов и оценки сделали возможным справиться с проблемами их решения. Теоретическая модель имеет следующие преимущества:
ü Она содействует научному пониманию изучаемой зависимости.
Обратите внимание на лекцию "Казахстан в начале ХХ в.".
ü Обеспечивает обычно лучшую основу для экстраполяции (по крайней мере, для условий, ценных для дальнейшего экспериментального исследования, если не для полных диапазонов значений всех факторов).
ü Является экономной (то есть умеренной) в использовании ограниченного числа параметров и позволяет получать объяснимые значения отклика.
Результаты проверки соответствия между получаемыми значениями теоретических функций и экспериментальными данными бывают иногда разочаровывающими, так как недостаточно внимания уделяется обнаружению того, какова действительная форма функции. Легко получить данные, которые никогда не “поставят постулируемую модель под сомнение”. Следовательно общепринято, например, в химической технологии, находить различные группы исследователей каждая из которых отстаивает свою отличную от других модель для одного и того же процесса и каждая группа предлагает данные, которые “доказывают” их модель. В таких случаях должны применяться методы, позволяющие находить различия между разными возможными моделями.
Комментарий
Необходимо отметить, что на практике при моделировании границы между этапами, «КОТОРЫЕ», «КАК» и «ПОЧЕМУ» часто плохо различимы. Например, используемый дробный факторный план на этапе «КОТОРЫЕ» при отборе существенных факторов может затем использоваться первым планом для получения функции отклика (этап «КАК»). В других условиях тщательное изучение аппроксимирующей функции отклика на этапе «КАК» может стимулировать идеи о возможном теоретическом объяснении (этап «ПОЧЕМУ») [Box, Youle (1955)].
Приведённая последовательность этапов моделирования применима в области химической технологии. Однако в другой области исследований, например в приборостроении, последовательность этих этапов может быть другой и сами этапы могут быть другими, как показано на Рис.2.3. Эта глава посвящена знакомству с построением статистических моделей, то есть этапу «КАК» моделирования, поэтому далее рассматриваются функции статистических моделей.