Статистическая оценивание, решение, моделирование
3. Статистическая оценивание, решение, моделирование
Методы изучения статистической совокупности разрабатываются и применяются в соответствии с целью и задачами исследования. При статистическом исследовании следует различать статистическое оценивание, статистическое решение, статистическое моделирование.
Статистическое оценивание представляет совокупность методов математической статистики для приближённого определения неизвестных распределений вероятностей (или каких-либо их характеристик) по результатам наблюдений. В наиболее распространённом случае результаты наблюдений образуют последовательность, независимых случайных величин (или векторов), имеющих одно и то же (неизвестное) распределение вероятностей с функцией распределения .
Обычно предполагают, что функция принадлежит какому-либо известному семейству, которое зависит от конечного числа параметров, и определению подлежат лишь значения самих этих параметров. Например, значительная часть теории, особенно в многомерном случае, развита в предположении, что неизвестное распределение является нормальным распределением, у которого все параметры или какая-либо их часть неизвестны, или что полностью неизвестна.
Два основных вида статистического оценивания - так называвемое точечное оценивание и интервальное оценивание с помощью доверительных интервалов. В первом случае в качестве приближённого значения для неизвестной характеристики выбирают какую-либо одну функцию от результатов наблюдений, во втором - указывают интервал значений, с высокой вероятностью «накрывающий» неизвестное значение этой характеристики.
Интервальная статистическая оценка это статистическая оценка неизвестного параметра вероятностного распределения, представляющая интервал приближённых значений параметра. Границы этого интервала, принадлежащего множеству допустимых значений параметра (параметрическому множеству), определяются по результатам наблюдений. Существует несколько способов построения интервальной статистической оценки для параметров распределения. Наиболее распространённым является метод доверительных интервалов (областей, множеств). При наличии априорной информации о распределении параметра применяются бейесовские интервальные статистические оценки. В отличие от точечной статистической оценки, интервальная статистическая оценка даёт возможность решить вопрос о точности оценивания, именно, вычислить вероятность ошибки при использовании данной интервальной статистической оценки.
Разработаны методы статистического оценивания и для случая, когда результаты наблюдений зависимы, и для случая, когда индекс заменяется непрерывно меняющимся аргументом , т. е. для случайных процессов. В частности, широко используется статистическое оценивание таких характеристик случайных процессов, как корреляционная функция и спектральная функция. Разработаны также методы статистического оценивания для случая, когда объём выборки не фиксируется заранее, а определяется в процессе наблюдения. В связи с задачами регрессионного анализа был развит метод непараметрического последовательного статистического оценивания - стохастическая аппроксимация. В наиболее общей форме методы статистического оценивания рассматриваются в теории статистических решений.
Статистическое решение (решающее правило, решающая функция), название решения, принимаемого в математической статистике на основе результатов наблюдений какого-либо явления, подчиняющегося вероятностным закономерностям, которые не полностью известны. Обычно предполагается, что соответствующее распределение вероятностей зависит от неизвестного параметра , оцениваемого по результатам наблюдений .
Например, при обеззараживании воды хлорированием количество добавляемого хлора зависит от среднего числа бактерий в единице объёма, однако значение неизвестно и оценивается по результатам подсчёта численности бактерий в независимо выбранных единицах объёма воды при допущении (в простейшей модели), что независимые случайные величины имеют одинаковое распределение Пуассона с неизвестным математическим ожиданием . Статистическое решение - решение о количестве добавляемого хлора - будет функцией от какой-либо статистической оценки параметра . Последняя должна выбираться с учётом риска нежелательных последствий как недооценки (недостаточное обеззараживание воды), так и завышение оценки (ухудшение качества воды от чрезмерного добавления хлора).
Рекомендуемые материалы
Точная математическая формулировка понятий, касающихся статистических решений и способов их сравнения, рассматривается теорией статистический решений.
Статистическое моделирование рассматривается как моделирование случайных величин или процессов для численного решения математических задач. При этом искомые величины (связанные или не связанные со случайностью) представляют вероятностными характеристиками какого-либо случайного явления. Это явление моделируют, после чего нужные характеристики приближённо определяют с помощью статистической обработки «наблюдений» модели (например, с помощью метода Монте-Карло).
Пусть, например, требуется рассчитать потоки тепла в нагреваемой тонкой металлической пластине, на краях которой поддерживается нулевая температура. Распределение тепла описывается тем же уравнением, что и расплывание пятна краски в слое жидкости. Поэтому моделируют плоское броуновское движение частиц «краски» по пластине, следя за их положениями в моменты , . Приближённо принимают, что за малый интервал частица перемещается на шаг равновероятно во всех направлениях. Каждый раз направление выбирается случайным образом независимо от всего предыдущего. Соотношение между и определяется коэффициентом теплопроводности. Движение начинается в источнике тепла и кончается при первом достижении края («краска» налипает на край). Поток тепла через участок границы измеряется количеством налипшей краски. При общем количестве частиц согласно закону больших чисел такая оценка даёт случайную относительную ошибку порядка (и систематическую ошибку порядка из-за дискретности выбранной модели). Искомую величину представляют математическим ожиданием числовой функции от случайного исхода :
,
т. е. интегралом по вероятностной мере р. На оценку
,
где — смоделированные исходы, можно смотреть как на квадратурную формулу для указанного интеграла со случайными узлами и случайной погрешностью . Обычно принимают
,
считая большую погрешность пренебрежимо маловероятной; дисперсия может быть оценена в ходе наблюдений.
"5 Естественное течение приобретенной вич-инфекции" - тут тоже много полезного для Вас.
В разобранном выше примере , когда траектория кончается на ; иначе f(w) = 0. Дисперсия . Интеграл берётся по пространству ломаных со звеньями постоянной длины; он может быть выражен через кратные интегралы.
Проведение каждого «эксперимента» распадается на две части: «розыгрыш» случайного исхода w и последующее вычисление функции f(w). Когда пространство всех исходов и вероятностная мера слишком сложны, розыгрыш проводится последовательно в несколько этапов (см. пример). Случайный выбор на каждом этапе проводится с помощью случайных чисел, например, генерируемых каким-либо физическим датчиком; употребительна также их арифметическая имитация - псевдослучайные числа. Аналогичные процедуры случайного выбора используются в математической статистике и теории игр.
Численные методы, основанные на статистическом моделировании, широко применяются для решения на компьютере многих задач вычислительной математики. Они удобны своей универсальностью и, как правило, не требуют большого объёма памяти. Недостаток - большие случайные погрешности, слишком медленно убывающие при увеличении числа экспериментов. Поэтому разработаны приёмы преобразования моделей, позволяющие понижать разброс наблюдаемых величин и объём модельного эксперимента.
В экономике статистические модели предполагают моделируемую систему неизменной во времени, т. е. полностью отвлекаются от её в принципе возможных (а подчас даже неизбежных) изменений, поскольку их учёт не требуется для достижения цели моделирования; кроме того, предполагается, что все интересующие исследователя процессы, происходящие в системе, не требуют при своём описании развёртывания во времени, так что могут быть с достаточной точностью охарактеризованы не зависящими от времени величинами - известными и неизвестными. Поэтому в статистическом моделировании время не вводится явно. Статистические модели характеризуют моделируемую систему на какой-либо фиксированный момент времени; такой момент может представлять целый временной интервал (как правило, в качестве его конечной, средней или начальной точки), в течение которого система предполагается неизменной.
К статистической модели естественно приводят самые разнообразные задачи экономического анализа и планирования, которые допускают постановки при жёстко фиксированной структуре моделируемой системы, например, моделирование межотраслевого баланса, задача максимизации выпуска в заданном ассортименте, задача диеты, задача оптимального назначения, задача раскроя и многие другие. Значительная часть этих задач относится к сфере текущего планирования производства.
Поскольку статистические модели в формализованном виде отвлекаются от фактора времени, они всегда проще, чем динамические модели тех же экономических систем, с той или иной степенью полноты учитывающие этот фактор. Поэтому для экономико-математического моделирования типична ситуация, когда сначала разрабатываются статистические модели, а затем они усложняются введением фактора времени, т. е. преобразуются в динамические. В частности, статическими первоначально были модели межотраслевого баланса, разнообразные модели, сводимые к транспортной задаче и распределительной задаче линейного программирования (в частности, некоторые статические модели размещения производства), к задачам о потоках в сетях и т. д. В последствии для всех этих моделей были разработаны динамические аналоги и обобщения, однако подобное усложнение далеко не всегда оказывается продуктивным даже в случаях, когда динамический аспект моделируемой системы небезразличен для цели моделирования. Например, статистические модели межотраслевого баланса для одного из предстоящих лет (фиксированного) может быть подчас не менее информативной, чем динамическая модель межотраслевого баланса, развёрнутая по годам на весь период от текущего года до года, фиксированного в анализе. Объясняется это тем, что получаемые из динамической модели детальные данные об изменении экономических показателей «внутри» исследуемого периода могут быть недостаточно состоятельны со статистической точки зрения, а обобщённые в сравнении с ними итоговые данные за период, существенно более устойчивые относительно вариаций исходной информации, практически совпадают с результатами расчётов по статистическим моделям. При этом динамическая модель существенно более сложна и трудоёмка во всех отношениях.