Калиткин, Карпенко, Михайлов, Тишкин, Черненков - Математические модели природы и общества - 2005 (947500), страница 61
Текст из файла (страница 61)
Далее следует выделить среди изоморфных штаммов группу, состоящую из к «потенциально компетентныхь штампов (ГПК). В нее будут включаться изоморфные штаммы с наиболыцей похожестью на базовый штамм гр Меру похожести между штаммами можно оценивать разными способами. Если ориентироваться на абсолютные значения характеристик их элементов, то можно использовать евклидово расстояние между штам- мами: и .,з Е Ь вЂ” Ьядг рП В ГПК отбирается й штаммов с наименьшими расстояниями Виля. Э 2 Прогнозирование зникгнии локизитзлгй оиу шющимсл 299 Если считать, что работа идет с данными, измеренными в шкале отношений, то похожесть двух штаммов можно обнаружить через расстояние между соответствующими отношениями: Инвариантами шкалы интервалов являются расстояния между отношениями интервалов: Хорошими свойствами обладает мера Лкаика )б].
выражающая степень похожести Р объектов через расстояние Л между ними: Р, Ггм Для всех приведенных выше сальных шкал похожесть штаммов можно определять и по модулю коэффициента корреляции между значениями соответствующих элементов этих штаммов. Если в таблице представлены данные, измеренные в более слабых шкалах (порядка и наименований), то для измерения расстояния между штаммами можно воспользоваться любыми другими мерами.
На следующем этапе проверяется, является ли данная ГПК на самом деле компетентной. Чтобы обосновать процедуру такой проверки, достаточно вспомнить смысл гипотезы компактности Н. Из нее следует, что сначала нужно удостовериться, что объекты множества (А,у) компактны в пространстве описывающих характеристик Л'. В данном случае имеется множество А из й штаммов, входящих в ГПК. Пространство Х имеет размерность, равную С. Каждая д-я характеристика этого пространства есть номер д-го элемента базового штамма.
Значение этого элемента Ьхл и есть значение д-й. характеристики объекта (в данном случае базового штамма). Для изоморфного штамма, сдвинутого относительно базового на р моментов времени назад, значение д-й характеристики равно значению Ь ызчй элемента, находящегося в клеточке с координатами иЯЕ Ь + р). Таким образом, мы имеем дело с множеством А обьектов в С-мерном пространстве Х. Эти объекты были отобраны по критерию похожести на базовый штамм Гп Если критерий похожести принять в качестве критерия компактности, то условие компактности Сну для множества штаммов из ГПК выполня- х ется автоматически. Добавим к Л еще одну — целевую характеристику , т.е. еще один элемент таблицы. Пусть для базового штамма этим элементом будет тот, значение которого требуется предсказать, т.е. Ь,о.
Соответственно к каждому штамму из ГПК добавим по одному известному ЗООРь (г ~Иитемшиичеекое моделирование сложных тррдноСЬормилиеремых элементу Ь, „. Теперь появляется возможность проверить, выполняется ли условие компактности для целевой характеристики у объектов множества (, входящих в ГПК. Условие компактности для значений одной характеристики может быть определено по-разному. Например, по величине дисперсии значений, по разности между =чия и -„,„„. и т. д.
Если условие компактности для - на штаммах множества А не выполняется, то это означает, что по свойствам Х они похожи друг на друга, а по свойству е не похожи. Следовательно, между свойствами Х и з этих объектов закономерной связи нет, и нет оснований рассчитывать на успешное прогнозирование целевого свойства с опорой на штаммы из данной группы. Такая ГПК не включается в список компетентных групп. Она и породивший ее базовый штамм из дальнейшего рассмотрения исключаются. Если же штаммы данной ГПК оказались компактными в пространстве свойств (Х, з), то они совместно со своим базовым штаммом образуют группу компетентных штаммов [7).
Затем вся описанная последовательность процедур повторяется для другого штамма той же мощности С, но другой архитектуры. Таким способом множество базовых штаммов порождает коллектив из И' групп компетентных штаммов мощности С. 2.4. Выработка частных вариантов прогноза. Стратегии прогнозирования зависят от того, какие отношения между элементами разных штаммов считаются инвариантными при переходе от одного штамма к другому (т.е.
постоянными для разных моментов времени). Если считать, что информативными являются абсолютные значения соответствующих элементов штаммов, то значение прогнозируемого элемента Ь, о можно найти по абсолютным значениям Й соответствующих элементов (предикторов), связанных с компетентными штампами данной группы, т.е. с элементами 6, . Следует напомнить, что количество разных компетентных базовых штаммов моппюсти С равно И', так что в прогнозировании элемента Ь,о может принять участие И х /с предикторов (И' групп по й прсдикторов). Если предполагается линейная зависимость между соответствующими элементами разных штаммов, то можно воспользоваться прогнозированием с помощью линейной регрессии. Строится линейная регрессия между С элементами базового и р-го компетентного штаммов. Подстановка элемента 6, „в уравнение этой регрессии позволяет получить величину Ь,о в качестве р-го варианта прогноза для элемента Ь,,о.
Аналогично получаются и все другие 6 вариантов прогноза для штамлюв этой группы: Ьщ о, Ь,о, ..., Ьрлл,...,Ььло.Здесь, как и в предыдущем случае, общее число предикторов (и вырабатываемых ими частных прогнозов) равно (И х 6. Кроме этого, если предположить, что отношения между элементом Ь,„и всеми ст-ыи элементами данного штамма 6 Оч р~ такие же, как и отношения межлу элементом Ь, о базового штамма и всеми его элементами Ь л. Тогда можно получить С вариантов значения прогнози- р 2 Прогнозировшвив знвивнии покизижвлвй обччиющи,исл 301 руемого элемента с опорой на каждый ь-й элемент р-го компетентного штамма: (й,,о = ((ах х б .р) г(п,р, икал '" (вэ г х (вир1)Г(ркр (вдв.о = (охз и вср) (оюр, йпв.в -- (осси х (й,р)г(сдр.
В этом случае роль предиктора играет каждый элемент штамма в отдельности, так что каждый р — й штамм представляет собой набор из С предикторов, а все й гвтаымов из компетентной группы образуют коллектив из й групп по С предикторов. Общее число предикторов (частных прогнозов) для этого случая будет равным В' х й х С (И' коллективов по к групп из Сз предикторов). Возможны и другие способы получения вариантов прогноза для данных, измеренных как в количественных, так и в любых других шкалах. Эти способы в основном зависят от располагаемой априорной информации о характере исходных данных.
2.5. Получение окончательного прогноза. Частные прогнозы получены с помощью предикторов, организованных в иерархическую структуру: отдельные предикторы обьсдиняквтся в группы, которые объединяются в коллективы и т.д. Фактически это коллективно-групповой метод прогнозирования (КГМ). При свертке частных решений в общее имеет смысл обратить внимание па тот факт, что компетентность всех предикторов, породивших эти решения, превышает некоторый порог, но может быть неодинаковой. В результате разные группы предикторов вырабатывают разные наборы частных решений. Можно рассчитывать на то, что более компетентные группы будут выдавать более точные прогнозы, Но компетентность групп проверялась по критерию компактности на множестве известных элементов Л и отражала ситуацию в прошлом.
Так делается обычно при ретроспективном выборе стратегий прогнозирования или распознавания: лучи~ей считается та стратегия, применение которой приводило к наименьшей сумме ошибок прогноза известных элементов. Однако экспериментально нередко обнаруживается, что в ряде случаев лучшие результаты дают некоторые другие стратегии, а не та, которая была лучшей «в среднем». По-видимому, они более точно соответствуют тем закономерностям процесса, которые проявляют себя в данный конкретный момент. Соответственно возникает вопрос: какую же стратегию использовать для реального прогнозирования неизвестных величин) Где гарантия, что стратегия, чаще других в прошлом приводившая к успеху, будет лучшей и в этом конкретном случае) Гипотеза компактности позволяет ответить на этот вопрос. Из нее следует, что истинная компетентность груггпы предикторов должна 302Гл.
е' гИатематическае .иаделирааание слетает труднафармализуемегл проявляться не только в компактности объектов (Л,у) в пространстве Х и компактности объектов Л в пространстве (Х,з), но и в компактности вариантов прогноза характеристики з объекта г!. Теперь, когда эти варианты найдены, можно оцецить компактность прогнозов, полученных от группы предикторов Г', например, через дисперсию их значений Тлу.
Как показывают эксперименты, дисперсионный критерий оказывается в большинстве случаев очень информативным: корреляция между 7дг и ошибкой прогнозирования достигает величины +0,7. Опираясь на это, в качестве меры компетентности группы 7' целесообразно принимать величину Лу .=. 1,г(1 + Оу). Введение описанного выше дисперсионного критерия позволяет сформулировать следующий принцип выбора стратегий (в нашем случае — групповых предикторов): следует применять все имеющиеся в распоряжении стратегии и отдавать предпочтение той из них, которая дает варианты прогноза, обладающие наименьшей дисперсией. Эта эмпирическая гипотеза отражает закономерность более высокого уровня (метазакономерность) по сравнению с традиционно используемой гипотезой о том, что хорошие результаты в прошлом обеспечивают хорошие результаты и в будушем. С учетом сказанного выше процедура получения обобщенного решения состоит в следующем.
Вначале на базе частных решений для каждой группы 7' вырабатывается групповое решение Вг. При прогнозировании в качестве группового регцения может быть использовано среднеарифметическое значение частных прогнозов или их медиана. Вычисляется также характеристика компетентности группы Ьу. Эти характеристики находятся для всех й групп предикторов из коллектива групп, участвовавших в прогнозировании.
Обобщенное решение (В) на следующем иерархическом уровне (на уровне коллектива) может быть получено с использованием параметрического семейства функций взвец~енного усреднения групповых решении: (Вг х Ц) у ц Здесь величина показателя степени о отражает стратегию учета влияния компетентности. Если о = О, то решения всех групп учитываются с равными весами. С ростом о растет влияние более компетентных групп. При очень больших значениях т в усреднении участвуют одна или несколько самых компетентных групп. Если в прогнозировании участвовал один коллектив групповых предикторов, то величина коллективного решения (В) принимается в качестве окончательного значения пропюзируемой величины б,а. Если определить дисперсию групповых прогнозов, то можно получить представление о компетентности коллектива в целом и о величине ожидаемой ошибки данного прогноза.
Э 2 Прогнозирование значении показателей абучаюи~имея 303 Метод допускает использование не одного коллектива, а множества из г1г коллективов. Новые коллективы могут порождаться базовыми штаммами, мощность которых отличается от С. В этом случае по формуле, аналогичной вышеприведенной, делается взвешенное усреднение коллективных решений. На рис. 2 представлена схема многоуровневого алгоритма, коллективно-группового прогнозирования.