Диссертация (1149691), страница 4
Текст из файла (страница 4)
В последнем разделе первой главы описывается подход кдекомпозиции данных, применяемый в вероятностных графических моделях и мотивация его использования в контексте больших объемов данныхс неопределенностью. Наконец, в первой главе дается обоснование цели изадач настоящего диссертационного исследования.Во второй главе вводятся основы необходимого теоретического аппарата, используемого в последующих главах диссертации. Материалыданной главы в подавляющей части основаны на работах В.И. Городецкого,А.Л. Тулупьева и А.В.
Сироткина. В данной главе рассмотрены локальные и глобальные структуры алгебраических байесовских сетей, а такжемножества элементов, лежащих в их основе. Даны определения непротиворечивости для различных видов оценок вероятностей, рассмотреныалгоритмы априорного и апостериорного вывода, а также описаны видыглобальных структур АБС и алгоритмы их синтеза.Как отмечалось выше, первая и вторая глава носят систематизирующий и обзорный характер. Они содержат результаты, важные длядальнейшего развития, и создают задел для исследований, теоретическиерезультаты которых приведены в третьей главе настоящей работы.Третья глава содержит описание теоретических результатов, полученных соискателем.
Во втором разделе приводятся матрицы перехода отвектора вероятностей идеала дизъюнктов к вероятностям иных моделейфрагментов знаний. Третий раздел главы посвящен матрично-векторнымуравнениям для решения первой и второй задач локального апостериорноговывода. Полученные уравнения используются для построения в четвертомразделе задач линейного программирования для случая неточных оценок вероятностей в фрагменте знаний или поступающем свидетельстве.В следующем параграфе с помощью битовых операций выражены компоненты векторов, являющихся нормирующими множителями в уравненияхапостериорного вывода.
Наконец шестой раздел посвящен оценкам чувствительности первой задачи апостериорного вывода к вариации входныхданных. Каждый из вышеприведенных результатов получен для всех трехмоделей фрагментов знаний (идеал конъюнктов, идеал дизъюнктов и наборпропозиций-квантов).В восьмом параграфе предложена и доказана теорема,19постулирующая матрицу для формирования вектора вероятностей элементов фрагмента-сепаратора в рамках глобального апостериорного вывода.Завершается глава описанием и доказательством корректности инкрементального алгоритма для синтеза минимального графа смежности, а такжешагами, описывающимиВ четвертой главе содержится описание комплекса программ, реализующего на языке C# алгоритмы, описанные в третьей главе.
Реализацияалгоритмов и объектов алгебраических байесовских сетей структурированапо четырем основным пространствам имен: пространство kp, содержащееописание структур данных фрагментов знаний, пространство evidence, содержащее описание структуры свидетельства и пространства inferrer иpropagator, содержащие интерфейсы и классы с реализацией алгоритмоваприорного и апостериорного вывода соответственно. Описание функциональности каждого из классов указанных пакетов дополнено примерамииспользования библиотеки. Третий и четвертый разделы данной главыпосвящены описанию графического пользовательского интерфейса настольного приложения, дающего доступ к функционалу математическойбиблиотеки, и графического интерфейса веб-приложения для коллаборативной работы с структурами и визуализациями алгебраических байесовских сетей.В заключении приведены итоги выполненного исследования, сформулированы рекомендации по применению результатов работы и освещеныперспективы дальнейшей разработки тематики.20Глава 1.
Обзор предметной области1.1ВведениеСреди существующих современных интеллектуальных систем поддержки принятия решений можно выделить несколько идеологическихподходов, на которых они базируются:1. Системы типа «IF-THEN» (продукционные системы) [64; 75]. Онистроятся на основе определенного набора правил, зачастую вербализованных, которые определяют истинность одних утвержденийна основе истинности других.
В таких системах существенно осложняется задание стохастических закономерностей, когда истинностьодних утверждений не приводит к истинности других, но существенно увеличивает вероятность их истинности.2. Системы, построенные на моделях вероятностной логики, такиекак байесовские сети доверия [48; 58] или марковские сети [28].Такие системы эффективно используют оценки вероятности истинности, но при этом возникают заметные проблемы при поступлениипротиворечивой, неточной или нечисловой информации. Указанные системы требуют, чтобы были заданы точечные оценки вероятностей, в то время как при поступлении нечисловой или неточнойинформации требуется использование интервальных оценок; сведение нечисловой или неточной информации к набору точечныхоценок зависит от сиюминутных невоспроизводимых субъективныхоценок эксперта.3.
Системы, построенные на основе различных мер истинности, такихкак мера доверия и правдоподобия, необходимости и возможности, или семействе нечетких мер, в частности, на мерах Сугено.К недостаткам данного вида систем часто относят отсутствие «физического смысла», стоящего за получаемыми оценками, а такжето, что указанные системы недостаточно хорошо учитывают структуру взаимоотношений между различными элементами системызнаний [18; 19; 84].214. Системы, основанные на стохастическом моделировании (например, по Гиббсу) предметной среды на основе заданных параметров.К недостаткам данных систем можно отнести высокую сложностьоценки надежности, воспроизводимости или достоверности получаемых результатов [25; 68].5.
Различные гибридные системы, сочетающие несколько выше названных подходов. Несмотря на то, что такие системы могутсочетать положительные качества нескольких подходов, согласование получаемых разными путями выводов, оценок или заключенийстановится затруднительным, поскольку, в первую очередь, требует согласованного использования весьма разных теоретическихаппаратов [117; 156; 166; 186; 187].В свою очередь можно заметить, что эти подходы условно разделяются по преобладающему аспекту отражения особенностей системызнаний на два класса [126; 157].
Первый класс состоит «сетевых» подходов,которые достаточно успешно справляются с представлением причинноследственной структуры над всей доступной системой знаний о предметнойобласти (к ним относятся, например, байесовские сети доверия и продукционные системы). Второй класс состоит из подходов, «оперирующихоценками истинности над фрагментом знаний» (т.е.
над небольшим набором утверждений о предметной области, связи между которыми можноохарактеризовать достаточно полно). Подходы второго класса снабженыглубоко проработанным теоретическим аппаратом мер истинности утверждений (например, вероятностная мера в рамках вероятностной логики ипарадигмы неточных вероятностей (imprecise probabilities), нечеткие меры,меры доверия и правдоподобия, меры необходимости и возможности) [156].Хотя первый класс подходов успешно справляется с «сетевыми»аспектами представления знаний, он имеет определенные затрудненияв представлении их неопределенности. Например, в байесовских сетяхдоверия не рассматриваются систематически интервальные оценки вероятности, в них невозможно использовать иные упоминавшиеся выше мерынеопределенности истинности [145]. В продукционных системах аппаратобработки неопределенностей носит, как правило, «присоединенный характер»; в отношении этого аппарата не решен вопрос о получаемых в22результате вычислений оценках истинности — насколько они соответствуют аксиоматике изначально выбранной меры истинности [123].
Во второмклассе подходов достаточно тщательно изучаются математические свойства мер истинности в условиях, когда они определены над небольшимчислом атомарных утверждений о предметной области, т.е., фактически,над «фрагментом знаний», однако, как правило, ничего не говорится о том,как представлять и обрабатывать несколько фрагментов знаний, как делать вывод на основе всех имеющихся фрагментов знаний о предметнойобласти [136; 137; 142; 171].1.2Байесовские сети доверияОсновной материал настоящего раздела был опубликован в единоличной работе соискателя [87]. Уже много веков люди стараются предугадатьисход того или иного события, авантюры, игры, оценить вероятность успеха исследования.
Древние римляне и греки, движимые во многом тягой кматериальным благам, обожествляли «случай», наделяя богиню Фортуну(Тихе) способностью даровать удачу. Очевидная популярность Фортуны,дошедшая до наших дней под различными именами говорит о том, что досих пор человек не в силах самостоятельно полностью проанализироватьнекоторые ситуации и сделать верный вывод о вероятности благоприятногоисхода и порой полагается на «случай». Однако, развитие математических моделей и применяемых к ним методов, происходящее на протяжениивторого тысячелетия, дополненное появлением вычислительной техникивысокой мощности, позволяет сократить «слепую зону», в которой можнонадеяться лишь на интуицию.За последнее столетие развитие средств коммуникации, интернета итехники в информатике вкупе с глобализацией делают доступными существенные объемы данных, которые продолжают расти и требуют большихзатрат на обработку.
Среди прочих данных стоит отметить данные с неопределенностью, выражаемой как недостатком или потерей данных, так инеточностью в данных, выраженной, например, человеческим фактором.Как пример таких данных можно привести интервальную оценку, данную23экспертом в каком-либо вопросе. Вероятностные графические модели призваны сделать обработку таких данных, за приемлемое время, возможной.С точки зрения искусственного интеллекта, вероятностные графические модели можно рассматривать как представление баз знаний или, болеедетально, баз фрагментов знаний с неопределенностью.















