Диссертация (1149691), страница 5
Текст из файла (страница 5)
Такое представление знаний о предметной области не является универсально употребимым:система знаний должна допускать потенциал к декомпозиции. Более того,фрагменты знаний, которые в конце концов получаются по результатамдекомпозиции должны иметь небольшую размерность [59]. Зато во фрагменте знаний, ограниченном в размере, в деталях удается охарактеризоватьсвязи между утверждениями или переменными.
Небольшой размер ФЗ неединственное ограничение; связи в получившейся системе ФЗ должны бытьв высокой степени разрежены, чтобы обрабатывать получившийся объектприемлимыми с вычислительной точки зрения алгоритмами (как по скорости работы, так и по объему требуемой памяти).Фрагменты знаний формируют локальный уровень, этот уровень обеспечивается локальными алгоритмами вывода. Связи между ФЗ формируютглобальный уровень; соответственно распространение изменений по сетисвязей обеспечивают алгоритмы глобального вывода. На локальном уровневычислительная сложность алгоритмов вывода может быть высока, однако это не оказывает существенного влияния в силу ожидаемого небольшогообъема ФЗ. Алгоритмы на глобальном уровне эффективны именно за счетразреженности связей [140; 142; 166].
Кроме того, вероятностная логика, вцелом, предоставляет более богатый и гибкий аппарат для представлениясвязи между утверждениями. Например, вероятность истинности импликации или дизъюнкции, скалярные и интервальные оценки вероятностейистинности пропозициональных формул [51; 166].Развитие информационных технологий, и ЭВМ в частности, за последние годы позволяет переложить все большую часть работы на автоматическую систему, выполняющую рутинную работу, что в большинствеслучаев ускоряет процесс производства и снижает стоимость продукта. Однако, до сиx пор требуется вмешательство человека в процесс в тот момент,когда, проанализировав небольшой объем данных, нужно принять решение.Данное обстоятельство делает очевидным необходимость развития математических моделей, моделирующих рассуждения.24Отметим, что слово «графические» в данном контексте наталкивает в некотором смысле на мнение о том, что знания представляются ввизуальной форме (диаграмма, рисунок, макет и т.д.), однако, это лишь отчасти верно, поскольку слово является переводом английского «graphical»(probabilistic graphical models) и подразумевает модели, в основе которыхлежит графовая структура.1.2.1Байесовская вероятностьДо середины XVIII века, события, рассматриваемые теорией вероятностей, носили элементарный характер и не было единого решениядля вычисления вероятности события, зависящего от некоторого другогособытия.
Эта проблема была решена английским математиком ТомасомБайесом, доказавшим частный случай теоремы, названной впоследствиитеоремой Байеса, позволявшей вычислить условную вероятность. ПозжеПьер-Симон Лаплас доказал общий случай теоремы, однако не считал ееважной для развития теории вероятностей и придерживался классическогоопределения вероятности. Кроме того развитию теории вероятностей способствовал трактат по математической логике Джорджа Буля [9].Формула условной вероятности быстро нашла применение, а в XIXвеке подавались надежды применить формулу к некоторым природнымявлениям. Например, Лаплас пытался, пользуясь теоремой Байеса, вычислить вероятность восхода Солнца [185], а Пуассон, опережая свою эпоху,применял теорию вероятностей для определения правдивости показаниясвидетелей, но ни одна из попыток не увенчалась успехом.
Интересно, чтотермин «байесовский» начал набирать популярность в 50-х годах XX векаи большая часть математических объектов и методов, называемых сегодня«байесовскими» не имеет прямого отношения в Томасу Байесу.251.2.2Развитие теорииЖелание сконструировать интуитивно понятную модель, на которуюбы можно было спроецировать образ мышления человека приводит нас кнеобходимости визуализации зависимостей между случайными элементами, характеризующими некоторые утверждения, с помощью направленногопути в графе, где вершинами являются элементы, а ребра представляютпрямые зависимости между ними.
Отметим, что если два элемента X и Yзависят не напрямую, а через еще один элемент Z, то очевидно, что в нашеймодели они также будут связаны не напрямую, а через элемент Z. Добавляя узел Z мы избавляемся от условной зависимости между X и Y, что даетвозможность создавать ситуацию условной независимости X и Y при некоторых условиях. К таким моделям относится и байесовская сеть доверия. Какбыло сказано ранее, название «байесовские» не связано напрямую с байесовскими методами, а скорее с байесовским правилом вероятностного вывода.С другой стороны, развитие вычислительной техники требует удобного представления знаний для компьютерной обработки.
В этом срезевозникает проблема вычислительной сложности алгоритмов, требующихбольших затрат времени и памяти, решаемая вероятностными графическими моделями.Рисунок 1.1 — Байесовская сеть доверияПервые шаги в развитии байесовских сетей доверия сделал американский ученый израильского происхождения, лауреат Премии Тьюринга 2011года за «фундаментальный вклад в искусственный интеллект посредствомразработки исчисления для проведения вероятностных и причинно-следственных рассуждений», Джуда Перл. Перл начал свой исследовательский26путь в области физики и электротехнике, но интерес к логическим методам в 1969 году побудил его перейти в Калифорнийский университет вЛос-Анджелесе на только что созданный факультет информатики, где через 9 лет он получил должность профессора и еще через 2 года основаллабораторию когнитивных систем, впоследствии проводившую исследования в области искусственного интеллекта, вероятностных рассуждений ипричинно-следственных рассуждений.
На базе лаборатории была опубликована в 1984 году книга «Эвристики: интеллектуальные поисковые стратегиидля автоматизированного решения проблем», в которой были собранырезультаты области алгоритмов поиска, поднявшие исследования в этомнаправлении на новый виток.Настоящим прорывом для искусственного интеллекта стала публикация в 1988 году фундаментального труда «Вероятностные рассужденияв интеллектуальных системах», собравшего в себе многолетние исследования и основанной более чем на 50 публикациях. В ряде работе Перломбыла предложен [56; 57; 59] новый подход к построению вероятностныхмоделей, основанный на использовании ациклических направленных графов, ставших впоследствии называться ВГМ. В дополнение к этому Перломбыл предложен новый алгоритм «распространения свидетельства» (beliefpropagation), используемый для вычисления апостериорных вероятностейпри условии поступления новых обуславливающих данных (свидетельства,от англ.
evidence). Данный алгоритм впоследствии лег в основу каскадногокода, способного исправлять ошибки в сообщениях, возникающие при передаче цифровой информации. Кроме того, к важным исследованиям Перластоит отнести применение метода Монте-Карло в марковских цепях, также являющихся одним из классов ВГМ, свойства условной независимостии алгоритмы обучения.Через 12 лет после публикации труда по байесовским сетям доверия выходит в свет работа «Причинность: модели, рассуждения и вывод»,удостоенная премии Лакатоса как новаторское произведение в областифилософии наук.
В работе предложен строгий математический аппаратдля определения казуальных связей в данных, а также для проведенияказуальных рассуждений. Джуда Перл является яркой фигурой в математическом сообществе, награжденный медалями Аллена Ньюэлла и27Бенджамина Франклина, лауреат премий Тьюринга, Харви и Румельхарта (2011).Другим исследователем, внесшим большой вклад в развитие байесовских сетей доверия является Финн Вернес Йенсен.
В его книгерассматриваются [48] байесовские сети доверия, алгоритмы обновлениявероятностей и обучения в них и графы принятия решений, также являющиеся языком моделирования знаний для принятия решений в условияхнеопределенности. Кроме того Йенсен описывает новое разработанное программное обеспечение для построения и проведения вывода в байесовскихсетях доверия.1.2.3Задачи классификации как пример приложенияПопробовав проследить за циклом действий эксперта в предметнойобласти, мы получим следующий алгоритм действий: получение данных осостоянии системы, принятие некоторых решений на основании полученных ранее данных об ожидаемом результате, сопоставление ожидаемогорезультата с полученным и внесение коррективов в базу знаний.
На данной модели действий были основаны первые экспертные системы, цельюкоторых было моделирование рассуждений человека. В дальнейшем былодобавлено применение теория вероятностей вместо рассуждений с учетомнеопределенности в правилах, а также процедура «обучения» экспертнойсистемы вместо полной ее реконструкции. На сегодняшний день байесовские сети доверия находят применение в распознавание образов [60;65], интеллектуальные системах поддержки принятия решений и рекомендательных системах [8; 12; 27], системах моделирования рисков иобнаружения отказов [13; 31; 67], оценки повреждений и мониторинга состояния здоровья [4; 10; 61] и системах моделирования отклика экологическихсистем на различные изменения и воздействия [24; 33].Одним из наглядных примеров использования байесовских сетей доверия является интернет-сервис Surfingbird [30].















