Главная » Просмотр файлов » Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006)

Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 175

Файл №1245267 Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006)) 175 страницаРассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267) страница 1752021-01-15СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 175)

Но в случае вероятностей, с другой стороны, утверждения относятся не непосредственно к самому миру, а к собственному состоянию знаний агента. В таком случае, почему агент не мог бы иметь приведенное ниже множество убеждений, которое явно нарушает аксиому 3? р(а) = 0.4 р(а л Ы = 0.0 Р~Ь) = 0.3 Р(а ч Ь) = 0.8 Такого рода вопрос был предметом яростных дебатов, продолжавшихся в течение нескольких десятилетий, между теми, кто отстаивал допустимость использования вероятностей как единственной обоснованной формы оценки степеней уверенности, и теми, кто отстаивал альтернативные подходы.

В данном разделе мы приведем один довод в пользу аксиом вероятностей, впервые сформулированный в! 931 году в работах Бруно де Финетти (Вгнпо де Р(пе((1). Ключом к этому доводу де Финетти является связь мехду степенью уверенности и действиями. Идея состоит в том, что если агент имеет некоторую степень уверенности в истинности высказывания а, то агент должен быть способен сформулировать оценку того, в какой степени он безразличен к ставке за или против высказывания гь Рассмотрим эту ситуацию как игру между двумя агентами: агент 1 утверждает "моя степень уверенности в истинности события а равна 0,4". Затем агент 2 вправе выбрать, будет ли он делать ставку за или против высказывания а, применяя суммы, которые совместимы с заявленной степенью уверенности. Это означает, что агент 2 может решить сделать ставку на то, что событие а произойдет, поставив 4 доллара против 6 долларов агента 1. С другой стороны, агент 2 может поставить 6 долларов против 4, что А не произойдет'.

Если степень уверенности агента не точно отражает состояние мира, можно вполне рассчитывать на то, что в долговременной перспективе он будет проигрывать деньги агенту-противнику, убеждения которого более точно отражают состояние мира. Но де Финетти доказал гораздо более сильное утверждение: гв- если агент 1 руководствуется мнозкеством степеней уверенности, которое нарушаегл аксиомы теории вероятностей, та существует такая комбинация ставок агента 2, которая гарантирует, что агент 1 будет терять деньги при каждой ставке. Поэтому, если вы придерживаетесь той идеи, что агент должен стремиться "ставить свои деньги на те события, вероятности которых выше", то должны также признать, что нерационально иметь такие убеждения, которые нарушают аксиомы вероятностей.

' Можно бьшо бы возразить, что предпочтения агента применительно к балансам разных стааок являются таковыми, что возможность потерять 1 доллар не уравновешивается равной возможностью выиграть 1 доллар Один из возможных ответов на это возражение состоит а том, по суммы ставок должны быть достаточно малыми для того, 'побы можно бьшо избежать данной проблемы. Анализ, проведенный Оэвелжем 1!3541, позволяет полностью исключить из рассмотрения эту проблему.

638 Часть У. Неопределенные знания и рассуждения в условиях неопределенности На первый взгляд может показаться, что эта игра со ставками довольно надумана. Например, что было бы, если один из агентов отказался бы делать ставки? Закончился бы на этом спор? Ответ на данный вопрос состоит в том, что эта игра со ставками представляет собой абстрактную модель для ситуации принятия решений, в которую любой агент неизбежно вовлечен в любой момент своего существования. Каждое действие (включая бездействие) — это своего рода ставка, а каждый результат может рассматриваться как положительное или отрицательное вознаграждение за эту ставку.

Отказ делать ставку аналогичен решению предоставить все естественному течению событий. Мы не будем доказывать представленную выше теорему де Финетти, а приведем один пример. Предположим, что агент 1 руководствуется множеством степеней уверенности, приведенным в уравнении !3.3. В табл. !3.1 показано, что если агент 2 решит делать ставки 4 доллара на событие а, 3 доллара — на событие Ь и 2 доллара на событие !а ч Ь), то агент ! будет всегда терять деньги, независимо от результатов а и Ь.

Таблица 13.1. Пример того, что при наличии у агента 1 несогласованных убеждений агент 2 получает возможности составить множество ставок, которое гарантирует потери для агента 1, независимо от результатов а и Ь Результат для Агента ! Агент 1 Агент 2 Высказы- Степень Ставка Сумма а л Ь е л Ь а л Ь о л Ь ванне уверен- ставки ности 0.4 а 4-6 — б — б 4 0.З Ь 3 — 7 — 7 3 -7 з 0.8 (е ч Ь! 2 — 8 2 2 2 — 8 ачЬ В пользу применения вероятностей были выдвинуты и другие весомые философские аргументы; к числу наиболее широко известных из них относятся сформулированные Коксом !304! и Карнапом [225!.

Но лгир таков, каким он является, и практические свидетельства иногда становятся более весомыми, чем доказательства. Успех систем формирования рассуждений, основанных на теории вероятностей, оказался гораздо более привлекательным стимулом, который вызвал пересмотр многих взглялов. В следуюгцем разделе будет показано, как описанные выше аксиомы могут быть применены для составления логических выводов. 13.4. ЛОГИЧЕСКИЙ ВЫВОД С ИСПОЛЬЗОВАНИЕМ ПОЛНЫХ СОВМЕСТНЫХ РАСПРЕДЕЛЕНИЙ В данном разделе будет описан простой метод 'в. вероятностного вывода, т.е. вычисления апостериорных вероятностей для высказываний, заданных в виде запросов, на основании наблюдаемых свидетельств. Мы будем использовать полное совместное распределение как своего рода "базу знаний'*, из которой могут быть выве- б39 Глава 13.

Неопределенность Таблица 13.2. Полное совместное распределение для мира тоосьасве, саех су, свесь Соослас)те Сосс)зесле сеСсп сассй саесп са Ссп саихсу сао1Су 0.108 О. 016 0.012 0.064 0.072 0.144 О.ОО8 0.576 Обратите внимание на то, что вероятности в этом совместном распределении в сумме составляют 1, как и требуется согласно аксиомам вероятностей.

Следует также отметить, что уравнение 13.2 предоставляет нам прямой способ вычисления вероятности любого высказывания, простого или сложного: мы должны определить те атомарные события, в которых данное высказывание является истинным, и сложить их вероятности. Например, имеется шесть атомарных событий, в которых истинным является высказывание сауйеу о Соое)тас)те: Р(сао1 Су м Ссос)час)зе) = О.

108 + О. 012 + О. 072 + О. 008 + О. 016 0.064 = 0.28 Одна из задач, которая встречается особенно часто, состоит в том, чтобы извлечь из подобной таблицы распределение вероятностей по некоторому подмножеству переменных или по одной переменной. Например, складывая элементы первого ряда табл. 13.2, получим безусловную, или сх маргинальную, вероятность" события сатт1 Су Р(сао1су) = О 108 + О 012 + О 072 + 0.008 = О 2 Такой процесс называется Ъ. маргинализацией, или исключением из суммы, поскольку из суммы вероятностей исключаются прочие переменные, кроме Сау1Су.

Можно записать следуюгцее общее правило маргинализации для любых множеств переменных х и вк Р(Х) = ~~) Р(Х,а) (13.4) Это означает, что распределение вероятностей по т может быть получено путем исключения из суммы вероятностей всех прочих переменных, относящихся к любому совместному распределению вероятностей, содержащему х. В одном из вариантов этого правила учитываются условные вероятности, а не совместные вероятности с использованием правила произведения: з Эта вероятность получила такое название, поскольку страховщики имеют общую привычку записывать суммы наблюдаемых частот собьпий на полях (татшп) таблиц страхования.

лены ответы на все вопросы. В ходе этого мы также представим несколько полезных методов манипулирования уравнениями, в которых учитываются вероятности. Начнем с очень простого примера — с описания проблемной области, состоящей только из трех булевых переменных, тоос)зас)те, Сатхсу и Сасс)7 (неприятные ощущения от захвата зуба стальными клешами дантиста все еще свежи в памяти автора). Полное совместное распределение представляет собой таблицу с размерами 2х2 х2 (табл.

13.2). 640 Часть Ч. Неопределенные знания и рассуждения в условиях неопределенности (х) = ~) Р(х! )щ ) Это правило называется правилом ахобусловливания. Как оказалось, правила маргинализации и обусловливания являются очень полезными правилами для всех видов логических выводов, в которых применяются вероятностные выражения. В большинстве случаев нас будет интересовать задача вычисления условных вероятностей некоторых переменных при наличии свидетельств, касающихся других переменных, Условные вероятности можно найти, вначале воспользовавшись уравнением ]3.1 для получения выражения в терминах безусловных вероятностей, а затем рассчитав это выражение на основании полного совместного распределения.

Например, можно вычислить вероятность наличия дупла после получения свидетельства о том, что пациент страдает от зубной боли, следующим образом; Р(сатхс а Еоос)засае) Р(саи1су]ссасаасле) Р(ссосаас)зе) 0.108 + 0.012 0.108 ч 0.012 + 0.016 ь 0.064 Просто для проверки мы можем также рассчитать вероятность того, что у пациента нет дупла, если у него наблюдается зубная боль: Р! са >хсу а Есасдасде) Р( са>4су] Есосдаспе) Р( Еаасласпе) 0.016<0.064 0.108 а 0.012 . 0.016 е 0.064 Обратите внимание на то, что в этих двух примерах вычисления вероятности терм 16 Р( еооШас)зе) остается постоянным, независимо от того, какое значение Саму еу вычисляется.

Фактически этот терм может рассматриваться как константа 'ж нормализации для распределения Р(сау1еу( евое)зас)зе), гарантирующая, что полученные вероятности в сумме составят 1. Во всех главах этой книги, где речь идет о вероятностях, для обозначения подобных констант будем использовать символ 01 С помощью такого обозначения можно записать лва приведенных выше уравнения в виде олного: Р(са>хеу] ссаеьасде) = и Р(саНеу, ееее)заеме) ) — а (Р(са>хеу, есаеаасле, саеса) ь Р(сачхеу, ееаеаасае, саеса) ] и (<0.108,0.016> + <0.012,0.064>] = а <0.12,0.08> = <0.6,0.4> Как оказалось, нормализация является полезным сокращением во многих вероятностных вычислениях.

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6473
Авторов
на СтудИзбе
304
Средний доход
с одного платного файла
Обучение Подробнее