Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 173
Текст из файла (страница 173)
Например, высказывание саН су эквивалентно дизъюнкции атомарных событий сат Есу л соос)час)зеи самйсу л — сооспаспе. В упр. 13.4 предлагается доказать некоторые из этих свойств. Априорная вероятность 'ш. Безусловная, или 'а. априорная, вероятность, связанная с высказыванием а, представляет собой степень уверенности, относяшуюся к этому высказыванию в отсутствии любой другой информации; она записывается как р)а) . Например, если априорная вероятность того, что у пациента в зубе имеется дупло, равна 0,1, то можно записать следующее: Р(СаНСу = Сгие) = 0.1 или Р)саНСу) = 0.1 Важно помнить, что вероятность Р)а) может использоваться, только если нет другой информации. Как только становится известной какая-то новая информация, мы должны проводить рассуждения с условной вероятностью высказывания а, в которой учитывается эта новая информация.
Условные вероятности рассматриваются в следующем разделе. Иногда приходится вести речь о вероятностях всех возможных значений случай'- ной переменной. В этом случае используется такое выражение, как Р)й)еас)зех), которое обозначает вектор значений для вероятностей каждого отдельного состоя- ' Во многих стандартных определениях теории вероятностей в качестве примитивных рассматриваютсл атомарныс события, известные также под названием элементов выборка, а случайная переменная задается как функиия, принимающая атомарное событие в качестве параметра и возврашэюшая значение из соответствуюшей области определения. Возможно, что такой подход является более об~дкм, но вместе с тем он менее понятен интуитивно.
631 Глава 13. Неопределенность ния погоды. Таким образом, вместо того, чтобы записывать следующие четыре уравнения: Р(аеас)зег = анапу) = 0.7 Р()аеас)зег = газп) = 0.2 Р(уеасйег = с1оис)у) = 0.08 Р((теаг)зег = апов) = 0.02 можно просто применить такую запись: Р(йгеас)зег) = ( 0.7,0.2,0.08,0.02 ) В этом выражении определено ск распределение априорных вероятностей дзгя случайной переменной й)еае)зег. Кроме того, такие выражения, как Р(й(еае)зег, Саиуеу), МОГУТ использоваться для обозначения вероятностей всех комбинаций значений множества случайных переменных'.
В этом случае выражение Р(йгеае)зег, саид су) можно представить с помощью таблицы вероятностей с размерами 4х2. Такая таблица называется Са СОВМЕСТНЫМ раеирвдЕЛЕНИЕМ ВЕрОятНОСтЕй ПЕРЕМЕННЫХ йГЕа Е)ЗЕГ И СаЗгу Оу. Иногда возникает необходимость рассматривать полное множество случайных переменных, используемых для описания мира. Совместное распределение вероятностей, которое охватывает указанное полное множество, называется Ъ. полным совместным распределением вероятностей. Например, если мир состоит только из переменных сазгйеу, тосе)зас)зе и йгеаейег, то полное совместное распределение определяется следующим выражением: В(са згу,т Ед )зе,)таас)тег) Это совместное распределение может быть представлено в виде таблицы с размерами 2х2х4, имеющей 16 элементов.
Полное совместное распределение вероятностей задает вероятность каждого атомарного события и поэтому представляет собой полную спецификацию неопределенности знаний некоего лица о рассматриваемом мире. Как будет показано в разделе 13.4, с помощью полного совместного распрелеления можно получить ответ на любой запрос, касающийся вероятностных знаний. Для непрерывных переменных возможность записать все распределение в виде таблицы просто исключена, поскольку количество значений бесконечно велико. Вместо этого обычно определяется вероятность, которую принимает случайная переменная при некотором значении х, в виде параметризованной функции от х. Например, допустим, что случайная переменная х обозначает прогноз максимальной температуры воздуха на завтра в Беркли.
В таком случае следующее высказывание: Р(Х = х) = Щ18,26)(х) выражает уверенность в том, что значение х распределено равномерно между 18 и 26 градусами Цельсия. (Некоторые полезные непрерывные распределения описаны в приложении А.) Вероятностные распределения для непрерывных переменных называются 'ъ функциями плотности вероятностей. Функции плотности отличаются по смыслу от дискретных распределений. Например, с использованием распределения температур, з Обшее правило применения этого обозначения состоит в том, что распрелеление охватывает все значения переменных, имена которых записаны е прописной буквы.
Таким образом, выраже- НИЕ Р ( ИЕаг)ЗЕГ, СаЗг1гу) — ЭтО ЧЕтЫРЕХЭЛЕМЕНтНЫй ВЕКтОр ВврОятисствй дпя КОНЫОНКинн Каждого высказывания о состоянии погоды е высказыванием саиз еу= его е. 632 Часть У. Неопределенные знания н рассуждения в условиях неопределенности приведенного выше, можно найти, что Р(Х = 20.5) =0[18,261 (20.5) =0.125с'С Это не означает, что имеется 12,5% шансов на то, что завтра максимальная температура будет точно равна 20,5 градуса; вероятность того, что это произойдет, разумеется, равна нулю.
Формальный смысл приведенного выше выражения состоит втом, что вероятность пребывания значений температуры в небольшом регионе вокруг 20,5 градуса равна в этих пределах значению 0,125, деленному на ширину региона в градусах Цельсия: 11сп Р(20. 5 < Х < 20. 5ьсос) с'с(х = О. 125,'С а -~о Некоторые авторы используют разные символы для дискретных распределений и функций плотности, а авторы данной книги в обоих случаях используют обозначение Р, поскольку путаница возникает редко и уравнения для обоих случаев обычно одинаковы. Следует учитывать, что вероятности обозначаются безразмерными числами, а функции плотности измеряются с помошью некоторой единицы, в данном примере в качестве такой единицы применяется единица измерения, обратная градусам Цельсия. Условная вероятность После того как агент получает определенное свидетельство, касающееся ранее неизвестных случайных переменных, составляющих рассматриваемую проблемную область, априорные вероятности становятся больше не применимыми.
Вместо этого должны использоваться 'ох условные, или 'ск апостериориые, вероятности. При этом используется обозначение' Р(а ~ Ь), где а и Ь вЂ” любые высказывания. Это обозначение читается как "вероятность а, при условии, что все, что нам известно, — это Ь". Например, следующее выражение; Р(сачдсу) Соосдасле) = 0.8 показывает, что если наблюдается пациент, имеющий зубную боль, и еше не получена какая-либо иная информация, то вероятность наличия у этого пациента дупла в зубе составляет 0,8. Априорная вероятность, такая как Р(саут Еу), может рассматриваться как частный случай условной вероятности, Р ( сауз Еу ~ ), где условием вероятности является отсутствие свидетельства. Условные вероятности могут быть определены в терминах безусловных вероятностей.
Таким определяющим уравнением является следуюшее, которое остается истинным, если Р(Ь) > 0: Р(а л Ь) Р(а)Ь) = (13.1) Это уравнение может быть также записано следующим образом и в таком виде называется ск правилом произведения: Р(а л Ь) = Р(а)Ь) Р(Ь) По-видимому, правило произведения запомнить проще; оно основано на таком факте: лля того чтобы а и Ь были истинными, необходимо, чтобы Ь было истинным, ' Оператор 1 имеет наименьший возможный приоризет, позтому выражение Р(а л Ь 1 с м с)) означает Р( (а л Ь) 1 (с м с() ). 633 Глава 13.
Неопределенность а также необходимо, чтобы а было истинным, если дано Ь. Такое же утверждение можно выразить иначе: Р(а л Ь) = Р(Ь( а) Р( а) В некоторых случаях проще формировать рассуждения в терминах априорных вероятностей конъюнкций, но чаще всего мы в качестве своего основного инструмента для вероятностного логического вывода будем использовать условные вероятности.
Кроме того, для условных распределений может использоваться обозначение Р. Выражение Р (х~ у) задает значения выражения Р(х=х, ~ у=у, ) для каждой возможной комбинации Т, 31 В качестве примера того, что с помощью векторного обозначения можно добиться сокрашения размеров формул, рассмотрим, как применяется правило произведения к каждому случаю, когда высказывания а и Ь, соответственно, подтверждают конкретные значения переменных х и У. При этом будут получены следующие уравнения: Р(Х = х1 л У = у1) = Р(Х = хНУ = уз)Р(У = у1) Р(Х = х, л У = у:) = Р(Х = х,(У = у,)Р(У = у2) Все эти уравнения можно объединить в такое единственное уравнение: Р(Х, У) = Р(Х(У) Р(У) Следует учитывать, что это уравнение обозначает множество уравнений, которые связывают между собой соответствующие отдельные записи в таблицах распределения вероятностей, а не выражает матричное умножение этих таблиц.
Было бы соблазнительно, но неправильно рассматривать условные вероятности как логические следствия с оценкой неопределенности. Например, высказывание Р( а ~ Ь) =О . 8 нельзя интерпретировать в том смысле, что "если Ь истинно, из этою следует вывод, что вероятность Р(а) равна 0,8". Такая интерпретация была бы неправильной в двух отношениях: во-первых, Р(а) всегда обозначает априорную вероятность а, но не апостериорную вероятность, полученную с учетом некоторого свидетельства; во-вторых, само утверждение Р(а ~ Ь) = О.
8 непосредственно относится к делу, только если Ь вЂ” единственное доступное свидетельство. Как только становится доступной дополнительная информация с, степень уверенности в истинности а становится равной Р(а(Ь л с), а это значение может быть почти не связанным со значением Р(а) Ь) .
Например, в высказывании с может быть непосредственно указано, является ли а истинным или ложным. Если врач обследует пациента, который жалуется на зубную боль, и обнаруживает дупло, то получает дополнительное свидетельство сат Т су и составляет логический вывод (тривиальный), что Р(саууеу~ еооейасйе л саууеу) =1.
О. ИСТОКИ ПОНЯТИЯ ВЕРОЯТНОСТИ По поводу того, каковы истоки и значения вероятностных числовых оценок, существуют разные взгляды, и между сторонниками этих взглядов ведутся нескончаемые споры. 'в. Фреквентистская (от слова Ггег(цепсу — частота) позиция состоит в том, что эти числовые оценки могут быть основаны только на экспериментах: если мы обследуем 100 человек и обнаружим, что у 10 из них в зубах имеется дупло, то лишь в этом случае можем утверждать, что веро- 634 Часть Ч. Неопределенные знания и рассуждения в условиях неопределенности ятность наличия дупла примерно равна 0,1. Согласно этим взглядам, утверждение "вероятность дупла равна 0,1" означает, что О .