Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 174
Текст из файла (страница 174)
1 — это доля соответствуюших пациентов, которая будет наблюдаться в пределе при обследовании выборки, состояшей из бесконечного количества людей. А любая конечная выборка позволяет оценить истинную долю, а также рассчитать, насколько точной, по-видимому, является эта оценка. Согласно Ж объективистским взглядам, вероятности — это реальные аспекты универсума (связанные с тем, что в поведении объектов наблюдаются определенные закономерности), а не просто описания степени уверенности наблюдателя. Например, тот факт, что подлинная монета падает решкой вверх с вероятностью 0,5, отражает закономерности падения самой монеты. С точки зрения сторонников этих взглядов, фреквентистские измерения представляют собой попытки проведения наблюдений за реализацией таких закономерностей. Болыпинство физиков согласны с тем, что квантовые феномены, наблюдаемые в микроскопических масштабах, объективно являются вероятностнымн, а неопределенность в макроскопических масштабах (например, при подбрасывании монеты) обычно обусловлена незнанием начальных условий и, скорее всего, не согласуется с этими взглядами о реализации каких-то закономерностей.
Сторонники ж субъективистских взглядов описывают вероятности как способ описания уверенности агента, а не как проявления, имеющие какуюто внешнюю физическую значимость. Именно это позволяет врачу или аналитику оперировать с числами, например, чтобы иметь возможность утверждать: "По моему мнению, ожидаемая вероятность наличия дупла составляет около 0,1". Кроме того, для выявления вероятностных оценок, применяемых людьми, было разработано несколько более надежных методов, таких как системы регистрации ставок, описанные на с.
637. В конце концов, даже строго фреквентистская позиция требует субъективного анализа, поэтому с точки зрения практики различия межлу взглядами сторонников этих трех направлений, по-видимому, не имеют большого значения. То, что нельзя обойтись без субъективного подхода, иллюстрирует проблема Ъ. референтного класса (геГегепсе с1азз). Предположим, что некий врач, сторонник фреквентистских взглядов, желает знать, каковы шансы того, что некоторый пациент имеет данное конкретное заболевание. Этот врач хочет рассмотреть сведения о других пациентах, которые обладают аналогичными характеристиками по важным показателям (возраст, симптомы и, возможно, пол), и определить, какая часть из них имеет это заболевание.
Такая задача может быть решена, но если врач станет рассматривать все, что известно о пациенте (вес с точностью до грамма, цвет волос, девичья фамилия матери и т.д.), результатом станет то, что не найдется больше пациентов, имеюших точно такие же характеристики, и поэтому нельзя будет определить референтный класс, в котором можно было бы собрать экспериментальные данные. Это — одна из неразрешимых проблем в философии науки.
В принципе безразличия Лапласа [887] утверждается, что высказывания, которые являются синтаксически "симметричными" по отношению к данному свидетельству, должны рассматриваться как равновероятные. Были предложены различные уточнения этого принципа, а кульминацией этих усилий ста- 635 Глава 13. Неопределенность ла попытка Карнапа и других ученых разработать строгую индуктивную логику, позволяюгдую правильно вычислять вероятность любого высказывания на основании результатов любой коллекции наблюдений.
В настоящее время считается, что никакой уникальной индуктивной логики не существует; вместо этого любая полобная логика опирается на субъективное априорное распределение вероятностей, субъективность которой уменьшается по мере накопления все большего и большего количества наблюдений. 13.3. АКСИОМЫ ВЕРОЯТНОСТЕЙ До сих пор в этой главе был определен синтаксис для высказываний, а также для априорных и условных вероятностных утверждений об этих высказываниях. Теперь необходимо определить своего рода семантику для вероятностных утверждений. Начнем с базовых аксиом, которые служат для опрелеления шкалы вероятностей и ее конечных точек, как описано ниже.
1. Все вероятности находятся в пределах от О до 1; для любого высказывания а справедливо следующее: а < д(а( < т 2. Безусловно истинные (т.е. выполнимые) высказывания имеют вероятность 1, а безусловно ложные (т.е. невыполнимые) высказывания имеют вероятность Рл д(егие) я(амадее) = О Кроме того, требуется аксиома, которая соединяет вероятности логически взаимосвязанных высказываний. Такую аксиому можно проще всего составить, опрелелнв вероятность дизъюнкции, как показано ниже. 3. Вероятность дизъюнкции задается следующей формулой: Р(а ч Ь( = Р(а( е Р(Ь) — Р(а а Ь( Это правило можно легко запомнить, отметив, что те случаи, когда высказывание а является истинным, вместе с теми случаями, когда Ь является истинным, безусловно, охватывают все те случаи, когда истинно высказывание а м Ь; но в сумме двух множеств случаев их пересечение встречается дважды, поэтому необходимо вы- честь Р(а а Ь).
Эти три аксиомы часто называют 'в. аксиомами Колмогорова в честь советского математика Андрея Колмогорова, который показал, как построить остальную часть теории вероятностей на этом простом фундаменте. Обратите внимание на то, что в этих аксиомах речь идет только об априорных вероятностях, а не об условных; это связано с тем, что последние уже были определены в терминах первых в уравнении 13.1. Использование аксиом вероятностей Из этих основных аксиом можно вывести целый ряд полезных фактов. Например, знакомое правило отрицания следует нз подстановки а вместо Ь в аксиому 3, что приводит к получению следующего выражения: б36 Часть Ч.
Неопределенные знания и рассуждения в условиях неопределенности Р(а ч а) = Р(а) ь Р( а) — Р(а ь а) Р(егиа) = Р(а) + Р( а) — Р(газне) (согласно аксиоме 3 с )э = а) согласно правилу логической эквивалентности) согласно аксиоме 2) (согласно алгебраическому определению) 1 = Р(а) ь Р( а) Р( а) = 1 — Р(а) Третья строка этого логического вывода сама является полезным фактом и может быть распространена с данного булева случая на обший дискретный случай.
Допустим, что дискретная переменная )3 имеет область определения <с),, ..., с)мм Тогда можно легко показать (упр. 13.2), что справедлива следующая формула: Это означает, что любое вероятностное распределение по одной переменной должно в сумме' составлять 1.
Справедливо также утверждение, что любое совместное распределение вероятностей по любому множеству переменных должно в сумме составлять 1; в этом можно убедиться, создав одну мегапеременную, областью опрелеления которой является перекрестное произведение областей определения первоначальных переменных. Напомним, что любое высказывание а эквивалентно лизъюнкции всех атомарных событий, в которых а является истинным; назовем эту дизъюнкцию множеством событий е ( а) . Напомним глюке, что атомарные события являются взаимно исключаю- шими, поэтому вероятность любой конъюнкции атомарных событий равна нулю, согласно аксиоме 2.
Таким образом, из аксиомы 3 можно вывести следующее простое соотношение; ОР* вероятность любого высказывания равна сумме вероятностей атомарных событий, в которыя оно является истанным; т.е. вывссгн такое уравнение: Р(а) =,) Р(е,) (13.2) е ае(а) Это уравнение предоставляет простой метод вычисления вероятности любого высказывания при наличии полного совместного распределения, которое задает вероятности всех атомарных событий (см. раздел 13.4.) В следующих разделах будут выведены дополнительные правила для манипулирования вероятностями. Но вначале исследуем теоретические основы самих этих аксиом. Для непрерывныхпеременныхэтасумма заменяется иитегрыюм: ~ Р(х = «)сЬс = 1.
Теоретическое обоснование аксиом вероятностей Аксиомы вероятностей могут рассматриваться как ограничивающие множество вероятностных убеждений, которых может придерживаться некоторый агент. Такой подход в опрелеленной степени подобен логическому подходу, согласно которому, Глава 13. Неопределенность 637 например, логический агент не может одновременно быть уверенном в истинности высказываний А, В и «(А А В) . Тем не менее в вероятностном подходе возникает дополнительное усложнение. В логическом случае семантическое определение коньюнкции означает, что, по меньшей мере, одно из трех только что упомянутых убеждений должно быть ложным в этом мире, поэтому для любого агента неразумно было бы сохранять уверенность в истинности этих трех высказываний.