Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 5
Текст из файла (страница 5)
Каждому известны более простые опыты,в которых результат определяется случаем: раздача игральных картили костей домино, бросание игральных костей, монет и т.д. У всехэтих примеров есть общая черта — непредсказуемость результатов длядействий, проводящихся в неизменных условиях.Закономерность и случайность. В большинстве явлений присут"ствуют оба вида изменчивости — и закономерная, и случайная, и длянахождения закономерностей нам приходится «отсеивать» мешающиеслучайные факторы. Например, при внесении удобрений на пшеничноеполе мы не можем точно предсказать, какова будет урожайность на этомполе, поскольку она зависит от множества причин, которые мы считаемслучайными (от погодных условий, нашествий вредителей, болезнейрастений и т.д.). Однако с помощью методов статистического анализамы все же можем определить степень влияния на урожайность внесенияудобрений и применения других агротехнических приемов.
Для этогомогут потребоваться многолетние тщательно спланированные экспери"менты, с помощью которых влияние агротехнических приемов оценива"ется на фоне мешающих факторов.18Итак, статистический подход к изучению явлений природы состоитв мысленном разделении наблюдаемой изменчивости на две части —обусловленные закономерными и случайными причинами, и выявлениюзакономерной изменчивости на фоне случайной. Например, в табл. 1.2 ина рис. 1.1 отображено изменение урожайности зерновых (в центнерахс гектара) в СССР за 45 лет, с 1945 по 1989 год.
Данные предоставленыА.И.Манелля, которому авторы выражают глубокую признательность.Таблица 1.2Урожайность зерновых культур в СССР с 1945 по 1989 гг.(в центнерах с гектара в первоначально оприходованном весе)Год194519461947194819491950195119521953195419551956195719581959Урожайность5.64.67.36.76.97.97.48.67.87.78.49.98.411.110.4Год196019611962196319641965196619671968196919701971197219731974Урожайность10.910.710.98.311.49.513.712.114.013.215.615.414.017.615.4Год197519761977197819791980198119821983198419851986198719881989Урожайность10.917.515.018.514.214.912.615.215.914.416.218.018.317.018.8и значительные колебания урожайности в разные годы, по"видимому, засчет погодных условий и иных факторов, изменения которых мы счи"таем случайными. Методы математической статистики позволяютв подобных ситуациях оценивать параметры имеющихся закономерно"стей, проверять те или иные гипотезы об этих закономерностях и т.д.
Впоследующих главах этой книги мы рассмотрим, как решаются многиеиз подобных задач.Однако случайности могут не только мешать нам постигать законо"мерности — они способны и сами порождать их. Рассмотрим, например,газ в некотором сосуде (скажем, воздух в комнате). Поведение каждоймолекулы газа носит случайный характер, но вся совокупность этихмолекул ведет себя вполне закономерно, подчиняясь хорошо известнымзаконам физики.
Так, давление газа на каждую единицу площади по"верхности сосуда строго постоянно (колебания проявляются только дляочень сильно разреженных газов), а объем газа, его давление и тем"пература связаны друг с другом уравнением Менделеева"Клапейрона.Аналогично, выбор времени для телефонных звонков каждый человекосуществляет сам, но нагрузка на телефонную станцию (АТС), распре"деление интервалов между звонками различных абонентов и т.д.
под"чиняются вполне определенным закономерностям. Изучением законо"мерностей, которые порождаются случайными событиями, занимаетсянаука теория вероятностей.1.2. …Рис. 1.1. Урожайность всех зерновых культур в СССР с 1945 по 1989 гг. (ц/га)Хорошо видно, что урожайность, в целом, возрастала (по"видимому,за счет улучшения агротехники и внесения минеральных удобрений).Ее рост и составляет закономерную часть картины. В то же время видны19Хотя результаты эксперимента (наблюдений, опыта), зависящего отслучайных факторов, нельзя предсказать, все же разные возможные егоисходы и связанные с ними события имеют неодинаковые шансы напоявление. Количественное описание правдоподобия отдельных исхо"дов и событий основывается на понятии вероятности. Предполагается,что каждому событию, возможному в данном случайном испытании,может быть приписана числовая мера его правдоподобия, называемаяего вероятностью. Если, скажем, A есть случайное событие, то еговероятность обычно обозначается через P (A).
(Буква P — начальная влатинском слове «вероятность».) Вероятность невозможного события(которое никогда не происходит) принимается равной 0, а вероятностьдостоверного события (которое происходит всегда) принимается рав"ной 1. Поэтому для любого события A: 0 P (A) 1.Свойства вероятности просты, естественны и, в общем, известныкаждому. Однако перед тем, как рассказывать о них, необходимо датьнекоторые определения, касающиеся случайных событий.203.
Вероятность достоверного события равна 1, а невозможногособытия — нулю.Случайные события.Объединением, или суммой событий A и B называют событие C,которое состоит в том, что происходит хотя бы одно из событий A иB. (C происходит тогда и только тогда, когда происходит либо A, либоB, либо оба вместе.) Обозначение:C = A ∪ B,илиC = A + B.Пересечением, или произведением событий A и B называют со"бытие C, которое состоит в том, что происходят оба события A и B.Обозначение:C = A ∩ B,илиC = AB.Отрицанием события A называют такое событие, которое состоитв том, что A не происходит. Обозначение для него A.Событие, которое при нашем случайном испытании обязательнопроисходит, называют достоверным; которое не может произойти —невозможным. Вероятность достоверного события равна 1; вероятностьневозможного события равна 0.Если события A и B не могут произойти одновременно (т.е.
еслиAB — невозможное событие), их называют несовместимыми. Несо"вместимы, например, события A и A. В то же время A + A — событиедостоверное.Для полного описания случайного эксперимента нужно указать всеего возможные исходы и их вероятности. Например, бросание играль"ной кости, имеющей форму куба, приводит к выпадению одной из еешести граней. Это шесть элементарных исходов, т.е. неразложимыхна более простые.
Если кость, как говорят, правильная, то эти шестьисходов равноправны и поэтому должны иметь равные вероятности.Следовательно, вероятность каждого из них равна 1/6. Вероятностиостальных (составных) событий может быть вычислена из приведенныхвыше свойств вероятности. Например, вероятность P (B) события B,состоящего в том, что в результате бросания кости выпадет 3 или 6очков, равна 1/3. Действительно, это событие является объединениемдвух несовместимых событий: «выпало 3 очка» и «выпало 6 очков»,вероятность каждого из которых равна 1/6. Аналогично, вероятностьP (A) события A, состоящего в том, что в результате бросания костивыпадет меньше 4 очков, равна 1/2.Не будем далее развивать эту тему, оставив ее теории вероятно"стей. Но все же нам придется ввести еще два важных понятия —независимости событий и условной вероятности.Например, при бросании игральной кости:Независимость событий.•Определение 1.
События A и B называются независимыми, если••••событие, состоящее в том, что в результате бросания костивыпадет 1, 2, 3, 4, 5 или 6 очков, является достоверным;событие, состоящее в том, что результате бросания кости выпа"дет 7 очков, является невозможным;объединением события A, состоящего в том, что в результатебросания кости выпадет меньше 4 очков, и события B, состоя"щего в том, что в результате бросания кости выпадет 3 или 6очков, будет событие A + B, состоящее в том, что в результатебросания кости выпадет 1, 2, 3 или 6 очков;пересечение AB событий A и B состоит в том, что в результатебросания кости выпадет 3 очка;отрицание события A, обозначаемое A, состоит в том, что врезультате бросания кости выпадет 4, 5 или 6 очков.Свойства вероятности. Теперь свойства вероятности перечислитьпросто:1. 0 P (A) 1 для любого события A;2. P (A + B) = P (A) + P (B), если события A и B несовместимы, ав общем случае P (A + B) = P (A) + P (B) − P (AB);21P (AB) = P (A) P (B).На практике независимость событий обычно устанавливается не спомощью проверки этого равенства, а из условий опыта и других со"держательных соображений.
При этом указанное соотношение можноиспользовать для вычисления вероятности событий AB через вероятно"сти событий A и B. Понятие независимости очень существенно для те"ории вероятностей. То, насколько в своей математической форме поня"тие независимости соответствует нашим интуитивным представлениям,лучше всего разобрать с помощью понятия условной вероятности.Условная вероятность. Для простоты мы рассмотрим, как можноопределить понятие условной вероятности в случайном испытании сконечным числом исходов.
Пусть Ω — совокупность всех таких ис"ходов, ω обозначает произвольный элементарный исход, P (ω) — еговероятность. Любые события A и B в этом опыте представляют собойнекоторые подмножества Ω, поскольку они состоят из элементарныхисходов. Обозначим через P (A | B) условную вероятность события A22при условии, что произошло событие B. Достаточно определить услов"ную вероятность для элементарных исходов ω. Те исходы ω, которые невходят в B, невозможны при наступлении события B, поэтому для нихследует положить условную вероятность равной нулю:P (ω | B) = 0,от B, то и B не зависит от A. Единственная оговорка, которую надодобавить к сказанному, — что условную вероятность можно определятьтаким образом, лишь если P (B) > 0.если ω ∈/ B.Для исходов ω, входящих в B, сумма их вероятностей ω∈B P (ω)равна P (B), а сумма их условных вероятностей должна быть равнаединице.
Действительно, ω∈B P (ω | B) равна P (B | B). Но при насту"пления B событие B является достоверным, поэтому согласно свойству3 вероятностей P (B | B) равно 1. Чтобы это условие выполнялось,естественно положить для ω ∈ B:P (ω | B) = P (ω)/P (B).Теперь мы можем определить условную вероятность для любогособытия A.Определение. Условная вероятность события A при условииB естьP (ω | B).P (A | B) =ω∈AИз этого определения легко вывести, что:P (A | B) =P (AB).P (B)Это соотношение в общем случае (когда число элементарных ис"ходов не обязательно конечно) и принимают за определение условнойвероятности. Из него легко следует известная формула умножениявероятностей:P (AB) = P (A | B)P (B).Заметим, что равноправие событий A и B позволяет написать также,что P (AB) = P (B | A)P (A).С помощью понятия условной вероятности мы можем дать другоеопределение независимости событий.Определение 2.