Айала, Кайгер - Современная генетика - т.3 (947306), страница 61
Текст из файла (страница 61)
Два наиболее важных из них называются законами сложения и умножения вероятностей. Закон сложения вероатиостей. Вероятность того, что реализуется один из нескольких взаимоисключающих исходов данного события„ равна сумме вероятностей каждого отдельного исхода. Например, предположим, что существует только три возможных исхода, вероятности которых можно изобразить в виде участков единичного квадрата, изображенного на рис. П.1, где вероятность А равна 1/2, вероятность В-1/4 и вероятность С-тоже 1/4.
Тогда вероятность, скажем, того, что произойдет либо А, либо В, равна 1/2+ 1/4 = 3/4, что очевидно из рисунка. При скрещивании двух гетерозиготных (Кг) растений гороха вероятносп~ возникновения трех типов потомства оставляют: 1/4 гомозигот КВ, 1/4 гомозигот гг и 1/2 гетерозигот Вг. Следовательно, вероятность того, что в потомстве появится доминантный фенотип, т.е. что данное растение в потомстве будет обладать генотипом либо КВ, либо Яг, равна 1/4+ 11л = 3/4.
Закон умножения вероятностей. Вероятность того, что несколько взаимно независимых исходов реализуются одновременно, равна произведению вероятностей каждого исхода Рассмотрим, например, то же скрещивание, что и в предыдущем абзаце: Яг х Вг. Вероятность того, Приложение 1. Вероятность и статистика Рпс. 1. П.1. Аддптпвность вероятностей взаимоисключающих событий. Если А, В и С-трн взаимоисключающих исхода данного события причем вероятности этях исходов измеряются относительной плошадью изображенных на рисунке участков, то вероятность того, что исходом события будет либо А, либо В, равна сумме двух соответствующих площадей.
что определенное растение в потомстве получит аллель г от одного из родителей, равна 1/2, такова же вероятность того, что это растение получит аллель г от второго родителя. Следовательно, вероятность того, что это растение получит аллель г от обоих родителей, равна 1/2 х х 1/2=1/4. При этом существенно, чтобы исходы были взаимно независимыми. Рассмотрим, например, скрешивание, изображенное на рис. 3.5. Поколение Р, получено от скрещивания самок (ю+/в)„гетерозиготных по аллелю красноглазости (ю+) и аллелю белоглазости (ю), с красноглазыми самцами, имеющими генотип (и +/У). В Г, вероятносп, появления мух с белыми глазами равна 1/4, поскольку для этого требуется, чтобы муха получила аллель в от матери (вероятность этого события равна 112) и У-хромосому отца (вероятность этого события также равна 112).
Вероятность того, что данная муха — самеп„равна 1/2. Но было бы ошибкой заключить, что вероятность того, что рассматриваемая муха имеет белые глаза и одновременно представляет собой самца, равна (1/4 х х 1/2) = 1/8. Дело в том, что два рассматриваемых исхода отнюдь не являются независимыми. Для того чтобы глаза данной мухи были белыми, она должна унаследовать У-хромосому отпд; следовательно, в Рх все белоглазые мухи — самцы. Первое предостережение. При вычислении вероятности последовательных событий важно отличать вероятность всех последовательных событий, взятых вместе, от вероятности какого-то одного определенного события.
Рассмотрим, например, следующий вопрос: какова вероятность того, что два первых ребенка в семье окажутся мальчиками? Для ответа на этот вопрос надо воспользоваться законом произведения вероятностей. Предположив, что вероятность рождения мальчика всегда равна 112, получаем ответ: 1/2 х 1/2= 1/4. Зададим теперь несколько иной вопрос: какова вероятность того, что у родителей, уже имеющих одного сына, вторым ребенком также будет мальчик? Ответ в этом случае будет 112. Независимо от пола всех старших детей вероятность того, что следующий ребенок окажется мальчиком, всегда равна 1/2. Второе предостережение. Иногда общее число последовательно происходящих событий ограничено (такую ситуацию специалисты по статистике называют еизъятием без возвращения»).
В этом случае сле- 261 Лрилозгсение 1. Вероятность и статистика дует принимать во внимание, что вероятность последующих событий зависит от числа и исхода предыдущих. В качестве иллюстрации рассмотрим колоду из 52 карт с четырьмя тузами. Какова вероятность того, что первой картой, которую мы вынем из тасованной колоды, окажется туз? Ответ очевиден: 4/52. Предположим теперь„что первой картой оказался не туз, и вынутую карту мы в колоду не возвращаем. Какова вероятность того, что тузом окажется вторая карта? В колоде осталась 51 карта; следовательно, вероятность вынуть туза равна 4/51. Допустим теперь, что первой картой был туз.
Какова вероятность того, что тузом окажется вторая карта? В колоде осталась 51 карта, из которых 3 туза; следовательно, ответом будет 3/51. П.П. Метод хи-квадрат где Н-наблюдаемое значение, О-ожидаемое значение, а символ ',! означает суммирование по всем сериям экспериментов. Рассмотрим эксперимент, в котором Мендель скрещивал высокие растения (ТТ) с низкими (П). В поколении Р, скрещиваются гетерозиготы Т! х Т!. Согласно гипотезе Менделя, в поколении Рх соотношение высоких (ТТ и Тг) н низких (П) растений должно быть 3: 1.
Было получено 787 высоких и 277 низких растений. Расчет значений хи-квадрат для этого эксперимента приведен в табл. П.1. В результате )(з = = 0,59. Подтверждает лн это значение исходную гипотезу? Иными словами, можно ли разность между теоретически ожидаемой и реально наблюдаемой величинами отнести за счет случайности? Чтобы ответить на этот вопрос, мы должны познакомиться с двумя понятиями: число степеней свободы и уровень значимости (достоверности). Число ствиеней свободы легко определить как число «классов»и объемы которых должны быть известны, для того, чтобы подсчитать объемы всех классов исходя из общего обьема выборки.
В рассматриваемом примере число степеней свободы равно единице, так как если мы знаем объем одного класса (например, 787 высоких растений), то можем определить объем другого класса вычитанием объема первого класса из общего объема (1064 — 787 = 277). Вообще, в экспериментах Таблица 1.Н.1. Вычисление Хз для эксперимента Менделя с высокими в вяз- кими растениями гороха Последовательность действий Высокие растения Низкие раетеааа Всего Наблюдаемые значения (Н) Ожидаемые значения (О) Н вЂ” О (Н вЂ” О)з (Н вЂ” О) /О 787 1064 3/4 = 798 — 11 121 О,! 5 277 1064 1/4 = 266 +11 121 0,44 1064 1064 0 Хз= 059 Полезным методом, позволяющим судить о том, соответствуют ли результаты экспериментов той или иной гипотезе, является метод хи-квадрат (2з).
Функция ~з определяется как (Н вЂ” О)з О Лрияожение 1. Вероятность и статистика 262 Тябляяи 2ЛГЛ. Значения Х', соответствующие различ- ным уровням значимости и степеням свободы Уромнь значимости Число стененей слободы 0,05 0,0! 0,00! 3,84 5,99 7,82 9,49 11,07 12,59 14,07 15,51 16,92 18,31 6,64 9,21 11,34 13,28 15,09 16,81 ! 8,48 20,09 21,67 23,21 ! 2 3 4 5 б 7 8 9 10 10,83 13,82 16,27 18,47 Ю,52 22,46 24,32 26,13 27,88 29,59 такого пша число степеней свободы на единицу меньше числа классов, т.е. /с — 1, поскольку последний класс может быть подсчитан вычитанием суммы всех остальных классов из их общего числа.
(Ниже мы увидим, что в экспериментах другого типа число степеней свободы может отличаться от )с — Ц л)зоееиь значимости отражает риск того, что мы отвергнем истинную гипотезу. Различия майклу ожидаемыми и наблюдаемыми значениями могут варьировать в силу случайных причин, но если вероятность того, что расхождение объясняется случайными причинами, очень мала, то гипотеза отвергается, хотя и не исключено, что она верна, Обычно в качестве уровня значимости выбирается значение 5и Это означает„что гипотезу решено считать не соответствующей наблюдениям, если вероятность того, что расхождение между теоретически ожидаемыми и наблюдаемыми в эксперименте данными, обусловленное только случайными причинами, составляет не более 5У,. Значения 7(Я для различного числа степеней свободы и уровней значимости 5, 1 и 0,1;/ приведены в табл. П.2. Возвратимся к вопросу о том, соответствуют ли данные эксперимента Меццеля его гипотезе.