Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 6
Текст из файла (страница 6)
Событие A не зависит от события B, еслиP (A | B) = P (A).Иначе говоря, событие A не зависит от события B, если вероятностьсобытия A не зависит от того, произошло или нет событие B. Нетруднопоказать, что два определения независимости события A от B, данныевыше, эквивалентны. Так же можно показать, что если A не зависит231.3. ƒ… …Раз мы ввели понятие вероятности как количественное выражениедля правдоподобия случайного события, нам необходим метод ее чи"сленного выражения.
Здесь возможны два пути — умозрения и прямогоизмерения.Умозрительный способ определения численного значения вероятно"сти зиждется, в основном, на понятии равновозможности тех или иныхисходов эксперимента. Мы уже прибегали к помощи этого соображенияпри обсуждении бросания игральной кости. Основная область прило"жения этого принципа — случайный выбор и азартные игры. Поэтомупринцип равновозможности исходов эксперимента имеет ограниченноеприменение. Кроме того, выводы из этого принципа всегда относятся кнекому идеальному случайному опыту, и то, насколько им подчиняетсяреальный эксперимент, само зачастую нуждается в проверке.Измерение вероятности события отличается от измерения другихфизических величин.
Для массы, скорости, температуры и большинствадругих физических величин есть специальные приборы, позволяющиевыразить их числом (что и означает измерить). К сожалению, длявероятности такого прибора нет. Все же прямое измерение вероятно"сти возможно, оно основано на независимых повторениях случайногоэксперимента.Пусть в определенном случайном эксперименте нас интересует ве"роятность некоторого события A. Допустим, что мы можем многократноосуществлять этот эксперимент в неизменных условиях, так что от опы"та к опыту P (A) не меняется. Проведем N таких повторений (иногдаговорят — реализаций) этого опыта. Число N не должно зависетьот исходов отдельных опытов; например, оно может быть назначенозаранее.
Подсчитаем число тех опытов из N , в которых событие Aпроизошло. Обозначим это число через N (A). Рассмотрим отношениеN (A)/N — частоту события A в N повторениях опыта. Оказывается,частота N (A)/N приблизительно равна P (A), если число повторений N велико.Указанная связь между частотой события и его вероятностью соста"вляет содержание теоремы Бернулли, о которой подробнее мы будем го"ворить в главе 4. Там будет дана ее точная формулировка и доказатель"ство.
Кроме того, важен и вопрос о достигаемой точности приближения24частоты к вероятности, в частности, о числе опытов, необходимых дляполучения заранее указанной точности. Этому второму вопросу должнопредшествовать прояснение содержания статистической точности, ко"торое реализуется через посредство доверительных интервалов. Обэтом речь пойдет в главе 5.Итак, задав вопрос об измерении вероятностей, мы столкнулись снеприятной неожиданностью — это измерение оказалось, во"первых,непростым с чисто физической точки зрения (многократное повторениеопыта), а во"вторых, сопряженным с довольно сложными и новымипонятиями.Особо надо подчеркнуть, что описанные выше опыты должны проис"ходить независимо друг от друга в неизменных условиях, чтобы вероят"ность события сохранялась постоянной.
При большом числе повторенийопытов соблюсти это требование зачастую оказывается нелегко. Даженебольшие отклонения от статистической устойчивости могут оказатьвоздействие на результаты, особенно при высоких требованиях к точ"ности выводов. Не говоря уже о том, что повторения опытов, да ещемногократные, далеко не всегда возможны.1.4.
… ….… …В случайных экспериментах нас часто интересуют такие величины,которые имеют числовое выражение. Например, у каждого человекаимеется много числовых характеристик: рост, возраст, вес и т.д. Еслимы выбираем человека случайно (например, из группы или из толпы),то случайными будут и значения указанных характеристик. Чтобы под"черкнуть то обстоятельство, что измеряемая по ходу опыта численнаяхарактеристика зависит от его случайного исхода и потому сама явля"ется случайной, ее называют случайной величиной.Случайной величиной, в частности, является упомянутое выше чи"сло очков, выпадающее при бросании игральной кости. Случайна суммаочков, выпавших при бросании двух игральных костей (а также ихразность, произведение и т.д.). Случайной величиной надо считать диа"метр головки заклепки, изготавливаемой станком (см.
табл. 1.1 выше,где приведены значения, которые приняла эта случайная величина в200 опытах).Часто говорят, что случайная величина реализуется во время опыта.Если употребить это слово, то можно также сказать, что табл. 1.1 дает200 реализаций этой случайной величины.25Каждая случайная величина задает распределение вероятностейна множестве своих значений. Если ξ — случайная величина, принима"ющая значения из X, то мы можем задать распределение вероятностейPξ на X следующим образом:Pξ (A) = P (ξ ∈ A).Чтобы дать полное математическое описание случайной величины,надо указать множество ее значений и соответствующее случайнойвеличине распределение вероятностей на этом множестве.Виды случайных величин. В практических задачах обычно ис"пользуются два вида случайных величин — дискретные и непрерывные, хотя бывают и такие случайные величины, которые не являютсяни дискретными, ни непрерывными.
Рассмотрим сначала дискретныеслучайные величины.Дискретные случайные величины обладают тем свойством, чтомы можем перечислить (перенумеровать) все их возможные значения.Таким образом, для задания распределения вероятностей, порожденныхдискретными случайными величинами, надо только указать вероятностикаждого возможного значения этой случайной величины. Например, чи"сло очков, выпавших при бросании игральной кости, — это дискретнаяслучайная величина, так как она может принимать только 6 значений: 1,2, 3, 4, 5 или 6. Для определения вероятностей любых событий, связан"ных с этой случайной величиной, нам надо только указать вероятностикаждого из этих значений.Определение.
Случайную величину называют дискретной, еслимножество ее возможных значений конечно, либо счетно.Напомним, что множество называется счетным, если его элементыможно перенумеровать натуральными числами.Каждое возможное значение дискретной случайной величины имеетположительную вероятность (иногда, впрочем, допускают, что некото"рые значения могут иметь нулевые вероятности, особенно когда рассма"тривают не одно, а несколько дискретных распределений одновремен"но). Чтобы полностью описать дискретное распределение вероятностей,надо указать все значения, вероятности которых положительны (точнее,могут быть положительны), и вероятности этих значений.Пример. При бросании двух игральных костей сумма выпавших очковможет принимать значения от 2 до 12.
При этом для правильных костей,бросаемых независимо, вероятность получить в сумме 2 очка равна 1/6 × 1/6 =1/36, получить 3 очка — равна 2/36 и так далее. Распределение вероятностейсуммы выпавших очков определяется следующей таблицей 1.3.26Таблица 1.3значениявероятности234567891011121/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36Однако не все случайные величины могут быть описаны так про"сто, как дискретные случайные величины. Например, время службыэлектрической лампочки может, в принципе, принимать любое значе"ние от нуля до бесконечности (как хорошо известно, это множествоне является счетным).
И если предполагается, что лампочка была вначале исправна, то вероятность того, что время ее службы будет вточности равно некоторому значению, будет равна нулю. Ненулевы"ми будут вероятности только сложных событий: например, что времяслужбы лампочки — от одного до двух месяцев. Для подобных (такназываемых непрерывных) случайных величин мы не можем задать ихраспределение путем указания вероятностей каждого возможного зна"чения, так как все эти вероятности равны нулю. При описании такихслучайных величин используются другие средства. В частности, еслизначениями случайной величины являются вещественные числа, то рас"пределение случайной величины полностью определяется ее функциейраспределения.Функция распределения.
Пусть ξ обозначает случайную величи"ну, принимающую вещественные значения, x — вещественное число.Определение. Функцией распределения F (x) случайной величины ξ называют F (x) = P (ξ x).Ясно, что функция F (x) монотонно возрастает с ростом x (точнеесказать, не убывает, потому что могут существовать участки, на которыхона постоянна). У дискретной случайной величины функция распреде"ления ступенчатая, она возрастает скачком в тех точках, вероятностикоторых положительны. Это точки разрыва F (x). На рис.
1.2 приведенграфик функции распределения для описанной выше случайной величи"ны — суммы очков, выпавшей при бросании двух игральных костей.Непрерывные случайные величины. Для случайной величины,принимающей вещественные значения, то свойство, что вероятностьлюбого отдельного ее значения равна нулю, может легко быть выраженочерез функцию распределения.Определение. Случайную величину, принимающую вещественные значения, называют непрерывной, если непрерывна ее функцияраспределения.Непрерывным в этом случае называют и соответствующее распре"деление вероятностей.
Для непрерывного распределения вероятность27Рис. 1.2. График функции распределения суммыочков, выпавших на двух игральных костяхкаждого отдельного значения случайной величины равна нулю. На этоми основано противопоставление непрерывных и дискретных распреде"лений — ведь для последних вся единичная вероятность распределенаконечными положительными порциями. Для непрерывных же она какбы «разлита» по области определения случайной величины (в данномслучае — по прямой).Плотность вероятности. Нагляднее всего непрерывную случай"ную величину можно представить тогда, когда ее функция распределе"ния не только непрерывна, но и дифференцируема (за исключением,может быть, конечного числа точек). В этом случае вероятности свя"занных с данной случайной величиной событий можно выразить черезпосредство так называемой функции плотности вероятности.