Популярные услуги

Главная » Лекции » Медицина » Медицинская статистика » Основные законы распределения непрерывной случайной величины

Основные законы распределения непрерывной случайной величины

2021-03-09СтудИзба

Основные законы распределения непрерывной случайной величины.

1. Равномерное или прямоугольное распределение.

Случайная величина называется равномерно распределённой на интервале [c,d], если функция плотности распределения её на этом интервале постоянна, а вне него равна нулю.

Из условия нормировки имеем:   , в нашем случае  за пределами этого интервала f(x)=0.

Вероятность того что X попадёт в интервал :

Это значит, что каждое своё значение случайная величина принимает с одинаковой вероятностью. На практике такой закон распределения встречается редко.

Рекомендуемые материалы

В реальности же с наибольшей вероятностью случайная величина принимает значения вблизи М[Х] (среднего значения), а по мере удаления от него вероятность принять такое значение уменьшается.

2. Нормальный закон распределения или распределение Гаусса.

Случайная величина распределена по нормальному закону, если функция плотности её распределения имеет вид:

        где а,σ – параметры распределения.

1/(σ∙√2π)a-3σ a-2σ a-σ a a+σ a+2σ a+3σ

Кривая симметрична относительно прямой х=а, в этой точкеf(x) имеет максимум: .По условию нормировки  площадь под кривой не меняется, но с изменением параметра а, кривая смещается по оси х:

a3=0a2=1a1=2

С изменением параметра σ меняется форма кривой, но не площадь под ней:

Для распределения Гаусса (нормального распределения):

То есть, параметр  -математическое ожидание,

               параметр – среднее квадратическое отклонение.

Нормальный закон распределения можно задать функцией распределения:

Введём замену переменной:   

     это нормированная случайная величина, она – безразмерная,

Так как 99,7% всех значений случайной величины Х отличаются от М[Х] не больше, чем на 3·σ[Х], следовательно для любого значения x получим:

                             с вероятностью Р=0,997.

Ф(t) функция Гаусса или нормальная функция распределения,

Значения функции Ф(t) для  содержатся в таблице «Нормальная функция распределения».

Свойства функции Ф(t):

Ф(t₁) 

Вероятность попадания значений случайной величины в интервал [a.b]:

 Правило трёх сигм:

Математическая статистика.

Основные понятия математической статистики.

Математическая статистика – это раздел математики о методах регистрации, систематизации и анализа статистических экспериментальных данных, полученных в результате наблюдения массовых случайных явлений.

Статистическая совокупность – это множество объектов, обладающих общими признаками, которые являются наиболее важными (типичными) для характеристики этих объектов.

Серия измерений какого либо признака совокупности – это совокупность значений случайной величины.

Объём совокупности n –это число членов совокупности.

Генеральная совокупность – это совокупность всех объектов, которые имеют типичную характеристику или признак. Это все возможные значения случайной величины. Объём генеральной совокупности  (n →∞).

Изучить всю генеральную совокупность практически невозможно, поэтому изучают её часть – выборочную совокупность.

Выборочная совокупность (выборка) – это отобранная тем или иным способом часть генеральной совокупности (n конечно).

Из одной генеральной совокупности можно отбирать сколь угодно много выборок, главное, чтобы выборка была репрезентативной (представительной), а для этого элементы выборки должны отбираться случайным образом.

Пример: признак  - рост мужчины в России.

                 Генеральная совокупность  --  все мужчины в стране.

                 Выборка  --  случайно отобранные мужчины из разных регионов страны (не в секции баскетбола).

Варианта – это числовое значение изучаемого признака( отдельные значения случайной величины).

Основные задачи, которые стоят перед математической статистикой:

  1. Определение закона распределения случайной величины по имеющимся статистическим данным ( по выборке – закон распределения для всей генеральной совокупности).
  2. Определение неизвестных параметров распределения ( по выборке оценить параметры генеральной совокупности).
  3. Задача проверки правдоподобия выдвигаемых статистических гипотез.

1. Схема предварительной обработки экспериментальных данных.

1). Сбор экспериментальных данных.

Чтобы определить закон распределения случайной величины, то есть связь между значениями случайной величины (вариантами) и вероятностями , с которыми случайная величина эти значения принимает, нужно провести серию измерений или подсчётов для интересующей нас случайной величины (признака).

В результате получаем статистический ряд – это совокупность числовых данных или выборка объёмом n:

Затем производят упорядочивание членов выборки – эта операция называется ранжирование.

Ранжирование  --  это расположение всех имеющихся вариант по возрастанию. Получаем ранжированный статистический ряд.

Пример: при измерении частоты пульса у 10 пациентов получены следующие результаты:                                   90, 110, 65, 80, 90, 60, 70, 80, 70, 80

Ранжированный ряд имеет вид: 60, 65, 70, 70, 80, 80, 80, 90, 90, 110.

Колебания изучаемого признака называются варьирование, В нашем примере варьирование  -  это изменение частоты пульса.

2).Составление вариационного ряда.

Вариационный ряд (статистическое распределение)  --  это двойной ряд чисел в котором каждому значению случайной величины соответствует её частота mi (то есть сколько раз случайная величина принимала данное значение).

Если случайная величина (признак) изменяется дискретно, то составляем дискретный вариационный ряд.

Для нашего примера вариационный ряд имеет вид:

xi

60

65

70

80

90

110

mi

1

1

2

3

2

1

Очевидно, что , где к – количество различных значений(к=6).

Графическая характеристика дискретного вариационного ряда  -  это полигон частот:

Если признак изменяется непрерывно, то составляется интервальный вариационный ряд:

В первой строке указываются интервалы изменения признака, а во второй – частоты, относящиеся к данным интервалам.

Для построения интервального вариационного ряда выборку разбивают на интервалы. Число интервалов можно приблизительно определить по формулам:

- берётся целая часть числа.

 - (формула Стерджеса, 1926 г.)

 –(формула Брукса, 1963 г.)

Если n=100, то к=9 или к=7

Если n=60, то к=7 или к=5.

Длина интервала ΔX рассчитывается по формуле: 

Пример.  Анализ веса 60-ти новорожденных дал следующие результаты:

min вес 1,5 кг,  max вес 5 кг. Число интервалов берём к=7, следовательно:

Определяем границы интервалов, подсчитываем число новорожденных, вес которых попадает в каждый интервал и составляем таблицу

интервальный вариационный ряд:

вес         xi (кг)

1,5-2

2-2,5

2,5-3

3-3,5

3,5-4

4-4,5

4,5-5

число     mi

новорожденных

2

6

12

20

14

4

2

Графическая характеристика  непрерывного вариационного ряда  - Гистограмма:

Замеченные при построении графиков закономерности есть ни что иное как закономерности распределения случайной величины, образующей выборочную совокупность. Гораздо важнее знать закономерности распределения генеральной совокупности. Для этого нужно увеличить объём выборки (n→∞), тогда относительные частоты    и можно перейти к закону распределения.

2. Статистические характеристики совокупности.

Математическое ожидание M[X],дисперсия D[X],среднее квадратическое отклонение σ[X] -- это числовые характеристики (параметры), которые характеризуют генеральную совокупность.

Если из генеральной совокупности извлечь выборку объёмом n, то она будет иметь свои параметры:

среднее арифметическое,

дисперсия,

стандартное отклонение (среднее квадратическое)

Это выборочные характеристики или статистики. Они являются точечными оценками параметров генеральной совокупности.

Генеральная совокупность (n→∞)        Выборка (n- конечно)

                       

                 

                                           

Пояснения: если вычислять дисперсию для выборки по формуле

, то получим смещённую оценку дисперсии  генеральной совокупности. Чтобы получить несмещённую оценку дисперсии или исправленную дисперсию, нужно домножить формулу (1) на множитель , тогда:  --  это и есть правильная оценка дисперсии генеральной совокупности.

Число называется число степеней свободы. В генеральной совокупности при n→∞, различие между n и (n-1) не существенно, для выборки же это различие велико.

В формуле для дисперсии выборки мы подсчитываем отклонения вариант от -среднего арифметического выборки. Так как из одной генеральной совокупности можно извлечь множество выборок, то в каждой выборке будет своё среднее арифметическое, и ни одно из них не будет равно М[X] генеральной совокупности. Следовательно, среднее арифметическое вычислено с ошибкой относительно М[X], так же как и  к D[X]  --  это статистические ошибки.

3.  Ошибка среднего арифметического.

Извлечём из генеральной совокупности N выборок, тогда их средние арифметические сами будут являться значениями случайной величины

.

Все эти значения имеют отклонения (рассеивание) от истинного значения М[X].

Это отклонение называется ошибка среднего арифметического, она в n раз меньше отклонения каждого xi от  для данной выборки объёмом n

показывает насколько близко получаемое по выборке среднее арифметическое значение, приближается к истинному среднему М[X] генеральной совокупности. Чем больше объём выборки n, тем ближе среднее арифметическое к М[X] генеральной совокупности ( т.е., ошибка  меньше, чем больше n). Этот вывод получил название  Закон больших чисел.

4. Доверительный интервал и доверительная вероятность.

Истинные значения  М[X] и D[X] можно найти по генеральной совокупности, что практически невозможно. По выборке из этой совокупности мы находим лишь их точечные оценки  и , но насколько их значения близки истинным М[X] и D[X]? Например, как велика разность ?  может быть как больше, так и меньше М[X]. Поэтому наряду с точечными оценками, применяют интервальные оценки параметров генеральной совокупности по выборке.

То есть мы хотим найти интервал ΔX, такой что:  или

Если известна функция распределения, то этот интервал можно найти из соотношения:

, зная границы интервала, мы найдём вероятность случайной величины  принимать значения из данного интервала. Но нам требуется решить обратную задачу: определить границы интервала, следовательно, для этого надо заранее задать вероятность, с которой мы этот интервал будем определять. Эту вероятность называют доверительной вероятностью РД, а определённый с её помощью интервал  --  доверительным интервалом  ΔXд.

Доверительным интервалом какого либо параметра, называют такой интервал, о котором можно сказать, что с вероятностью РД он содержит в себе этот параметр.

Доверительную вероятность обычно берут равной РД=0,95, но в особо ответственных случаях принимают РД=0,99 или даже РД=0,999.

С доверительной вероятностью связан уровень значимости α=1-РД.

Уровень значимости α --это вероятность того, что значение исследуемого параметра не попадёт в доверительный интервал.

Основная масса случайных величин в биологии и медицине распределена по нормальному закону распределения, следовательно, задав доверительную вероятность можно определить доверительный интервал:

Например, при РД=0,95 

Где стандартное отклонение для случайной величины .

Но для малых выборок (n<30) распределение может значительно отличаться от нормального.

В 1908 г английский математик и химик Уильям Госсет под псевдонимом  Стьюдент предложил распределение случайной величины для малых выборок.

5. Распределение Стьюдента.

Нормированная случайная величина вычисляется по формуле:

Плотность вероятности случайной величины:   

Где Вn  --  параметр , зависит от n.

По мере увеличения объёма выборок n, распределение Стьюдента довольно быстро приближается к нормальному распределению Гаусса и при n˃30 практически не отличается от него.

Практическим следствием этого открытия явилась возможность определять границы доверительного интервала для М[X] с заданной доверительной вероятностью РД:

коэффициент Стьюдента, находим в таблице для заданной РД и известного нам n.

Таким образом, определив доверительный интервал, можно записать:

Контрольные вопросы.

1. Равномерный закон распределения непрерывной случайной величины.

2. Нормальный закон распределения непрерывной случайной величины.

3. Основные понятия математической статистики.

Рекомендуем посмотреть лекцию "10. Состав транспортного потока".

4. Схема предварительной обработки экспериментальных данных.

5. Статистические характеристики совокупности.

6. Ошибка среднего арифметического.

7. Доверительный интервал и доверительная вероятность.

8. Распределение Стьюдента.

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5167
Авторов
на СтудИзбе
437
Средний доход
с одного платного файла
Обучение Подробнее