Популярные услуги

Любая задача по линалу
КМ-3 Важнейшие аспекты теории графов - любой вариант за 3 суток!
Любая задача по математическому анализу и по интегралам и дифференциальным уравнениям
Решу любую задачу
Любая задача по Линейной алгебре и аналитической геометрии
НОМОТЕХ
Повышение уникальности твоей работе
Предельные теоремы и математическая статистика
Любая задача из Демидовича
Сдам любой тест по дискретке в течение суток на положительную оценку!

Распределения

2021-03-09СтудИзба

1.2. Распределения

Предварительное изучение большинства данных облегчается построением диаграмм. Диаграммы наглядно показывают главные свойства данных. Они не заменяют важные проверки, которым данные могут быть подвергнуты, но являются ценными для выявления необходимости таких проверок и объяснения, полученных на основе их выводов.

Точечная диаграмма и распределение по фрагментам

На Рис.1.2.1 представлена точечная диаграмма, показывающая разброс приведённых выше результатов наблюдений. Легко обнаружить, что точечная диаграмма является полезным способом изображения распределения малого числа данных. В частности, она показывает:

  1. Положение центра результатов наблюдений (в этом примере видно, что они группируются около числа 67, а не около 70 или 63).
  2. Разброс наблюдений (в этом примере они разбросаны в интервале из 5 единиц).
  3. Имеются ли в данных некоторые результаты, которые сильно отличаются от остальных. Такие резко выделяющиеся значения могут быть результатом небрежной записи данных или невнимательности в проведении отдельного опыта.


Рис. 1.2.1. Точечная диаграмма для выборки результатов 10 наблюдений.

Когда имеется большое число результатов наблюдений, то представление этих данных может быть улучшено путём построения диаграммы их распределения по фрагментам. Эта диаграмма называется также гистограммой. Её построение осуществляется разбиением горизонтальной оси значений результатов наблюдений на некоторое число интервалов определённой длины и построением на каждом i-м интервале прямоугольника с площадью пропорциональной числу ni результатов наблюдений, попадающих в i-й интервал.

Рассмотрим распределение по фрагментам N=360 значений выраженной в процентах относительной погрешности, полученных в результате калибровки жидкостных кондуктометров для измерения электрической проводимости. Число фрагментов обычно выбирается между 5 и 20. Выбирая слишком много или мало фрагментов, не способствует выявлению сущности распределения рассматриваемых данных. Максимальное число фрагментов можно вычислить, например, по формуле

nф=1+3,3log(N)                                              (1.2.1)

или найти приблизительно в виде nф.

Рекомендуемые материалы

Для построения гистограммы распределения данных по фрагментам можно использовать, например, встроенную в компьютерную программу Mathcad 13 функцию histogram(nф, N). Для N=360 расчёт по формуле (1.2.1) даёт nф=9,4, а также ≈19,0. Поэтому гистограммы распределений рассматриваемых данных с 9 и 18 фрагментами показаны на Рис.1.2.1. Из рисунка видно, что гистограмма с 9 фрагментами лучше представляет распределение данных. На ней видны положение центра данных и их разброс.

         

Рис.1.2.1. Гистограммы распределения по фрагментам выборки из 360 значений.

Упражнение 1.2.1. Постройте точечную диаграмму для данных пробега в километрах на литр для пяти испытываемых машин: 7,6; 6,1; 6,7; 7,7; 8,6.

Упражнение 1.2.2. Постройте гистограмму частот в МГц, на которых работают микропроцессоры для следующих данных:

680 669 719 699 670 710 722 663 658 634 720 690 677 669 700 718 690 681 702 696 692 690 694 660 649 675 701 721 683 735 688 763 672 698 659 704 681 679 691 683 705 746 706 649 668 672 690 724 652 720 660 695 701 724 668 698 668 660 680 739 717 727 653 637 660 693 679 682 724 642 704 695 704 652 664 702 661 720 695 670 656 718 660 648 683 723 710 680 684 705 681 748 697 703 660 722 662 644 683 695 678 674 656 667 683 691 680 685 681 715 665 676 665 675 655 659 720 675 697 663 [Montgomery, Runger (2011) стр. 203]

Гипотетическая популяция результатов и их вероятность

Всё множество значений, которые получаются в итоге многократных вычислений относительной погрешности по результатам измерительного эксперимента, может рассматриваться как популяция или совокупность значений. Такая популяция обычно теоретически считается бесконечной, но для целей этой книги будем считать её состоящей из большого числа N членов. Получаемое в действительности, как правило, небольшое число значений представляется в виде некоторой выборки из этой мыслимой популяции. При увеличении числа рассматриваемых значений скачки в гистограмме постепенно уменьшаются и, для 100 000 значений относительной погрешности, может получиться показанная на Рис.1.2.2 гистограмма.

Рис. 1.2.2. Гипотетическое распределение вероятности для мысленно представляемой популяции значений относительной погрешности.

Если площади прямоугольников на каждом i-м интервалом этой гистограммы сделать равными отношениям ni/N, где ni – число попадающих в i-й интервал значений, а N - общее число рассматриваемых значений, то это равносильно выбору шкалы вертикальной оси так, что площадь всей гистограммы равна единице /N=1. И если считать, что ni является числом независимых и равновозможных значений, то отношение ni/N является вероятностью ni значений

Pr(ni)=ni/N.                                                    (1.2.2)

Случайность и вероятность

Случайность выбора справедлива только при условии, что каждый член популяции имеет одинаковую вероятность быть выбранным. Представим, что результаты N вычислений относительной погрешности записаны на билетах, помещённых в лотерейный барабан. Из барабана случайно выбран билет с записью некоторого числа (у). Тогда,

1. Вероятность Pr(у<y0), что число (у) меньше заданного значения y0, будет равна площади гистограммы слева от y0. Для распределения на Рис.1.2.2, если y0=0, то вероятность выбора билета с числом (у) меньше 0 равна 0,666, то есть Pr(у<y0) =0,666. Эта вероятность равна отношению числа членов популяции меньших y0=0 к общему числу членов популяции.

2. Вероятность Pr(у>y0), что выбранный билет с числом (у) большим, чем y0, будет равна площади гистограммы справа от y0. Это эквивалентно отношению числа членов популяции больших y0=0 к общему числу членов популяции.

3. Вероятность Pr(y0<у<y1), что выбранный билет с числом (у) больше y0, но меньше y1, будет равна площади гистограммы между y0 и y1. Например, на Рис.1.2.2 часть гистограммы между 0 и 0,5 имеет площадь 0,328 и поэтому Pr(0<у<0,5)=0,328. Эта вероятность находится как отношение числа членов популяции больших y0=0, но меньших y1=0,5 к общему числу членов популяции.

С точностью до величины деления горизонтальной оси такая гистограмма для всех чисел популяции сообщает всё, что можно знать о вероятности попадания в пределы любого заданного интервала значений случайно выбранного члена популяции. Эта гистограмма называется распределением вероятности переменной (у), значениями которой являются числа, записанные на случайно выбираемых билетах. Такая переменная (у), принимающая только одно значение при выполнении каждого опыта (например, случайного выбора билета из барабана), называется случайной переменной.

Плотность вероятности

Пусть величина интервала разбиения горизонтальной оси составляет h единиц измерения. Положим также, что для отдельного интервала размером h прямоугольник над ним имеет высоту pу(y), а площадь этого прямоугольника равна P. (Напомним, что площадь P=n/N является вероятностью того, что интервал содержит случайно выбранное значение y случайной переменной у.) Тогда площадь прямоугольника P=pу(yh, а его высота pу(y)=P/h. Таким образом, являющаяся ординатой pу(y) плотность вероятности получается делением вероятности, то есть, площади прямоугольника над данным интервалом, на длину этого интервала. Вероятность всегда представляется площадью. Ордината pу(y) распределения, то есть плотность в точке y, не является вероятностью. Вероятность получается только, когда плотность вероятности умножается на длину интервала. Плотность вероятности имеет тот же смысл, что и физическая плотность. Знать весовую плотность некоторого металла ещё недостаточно, чтобы знать, сколько весит данный кусок этого металла. Чтобы это узнать, надо умножить его весовую плотность на объём этого куска. Отсюда имеем вероятность = плотность вероятности х длина интервала, просто, как вес = весовая плотность х объём.

Представление распределения вероятности непрерывной кривой

Если считать, что интервал h гистограммы взят очень малым, то связанная с ним вероятность P становится также очень малой. Однако неважно, в какой степени будут малы интервал h и вероятность P. Их отношение P/h является плотностью вероятности p(y), которая является всё же конечной величиной. В пределе, когда интервал становится бесконечно малым, можно полагать, что популяция представляется непрерывным распределением вероятности, изображённым на Рис.1.2.3 непрерывной линией.


Рис.1.2.3. График непрерывного распределения вероятности.

Когда для представления этого непрерывного распределения вероятности используется математическая функция, то её называют функцией плотности вероятности. Одной из таких теоретических функцией является функция плотности вероятности распределения по нормальному закону. Как и ранее, общая площадь под непрерывной кривой распределения вероятности должна равняться единице, а площадь между любыми двумя значениями y0 и y1 равна вероятности Pr(y0<у<y1).

Иногда задают вопрос: «Если случайная переменная (у) представляется непрерывной кривой распределения вероятности, то какова вероятность получения определённого её значения, скажем, y=66,3?» Если этот вопрос означает поиск вероятности значения y точно равного 66,300000000..., что соответствует точке на горизонтальной оси, то ответ будет нуль, так как при h=0 и вероятность P=pу(yh=0. Поэтому этот вопрос надо понимать так: «Если наблюдения сделаны, скажем, с погрешностью ±0,05, то какова вероятность получения значения y=66,3?» Очевидно, что ответ на этот вопрос не нуль. Если допустить, что все значения между 66,25 и 66,35 записываются как y=66,3, то искомой вероятностью является Pr(66,25<у<66,35). Эта вероятность равна площади под кривой распределения вероятности между двумя значениями 66,25 и 66,35 и адекватно представляется произведением pу(66,3)х0,1.

Люди также интересуются этой лекцией: 5 Операционная система Linux.

Усреднённое выборки и среднее популяции

Важной характеристикой выборки значений n наблюдений является их усреднённое значение обозначаемое  (читается y с чертой). Для изображённых на Рис.1.2.1 значений 10 результатов наблюдений их усреднённое = (66,7+64,3+...+66,4)/10 =66,62.

В общем случае, для выборки, состоящей из n наблюдений, усреднённое значение находится по формуле

= (y1+y2+...+yn)/n=.                               (1.2.3)

Так как  указывает местоположение центра разброса членов выборки по оси y, то усреднённое  является мерой центра выборки. Если вообразить гипотетическую популяцию, содержащую очень большое число N значений наблюдений, то удобно обозначить соответствующую меру положения греческой буквой y (пси) и называть это средним популяции значений переменной (у), так что

y =.                                                (1.2.4)

Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5167
Авторов
на СтудИзбе
437
Средний доход
с одного платного файла
Обучение Подробнее