Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 13
Текст из файла (страница 13)
Для получения этого значения достаточно вы"честь из накопленного процента для значения 13.30 (15%) накопленныйпроцент предыдущих интервалов (в данном случае 1%).Есть и другие непрямые пути решения этой задачи в SPSS. Так,можно использовать процедуру Record (перекодировки) из меню Transformпанели управления редактора данных. Но и этой процедуре приходитсявручную задавать границы всех интервалов группировки. Не будемболее подробно останавливаться на этом способе.Êîììåíòàðèè. Этот пример показывает, что даже в очень хорошемстатистическом пакете может не быть удобных инструментов для решенияочень простой задачи. Следует помнить, что часть возможностей пакета SPSS недоступна непосредственно из меню пакета, а требует обращения к командномуязыку пакета со всеми вытекающими отсюда преимуществами и неудобствами.Пример 1.3к.
Для выборки диаметров головок заклепок построитьгистограмму частот с шагом группировки 0.075 мм на интервале от 13до 13.75 мм (т.е. без учета сильно выделяющегося наблюдения).Ïîäãîòîâêà äàííûõ выполняется так же, как в примере 1.1к.Âûáîð ïðîöåäóðû. В меню пункта Graphs (графики) панели упра"вления редактора данных следует выбрать процедуру Histogram. При этомпоявится окно ввода данных и параметров процедуры (рис. 1.28).Çàïîëíåíèå ïîëåé ââîäà äàííûõ.
Следует выделить перемен"ную d в левой части окна и перенести ее в поле Variable. Затем нажмитекнопку «OK». Окно ввода параметров процедуры также позволяет предва"рительно оформить заголовки и подзаголовки графика (кнопка «Titles»)и использовать подготовленные ранее различные элементы оформления62Для задания параметров группировки данных вручную в меню Chart(диаграммы) редактора графиков следует выбрать процедуру Axis (оси). Впоявившемся окне Axis Selection указать режим Interval. На экране появитсяокно Interval Axis (рис. 1.30).
В блоке Interval выбрать режим Custom (заказпользователя) и нажать кнопку «Define».Рис. 1.28. Пакет SPSS. Окно ввода данных и параметров процедуры «Histogram»графика (блок Template (шаблоны)). Кроме того, на график гистограм"мы может быть наложена подобранная кривая плотности нормальногораспределения (опция Display normal curve).Пакет SPSS в автоматическом режиме выбирает диапозон построе"ния гистограммы и число интервалов группировки и помещает постро"енный график в окно навигатора вывода.
Чтобы задать указанные вышепараметры гистограммы вручную необходимо дважды щелкнуть мышкойна полученном графике. При этом произойдет переход в окно редактораграфиков пакета, как это показано на рис. 1.29а.Рис. 1.30. Пакет SPSS. Окно настройки параметров осей графикаВ появившемся окне Interval Axis: Define Custom Intervals (рис. 1.31) задатьтребуемые границы диапозона группировки данных и число интервалов,как это показано на рис. 1.31. Нажать кнопку «Continue», а затем кнопку«OK» в окне Interval Axis.Рис. 1.31.
Пакет SPSS. Окно настройки диапозонавывода и числа интервалов группировки гистограммыРезультаты работы процедуры в окне редактора графиков приведенына рис. 1.29b. Одновременно происходит коррекция графика и в окненавигатора вывода результатов.Рис. 1.29. Пакет SPSS. Гистограмма диаметров головок заклепокв окне графического редактора. а — построенная в автоматическомрежиме, b — после задания параметров группировки вручнуюÊîììåíòàðèé. 1. Гистораммы строят процедуры Frequencies и Explore из менюDescriptive Statistics и ряд других.
При этом все они используют автоматический6364режим выбора параметров группировки данных. Все эти процедуры помещаютпостроенный график гистограммы в окно навигатора вывода как самостоятель"ный объект. Для задания требуемых параметров группировки гистограммынеобходимо каждый раз проделать процедуру, описанную выше.Другие возможности. На наш взгляд, наиболее полно различныеописательные характеристики выборок представляет в пакете SPSSпроцедура Explore. Она очень хорошо позволяет судить о наличии ввыборке нехарактерных значений, показывая несколько минимальныхи максимальных элементов выборки и выделяя их на графике «ящик сусами».
Кроме того эта процедура позволяет судить об устойчивостиоценки среднего значения, вычисляя усеченные оценки и различныеробастные оценки среднего, а также строя доверительные интервалы длясреднего значения. Мы частично расскажем о работе этой процедурыв гл. 10, обсуждая критерии согласия.652"›… ƒ…… …Подчиняются ли каким"то законам явления, носящие случайный ха"рактер? Да, но эти законы отличаются от привычных нам физическихзаконов.
Значения случайных величин невозможно предугадать дажепри полностью известных условиях эксперимента, в котором они изме"ряются. Мы можем лишь указать вероятности того, что случайнаявеличина принимает то или иное значение или попадает в то или иноемножество. Зато зная распределения вероятностей интересующих насслучайных величин, мы можем делать выводы об событиях, в которыхучаствуют эти случайные величины. Правда, эти выводы будут такженосить вероятностный характер. В последующих главах этой книги мырасскажем о том, как при знании распределений вероятностей или принекоторых предположениях относительно этих распределений делаютсястатистические выводы: как проверяются гипотезы, оцениваются пара"метры, определяются допустимые отклонения или вероятности ошибокэтих оценок и т.д.Но среди всех вероятностных распределений есть такие, которыеиспользуются на практике особенно часто.
Эти распределения детальноизучены и свойства их хорошо известны. Многие из этих распределенийлежат в основе целых областей знания — таких, как теория массовогообслуживания, теория надежности, контроль качества, теория измере"ний, теория игр и т.п. В этой главе мы расскажем о некоторых из такихраспределений, покажем типичные ситуации, в которых они необходи"мы, дадим описания наиболее распространенных таблиц распределенийи правил их использования.
Материал главы имеет справочный харак"тер и постоянно используется в дальнейшем тексте. При первом зна"комстве его достаточно лишь бегло просмотреть, возвращаясь к нему вдальнейшем по необходимости.Большинство применяемых на практике распределений являютсядискретными или непрерывными. Среди дискретных распределений бу"дут рассмотрены биномиальное и пуассоновское, среди непрерывных —показательное, нормальное и связанные с ним распределения: Стьюден"та, хи"квадрат и F "распределение Фишера. Последние особенно частоиспользуются при построении доверительных интервалов и проверкегипотез.66Более подробное изложение свойств этих и многих других распре"делений можно найти в [19], [65], [77], [87] и [111].2.1.
%…… …Область применения. Биномиальное распределение — это одноиз самых распространенных дискретных распределений, оно служитвероятностной моделью для многих явлений. Оно возникает в тех слу"чаях, когда нас интересует, сколько раз происходит некоторое событиев серии из определенного числа независимых наблюдений (опытов),выполняемых в одинаковых условиях.
Поясним сказанное на примере.Рассмотрим какое"либо массовое производство. Даже во время егонормальной работы иногда изготавливаются изделия, не соответствую"щие стандарту, т.е. дефектные. Обозначим долю дефектных изделийчерез p, 0 < p < 1. Какое именно произведенное изделие окажетсянегодным, сказать заранее (до его изготовления) невозможно. Дляописания подобной ситуации обычно используется следующая матема"тическая модель:а) каждое изделие с вероятностью p может оказаться дефектным(с вероятностью q = 1 − p оно соответствует стандарту); этавероятность для всех изделий одинакова;б) появление как дефектных, так и стандартных изделий происхо"дит независимо друг от друга.
Это значит, что в нормальномпроцессе производства появление бракованного изделия не вли"яет на возможность появления брака в дальнейшем. Наруше"ние этого условия означает сбой нормального технологическогорежима.Последовательность независимых испытаний, в которых результа"том каждого из испытаний может быть один из двух исходов (например,успех и неудача), и вероятность «успеха» (или «неудачи») в каждомиз испытаний одна и та же, называется схемой испытаний Бернулли.Поэтому мы можем перефразировать вышесказанное так: в нормальныхусловиях технологический процесс производства математически пред"ставляется схемой испытаний Бернулли.Для чего же на производстве требуется подсчитывать число дефект"ных изделий? Как правило, это делается для контроля технологическогопроцесса.