Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 4
Текст из файла (страница 4)
методы, свободные от предположенийо распределении и потому более универсальные.Таблицы. По многим просьбам преподавателей, использующих пре"дыдущие издания этой книги в учебном процессе, в настоящее изданиедобавлены статистические таблицы. Они кроме, широко распростра"ненных в учебной литературе таблиц нормального и связанного с нимраспределений, включают мало доступные таблицы для основных непа"раметрических критериев.Порядок чтения книги.
Читать эту книгу можно в различном по"рядке. Тем, кто только начинает знакомиться с теорией статистики, мысоветуем прочитать сначала главы 1, 3 , 4 и 15. Они содержат базовыепонятия прикладной статистики. К главе 2, содержащей сведения обосновных вероятностных распределениях, можно обращаться по меренеобходимости. Те, кто уже знаком с такими понятиями, как случай"14ная величина, распределение вероятностей, статистические гипотезы иоценки, статистические критерии, уровни значимости, доверительныеинтервалы и т.п., могут начинать чтение с любой из интересующихих глав. Знакомство с работой типичных статистических процедур наперсональном компьютере полезно начинать с приложения 1, где опи"сываются общая архитектура пакетов, их интерфейсы, возможностиработы с данными и пр.Предварительные сведения. От читателя этой книги мы стара"лись не требовать особой математической подготовки — сведений изпрограммы первого курса вуза более чем достаточно.
Для использованиякомпьютерных разделов книги вполне достаточно общего знакомства синтерфейсом Windows.Обозначения. При записи чисел мы придерживались американскойсистемы записи, т.е. целая часть от дробной отделяется не запятой, аточкой (скажем, два с половиной — это 2.5, а не 2,5). Дело в том, чтоименно такая форма записи чисел принята в статистических пакетах,а кроме того, при этом списки чисел, которые нам иногда приходитсяиспользовать в книге, становятся проще для восприятия.Числами в квадратных скобках обозначаются книги или статьииз списка литературы (так, [4] — ссылка на третью книгу в спискелитературы).Сведения об авторахТюрин Юрий Николаевич — д.ф."м.н., профессор кафедрытеории вероятностей механико"математического факультета МГУим.
М.В.Ломоносова. Много лет читал курсы теоретической и при"кладной статистики на различных факультетах МГУ, в других учебныхзаведениях России и иных стран. Область научных интересов — общиевопросы статистической теории, а также многомерный и непараметри"ческий анализ.Макаров Алексей Алексеевич — к.ф."м.н., ведущий научный со"трудник НИИ Механики МГУ, доцент кафедры математики Высшейшколы экономики. Область научных интересов — непараметрическиеметоды анализа данных, стохастические модели мониторинга компью"терных сетей, статистические пакеты, прикладные задачи в бизнесе,маркетинге, логистике, экономике, медицине и т.д.Предложения и замечания по данной книге просьба посылать поадресу: 117899, Москва, Мичуринский проспект, д.1, НИИ механикиМГУ, Макарову А.А.
E"mail: makarov@imec.msu.ru, тел.: (095)939"5306151…… …… Цель этой главы — познакомить читателя с основными понятия"ми теории вероятностей и статистики, на которые опирается анализданных изменчивой (случайной) природы. Не стремясь к строгому фор"мальному изложению, мы расскажем о случайных событиях и случай"ных величинах, об их характеристиках: распределении вероятностей,математическом ожидании, дисперсии и т.д. Будут введены наиболеераспространенные понятия описательной статистики, используемые приобработке данных, такие как генеральная совокупность, выборка, вы"борочная функция распределения, медиана, квантили, гистограмма идр.
В конце главы мы опишем, как можно вычислить соответствующиехарактеристики на компьютере.1.1. … ƒ…Статистика изучает числа, чтобы обнаружить в них закономерности.Все мы хорошо знакомы с закономерными явлениями и закономернымиизменениями, они составляют главный объект научных исследований.Например, исследователя могут интересовать вопросы типа: как изме"няется давление в жидкости с изменением глубины? С какой скоростьюдвижутся падающие тела? Как будет проходить химическая реакция,если мы определенным образом изменим температуру, давление и кон"центрации участвующих в реакции веществ и т.п. Знание законовприроды позволяют нам ответить на подобные вопросы, не производяреальных опытов, т.е. заранее. Например, мы можем точно вычислить,какие вещества и в какой пропорции образуются при той или иной хими"ческой реакции, или предсказать, когда в данной местности произойдетследующее солнечное затмение.Но отнюдь не во всех ситуациях интересующий нас результат полно"стью и жестко определяется влияющими на него факторами.
Например,мы не можем указать, сколько часов будет светить электрическая лам"почка или как долго будет служить телевизионный приемник. Невоз"можно предвидеть число посетителей магазина и количество товаров,которое они купят, каков будет результат бросания игральных костейи т.д. Ответы на подобные вопросы можно получить, только проведя16соответствующие испытания. Часто явления (ситуации), в которых ре"зультат полностью определяется влияющими на него факторами, назы"ваются детерминированными или закономерными, а те, в которых этоне выполняется — недетерминированными или стохастическими.Идея случайности. Для описания явлений с неопределеннымисходом (как в повседневной жизни, так и в науке) используется идеяслучайности.
Согласно этой идее, результат явления с неопределеннымисходом как бы определяется неким случайным испытанием, случайнымэкспериментом, случайным выбором. Иначе говоря, считается, что длявыбора исхода в неопределенной ситуации природа словно бы бросаеткости. Вопрос о том, насколько применим такой подход к явлениямокружающего мира, решается не путем его логического обоснования, апо результатам практического применения.Замечание. Вопросы о том, существует ли случайность «на самом де"ле», о происхождении случайного и соотношении закономерного и случайногоявляются дискуссионными философскими темами. Действительно, закономер"ные изменения, как подчеркивает само их название, порождены определеннымипричинами, которые могут быть названы, указаны и изучены. Отыскивая этипричины, мы исходим из убеждения, что если нечто изменилось, так это потому,что изменилось что"то другое, и это другое служит причиной первому.
Когда жеизменения происходят при полной неизменности условий, в которых протекаетявление, мы объясняем это случайностью. Но поскольку полной неизменностиусловий на практике достичь невозможно, сохраняется логическая возможностьотрицать наличие в природе случайности и объяснять неопределенность резуль"татов эксперимента воздействием неизвестных нам и неучтенных факторов. Мыне будем входить в эти философские споры и будем рассматривать проблемыслучайности чисто технически, принимая этот подход лишь как модель дляописания непредсказуемой изменчивости, дабы на его основе получать количе"ственные выводы и рекомендации для практики.Случайная изменчивость. Мы все хорошо знаем, что такое зако"номерность.
Например, при формулировке законов природы мы гово"рим, что если одна величина принимает такое"то значение, то другаяпримет такое"то. Случайная изменчивость нам знакома в меньшей сте"пени, а потому о ней надо поговорить подробнее. Для начала лучшевзять такой пример, где случайная изменчивость действует отдельно отзакономерной, так сказать, «в чистом виде».Рассмотрим пример, заимствованный из книги А.Хальда. В таблице1.1 приведены размеры головок 200 заклепок, изготовленных станком(который делает их тысячами). Все контролируемые условия, в которыхработал станок, оставались неизменными.
В то же время диаметрыголовок раз от разу несколько изменялись. Характерная черта слу"чайных колебаний — эти изменения выглядят бессистемными, хаотич"ными. Действительно, если бы в этих изменениях мы смогли обнару"17жить какую"либо закономерность, у нас появились бы основания, чтобыискать ответственную за эту закономерность причину, тем самым из"менчивость не была бы чисто случайной. Если бы, скажем, с течениемвремени размер головки заклепки проявил тенденцию к увеличению, мымогли бы попытаться связать это, например, с износом инструмента.Таблица 1.1Диаметры 200 головок заклепок, мм13.3913.2813.5313.5713.4013.2913.4313.4113.5513.4313.3413.2313.4313.3813.3413.2813.3313.4313.5213.5313.3313.3413.5813.3613.3913.3313.5113.4913.4413.2613.1413.3713.5813.3313.5413.4613.3913.5113.2313.4413.5613.5013.3213.4313.5013.3813.5013.4213.5013.5813.3113.6413.6313.5713.4013.3713.5613.5113.4813.6913.3813.3813.2713.3813.5213.6113.3813.4513.4013.3813.5113.3013.4813.2813.4713.5313.4613.2413.4813.6613.4313.3813.4213.2613.3913.5513.4413.3413.4813.4813.5913.4013.3413.3213.2813.4313.2613.3413.5413.3213.3713.4513.4013.5213.3913.4013.6213.4713.2913.4513.3213.5813.3713.4013.4113.3013.3513.2813.4113.2613.5313.4713.5713.3513.4613.2013.4213.4813.3113.2913.5213.2413.1813.4013.3913.4513.4213.3713.5113.5113.4013.6213.4613.2913.2913.3113.5413.5913.4213.3213.5713.3213.5013.3313.4813.4013.3613.5413.4413.3813.2513.4513.3313.4813.5513.4613.3113.2013.32 13.3113.24 13.1313.62 13.5813.52 14.5613.45 13.4813.20 13.3813.42 13.2913.45 13.5013.44 13.6013.43 13.4413.36 13.4613.46 13.4013.37 13.4113.39 13.3513.40 13.3613.43 13.34Обсуждение случайной изменчивости не обязательно начинать стакого специального примера.