Л.Н. Фадеева, А.В. Лебедев - Теория вероятностей и математическая статистика, страница 54
Описание файла
DJVU-файл из архива "Л.Н. Фадеева, А.В. Лебедев - Теория вероятностей и математическая статистика", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из 3 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 54 - страница
Вычисления показывают, что и в этом случае гипотеза принимается. П1. Экономисты также используют критерий Х' в качестве критерия однородности. Пусть имеется гс а 2 независимых выборок, содержащих соответственно п„п„..., п„независимых наблюдений: (х„х„...,х ); (У~ Уг " Уч )' -~ (х~~гг~- ~ал ). Гипотеза об однородности предполагает, что генеральные совокупности, из которых извлечены выборки, одинаковы (или все выборки произведены из одной генеральной совокупности) и им соответствуют одинаковые функции распределения. Наиболее часто в приложениях встречается случай, когда lс = 2.
Пусть есть два ряда наблюдений некоторого признака, и каждый ряд разбит на г групп по значениям этого признака. Сгруппированный ряд имеет вид: ЧАСТЬ и. Математическая статистика Пусть т, и 1, — число выборочных значений в г-й группе соответственно для первого и второго наблюдений. Тогда статистический критерий для проверки истинности нулевой гипотезы принимает вид если Х' <Х„'и,, то нулевая гипотеза принимается, в противном случае отвергается. Если положить и,= ' и те= — ', то формулу можит, +1, ГА +От но представить в виде, часто более удобном для практических расчетов: у = ~ — ' — = ~титы,— и,тг . Задачи 3.
Распределение доходов среди рабочих и служащих согласно шведской переписи 1930 года приведено в таблице. С помощью критерия Пирсона проверьте гипотезу об одинаковости распределения доходов у двух возрастных групп для заводских мастеров и всех рабочих и служащих. Все рабочие и саужаппге а промыпыеииости Зааодсаие мастера Возрастные группы Доходы, 1000 прои Возрастиые группы 50-60 50 — 60 0 — 1 7831 7558 0,508869 0,568000 1 — 2 26 740 20 685 0,563837 430 324 0,570291 2 — 3 35 572 24 186 0,595267 !072 894 0,545269 3 — 4 0,629784 1609 0,629787 1178 20 009 12 280 11 527 6776 1202 0,572394 0,566074 4-6 903 6919 4222 0,621039 158 112 0,585185 збг и в случае истинности основной гипотезы при л -+ о он имеет предельное распределение Х', с г — 1 степенями свободы.
Критическими точками, соответствующими уровню значимости ст, будут Х ... и проверка гипотезы проводится по общей схеме: Глава 16 ф Решение. Рассматривается гипотеза однородности: обе выборки (по возрастным группам) извлечены из одной генеральной совокупности. Статистика критерия при проверке основной гипотезы имеет вид Для заводских мастеров получаем т' = 4,27. Отсюда т' < Х,'„., = 11,1 и можно считать, что две выборки извлечены из однкомйл генеральной совокупности.
Но если сравнить распределение доходов у возрастных групп всех промышленных рабочих и служащих, то получаем х' = 840,б2, что указывает на очень высокую степень различия между распределениями. При этом видно, что числа в1 имеют тенденцию возрастать с ростом доходов. $ аб.2.
Критерий согласия Колмогорова Критерий согласия Колмогорова применяют для проверки гипотез о законах распределения только непрерывных случайных величин. Проверяем гипотезу Н,: г(х) = Рв(х) против альтернативной Н,: У(х) ~ Рв(х). Критерий основан на том факте, что распределение супремума разности между теоретической и эмпирической функциями распределения Р„= зцр)Р„(х) — г(х)( одинаково для любой У(х). Величину Р„называют статистикой Колмогорова.
При малых и для статистики Колмогорова существуют таблицы критических точек Р„в. Если Р„< Р„,, то гипотеза Н, принимается, иначе отвергается. При больших и используют предельное распределение Колмогорова. Имеет место следующая теорема. ° Теорема 2 (Колмогорова) Р(.АР„<х)- Ц(х)=1+2~ ( — 1)'е '"", и- оо. Для распределения Колмогорова Д(х), предельного для статистики л.=.ЯР„, также существуют таблицы критических збз ! й) ЧАСТЬ ! !. Математическая статистика точек я, . Практически их используют уже при и > 20.
Если Х„< Х~, то гипотеза И, принимается, иначе отвергается. Покажем, что распределение статистики Колмогорова Р„не зависит от вида неизвестной функции распределения Р[х). Рассмотрим преобразование Г = Р(г), 0 < г' < 1. Можно предположить, что Р(г) — строго возрастающая функция. Тогда существует обратное преобразование г = Р'(Р). Разность функций распределения равна где Р(Р '(Г)) = ""са~" Р (~).
Однако из неравенства х. < Р'(Р) п следует, что Р(х) < Р. Пусть Р[х,.) = т1,. и обозначим через Ф„(г) выборочную функцию распределения для Ч„Ч„..., т1„. Теоретическая функция распределения для т! следующая: Ф(Г) = Р(т1т< Д) = Р(Р(х) < Р) = Р(х! < Р '(Р)) = = Р(Р '(Р)) = г', и в силу свойств вероятности можно записать О, Р~О, Ф(Р) = Т', 0(Р(1, 1, т'>1 Следовательно, Ф(Р) является функцией распределения равномерной случайной величины, заданной на отрезке [О, 1], т.е.
г1х,.) имеет равномерное распределение на отрезке [О, Ц. Тогда статистика Ю„= птах !٠— Р„(г) ! = птах !и — Р„(Р'(Р)! = птах !г' — Ф„(Р) ! имеет ту же величину, но уже для извеспюго (равномерного) распределения. Таким образом доказано, что распределение статистики Р„не зависит от вида неизвестной функции распределения Р[х). Функция распределения Х[х) может быть и разрывной, хотя она может иметь разрывы только первого рода, являющиеся скачками, и поэтому выборочную статистику Ю„в общем случае определяют с помощью точной верхней границы (зир): и = щр [Рк(х) Ре(х)1' Гудава ~б ф Введем также статистики Р„= аар [У'„(х) — Е„(х)] и Р„' = вар [Р(х) — г0(х)] тогда Ю„= пзах[ Р„,Р„"].
Статистики Р„, Р' называют статистиками Смирнова. На практике статистику Колмогорова можно считать по формуле 21-1~ 1 Р„=щах Г(хю — — ~+ —, 0 1 /<и 2л ~ 2л где х,„— члены вариационного ряда. Заметим, что критерий Колмогорова, строго говоря, нельзя применять в случаях сгруппированных данных при неизвестных параметрах распределения. Тем не менее, его иногда применяют на практике и в подобных ситуациях. Однако при этом статистики критерия получаются заниженными, что увеличивает ошибку первого рода. В таких случаях предпочтительней пользоваться критерием хи-квадрат Пирсона. Проверка гипотезы однородности с помощью критерия Колмогорова-Смирнова состоит в следующем. Пусть х„х„..., х„и у„у„..., у„— выборки из двух генеральных совокупностей.
Требуется проверить нулевую гипотезу Н, о совпадении законов распределения генеральных совокупностей, из которых произведены выборки. Определим эмпирические функции распределения У "' и Р,"" '. Для проверки гипотезы вводятся статистики: Пусть л„л, <о, „— ~"г и предельные функции г,(х) и и,+л, Р;(х) непрерывны. Тогда в условиях истинности нулевой гипотезы статистика Р„„Я имеет в пределе распределение Колмо- 365 аа ЧАСТЬ Н.
Математическая статистика горова. Критической областью является область больших значений, т.е. основная гипотеза отклоняется, если р.../и, > Л,— критическая точка распределения Колмогорова, соответствующая уровню значимости а. Задачи 4. Пассажир, приходящий в случайные моменты времени на автобусную остановку, в течение пяти поездок фиксировал время ожидания автобуса: 5,1; 3,7; 1,2; 9,2„ 4,8 мин. Проверить гипотезу о том, что время ожидания равномерно распределено на отрезке 10; 10] на уровне значимости а = 0,05. Решение. Составим вариационный ряд: 1,2; 3,7; 4,8; 5,1; 9,2. С учетом того, что в данном случае Ре(х) = х/10, 0 < х < 10, построим таблицу.
Таким образом, значение статистики Колмогорова составляет Ю, = 0,18 + 0,1 = 0,28. По таблице критических точек при а = 0,05 и и = 5 находим В„, = 0,56. Поскольку Ю < О~, нулевая гипотеза (о равномерности распределения) принимается. Замечание. На самом деле по таким небольшим выборкам, конечно же, нельзя делать далеко идущие выводы. Задача 5.
Выборка из 10 наблюдений приведена в таблице. Проверить с помощью критерия Колмогорова гипотезу о том, что эта выборка из генеральной совокупности, равномерно распределенной на отрезке 10, Г1. Уровень значимости а = 0,05. з66 Глава вб 8!р Решение. Пусть г(х,.) = г, Задача 6. В таблице приведены условные данные о заработной плате и, = 100 и н, = 100 служащих двух отраслей народного хозяйства. Проверить с помощью критерия Колмогорова гипотезу о том, что распределение заработной платы служащих первой отрасли (Р(х)) совпадает с распределением заработной платы служащих второй отрасли (Р,(х)). Уровень значимости а = 0,05. Решение. к;(к ) Р(х ) — Г(х ) х;(к ) Зарплата х, у, 150 0,04 0,01 0,03 130...150 4 1 150...170 4 1 0,08 0,02 0,06 170 170...200 15 8 0,23 0,10 0,13 250 0,74 0,53 0,21 200...250 51 43 0,96 250...300 22 34 300...350 3 7 300 0,87 0,09 0,05 350 0,99 0,94 0,97 0,03 350...400 1 3 500 1,00 0,00 367 Из таблицы получаем Р„= 0,25.
По заданному уровню зйачимости а = 0,05 находим критическую точку Рвв = 0,41. Поскольку Р„< Р„,, то гипотеза принимается. бВ1 ЧАСТЬ Н. Математическая статнсгика Используя значения эмпирических функций распределения в правых концах интервалов, получаем данные для расчета критических статистик. Получаем к= 21,м, ~Г50 =0 2Ь/50 0=14849, = — = 50. а+я, г По таблице критических точек распределения Колмогорова находим А = 1,36. Поскольку А > Х„,, гипотеза однородности отвергается. Задачи для самостоятельного решения Теоретические задачи т.
В городе тт о96 семей имеют двоих детей. В 45з9 семьях — два мальчика, в 4019 — две девочки, в 8488 семьях — мальчик и девочка. Можно ли на уровне значимости о,о5 считать, что число мальчиков в семьях с двумя детьми имеет биномиальное распределение с вероятностью рождения мальчика о,515т г. Проведено исследование посещаемости популярного интернетсайта.
Долгое время регистрируется число людей, посетивших сайт в течение данного часа. Результаты исследования представлены в таблице. На уровне значимости а о,о5 проверить гипотезу, что посещаемость сайта можно описать распределением Пуассона. зб8 Глава тб З. Проведено исследование посещаемости популярного интернетсайта. Долгое время регистрируется число людей, посетивших сайт в течение данного часа. Результаты исследования представлены в таблице. На уровне значимости а = о,об проверить гипотезу, что посещаемость сайта можно описать биномиальным распределением с числом испытаний т = то.
а. В ОТК были измерены диаметры Зоо валиков из партии, изготовленной одним станком-автоматом. Отклонения измеренных диаметров от номинала, нм, даны в таблице. На уровне значимости а о,об проверить гипотезу, что отклонения диаметров от номинала можно описать нормальным распределением. 369 в8 чАСТь и. Математическая статистика 5. В таблиЦе пРеДставлены Данные о числе сДелок пя заключенных на фондовой бирже за квартал, для 4оо инвесторов. На уровне значимости а - о,о5 проверить гипотезу о том, что число сделок, заключенных инвестором за квартал, имеет распределение Пуассона. 6. В таблице представлены данные о месячных доходах х„ руб.,жителей региона для топо жителей: На уровне значимости а = о,о5 проверить гипотезу, что доходы жителей региона можно описать нормальным распределением.