341_4- Сборник задач по математике для втузов. В 4-х ч. Ч.4_ (ред) Ефимов А.В, Поспелов А.С_2003 -432с (987780), страница 40
Текст из файла (страница 40)
ь Сначала вычисляют суммы ~ пьнп ~~ пзиз, у п! и! ~п зоз ч 1 % ~ 2 ь з=! з=! з=! з=! Е пе. цзи .. Затем определяют следующие суммы: г=! з=! (21) (22) Гл. 19. Математическая статистика 212 Выборочные средние, дисперсии и коэффициент корреляции находят по формулам и,.; ~~ Я.,оа х = Ь + !( , р = 69 + <1,, (24) я я Р =6 —, 2 Ои х и Р' =Ь вЂ”, 2 'эе 9 (25) т= (26) Коэффициенты Д; и Щ* линейной регрессии У на Х и Х на У вычисляют по формулам д иа Ь ч„„ (27) ь„а„' х; — 11,5 !' = 1, 2, ..., 9, ц! = 1 у! — 9 о ! 2 у = 1, 2, ..., 7. Вычисляем следующие суммы: цьи; = 43, ~~! пцо!.
— — — 15, ~ я!.иэ = 215, 9 7 2 87 !',! я! ц!о = 80 2=! 29П По формулам (21)-(23) находим 432 Я„= 215 — — аэ 170,976, Я„= 87 — 81,643, ( — 15)2 Я„„= 80 — а 95,357. 43 ( — 15) 42 (28) Г = Ь'„а". Коэффициенты бо и Доем находят по формулам (17) и (19). Пример 10. Проведя группировку выборки примера 7, вычислить выборочные средние, дисперсии, коэффициент корреляции, а также выборочные коэффициенты линейной регрессии Х на У и У на Х. 2 Выберем Ь, = 1, 69 = 2. Прямоугольная сетка, соответствующая этим значениям, нанесена на диаграмму рассеивания (рис. 30).
Непосредственно по диаграмме строим корреляционную таблицу (таблица 1.6) . Находим !(' = 11,5, !('„= 9 и вычисляем значения и! и о! по формулам Гл. 19. Математическая статистика 214 ЯОг АВОз ЯОг А1гоз 87ог А1гоз ЯОг А!гоз 57,8 17,2 54,6 17,9 54,8 18,8 51,7 19,9 61,1 16,0 62,3 1 7,8 52,2 18,8 49,2 19,3 53,9 16,1 60,0 14,8 56,2 17,0 55,2 17,8 53,3 19,9 57,9 17,1 54,0 15,5 52,6 17,6 53,8 16,3 53,6 17,2 51,5 15,3 54,0 15,0 50,4 14,4 53,0 15,3 53,3 16,6 51,6 14,9 50,9 14,7 49,6 16,1 52,2 19,5 50,5 15,6 51,1 18,1 52,2 19,5 49,2 15,7 49,3 13,2 48,8 16,4 53,5 15,9 52,3 15,9 52,9 14,8 52,1 19,8 47,3 18,7 49,8 20,2 49,3 17,6 5О,1 Ю,2 54,4 !8,2 49,0 16,8 48,9 18,2 51,3 19,7 51,6 19,6 46,2 19,! 50,4 20,2 50,7 21,5 бз,! Я,з 52,9 20,3 51,3 20,1 52,7 17,2 46,6 15,6 46,5 16,0 51,3 15,5 Ы,О 19,2 47,5 18,5 47,7 19,0 44,9 16,6 49,4 16,0 48,9 18,6 48,8 19,4 50,6 18,9 По формулам (24)-(26) вычисляем 43 ( — 15) х=1 — +11,5 12,52, у=2 ° +9 8,28, 42 ' ' ' 42 170,976 81,643 0* = 1 ' = 4,071, 17'„= 2 — ' 7,775, 42 ' ' " 42 95,357 7 774,474 47,444 Выборочные коэффициенты регрессии вычисляем по формулам (27), (28), (17) и (19): 2 95,357 1 95,357 1 170,976 ' ' ' 2 81,643 До =828 112'1252 574 78~0, 1252 058 828 772 Таким образом, уравнение линейной регрессии У на Х имеет вид р = — 5,74+ 1,12х, а уравнение линейной регрессии Х на У имеет вид х = 7,72+ 0,58у.
Расхождение полученных результатов с результатами примеров 8 и 9 обу- словлено группировкой. 1> 19.80, В таблице 1.7 приводятся результаты лабораторного ана- лиза 64 образцов сланцевых пород на содержание двуокиси крем- ния (%02) и двуокиси алюминия (А!20з) (в условных единицах). Вычислить коэффициент корреляции между этими признаками, предварительно сгруппировав эти данные в корреляционную таб- лицу.
Таблица 1.7 9 1. Методы статистического описания результатов наблюдений 21! Вычислить коэффициент корреляции и найти уравнения пря. мых регрессии У на Х и Х на У по данным в следующих корре ляционных таблицах (задачи 19.81-19.84): 19.81. 19.82. 19.83. Гл. 19.
Математическая статистика 216 19.84. В задачах 19.85 — 19.90 найти числовые характеристики системы двух случайных величин и коэффициенты регрессии У на Х и Х на У по данным выборкам. 19.86. 19.8Т. 19.85. Э 1. Методы статистического описания результатов наблюдений 217 19.88. 19.90. 19.89. 19.91. Построить диаграммы рассеяния для каждого из четырех приведенных в таблице (с. 218) множеств данных э). Для каждого набора данных найдите и нанесите на диаграмму рассеяния график линейной регрессии у и т.
Прокомментируйте полученные результаты. 19.92. Получить выборку объема и = 100 из генеральной совокупности, имеющей биномиальное распределение О (10; О,З). Полученные данные представить в виде статистического ряда. Построить эмпирическую функцию распределения и гистограмму частот. Найти выборочные среднее, дисперсию, коэффициенты асимметрии и эксцесса. 19.93. Получить выборку объема и = 100 из генеральной совокупности, имеющей нормальное распределение А!(5, 2). Выполнить группировку полученных данных. Построить гистограмму частот. Найти выборочные среднее, дисперсию, коэффициенты асимметрии и эксцесса.
19.94. Решить предыдущую задачу по данным 100 реализаций случайной величины Х, имеющей экспоненциальное распределение Ех (3). ) Апясотбе г.з. Сгарпв !и Б!а!!э!!са! Апа1ув!в, Атег!сап 8!а!!я!!с!ап, 17 — 21, 1973, Гл. 19. Математическая статистика 218 Таблица к задаче 19.91. у' х №и/и У1 Хг Хз Х1 7,46 8 9,14 6,58 10 8,04 10 10 6,95 8 5,76 6,77 8 8,14 12,74 8 7,71 7,58 13 8,74 13 13 7,114 8 8,84 8,77 8,81 9 7,814 8 8,47 9,26 8,33 11 7,04 8,84 8 14 9,96 14 8,10 14 5,25 6,13 7,24 6 6,08 8 12,5 5,39 19 4,26 4 3,10 8,15 8 6,42 8 12 10,84 12 482 7 9,13 12 5,96 74П 7,26 10 6,89 5,68 5 4,74 5,73 8 9,0 9,0 9,0 9,0 19.95. Получить выборку объема п = 100 из двумерной нормально распределенной генеральной совокупности с параметрами тх = 3, т,.
= б, оз = 1, о2 = 2, рхг =. 0,8. Найти выборочные средние, дисперсии и коэффициент корреляции. Вычислить коэффициенты линейной регрессии Х на У и У на Х. 92. Статистическое опенивание характеристик распределении генеральной совокупности по выборке 1. Точечные оценки и их свойства. Метод подстановки. Основная задача математической статистики состоит в нахождении распределения наблюдаемой случайной величины Х по данным выборки. Во многих случаях вид распределения Х можно считать известным, и задача сводится к получению приближенных значений неизвестных параметров этого распределения.
Пусть Г,1х, 6) — функция распределения Р 4У, 'еи Я„ 7,50 110,0 41,27 55,01 7,50 7,50 7,50 110,0 110,0 110,0 41,27 41,23 41,23 55,00 54,97 54,99 З 2. Статистическое оценяванне аспределенил по выборке 219 случайной величины Х, содержащая один неизвестный параметр В, а хы хг,..., х„ — выборка наблюдений этой случайной величины. Точечной оценкой В неизвестного параметра В называется приближенное значение этого параметра, полученное по выборке.
Очевидно, что оценка В есть значение некоторой функции элементов выборки, т.е. В = В [хы хг,..., х„). Любую функцию элементов выборки называют статистикой. Чтобы выяснить, какие свойства должна иметь статистика В[хм хэ, ..., х„) для того, чтобьч ее значения могли бы считаться хорошей в некотором смысле оценкой параметра В, ее рассматривают как функцию случайного вектора (Хм Хг, ..., Х„), одной из реализаций которого является данн я выборка х1, хг, ..., х„. Так как закон распределенин каждой из случайных величин Х„1 = 1, 2, ..., и, есть Гл(х, В), являющаяся функцией параметра В, то н распределение статистики В[хм хг, ...,х„) также зависит от неизвестного параметра В. Качество оценок характеризуется следующими основными свойствами: 1.
Состоятельность. Оценка В = В„= В(хы ..., х„) называется состоятельной оценкой параметра В, если В„сходится по вероятности к В при и -+ со. Последнее означает, что Че ) 0 Р [[„— В/ < е[-+ 1 при и -+ оо. Состоятельность оценки В„во многих случаях может быть установлена с помощью следующей теоремы. Теорема 1. Если М [В„[ -+ В и 0 [В„] -+ 0 при и -+ оо, то „— состоятельная оценка параметра В. 2. Несмещенность. Оценка В называется несмещенной оценкой параметра В, если ее математическое ожидание равно оцениваемому параметру, т.е. М[В[ = В. Разность М [В[ — В называется смещением. Для несмешенных оценок систематическая ошибка оценивания равна нулю. Простейший метод статистического оценивания — метод подстановки или аналогии — состоит в том, что в качестве оценки той или иной числовой характеристики [среднего, дисперсии и др.) генеральной совокупности берут соответствующую характеристику распределения выборки — выборочную характеристику.
Пример 1. Пусть хы хг, ..., х„— выборка нз генеральной сово- Р пности с конечными математическим ожиданием т и лисперсией о~. спользуя метод подстановки, найти оценку т. Проверить несмешенНость и состоятельность полученной оценки. 0 По методу подстановки в качестве оценки т математического ожидания надо взять математическое ожидание распределения выборки— Гл.19. Математическая статистика 220 выборочное среднее. Таким образом, получаем 1 т=х= — д~ х,. я 1=1 М[Х;] = — ит = т, 1 я а=1 П 1 э О [Х;] = — поо =— я' я ~=1 М[Х] = М О[Х] = 0 Отсюда по определению получаем, что Х вЂ” несмещенная оценка т, и так как 0 [Х] -+ 0 при я — ~ оо, то в силу теоремы 1 Х является состоятельной оценкой математического ожидания тл генеральной совокупности. > 19,96. Пусть хы хэ, ..., х„— выборка наблюдений случайной величины Х.
Используя метод подстановки, найти оценки следующих числовых характеристик случайной величины Х: дисперсии, медианы, асимметрии, эксцесса. 19.9Т*, Пусть хы хэ, ..., х„— выборка из генеральной совокупности с конечным начальным моментом ггть Используя метод подстановки, найти оценку начального момента ггь Показать, что полученная оценка является несмещенной и состоятельной. 19.98*. Предположим, что выборка хы хэ, ..., х„получена из генеральной совокупности с конечными математическим ожиданием т и дисперсией оэ.
Показать, что выборочная дисперсия Р„' = — ~~> (х, — х) 1 является смещенной оценкой дисперсии генеральной совокупности, и найти ее смещение. 19.99 (продолжение). В условиях предыдущей задачи показать., что несмещенная оценка дисперсии генеральной совокупности задается статистикой з = ~~> (х, — х)~. 1 19.100**. Показать, что оценки Р„ *и з~, полученные в задачах 19.98 и 19.99 соответственно, являются состоятельными оценками дисперсии генеральной совокупности.
Чтобы проверить несмещенность и состоятельность выборочного среднего как оценки т, рассмотрим эту статистику как функцию выборочного вектора (Хы ..., Х„). По определению выборочного вектора имеем: М[Х;] = т и Р[Х,] = пт, 1 = 1, 2,..., и, причем Х, — независимые в совокупности случайные величины. Следовательно, э 2. Статистическое оцеиивание распределения но выборке 221 19.101. Пусть хм ..., х„— выборка из генеральной совокупности с известным средним т и неизвестной дисперсией о2. Показать, что несмещенной оценкой о2 будет статистика во = ~~~~~(х' гп) .