Тема 3 (Лекция)
Описание файла
Файл "Тема 3" внутри архива находится в папке "Лекция". PDF-файл из архива "Лекция", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из 3 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст из PDF
Тема 3. Правило сложения дисперсий1. Понятие общей, межгрупповой и внутригрупповой дисперсии.2. Правило сложения дисперсий.3. Коэффициент детерминации и эмпирическое корреляционное отношение.4. Критерий Фишера.1. Общая дисперсия ( об ) характеризирует вариацию признака под влиянием всех условий(факторов) в данной совокупности: ( xij xоб ) 2 m i2 об2 ij miijx об - общая средняя для всей изучаемой совокупности:где x mijx об iijj mijijx nnjjjгде x j - частные средние по группам; k – число групп; nj – число единиц в j-й группе.Межгрупповая дисперсия ( 2 ) измеряет вариацию изучаемого признака, обусловленную (x j xоб ) 2 n j2 влиянием фактора, положенного в основу группировки:jnjjСредняя из внутригрупповых дисперсий ( 2 ) характеризует случайную вариацию,обусловленную влиянием прочих факторов и не связанную с изучаемым фактором:( xij x j ) 2 mij2 j n j i j2 nj mijjij2.
Правило сложения дисперсий: общая дисперсия признакавнутригрупповых дисперсий и межгрупповой дисперсии: об2 равна сумме средней из об2 2 23. Коэффициент детерминации ( ) – показывает, на сколько вариация признака2обусловлена вариацией признака, положенного в основу группировки.2 2 об2Эмпирическое корреляционное отношение ( ) – показатель степени тесноты связи22 обЕсли =0 – связь отсутствует; 0< <0,33 - связь слабая; 0,33 <0,67 – средняя степень теснотысвязи; 0,67 <1 – связь тесная; =1 – функциональная связь.4. При проверке существенности связи часто используется показатель дисперсионноеотношение F (Критерий Фишера):исследуемого явления и группировочного признака.F2 2 ост.:1 2где 2 - факторная дисперсия;2 ост. - остаточная дисперсия;1 ,2 - число степеней свободы;1 k - 1 = количество групп – 1;2 n k = число наблюдений – число групп.Расчетное значение F сравнивается с критическим для принятого уровня значимости ( ) ичисла степеней свободы.
Если Fрасч.>Fкрит., наличие корреляционной связи доказано.При больших числах степеней свободы ( 1 60 и 2 120 ) можно ограничиться расчетомкоэффициента детерминации и корреляционного отношения.Пример:Имеются данные о продолжительности рабочей недели у работающих по найму и уработающих не по найму.Продолжительностьрабочейнедели, час.в том числепоне понаймунаймуmi1mi223181891597398112746159142241625004581035267645804891Всегоработающих,тыс. чел. (mi)110729951586615582958130269471Менее 1616-2021-3031-4041-5051 и болееИтогоРасчет общей средней и дисперсиисерединаинтервалаximi( x i xоб ) 2 mixi45613,514472541253,7618,518407,5303674,92641236157649,836221608855,4461360,68297577,465672912522363,572499183,51822574,89ximi1ximi272443,511044,5292502129112115000579602344810812028,57363119,86869762106814952154373,5( x i x1 ) 2 mi1 ( x i x 2 ) 2 mi 2994173,59189366,07119583,115683,55234740,25401265,461044812,0310290611,7767884,3114251,1747628,0695499,23159482,73675357,27Определить, влияет ли статус в занятости на вариацию продолжительности рабочей недели.1.
Рассчитываем общую среднюю и общую дисперсию (гр.5 и гр.6) (проверка правиласложения дисперсий)i xi mi 2499183,5x об 35,97 час.69471 mii2 об (x x )mобi2mii1822574,89 26,24694712. Рассчитываем общую среднюю, групповые средние (гр.7, гр.8)и дисперсии (гр.9, гр.10)I группа (по найму)II группа (не по найму)x1 x2 x m 2344810 36,31 час.64580m (x x ) m 1044812,03 16,1864580mii1i1i1i1i1n1= 64580x обii2i222 12 x m 154373,5 31,56 час.4891m (x x ) m 657357,27 138,084891m 22i2i2i2n2= 489136,31 64580 31,56 4891 35,97 час.64580 48913. Средняя из внутригрупповых дисперсий2 4.
Межгрупповая дисперсия ( x j xоб ) 2 n j2 jnj16,18 64580 138,08 4891 24,7664580 4891(36,31 35,97) 2 64580 (31,56 35,97) 2 4891 1,4869471jОбщая дисперсия об 24,76 1,48 26,245. Коэффициент детерминации22 1,48 0,056 (5,6%) ,26,24т.е. вариация в продолжительности рабочей недели только на 5,3% обусловлена статусом взанятости.6. Эмпирический коэффициент корреляции 0,056 0,24Значение 0,24 свидетельствует о слабой связи между продолжительностью рабочей недели истатусом в занятости..