В.Ю. Королев - Теория вероятностей и математическая статистика (1115266), страница 27
Текст из файла (страница 27)
По тому, насюлью велика зта статнстнка, можно сделать вывод о неадекватности или адекватности теоретнчесюго распределення (его согласни с экспернмевтальнымн данными). Чем эта статнстика больше, тем менее адекватна теоретнческая модель. А именно, макно показать, что в силу соотношения (2.4.7), если верна пшотеза Г(х) аа Го(х), то прн неограниченном увелнчении объема выборки (н -ь оо) распределение величины ~/й1)я все больше и больше сближается с функцией распределении Кол(е) могорова Х(х).
Поэтому„если мы зафиксируем произвольное малое положительное число а и, как и ранее, (1 — а)-кваитнлв распределения Колмогорова обозначим через к(1 — а), то указанная пшота)а отклоняется, если ~~ляг( ) > й(1 — а). Бслн же ~/йПи( ) ( 1(1 - а), то делается вывод о том, что экспервментальные данные не противоречат выдвинутой гипотезе, то есть согласуются с ней. При этом вероатносп ошибочного отклонения гипотезы Г(х) ая Го(х), если она на самом деле верна, равна а.
Критерий согласия Колмогорова можно применять толью тогда, югда выдвинутая гипотеза однозначно описывает непрерывное распределенне генеральной совокупности, то есть не содержит никаких неизвестных параметров. Например, с его помощью нельзя проверять гнпотезу "распределение генеральной совокупностн нормально", посюльку нормальных распределений бесюнечно много и каждое из них определяется парой параметров, но можно проверить гипотезу "распределение генеральной совокупности нормально с параметрами О н 1". При подстановке оценок параметров, построенных по выборке, вместо неизвестных параметров гнпотетичесюй функции распределения в статистику Колмогорова 1)( ) (о) изнвняанся ее предельное раслредеяение, юторое становится зависящим от юнкретного вида гнпотетнчесюй функции распределения н спосо- 2.И 11ссаадаааиис сиишастичссиии аааисииостсй 158 ба получения оценок.
А зто означает, что истинная вероятность ошибки будет отличаться от требуемого значения (оставаясь, вообще говоря, нензееспюй). 2.6. Исследование стохастических зависимостей 2.6.1. Выборочный коэффициент коррелнцнн Предположим, что изучаются л обьектов, причем для каждого из них независимо от друпгх обьектов одновременно измеряются два параметра (например, для каждого из л человек измершстся рост и вес).
результаты измерения представляют собой набор (Хп У1), (Хз, УЗ),..., (Х„, У„), где Х; — значение первого параметра, назовем его, сюжем, Х, зафиксированное для 1-го объекта, У; — значение второго параметра, назовем его, скажем, У, у 1-го объекта. В зтом случае говорят, что наблюдения (измерелия) представляют собой двумерную выборку. Степень взаимозависимости наблюдаемых параметров может характеризовать юзффициент коррешщии (см. раздел 1.5.2). В качестве выборочного хозффиццвюло корреляции признаюв Х и У естественно взять величину ~,".
1(х, - х)(У)-У) ~1,(х;-х)(У)-У) г хг— лбххг ~1,(Х, — Х)з~» 1(У; — У)з ~,". 1х)Уу — лхУ 1 ЕХ) л, 1 1 1 Х'(х х)2, л 1-1 д б.2. Меввод иоииеиьиоа квадромое 159 2.6.2. Линейная регрессия. Метод наименьших квадратов При исследовании зависимостей часто сталкиваются со следующей задачей, являющейся развитием проблем, для решения юторых был введен коэффициент корреляции. Пусть в отношении взаимосвязи между признаками (параметрами) Х и У сделано прешюложение, что их математические ожидания связаны линейной зависимостью: ЕУ = аЕХ+Ь. (6.2.1) У) = ах1 + ь + в, (6.2.2) где е, 1 = 1,..., н — случайные величины с нулевым математическим ожиданием: Ее = О.
Параметры а и Ь моделей (6.2.1) и (6.2.й), как правило, неизвестны и и подлежат определеншо (оцениванию) с помощью статистических процедур Эффективный способ оценивания параметров а и Ь заключается а минимизации суммы квадратов отклонений величин У) от аХ~ + Ь, то есть в выборе в качестве оценок для а и Ь таких функций а и Ь от К~ и 1', г = 1,..., н, для которых выполнено соотношение ~ (11 — аХ) -Ь) ~ ~(У) — аХ) — Ь) 1=1 1=1 для любых допустимых значений а и Ь. Такой подход привацит к следу ющим приближениям.
Во введенных выше обозначениях мы имеем ~;",Х)У)--„'');".,Х,~„-,".,У, „1~,",ХД-Х К а-а М 1Х2- (у)2 в Х2 1(~в Х) ЬжЬ=У вЂ” аХ. Зависимость типа (6.2.1), связывающая не сами наблюдения (Ху, 1~), а их ожидаемые величины, называется регрессионной. Прн зтом в случае (6.2.1) говорят о линейной регрессии У на Х. Соотношению (6.2.1) соответствует связь между наблюдениями (Х~, У~ ), имеющая вид Люнерангура Несложно видеть, что Уу и =гху Вх Рекомендуемая литература 1.
С. А. Айвазян, И. С. Бюоков н Л.Д. Маяалкии. Прикладная сюаюмсаика. Осно моделирования и иеремчиая обрабоюка данных. "Финансы и статястнка", Мосю 1983. 2. С. А. Айвазян, И. С. Бюоков и Л. Д. Мсшалкви. Прикладная сюааисюики. й следоеанме заемсммосюей. "Финансы я ствтистякй, Мосзза, 1985. 3. С.
А. Айвазян, В. М. Бухппабер, И. С. Баюнов и Л. Д. Мешалкин. Пргагладн сюанюсамка. Классификация и сниясенне размерносюи. "Фюгансы и ствгистны Москва, 1989. 4. С. А. Айвазян и В. С. Мхвтарзн. Прикладная сюааисмиаю м осноеы зкононе рмкм. Издательсюс обьадвяеюп ЮНИТИ, Москва, 1998.
5. Б. В. Гясдснко и А. Я. Хиичви. Зымеюмарное ееедение е юеормю аерсаюноснн 9-е юд. "Наука", Москва, 1982. 6. Г. Кимбл. Как нрааизыю нгаьзоеааься сниинмсюнкой. "Фюансы к статаснш 1зйгсквф, 1982. 7. А. И. Квтайгородсквй. Невероятно — не фаюн. "Молодая варина"„Москва, 19~ 8. Б. А. Севастьянов. Вердяюносюнме модели.
"Наука", Мосша, 1992. 9. В. Фсшар. Веедение е теорию ееролюносюей м ее ярвюжения. Т. Б "Май Мосша, 1984. 1О. В. Фсллср. Веедение е теорию аерояюноснюй и ее лризамання. Х 2. "Мщ Москва, 1984. .