В.Г. Блохин - Современный эксперимент (1062943), страница 3
Текст из файла (страница 3)
щт). Г1рнаедвнныа в таблица данные яв>яются тнщщным крнмсром статнстнчсской связя двух нарамстров. В нсй каждому заданному значскшо л, соотвстствует статнстячсгкос рзсирсдщ>сш>с значсннй у>, которое, в свою очередь, меняется с измсвсвнсм знв кчщн кь Лсйствнтсллно, если длн значщшя хз= 1,32 мкм. распре- дслгннс звачсннй у> имеет ввд бо Сб л 0'й --- б'х 00'1;=бМ б бо о бо 00.1 =бх 1о о бо об об йГ!='х о В о о Ф о б о о бб о ж 'бб о о. о йб 1="" йй'1 =-б'х М1=-"х Ой'1 =б'х 0Я 1- ох й~'!=ох йй'1-.."х ~0'1=ббх йс'! =-бх йй'! =-бх йй'1=-бх ФФ'1 =-бх ОФ'1 =-'х со со об о бо \:о сб об об сб б о .о л бо П ! 11 11 11 П В Как можно увидеть, прн нзмененнн значения Х изменяются не только значсння у, но н нх частоты.
Анапа>нчную кзртнну для х, н соответствующих нм п;т можно наблюдать. если задаваться по табл, !.! определеннымн значенпнмп уь Для постросю<я математической модели, отображающей зависимость функции отклика У от фактора Х, статистические данные, подобные приведенным в табл. 1.1, обрабатывают, подсчитывая средние значения сначала, например, функции отклика у,=. =-(Уп„у!)/(юп<!) для каждого определенного значения хп которые наносят на прямоугольную систему координат, где по осв ордянат откладывают значения уа, а по осп абсцисс — соответствующие им значения хь Апал<>гичным образом находят средние значения х< длн каждого значения уа и также наносят на соответствующую прямоугольную систему координат. По виду графическоп» изображения обработанных экспериментальных данных судят о наличии влияния одного параметра на другой.
Если такое влияние обнаружено, то можно говорить о наличии, так называемой„ корреляционной связи между рассматриваемыми параметрами. Полученные экспериментальные кривые называют криво<а<и регрессии, которыеь в свою очередь, могут быть представлены уравнениями вида У=1(Х) и Х=<р(У), называемыми урпвнениями регрессии соответственно У на Х и Х на У. Насколько тесна корреляционная связь и является зависимость между рассматриваемыми параметрами прямолинейной нлн криволинейной,— объективный ответ даст проведение корреляционного и регрессионного анализа результатов экспериментальных данных. Целью корреляционного анализа является установление тесноты корреляционной связи между рассматриваемыми параметрами, а целью регрессионного анализа — установление формьг этой связи (является ли корреляционная связь прямолинейной или криволинейной и каким конкретно уравнением регрессии она может быть описана).
При этом могут возникнуть следующие варианты. 1. Оба признака Х и У тесно связаны друг с другом (например„ электрический ток н напряжение в законе Ома — функциональная связь. Зависимость между обоими признаками выражается в виде формулы. При функциональных связях, как уже отмечалось ранее, каждому определенному значению х соответствует вполне определеннос одно или несколько зпачсппй у. и наоборот. 2. Оба признака Х и У не строго связаны между собой, и их связь носит статистический характер.
В этом случае каждому. фиксированному значению х соответствуют нс определенные значения у, а ряд пзмснякпцихся вместе с изменением Х значений У и, наоборот, каждому фпксиропгипц>му значению у соответствует ряд значений Х, которые тоже изменяются с изменением У. 3. Оба признака Х и У не связаны мел<ду собой. В этом случае значения признака У нс меня>отея с изменением Х, и наоборот.. Таким образом, оба признака Х и У не зависят друг от друга.
12 Па практике связь между двумя признаками в интересующей власти может быть линейной или приблизительной линейной. )) тех случаях, когда оиа нелинейная, часто путем преобразования (логарифмированием, извлечением корня н т. п.) одного из пришакои можно произвести линеаризацию характера кривой.
Кроме ~ого, практически любая нелинейная зависимость может быть раз,е лена на участки с линейной зависимостью рассматриваемых при«иаков. «Наилучшая» прямая, выравнива1ощая опытные данные, определяется методом наименьших квадратов (см. $1.4). Если наблюдаемые значения признаков обозначить через (хь , у~) (хэ, у2), „., (х„, ух), то прямая регрессии У на Х запишется в !~Ряс у=у+Ь(х — х), (1.3) ~ле у — средняя арифметическая значений уь ум ..., у,; х — сред- ~ яяя арифметическая значений хь хм ..., х„; У определяет ординаты ( точек вычисленной прямой в зависимости от значений признака Х.
Коэффициент Ь и управлении (1.3) иазывшот коэффициентом рсгрессии У на Х и определяют по формуле Ю ~ (х~-х) (у~ — у) ! 1 'Э~ (х~ — х)1 Если рассматривать характер изменения Х по У, т, е, считать„ ч ~о Х зависит от значений признака У, то прямая регрессии Х на У будет иметь вид х =х+ Ь'(у — у), (1,4) Оба уравнения регрессии (1.3) и (1,4) не эквивалентны, так как Ь'чь1/Ь; прямая регрессии У на Х не совпадает с прямой ре~рессии Х на У, хотя обе они проходят через точку с координа~эми (х, у). Графическое изображение регрессии представлено на рис.
1,3. Коэффициент регрессии У на Х равен тангенсу угла между прямой регрессии и осью х(1па), а коэффициент регрессии Х на У— котангенсу угла между прямой регрессии и осью х(с(яр) т. е. 1йо=Ь; 1йф=!/с1йй=!/Ь'. Полученные две прямые регрессии отражают различный подход к проблеме. В первом случае по известному значению Х получаем опенку дхя У, а во втором случае по известному значению У вЂ” оценку для Х. Соответственно для сглаживания эксверн- 13 Рис, 1.3.
Графическое изображение крима>а регрессия р иа Х(>) и Х на У(2) ментальных значений, как будет показано в $ !.4, находим минимум суммы квадратов отклонений по вертикали и горизонтали. Если форма связи рассматриваемых признаков определяется видом уравнения регрессии, то степень связи — коэ4фицигнгом корреляции г ~я~~ (х>- х) (у> — >') (1.й "~ ~(х; — х)> ~Ч~„"(у> — у)а > Из сравнения (1 >>) с выражениями для Ь и Ь' нетрудно увидеть, что г =- .+: )>ЬЬ' =- 4= у(д а/1д (3. (1.0) На основании (1.0>) можно сделать вывод, что при равенстве углов и и (а (что имеет место прн совпадении прямых регрессии У ~ на Х и Х на У, т.
е, при функшн>нальной связи мс:жду призна- > ками Л' и У) с==+1. Если г)О, то линейная функциональная связь прямая (с ро- ' стом значений Х увеличивается У, и наоборот); если г<0, то связь обратная (с ростом значений Л' значения У уменьшаются). При статистическом наблюдении функциональная зависимость превращается в корреляционную (ибо в этом случае имеем дело ' со случайными величинами), поэтому углы наклона прямых ре- ' грессии У на Х и Х на У будут отличаться, причем разность между углами а и () (т. е. угол >р между прямыми регрессии) тем б>ольше, чем меньше единицы абсолютное значение коэффиписпта корреляции, и, наконец, при г=О угол >р=-90', что означает полное отсутствие прямолинейной корреляционной связи между рассматриваемыми признаками. Таким образом, коэффициент корреляции принимает значения от — 1 до + 1.
Прн оценке самоп> коэффици»нта корреляции учитывается число пар пабл>одснпй и, по которым было произведено его пычнс- При небольшом числе пар величина г ~исто значительно отличается от его действительного значения. Поэтому нужен кри* терпй, который установит, случайно лн отклоняется коэффициент корреляции от нуля или имеется корреляционная связь. >4 Т а б л н ц а 1.2. Результаты расчета размаха и стандартного отклонения (ь меэ м)аар КН (э — а р (х~ -М(и; — И( (х,— хя х,л я,(э( 147,217 239,284 334,15 806,34 573 х =-11,45; ((:: 4,786 Для этого выг(исля(от г = = — 'у'Л вЂ” 2 у'~ — гз и оцеиивиот полученное зиачсиис 7 с числом стспсисй свободы :=а--2 по критсриго Стыодеита, 1:ели 1 .
(г (см. табл, ! приложсвия )), то корреляция между рассматриваемыми признаками сущсствует. (1.6а'р Пример 2. В качестве примера исследуем связь мел<ау размахом (( и стандартным отклонением з выборок одинакового объема. Для этого отберем 50 выьорок обьемом п=б из объекта М(х) =50. Для каждой выборки вы велим размах )с (признак х) и стандартное отклонение з (признак у).