Раздаточные материалы, страница 6
Описание файла
PDF-файл из архива "Раздаточные материалы", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из 6 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 6 страницы из PDF
Далее используя соответствующие критерии можно оценить степеньвлияния параметров А и В на исследуемую случайную величину.Если речь идёт о влиянии одного фактора на исследуемую случайную величину, то речьидёт об однофакторном дисперсионном анализе. Если же речь идёт о многих факторах, то говорято многофакторном дисперсионном анализе.Однофакторный дисперсионный анализ.30Большое количество практических задач приводится к задачам однофакторногодисперсионного анализа.Типичным примером является работа технологической линии в составе которой имеетсянесколько параллельных рабочих агрегатов.На выходе имеют место какие-то детали.
Эти детали по какому-то параметру можемконтролировать.Ясно, что среднее значения контролируемых параметров после каждого станка будутнесколько отличаться.Вопрос: Обусловлены ли эти отличия действием случайных факторов или имеет местовлияние конкретного станка агрегата.В данном случае фактор только один – станок.Совокупность размеров деталей подчиняется нормальному закону распределения, и все этисовокупности имеют равные дисперсии.Имеется m станков, т.о.
имеется m совокупностей. Из этих совокупностей мы проводимвыборки объёмом n. Так, что значение параметров i-той совокупности i: xi1 , xi2 ,..., xin .Все выборки можно записать в виде таблицы, которая называется матрицей наблюдения.12.j.nСр. выборочное xi12.ix11x21.xi1x12x22.xi2....x1jx2j.xij....x1nx2n.xin.m.xm1.xm2...xmj...xmnx1x2.xi.xmi \ jВыдвигаем гипотезу Н0 заключающуюся в равенстве средних выборочных.H 0 : x1 = x2 = ... = xmH1 : x1 ≠ x2 ≠ ...
≠ xm − влияние станков значимоГипотеза Н0 проверяется сравнением внутригрупповых и межгрупповых дисперсий по Fкритерию Фишера.Если расхождение незначительно, то принимается гипотеза Н0, в противном случаегипотеза Н0 отвергается.nx1 =x=∑nx1 jj =11mni;nm∑x jn∑∑i =1 j =1xi =xij =j =1;n1mm∑x ;ii =1Далее находят сумму квадратов отклонений от общего среднего:31(xij − x ) = ∑∑ (xij − xi + xi − x )2 =∑∑i 1 j 1i 1 j 1mnmn2=====(xij − xi ) + ∑∑ (xi − x )∑∑i 1 j 1i 1 j 1mnmn22=14=42443==1442443QQ1 = nQ1+2(xij − xi )2 (xi − x )2∑∑i 1 j 1mn=1=44442444430m(xi − x )2∑i 1=()Ноль потому, что стоит сумма от xij − xi ( xi − x ) - сумма отклонений переменных одной142430совокупности от средней арифметической той же совокупности.∑∑ (xij − x )2 = n∑ (xi − x )2 + ∑∑ (xij − x )2mmni =1 j =11442443Qm142441i =43Q1ni =1 j =11442443Q2Слагаемое Q1 является суммой квадратов разностей между средними отдельныхсовокупностей и общей средней всех совокупностей.
Эта сумма называется суммой квадратовотклонений между группами. Она характеризует систематическое отклонение междусовокупностями наблюдений.Величину Q1 – рассеяние по фактору.Слагаемое Q2 – представляет собой сумма квадратов разностей между отдельными исредней соответствующей совокупности. Эта сумма называется суммой квадратов отклоненийвнутри группы.Она характеризует остаточное рассеяние случайных погрешностей совокупностей.Величина Q называется общей или полной суммой квадратов отклонений отдельныхотклонений от общей средней.Получим оценки дисперсий: S 2 , S12 , S 22 .- дисперсия обусловленная влиянием фактора;Q22S 22 == S ост- остаточная дисперсия – влиянием случайных и других неучтённыхm(n − 1)факторов.QS2 =- полная дисперсия.mn − 1Далее формируем оценку различия между оценками S12 и S 22 :Q1S ф2S12(m − 1) = F подчиняется распределению f2 Фишера.= 2 =н2S 2 S ост Q2[m(n − 1)]Выбираем уровень значимости α, или доверительной вероятности 1– α = Р и по таблице Fраспределения с числом степеней свободы: к1 = m–1; к2 = m(n–1) находим критическое значениеFкр ,α Фишера.{}P Fн > Fкр ,α = α{}P Fн ≤ Fкр ,α = P = 1 − αСравнивая между собой Fн и Fкр,α мы делаем вывод насколько сильно влияниеинтересующего нас фактора на исследуемую случайную величину.В этом и состоит идея дисперсионного анализа.Однофакторный дисперсионный анализ обычно представляют в виде таблицы.32ОсновнойфакторСлучайные,неучтенныефакторыКомпонентыдисперсииМежгрупповаядисперсияВнутригрупповаядисперсияОбщая дисперсияОценкиЧисло степенейдисперсиисвободыQS12 = 1 = S ф2m-1m −1Q22S 22 == S остm(n - 1)m(n − 1)S2 =Qmn − 1mn - 1Основы регрессионного и корреляционного анализа.Связи между различными явлениями в природе сложны и многообразны.
В технике чащевсего речь идет о функциональной зависимости. В большинстве случаев интересующие насявления протекают в условиях воздействия на них множества неконтролируемых факторов.Воздействие каждого из этих факторов в целом невелико, при этом связь теряет строгуюфункциональность и система переходит не в строго определенное состояние, а в одно измножества возможных. Речь идет о стохастической связи.Под стохастической мы понимаем такую связь, когда одна случайная переменнаяреагирует на изменения другой случайной переменной изменением своего закона распределения.Наиболее широко в технике используется частный случай стохастической связи,называемый статистической связью, при которой условное МО некоторой случайнойвеличины Y является функцией от значения, которое принимает другая случайная величинаX:M ⎛⎜ y ⎞⎟ = f ( x )⎝ x⎠Как правило исследуются такие виды статистической связи, при которых значениенекоторой случайной переменной зависит в среднем от значений, принимаемых другой случайнойпеременной:M ⎛⎜ y ⎞⎟ = f ( x ) = Y (x)⎝ x⎠xТакое представление зависимости междупеременными X и Y называется полем корреляции.50X, смМожно также построить таблицу корреляции.40Y, смПроделывая операцию усреднения для всех тех(Хi , Yi )30значений Х, по которым есть экспериментальный20материал, приходим к тому, что облако исчезает и10получается набор точек, представляющих средниеyзначения.
Соединяя эти точки, получаем ломанную,305070называемую эмпирической линией регрессии.Связь между СВ характеризуется формой и теснотой связи.Определение фориы связи и понятие регрессии.Определить форму связи между СВ – значит выявить механизм получения зависимойслучайной величины. При изучении статистических связей, форму связей характеризует функциярегрессии:MY= f ( x ) - зависимость условного МОX =xЕсли св Х и Y зависимы, то МО их произведения:()33M ( xy ) = M ( x )M ⎛⎜ y ⎞⎟ = M ( y )M ⎛⎜ x ⎞⎟⎝ x⎠⎝ y⎠Регрессия св Y относительно Х определяется как:(MY) = ∫ yf ⎛⎜⎝ y x ⎞⎟⎠dy ,+∞X =x−∞где f ⎛⎜ y ⎞⎟dy - условная плотность вероятности по формуле Байеса:⎝ x⎠f (x , y )f (x , y )= +∞f ⎛⎜ y ⎞⎟ =x⎠⎝f (x )∫ f (x , y )dy−∞+∞⎞⎟ = xf ( x, y )dx - регрессия Х по Y.M ⎛⎜ X⎝ Y = y ⎠ −∫∞Функция регрессии имеет важное практическое значение.
Она может быть использованадля прогноза значений, которые может принимать известная случайная величина при ставшихизвестными значениях другой случайной величины.Точность прогноза определяется дисперсией условного распределения:22σ2 Y X = x =M Y X = x−M Y X = x =M Y X = x −M2 Y X = x22учитывая: σ 2 ( x ) = M ( x − m x ) = M ( x ) − M 2 ( x )(){()()}()Несмотря на важность функции регрессии, возможности ее практического использованияограничены, т.к. для ее вычисления необходимо знать аналитический вид двумерной функции{x,y}. Мы же, как правило, имеем выборку ограниченного объема.Традиционный путь приводи к большим ошибкам, т.к. одну и ту же совокупность точек наплоскости можно описать с помощью различных функций.Другой характеристикой формы связи, используемой на практике, стала кривая регрессии –зависимость условного среднего случайной величины от значения, которое принимает случайнаявеличина Х: Y ( x ) = f ( x ) .Определение кривой регрессии инвариантно закона совместного распределения св Х и Y.Важное значение в практике имеет двумерный нормальный закон распределения.
Особенностьюэтого распределения является то, что условные МО совпадают с условными средними. При этомфункция регрессии совпадает с кривой регрессии.Линейная регрессия (ЛР). Метод наименьших квадратов.Линейная регрессия занимает в технике и теории корреляции особое место. Онаобусловлена двумерным нормальным законом распределения СВ Х и Y:Y ( x ) = a 0 + a1 x , гдеа0 и а1 – коэффициенты регрессии,х – независимая случайная величинаПараметры уравнения регрессии определяются методом наименьших квадратов,предложенным Лагранжем и Гауссом, который сводится к следующему.Строятся квадратичные формы:nQ = ∑ ( xi − ε ) → min2i =1xi – измеренное значение переменной,ε - истинное или теоретическое значение этой величины.Требуется, чтобы сумма квадратов отклонений измеренных значений относительноистинных была минимальна.34В случае линейной регрессии за теоретическое значение принимается значение Y ( x ) , т.е.ищется такая прямая линия с коэффициентами а0 и а1, чтобы сумма квадратов отклонений от этойлинии была минимальна.nQ = ∑ ( y i − a 0 − a1 x ) ,2i =1а1 :уi – измеренное значение переменной Y.Минимальные квадратичные формы получают, приравнивая к нулю ее производные по а0 и⎧ ∂Q⎪ a = −2∑ ( y − a 0 − a1 x ) = 0⎪∂ 0⎨⎪ ∂Q = −2 ( y − a − a x )x = 0∑01⎪ ∂a1⎩a 0 , a1 = constn∑ a 0 = na0i =0nni =0i =0∑ a 1 x = a1 ∑ x⎧⎪na 0 + a1 ∑ x = ∑ y⎪⎨⎪ax + a1 ∑ x 2 =∑ yx⎪ 0∑⎩∑ y ∑ x − ∑ x∑ yxn∑ yx -∑ x ∑ y2a0 =a1 =⎛⎞⎛⎞n∑ x 2 − ⎜⎜ ∑ x ⎟⎟ 2n∑ x 2 − ⎜⎜ ∑ x ⎟⎟ 2⎝⎠⎝⎠Нелинейная регрессия (НР).Форма связи между условными средними определяется уравнениями регрессии.