Н.А. Спирин, В.В. Лавров - Методы планирования и обработки результатов инженерного эксперимента (1062945), страница 18
Текст из файла (страница 18)
ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХЧисло степеней свободы m=k-2 относится к такому случаю, когда обапараметра нормального закона распределения определяются по результатамизмерений, т.е. когда вместо точных измерений значений Mx и σx применяют ихэмпирические значения (оценки) x и Sx. Если же значение Mx точно известно(например, при измерении эталона), то число степеней свободы равно k=n-1;если известны оба параметра Mx и σx, то число степеней свободы равно k=n. Напрактике такая ситуация встречается относительно редко, и поэтому дляполучения числа степеней свободы не менее пяти желательно брать числоинтервалов не менее семи (иногда девяти).Критерий Колмогорова–СмирноваРассмотримиспользованиекритерияКолмогорова–Смирновадляпроверки гипотезы нормальности распределения случайных величин.
Даннаяпроцедуратакжеэкспериментальнопредполагаетполученныхпостроениезначенийстаблицыраспределениягруппировкойданныхвопределенное число разрядов k. Дополнительно в таблицу необходимовключить следующие колонки:− колонку с накопительной суммойi∑ mpp =1для каждого i-го интерваласгруппированных данных, как показано в табл.3.6.Таблица 3.6Процедура вычисления критерия Колмогорова–СмирноваЧислозамеровв каждоминтервалеmii∑ mpp =1ТеоретическаявероятностьPi*n∑ Pii *∑ m p − n ∑ Ppp =1p =1x1 ÷ x2m1m1P1*nP1*⏐ m 1- nP1* ⏐x2 ÷ x3m2m 1+ m 2P2*n( P1* + P2* )......………⏐ ( m 1+ m 2)-n( P1* + P2* )⏐…xi ÷ xi+1mii∑ mpp =1Pi*in ∑ Pp* ,p =1ii *∑ m p − n ∑ Ppp =1p =1......…………Интервал108ip =1*p3.
ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХxk ÷ xk+1k∑ mpp =1mkPk*− колонку с накопительной суммойin ∑ Pp* ,p =1kn ∑ Pp* ,p =1kk *∑ m p − n ∑ Ppp =1p =1где Р* – теоретическаявероятность попадания случайной величины в i-й интервал, значениякоторой, как уже отмечалось ранее, табулированы и приводятся встатистических справочниках.На основании данных табл.3.6 вычисляют экспериментальное значениекритерия согласия Колмогорова–Смирнова:maxD =iip =1p =1∑ m p − n∑ Pp*n(3.58а).Далее экспериментальное значение критерия Колмогорова–Смирновасравнивают с теоретическим Dn;α, которое определяют из статистическихтаблиц в соответствии с объемом выборки n и требуемым уровнем значимостиα (см.
табл. П.10). Если D<Dn;α , то гипотеза о нормальном распределениирезультатов замеров принимается с вероятностью P=1-α.Критерий согласия Колмогорова–Смирнова для проверки нормальностираспределения результатов наблюдений входит в пакет статистическойобработки данных STATISTICA, с которым мы познакомимся в главе 7.Рассмотрим использование рассмотренных критериев χ2 Пирсона иКолмогорова–Смирнова для оценки нормальности распределения данных наследующем примере.Пример 3.8. В табл. 3.7 приведено содержание кремния в чугуне привыплавке передельного чугуна в доменной печи, которое изменяется впределах от 0,32 до 0,95%. Всего было отобрано 50 проб чугуна.Требуется оценить, подчиняется ли содержание кремния в пробахнормальному закону распределения? Если да, определить медиану, моду,среднее,выборочнуюдисперсию,доверительныйинтервалдляматематического ожидания, среднеквадратичное отклонение.
Для вычислений1093. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХвоспользуемся статистическими функциями из электронной таблицы MicrosoftExcel.Предварительно вычислим с использованием статистических функцийСРЗНАЧ,ДИСПиСТАНДОТКЛОНсреднеезначениеx,выборочнуюдисперсию Sx2 и стандартное отклонение Sx, которые оказались равнысоответственно x =0,65, Sx2=0,01853 и Sx=0,1361.Таблица 3.7Содержание кремния в чугуне по результатам отбора 50 пробНомерпробы[Si],%Номерпробы[Si],%Номерпробы[Si],%Номерпробы[Si],%Номерпробы[Si],%123456789100,32 0,35 0,45 0,43 0,41 0,51 0,52 0,53 0,57 0,58111213141516171819200,59 0,56 0,56 0,58 0,54 0,57 0,61 0,62 0,63 0,64212223242526272829300,65 0,66 0,67 0,68 0,69 0,61 0,65 0,62 0,63 0,67313233343536373839400,65 0,62 0,68 0,71 0,72 0,78 0,75 0,72 0,79 0,72414243444546474849500,73 0,72 0,79 0,73 0,84 0,82 0,87 0,90 0,95 0,93Примем число интервалов равным 7.
Тогда величина интерваласоставит h=(0,95-0,32)/7=0,09=0,1. Результаты группировки исходныхданных и вычислений приведены в табл. 3.8.Таблица 3.8Процедура вычисления критерия χ2 Пирсона по данным примера 3.8Интервалmi -(m i − nPi *)2miF( x i )Pi*=F(xi)-F(xi-1)nPi*0,3÷0,420,0330,0331,70,40,070,4÷0,530,1350,1025,1-2,10,870,5÷0,6110,3560,22111,1-0,10,000,6÷0,7170,6420,28614,32,70,510,7÷0,8110,8640,22211,1-0,10,00xi-1÷xi110nPi*χ2 =inPi3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ0,8÷0,940,9670,1035,2-1,20,260,9÷1,020,9950,0281,40,60,26Вычисление F(xi) проводили с использованием статистической функцииНОРМРАСП.
В частности, для интервала 0,3÷0,4 находимНОРМРАСП(0,4; СРЗНАЧ(B4:B53); СТАНДОТКЛОН(B4:B53);ИСТИНА)=0,033.Отметим, что поскольку среди аргументов функции НОРМРАСП есть среднееарифметическоеистандартноеотклонение,тодляопределениясоответствующих параметров также воспользуемся встроенными функциямиэлектронныхтаблицMicrosoftExcelСРЗНАЧ()иСТАНДОТКЛОН().Впоказанном примере полагаем, что данные 50 опытов по содержанию кремнияв чугуне расположены на листе электронной таблицы в ячейках от B4 до B53.Аналогично определяли функции распределения для каждого интервала,результаты отражены в табл. 3.8.Такимобразом,экспериментальноезначениекритерияПирсонаkχ = ∑ χ i2 = 1,96 , а теоретическое при уровне значимости α=0,05 и числе2i =1степенейсвободыm1=7-2=5составляетχ20,05;5=11,07(ХИ2ОБР(0,05;5)=11,07048), что значительно больше экспериментального значения.Следовательно, весьма уверенно можно утверждать, что содержаниекремния в пробах чугуна подчиняется нормальному закону распределения.Предлагаеминтервалчитателямматематическогосамостоятельноожидания.Здесьоценитьможнодоверительныйотметить,что,какпоказывают расчеты, доверительный интервал с вероятностью 95% равен0,030.
Учитывая близость распределения к нормальному и достаточно большоечислоэкспериментальныхточек,можновоспользоватьсяэлектроннымитаблицами Microsoft Excel (функция ДОВЕРИТ), т.е. действительное среднеесодержание кремния в чугуне (математическое ожидание) лежит в интервале от0,62% до 0,68%.Процедура проверки гипотезы нормального распределения данных изпримера с использованием критерия Колмогорова–Смирнова (D) представленав табл.3.9.1113. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХТаблица 3.9Процедура вычисления критерия Колмогорова–Смирновапо данным примера 3.8Интервалxi-1÷ximii∑ mpp =10,3÷0,40,4÷0,50,5÷0,60,6÷0,70,7÷0,80,8÷0,90,9÷1,02311171142251633444850F(xi)Pi*=F(xi)-F(xi-1)nPi*in ∑ Pp*p =1ii *∑ m p − n ∑ Ppp =1p =10,0330,1350,3560,6420,8640,9670,9950,0330,1020,2210,2860,2220,1030,0281,75,111,114,311,15,21,41,76,817,832,143,248,449,80,41,81,80,90,80,30,3На основании результатов этой таблицы определяем максимальноезначение из последней колонки и по нему рассчитываем экспериментальноезначение критерия D:imaxD =∑mipp =1− n∑ Pp*p =1n=1,8= 0,036.50Экспериментальное значение критерия сравниваем с теоретическимD50;0,05 =0,177, взятым из табл.
П.10 с учетом объема выборки n=50 и уровнемзначимости α=0,05. Величина D50;0,05 >D, поэтому можно сделать тот же вывод,что и ранее: гипотеза нормального распределения результатов измерениясодержания кремния в чугуне принимается с вероятностью 95%.Пример 3.9. В табл. 3.10 приведено содержание оксида железа в шлакеперед раскислением металла при выплавке стали марки 0,8 КП в 200 -тонноймартеновскойпечи,работающейсприменениемкислородадляинтенсификации горения топлива и прямого окисления примесей ванны.
Всегоотобрано 56 проб шлака.1123. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХТаблица 3.10Исходные данные к примеру 3.9lхi, %:mi101213141516171819202223242526303115366286641411110∑ mii =1169152123313743474852535455565617*∑ x i ⋅ mix= 1= 17,375;17∑ mi1172∑ mi ⋅ x i − x= 16,0;S2x = 117∑ mi − 11S x = 4,0.()Из табл. 3.10 видно, что содержание оксида железа в шлаке колеблетсяот 10 до 31%. Примем число интервалов равным k=7. Тогда величинаинтервала составит h=(31-10)/7=3.
Результаты группировки исходных данных ивычислений приведены в табл. 3.11. Расчетное значение критерия Пирсонасоставило χ2=3,861. Его следует сравнить с табличным значением χ2α;m для 5%-ного уровня значимости, которое при числе степеней свободы, равном m=5,составляет χ20,05;5=11,07.1133. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХТаблица 3.11Процедура вычисления критерия χ2 по данным примера 3.9Интервал mixi-1÷xiF(xi)10÷13613÷1616÷1919÷2222÷2525÷2828÷31Сумма151610621560,03260,1370,3660,6580,8760,9720,9961,000-mi-nPi(m i − nPi )(m i − nPi ) 2Pi=F(xi)F(xi-1)nPi0,1045,8240,1760,0310,0050,2290,2920,2180,0960,0240,004-12,82416,35212,2085,3761,3440,224-2,1760,3522,2080,6240,6560,776-4,7350,1244,8750,3890,4300,602-0,3690,0080,3990,0720,3202,688Σ=3,861χ i2=nPiТаким образом, опытные данные не противоречат гипотезе о том, чтосодержаниеFeOвконечномшлакеподчиняетсязаконунормальногораспределения.
Оцените самостоятельно моду, медиану, доверительныйинтервал для математического ожидания при вероятностях 90, 95 и 99,7%.3.7. Преобразование распределений к нормальномуЕсли исследователь, использовав методы, изложенные в предыдущемпараграфе, убедился, что гипотеза нормальности распределения не можетбыть принята, то вполне может быть, что с помощью существующих методовудастся так преобразовать исходные данные, что их распределение будетподчинятьсянормальномупреобразованийзаконурассмотримраспределения.качественныйДляпример.поясненияПустьидеикриваяраспределения f(x) имеет вид, представленный на рис.