Стат20514 (1120234), страница 3
Текст из файла (страница 3)
8.21 10.13 Вывод: так как R^2 = 1, прослеживается явная зависимость, ошибка 0 12.01 13.92 15.82 17.73 19.61 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0.82 0.91 1.07 1.14 1.24 1.36 1.5 1.65 1.73 1.82 0.5 1 0 0.5 1 0 0.5 1 0 0 0 0 0.5 0.5 0.5 1 1 1 Проведено измерение содержания вещества в серии образцов двумя методами: стандартным (A) и новым (B). Проверить новый метод на систематические ошибки (постоянную и линейно изменяющуюся) относительно старого. Выводы см. справа от графика. 98.37 96.95 100.12 99.98 98.42 101.21 101.33 100.02 102.84 При определении некоторого вещества изучается зависимость аналитического сигнала (С) от содержания примесей (A, B). Провести линейную регрессию, вывести формулу.
Проверить значимость влияния каждой примеси на сигнал. Вывод: во всех трех случаях p-значение (2,51Е-17, 1,31Е-07, 1,34Е-07) м уровня значимости 0,05 => гипотеза о том, что коэффициенты = 0 отклон т.е. y зависит от X1 и X2 по следующему закону: y=-2,927*X1-2,917*X2+99,92 от содержания вещества (A). лу и коэффициент детерминации.
а (C1) и поместить в ячейку C2. 25 имость, ошибка 0 и образцов двумя методами: од на систематические ошибки зучается зависимость ия примесей (A, B). римеси на сигнал. (2,51Е-17, 1,31Е-07, 1,34Е-07) меньше м, что коэффициенты = 0 отклоняется, C(B) 20 f(x) = 19.0145454545455 x + 0.607999999999998 R² = 0.999995757529188 15 10 5 0 0 0.2 0.4 0.6 C(A) b a 19.015 0.608 ВЫВОД ИТОГОВ Регрессионная статистика Множественный R 0.9978466443865 R-квадрат 0.9956979257135 Нормированный R-квадрат 0.9951601664277 Стандартная ошибка 0.0210630342258 Наблюдения 10 Дисперсионный анализ df Регрессия Остаток Итого Y-пересечение Переменная X 1 1 8 9 Коэффициенты -0.604565652077 0.8720284381249 ВЫВОД ИТОГОВ Регрессионная статистика Множественный R 0.9981126461676 R-квадрат 0.9962288544397 Нормированный R-квадрат 0.9949718059196 Стандартная ошибка 0.1271081487611 Наблюдения 9 Дисперсионный анализ df Регрессия Остаток Итого Y-пересечение Переменная X 1 Переменная X 2 y=-2,927*X1-2,917*X2+99,92 2 6 8 Коэффициенты 99.920555555556 -2.926666666667 2.9166666666667 x + 0.607999999999998 0.4 0.6 0.8 1 1.2 C(A) SS MS F Значимость F 0.821450788713619 0.821450788714 1851.5680751 9.38249654E-11 0.003549211286381 0.000443651411 0.825 Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% 0.027646107517718 -21.8680207219 2.017436E-08 -0.66831769028 -0.5408136139 0.020265662518505 43.02985097717 9.382497E-11 0.825295736593 0.9187611397 SS MS 25.6084833333333 12.80424166667 0.096938888888887 0.016156481481 25.7054222222222 Стандартная ошибка 0.084738765840752 0.103783368871514 0.103783368871514 t-статистика 1179.159910629 -28.1997655163 28.10341096441 F Значимость F 792.5142415 5.3631493E-08 P-Значение Нижние 95% Верхние 95% 2.511092E-17 99.71320726557 100.12790385 1.316015E-07 -3.18061542142 -2.6727179119 1.343139E-07 2.662717911912 3.1706154214 Выводы: Так как значение R^2 (0,995697926) близко к 1, регрессию можно считать линейной.
Так как значение F >> 1, а величина значимости F очень мала, то отклонение гипотезы очень мало, а, следовательн Для свободного члена Р-значение = 2,01744E-08 < 0,05, следовательно, для уровня значимости 5% гипотезу о раве Для коэффициента перед Х1 Р-значение = 9,3825Е-11 < 0,05, следовательно, для уровня значимости 5% гипотезу о Уравнение регрессии: y = 0,872X1 - 0,605 Нижние 95,0% Верхние 95,0% -0.66831769028 -0.54081361387 0.82529573659 0.918761139657 Нижние 95,0% 99.7132072656 -3.18061542142 2.66271791191 Верхние 95,0% 100.1279038455 -2.67271791191 3.170615421421 ы очень мало, а, следовательно, регрессия допустима. ачимости 5% гипотезу о равенстве свободного члена нулю отвергаем.
вня значимости 5% гипотезу о равенстве данного коэффициента нулю отвергаем. 10 20 30 40 50 60 70 80 90 100 1.22 1.78 2.59 3.78 5.51 8.03 11.7 17.05 24.84 36.2 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0.46 0.62 0.74 0.84 0.92 1 1.06 1.13 1.18 1.24 Изучается зависимость некоторой характеристики вещества (B) от температуры (A). Подобрать функциональную зависимость (параболическую, степенную или экспоненциальную), наилучшим образом описывающую данные. Построить график, включая формулу и коэффициент детерминации. Вывод: лучше всего описывает полученную функцию экспонециальная линия тренда, т.к. ее коэффициент детерминации наибольший.
Получены данные по адсорбции некоторого вещества. Установить тип зависимости поглощения (B) от концентрации вещества (A): адсорбция может описываться либо изотермой Лэнгмюра [y=x/(ax+b)], либо изотермой Фрейндлиха [y=ax^b]. Оценить коэффициенты. Обращенный полином Степень минимального члена 0 Степень полинома 2 Коэффициенты 0.134832 0.96302 -0.296721 Коэффициент детерминации 0.991496 Абсолютная ошибка 0.001279 Степенная функция A 1.240458 B 0.430111 Коэффициент детерминации 0.996316 Абсолютная ошибка 8.93E-05 у=1,24х^0,43 Степенная функция лучше описывает полученные данные (ее коэф. детерминации больше).
Данные описываются изотермой Фрейндлиха. B) от температуры (A). епенную или понециальная линия Зависимость В от А (экспонециальная линия тренда) 40 35 f(x) = 0.837503430122723 exp( 0.037667541594854 x ) R² = 0.999999782911281 30 25 20 15 вещества (A): 10 5 0 0 20 40 60 80 100 120 Зависимость В от А (полиномиальная линия тренда) 40 35 f(x) = 0.005966666666667 x² − 0.307957575757575 x + 5.23599999999998 R² = 0.986575033731012 30 25 20 15 (ее коэф. детерми- 10 5 0 0 20 40 60 80 100 120 Зависимость В от А (степенная линия тренда) 40 35 30 25 20 f(x) = 0.023481360346673 x^1.48069609247481 R² = 0.905778490591904 15 10 5 0 0 20 40 60 80 100 120 20 f(x) = 0.023481360346673 x^1.48069609247481 R² = 0.905778490591904 15 10 5 0 0 20 40 60 80 100 120 15.28 18.66 16.24 15.62 16.67 16.91 18.48 19.36 17.87 16.76 15.24 16.81 19.33 15.76 16.28 18.22 14.99 16.84 13.02 17.08 35.41 33.13 32.84 31.68 35.25 31.68 33.12 33.9 31.26 31.86 32.51 35.16 33.94 32.57 32.28 34.14 31.58 33.7 35.12 32.45 19.95 20.78 18.94 18.19 22.27 24.05 22.7 21.49 24.89 20.63 16.13 16.87 17.99 17.02 15.81 17.27 15.46 14.61 20.27 16.9 17.08 15.64 17.61 17.45 17.53 13.94 17.74 17.77 16.95 18.38 21.53 21.39 20.19 19.56 20.83 21.45 21.51 23.76 20.02 19.49 19.89 19.36 20.56 22.86 19.04 19.15 20.98 21.87 20.64 20.5 33.54 36.18 34.92 35.21 33.34 35.59 36.14 33.55 34.59 32.83 24.55 23.89 23.09 23.39 21.02 23.87 25.64 22.93 22.43 23.53 25.13 24.31 25.11 26.33 25.4 22.85 24.84 26.7 20.41 22.62 22.25 24.4 23.65 25.02 23.14 23.73 24.92 23.92 26.38 22.03 24.32 22.84 25.2 23.59 21.64 21.07 21.89 24.52 22.89 21.91 22.07 22.76 24.9 21.53 23.81 25.09 22.9 24.51 22.18 22.91 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 19.13 33.05 24.91 Определены содержания трех микроэлементов (A, B, C) в нескольких группах образцов (D) из различных источников.
Построить попарные диаграммы рассеяния, выделив группы. Найти переменные, значимые для определения группы. Провести дискриминантный анализ, проверить качество. Провести классификацию нового образца (F1:H1). Значимые величины - А и В 40 35 30 25 20 15 10 5 0 10 15 20 25 30 35 40 Значения В и С 30 25 20 15 10 5 0 10 15 20 25 30 Значения А и С 30 25 20 15 35 Значения А и С 30 21.37 22.18 21.31 20.85 22.11 22.16 22.91 21.01 20.24 23.34 35.03 34.26 31.29 32.01 34.56 36.62 32.37 33.79 32.25 31.97 25.03 21.53 21.96 25.45 23.97 23.57 24.94 26.89 21.46 23.48 3 3 3 3 3 3 3 3 3 3 25 20 15 10 5 0 10 15 20 25 30 35 ментов (A, B, C) в ичных источников. ия, выделив группы.
еления группы. ерить качество. чины - А и В Colu mn B Colu mn B 30 35 Число объектов обучающей выборки 60 Число параметров 2 Число классов 3 Численности классов 20 20 20 Линейный дискриминантный анализ по Фишеру Качество распознавания, % 100 Простые классифицирующие функции (в столбце - константа, коэффициенты) -135.9989 -353.0942 -400.5956 7.398336 14.52361 9.623144 8.741816 10.82105 17.45881 40 Вывод: объект пренадлежит классу 3 с вероятностью 1 ВиС Colu mn C Colu mn C 30 35 40 АиС Colu mn C Colu mn C АиС Colu mn C Colu mn C 30 35 40 Общие требования к оформлению заданий 1. Результаты должны быть отделены от исходных данных и текста задания, располагаться компактно и не слишком далеко от исходного положения окна просмотра.
Результаты по разным частям задания должны быть разделены. 2. Все таблицы и диаграммы должны иметь четкие, понятные заголовки и должны быть отделены друг от друга. 3. Диаграммы должны быть масштабированы так, чтобы изображение не выглядело слишком сжатым или растянутым и т.п.
4. Вывод исследования должен быть сформулирован в текстовой форме и размещен рядом с текстом задания. Вывод должен быть развернутым, грамотно сформулированным и понятным, со ссылками на используемые статистические методы и представленные на листе результаты расчетов. 5. Размещение на листе лишних результатов (не требующихся для выполнения задания) нежелательно. 6. Каждое применение критерия должно сопровождаться подробным выводом, описанием проверяемой гипотезы и обоснованием вывода.















