Стат20521 (Восстановленный) (1120124), страница 3
Текст из файла (страница 3)
Проверить равенство средних выходов. Если средние различаются, найти наилучший катализатор. Проведены серии измерений содержания вещества на разных уровнях (A-E). Проверить зависимость точности измерения (среднего квадратического отклонения) от содержания вещества в образцах. Построить график зависимости СКО от среднего. мической реакции лизаторов (A-E). выходов.
Если аилучший катализатор. одержания вещества ерить зависимость квадратического щества в образцах. и СКО от среднего. 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.85 3.24 4.61 6.08 7.43 8.78 10.25 11.64 13.04 14.39 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0.83 0.94 1.07 1.18 1.3 1.41 1.5 1.66 1.79 1.88 0.5 1 0 0.5 1 0 0.5 1 0 0 0 0 0.5 0.5 0.5 1 1 1 2.48 Изучается зависимость аналитического сигнала (B) от содержания вещества (A). Построить градуировочный график, включая формулу и коэффициент детерминаци Оценить содержание вещества по величине сигнала (C1) и поместить в ячейку C2. Проведено измерение содержания вещества в серии образцов двумя методами: стандартным (A) и новым (B).
Проверить новый метод на систематические ошибки (постоянную и линейно изменяющуюся) относительно старого. 100.61 101.12 99.96 100.52 101.01 99.99 100.41 101.06 99.94 При определении некоторого вещества изучается зависимость аналитического сигнала (С) от содержания примесей (A, B). Провести линейную регрессию, вывести формулу. Проверить значимость влияния каждой примеси на сигнал.
от содержания вещества (A). лу и коэффициент детерминации. а (C1) и поместить в ячейку C2. и образцов двумя методами: од на систематические ошибки зучается зависимость ия примесей (A, B). римеси на сигнал. 10 20 30 40 50 60 70 80 90 100 1.52 2.42 3.84 6.1 9.67 15.35 24.35 38.63 61.28 97.2 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0.19 0.36 0.53 0.68 0.82 0.95 1.07 1.19 1.29 1.39 Изучается зависимость некоторой характеристики вещества (B) от температуры (A) Подобрать функциональную зависимость (параболическую, степенную или экспоненциальную), наилучшим образом описывающую данные.
Построить график, включая формулу и коэффициент детерминации. Получены данные по адсорбции некоторого вещества. Установить тип зависимости поглощения (B) от концентрации вещества (A): адсорбция может описываться либо изотермой Лэнгмюра [y=x/(ax+b)], либо изотермой Фрейндлиха [y=ax^b]. Оценить коэффициенты. ещества (B) от температуры (A). ческую, степенную или щую данные. т детерминации. ентрации вещества (A): мюра [y=x/(ax+b)], ффициенты. Описательная статистика Численность выборки Гистограмма Число классов Классовый интервал 20 11.368 31.064 50.76 70.456 90.152 Мода (по гистограмме) 5 19.696 8 4 2 3 3 11.368 18.92 24.66 19.42 20.81 19.8 20.64 20.93 24.28 19.61 19.83 22.67 20.59 18.95 21.89 22.98 19.12 19.85 21.41 21.26 19.75 20.26 23.13 20.07 20.38 19.89 21.5 20.67 20.41 19.14 20.51 22.51 20.1 19.9 22.51 20.57 20.68 20.29 22.76 20.84 20.48 19.99 21.59 21.05 17.92 19.42 21.93 20.23 19.7 20.28 21.92 24.09 24.84 26.6 25 24.47 25.97 22.09 23.72 24.62 24.76 25.02 22.13 22.87 24.49 24.27 25.04 22.96 24.64 24.27 23.07 27.51 28.53 28.58 28.85 25.13 28.89 25.65 26.41 24.74 26.11 25.69 26.7 26.35 24.71 28.71 25.43 25.51 25.98 26.49 28.06 12.35 10.53 10.15 12.69 13.82 9.41 10.25 9.75 10.34 10.48 13.56 10.36 11.8 11.04 12.74 9.68 11.12 11.42 13.97 11.51 13.55 11.29 11.3 11.21 12.96 13.44 12.77 9.56 10.43 11.95 29.04 31.44 28.34 29.83 29.92 29.54 30.85 29.37 28.71 28.26 28.55 31.6 27.4 27.44 27.28 28.28 28.56 29.03 27.75 27.27 21.18 21.32 21.33 22.33 23.17 21.34 20.19 20.97 21.41 23.61 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 20.73 24.24 28.45 Определены содержания трех микроэлементов (A, B, C) в нескольких группах образцов (D) из различных источников.
Построить попарные диаграммы рассеяния, выделив группы. Найти переменные, значимые для определения группы. Провести дискриминантный анализ, проверить качество. Провести классификацию нового образца (F1:H1). 22.84 20.64 20.88 21.3 20.38 19.87 20.87 21.03 20.42 20.57 10.72 13.26 9.83 10.26 13.74 9.72 13.38 10.5 9.73 11.67 22.53 18.78 22.67 21.42 20.89 24.46 22.6 22.22 21.59 21.63 3 3 3 3 3 3 3 3 3 3 ментов (A, B, C) в ичных источников. ия, выделив группы.
еления группы. ерить качество. Общие требования к оформлению заданий 1. Результаты должны быть отделены от исходных данных и текста задания, располагаться компактно и не слишком далеко от исходного положения окна просмотра. Результаты по разным частям задания должны быть разделены. 2. Все таблицы и диаграммы должны иметь четкие, понятные заголовки и должны быть отделены друг от друга. 3. Диаграммы должны быть масштабированы так, чтобы изображение не выглядело слишком сжатым или растянутым и т.п. 4. Вывод исследования должен быть сформулирован в текстовой форме и размещен рядом с текстом задания.
Вывод должен быть развернутым, грамотно сформулированным и понятным, со ссылками на используемые статистические методы и представленные на листе результаты расчетов. 5. Размещение на листе лишних результатов (не требующихся для выполнения задания) нежелательно. 6. Каждое применение критерия должно сопровождаться подробным выводом, описанием проверяемой гипотезы и обоснованием вывода. Задание 1. Статистики Часть 1. Вычисляем основные описательные статистики. Требуемые записываем в отдельную таблицу. Строим гистограммы, подобрав числа отрезков разбиения так, чтобы они выглядели наиболее представительно.
Часть 2. Проверяем нормальность распределения (с помощью нормальной вероятностной бумаги, критериев хи-квадрат, Колмогорова и "глазомерного"). Если есть основания заподозрить логнормальность (по асимметрии, гистограмме, низким уровням значимости и т.п.), следует отметить эти факты, перейти к логарифмам данных и проверить их на нормальность с помощью критериев. В случае, если соответствие получается лучше, чем у исходных данных, делается вывод о логнормальности. Задание 3.
Гипотезы Часть 1. Сначала проверяем равенство дисперсий с помощью критерия Фишера (F-тест) для двух выборок. Далее проверяется равенство средних с помощью критерия Стьюдента (t-тест) для двух выборок с одинаковыми или различными дисперсиями, в зависимости от предыдущего результата. Часть 2. Используем парный критерий Стьюдента для двух выборок. Пояснить необходимость использования именно парного критерия.
Задание 4. Дисперсионный анализ Часть 1. Прежде, чем проверять равенство средних, следует проверить равенство дисперсий с помощью критериев Бартлетта и G Кокрена. Если гипотеза о равенстве дисперсий подтверждается, можно проверить равенство средних методом дисперсионного анализа. Если средние оказываются различны, то наилучшим катализатором считаем тот, для которого средний выход больше. Часть 2. Проверяем равенство дисперсий с помощью критериев Бартлетта и G Кокрена. Если гипотеза о равенстве принимается, то зависимости нет.
Если гипотеза отклоняется, то зависимость есть, и ее нужно исследовать. Вычисляем средние и средние квадратические отклонения по каждому столбцу, а затем отражаем их на графике (средние – по горизонтали, средние квадратические отклонения – по вертикали), добавляем линейный тренд и делаем вывод о наличии/отсутствии линейной зависимости. Задание 5. Линейная регрессия Часть 1. Получив оценки для параметров линейной зависимости вида y=a+bx, используем их для оценивания неизвестного x по известному y, а именно: x=(y-a)/b. Часть 2. Проводим линейную регрессию результатов метода В по данным метода А.
Используем доверительные интервалы для свободного члена и углового коэффициента. Если в доверительный интервал для свободного члена не попадает 0, то есть постоянная систематическая ошибка. Если в доверительный интервал для углового коэффициента не попадает 1, то есть линейно изменяющаяся систематическая ошибка. Часть 3. Проводим линейную регрессию сигнала по содержаниям примесей. Для определения их значимости используем P-значения. Оценив коэффициенты, записываем формулу регресии.
Задание 6. Нелинейная регрессия Часть 1. Перебираем все перечисленные типы функциональной зависимости, построив соответствующие (различные) диаграммы, включая формулы и коэффициенты детерминации. Затем выбираем из них наилучшую, для которой коэффициент детерминации наибольший, и делаем вывод о типе зависимости. Часть 2. Пытаемся приблизить данные двумя типами функциональной зависимости (степенная функция и обращенный полином).
Затем выбираем из них наилучшую, для которой коэффициент детерминации наибольший, и делаем вывод о типе зависимости. Задание 7. Многомерный анализ. Переменные, значимые для определения групп, выбираем, исходя из диаграмм рассеяния. Диаграммы строятся так, чтобы каждой группе соответствовал свой ряд (они выделяются разным цветом). Нам нужна та пара переменных, на диаграмме которых группы разнесены в пространстве наиболее четко. Если наилучшей парой оказались A и C, их следует скопировать в рядом стоящие столбцы, чтобы их можно было указать в качестве единого диапазона.
Для выбранных переменных применяем линейный дискриминантный анализ Фишера (Распознавание образов с обучением > Обучение). Классификацию нового образца производим на основе вычисленных дискриминантных функций, представленных своими коэффициентами (Распознавание(Фишер)). .