Стат21013F (1120244), страница 4
Текст из файла (страница 4)
сионного анализа Аппроксимация зависимостей с элементами регрессионного анализа Полином Степень минимального члена 2 Степень полинома 2 КоэффициСтандарт Нижний 9 Верхний 9 t-статисти P-значение 0.006234 0.000546 0.005164 0.007304 5.825686 0.000126 Коэффициент детерминации 0.898927 F-статистика Формула: y=0,006234*x^2 71.15091 P-значение 2.98E-05 Коэффициент детерминации (исправ.) 0.898927 Аргумент Функция Модель Нижний 9 Верхний 9 Остаток 10 1.22 0.623434 -16.4094 17.65627 0.596566 20 1.95 2.493737 -14.5391 19.52657 -0.543737 30 3.1 5.610908 -11.42192 22.64374 -2.510908 40 4.93 9.974948 -7.057884 27.00778 -5.044948 50 7.85 15.58586 -1.446976 32.61869 -7.735856 60 12.48 22.44363 5.410801 39.47647 -9.963633 70 19.84 30.54828 13.51545 47.58111 -10.70828 80 31.55 39.89979 22.86696 56.93262 -8.349792 90 50.17 50.49817 33.46534 67.53101 -0.328175 100 79.77 62.34343 45.31059 79.37626 17.42657 P-значение : y=0,009385*x^1,825 СтандартиP-значение 0.040268 0.968866 -0.018642 0.985583 -0.1062 0.918039 -0.200681 0.845956 -0.271565 0.792833 -0.274753 0.790468 -0.139373 0.8926 0.245959 0.811907 1.056331 0.32167 2.569336 0.033162 зависимости, степенная функция Функция Модель Нижний 95% Верхний 95% 60 80 100 120 Функция Аппроксимация зав 100 80 60 40 20 0 -20 Аргумент носит экспоненциальный характер.
-40 0 20 40 60 Аргумен сионного анализа P-значение : y=0,006234*x^2 СтандартиP-значение 0.068647 0.946772 -0.062568 0.951478 -0.28893 0.77918 -0.580521 0.575808 -0.890163 0.396549 -1.146513 0.28115 -1.232199 0.249095 -0.960808 0.361749 -0.037763 0.970701 2.005271 0.075905 Аппроксимация зависимости Функция Модель Нижний 95% Верхний 95% 40 60 Аргумент 80 100 120 28.96 26.62 26.8 28.05 27.39 27.32 27.58 26.39 26.36 25.66 26.42 26.87 28.57 26.03 29.28 28.39 25.44 25.3 23.91 26.39 35.16 34.66 35.14 34.13 34.69 36.27 35.06 37.37 35.35 34.85 34.55 33.34 32.08 35.63 36.09 36.09 32.68 37.58 35.25 38.06 16.2 16.69 19.35 17.02 15.08 17.85 15.6 17.33 18.86 15.94 17.87 14.7 14.75 15.5 15.3 17.67 17.28 18.08 17.96 16.6 13.96 15.02 16.29 14.73 14.72 14.47 19.23 17.24 19.21 17.98 32.73 31.64 34.8 33.03 30.33 35.84 32.99 32.45 28.29 30.33 30.61 31.28 31.04 34.17 31.42 29.3 30.68 32.52 32.54 30.5 30.5 33.11 32.14 31.1 30.21 30.92 30.6 32.15 28.17 30.2 25.76 25.11 28.97 27.48 26.92 26.87 27.78 27.8 25.55 27.82 25.43 27.96 24.03 26.36 27.25 23.57 23.97 25.99 27.77 28.51 26.68 27.02 26.55 25.06 29.61 26.93 28.68 27.65 25.6 28.26 26.68 28.81 26 25.86 28.68 25.11 26.77 30.07 24.02 25.08 26.19 25.8 24.2 28.47 27.26 27.79 26.1 27.01 26.28 25.92 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 18.13 30.44 26.79 Определены содержания трех микроэлементов (A, B, C) в нескольких группах образцов (D) из различных источников.
Построить попарные диаграммы рассеяния, выделив группы. Найти переменные, значимые для определения группы. Провести дискриминантный анализ, проверить качество. Провести классификацию нового образца (F1:H1). Диаграмма рассения, столбцы 40 35 30 25 20 15 10 5 0 10 15 20 25 30 Диаграмма рассеяния, столбц 35 30 25 20 15 10 5 0 10 15 20 25 30 19.29 16.22 17.98 18.23 14.23 19.15 19.67 19.11 18.79 19.16 31.82 29.97 33.57 32.15 34.57 30.55 31.14 30.86 28.8 32.22 27.09 27.6 28.54 30.15 27.59 23.99 27.36 25.18 28.38 26.57 3 3 3 3 3 3 3 3 3 3 Диаграмма рассения, столб 35 30 25 20 15 10 5 0 10 15 20 25 30 ментов (A, B, C) в ичных источников.
ия, выделив группы. еления группы. ерить качество. Наиболее чётко разнесённые в пространстве группы наблюдаютс рассения, столбцы АВ 120 21-40 41-60 25 30 35 40 Число объектов обучающей выборки 60 Число параметров 2 Число классов 3 Численности классов 20 20 20 Линейный дискриминантный анализ по Фишеру Качество распознавания, % 100 Простые классифицирующие функции (в столбце - константа, коэффициенты) -232.5673 -513.8449 -269.6298 12.94383 17.44402 9.454585 7.129319 12.99735 11.94004 По результатам распознования Фишера объект (18,13; рассеяния, столбцы ВС 120 21-40 41-60 25 30 35 40 ма рассения, столбцы АС 120 21-40 41-60 25 30 35 40 стве группы наблюдаются у столбцов А и В нализ по Фишеру я Фишера объект (18,13; 30,44) принадлежит классу 3 свероятностью 1; объект (30,44; 26,79) классу 2 с вероятностью 0,9999; объек оятностью 0,9999; объект (18,13; 26, 79) классу 1 с вероятностью 1.
Общие требования к оформлению заданий 1. Результаты должны быть отделены от исходных данных и текста задания, располагаться компактно и не слишком далеко от исходного положения окна просмотра. Результаты по разным частям задания должны быть разделены. 2. Все таблицы и диаграммы должны иметь четкие, понятные заголовки и должны быть отделены друг от друга. 3. Диаграммы должны быть масштабированы так, чтобы изображение не выглядело слишком сжатым или растянутым и т.п. 4. Вывод исследования должен быть сформулирован в текстовой форме и размещен рядом с текстом задания. Вывод должен быть развернутым, грамотно сформулированным и понятным, со ссылками на используемые статистические методы и представленные на листе результаты расчетов. 5. Размещение на листе лишних результатов (не требующихся для выполнения задания) нежелательно.
6. Каждое применение критерия должно сопровождаться подробным выводом, описанием проверяемой гипотезы и обоснованием вывода. Задание 1. Статистики Часть 1. Вычисляем основные описательные статистики. Требуемые записываем в отдельную таблицу. Строим гистограммы, подобрав числа отрезков разбиения так, чтобы они выглядели наиболее представительно. Часть 2. Проверяем нормальность распределения (с помощью нормальной вероятностной бумаги, критериев хи-квадрат, Колмогорова и "глазомерного").
Если есть основания заподозрить логнормальность (по асимметрии, гистограмме, низким уровням значимости и т.п.), следует отметить эти факты, перейти к логарифмам данных и проверить их на нормальность с помощью критериев. В случае, если соответствие получается лучше, чем у исходных данных, делается вывод о логнормальности. Задание 3. Гипотезы Часть 1. Сначала проверяем равенство дисперсий с помощью критерия Фишера (F-тест) для двух выборок. Далее проверяется равенство средних с помощью критерия Стьюдента (t-тест) для двух выборок с одинаковыми или различными дисперсиями, в зависимости от предыдущего результата.
Часть 2. Используем парный критерий Стьюдента для двух выборок. Пояснить необходимость использования именно парного критерия. Задание 4. Дисперсионный анализ Часть 1. Прежде, чем проверять равенство средних, следует проверить равенство дисперсий с помощью критериев Бартлетта и G Кокрена. Если гипотеза о равенстве дисперсий подтверждается, можно проверить равенство средних методом дисперсионного анализа. Если средние оказываются различны, то наилучшим катализатором считаем тот, для которого средний выход больше. Часть 2.
Проверяем равенство дисперсий с помощью критериев Бартлетта и G Кокрена. Если гипотеза о равенстве принимается, то зависимости нет. Если гипотеза отклоняется, то зависимость есть, и ее нужно исследовать. Вычисляем средние и средние квадратические отклонения по каждому столбцу, а затем отражаем их на графике (средние – по горизонтали, средние квадратические отклонения – по вертикали), добавляем линейный тренд и делаем вывод о наличии/отсутствии линейной зависимости. Задание 5. Линейная регрессия Часть 1.
Получив оценки для параметров линейной зависимости вида y=a+bx, используем их для оценивания неизвестного x по известному y, а именно: x=(y-a)/b. Часть 2. Проводим линейную регрессию результатов метода В по данным метода А. Используем доверительные интервалы для свободного члена и углового коэффициента. Если в доверительный интервал для свободного члена не попадает 0, то есть постоянная систематическая ошибка. Если в доверительный интервал для углового коэффициента не попадает 1, то есть линейно изменяющаяся систематическая ошибка.















