Стат20714 (Практикум), страница 2
Описание файла
Файл "Стат20714" внутри архива находится в следующих папках: Практикум, Задачи практикума 2. Excel-файл из архива "Практикум", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из 4 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр Excel-файла онлайн
Текст 2 страницы из табличного файла "Стат20714"
Каждое применение критерия должно сопровождаться подробным выводом, описанием проверяемой гипотезы и обоснованием вывода. Задание 1. Статистики Часть 1. Вычисляем основные описательные статистики. Требуемые записываем в отдельную таблицу. Строим гистограммы, подобрав числа отрезков разбиения так, чтобы они выглядели наиболее представительно.
Часть 2. Проверяем нормальность распределения (с помощью нормальной вероятностной бумаги, критериев хи-квадрат, Колмогорова и "глазомерного"). Если есть основания заподозрить логнормальность (по асимметрии, гистограмме, низким уровням значимости и т.п.), следует отметить эти факты, перейти к логарифмам данных и проверить их на нормальность с помощью критериев. В случае, если соответствие получается лучше, чем у исходных данных, делается вывод о логнормальности. Задание 3. Гипотезы Часть 1.
Сначала проверяем равенство дисперсий с помощью критерия Фишера (F-тест) для двух выборок. Далее проверяется равенство средних с помощью критерия Стьюдента (t-тест) для двух выборок с одинаковыми или различными дисперсиями, в зависимости от предыдущего результата. Часть 2. Используем парный критерий Стьюдента для двух выборок.
Пояснить необходимость использования именно парного критерия. Задание 4. Дисперсионный анализ Часть 1. Прежде, чем проверять равенство средних, следует проверить равенство дисперсий с помощью критериев Бартлетта и G Кокрена. Если гипотеза о равенстве дисперсий подтверждается, можно проверить равенство средних методом дисперсионного анализа. Если средние оказываются различны, то наилучшим катализатором считаем тот, для которого средний выход больше. Часть 2. Проверяем равенство дисперсий с помощью критериев Бартлетта и G Кокрена. Если гипотеза о равенстве принимается, то зависимости нет. Если гипотеза отклоняется, то зависимость есть, и ее нужно исследовать.
Вычисляем средние и средние квадратические отклонения по каждому столбцу, а затем отражаем их на графике (средние – по горизонтали, средние квадратические отклонения – по вертикали), добавляем линейный тренд и делаем вывод о наличии/отсутствии линейной зависимости. Задание 5. Линейная регрессия Часть 1. Получив оценки для параметров линейной зависимости вида y=a+bx, используем их для оценивания неизвестного x по известному y, а именно: x=(y-a)/b. Часть 2. Проводим линейную регрессию результатов метода В по данным метода А.
Используем доверительные интервалы для свободного члена и углового коэффициента. Если в доверительный интервал для свободного члена не попадает 0, то есть постоянная систематическая ошибка. Если в доверительный интервал для углового коэффициента не попадает 1, то есть линейно изменяющаяся систематическая ошибка. Часть 3. Проводим линейную регрессию сигнала по содержаниям примесей.
Для определения их значимости используем P-значения. Оценив коэффициенты, записываем формулу регресии. Задание 6. Нелинейная регрессия Часть 1. Перебираем все перечисленные типы функциональной зависимости, построив соответствующие (различные) диаграммы, включая формулы и коэффициенты детерминации. Затем выбираем из них наилучшую, для которой коэффициент детерминации наибольший, и делаем вывод о типе зависимости. Часть 2. Пытаемся приблизить данные двумя типами функциональной зависимости (степенная функция и обращенный полином).
Затем выбираем из них наилучшую, для которой коэффициент детерминации наибольший, и делаем вывод о типе зависимости. Задание 7. Многомерный анализ. Переменные, значимые для определения групп, выбираем, исходя из диаграмм рассеяния. Диаграммы строятся так, чтобы каждой группе соответствовал свой ряд (они выделяются разным цветом). Нам нужна та пара переменных, на диаграмме которых группы разнесены в пространстве наиболее четко. Если наилучшей парой оказались A и C, их следует скопировать в рядом стоящие столбцы, чтобы их можно было указать в качестве единого диапазона.
Для выбранных переменных применяем линейный дискриминантный анализ Фишера (Распознавание образов с обучением > Обучение). Классификацию нового образца производим на основе вычисленных дискриминантных функций, представленных своими коэффициентами (Распознавание(Фишер)). .