2015 Теормин. Прикладной многомерный статический анализ (лектор - Хохлов) (1185337), страница 2
Текст из файла (страница 2)
+ Θ · + Проверяется, что∙ 0 : Θ = 0(фактор не значим), против∙ 1 : Θ ̸= 0(фактор значим).В данной задаче:1.- критерий проверяет значимость влияния отдельного фактора вприсутствии всех остальных факторов.2.- критерий оценивает чистое влияние отдельного фактора, когдавсе остальные факторы устранены.Очевидно, что если фактор всего один, то оба критерия эквивалентны.Вопрос №14Адекватность модели. Постановка задачи. = · Θ + считается адекватной, если предложеный набор факторов 1 , . . . , оказывает совместно значимое влияния на.Модель регрессииФормально, проверяется гипотеза:∙ 0 : Θ1 = Θ2 = . . . Θ = 0,против∙ 1 : Θ ̸= 0.Если0 отвергается, то модель считается адекватной.
В противном случае,выбранный набор фактор не оказывает значимого влияния и модель неадекватна. Необходимо выбрать другие факторы.Вопрос №15Коэффициент детерминации и что он измеряет.Можно показать, что справедливо следующее тождество:∑︁=12[ − ] =∑︁[ − ˆ ] +2=1∑︁[ˆ − ]2=1Для сокращения, эту формулу записывают по другому: = + где1. - полная сумма квадратов.72.- сумма квадратов остатков.3.- объясненная сумма квадратов.Коэффициентом детерминизации называется число:2 := 2 - это оценка квадрата множественного коэффициента корреляции. Иными словами это доля дисперсии зависимой переменной, объясняемая рассматриваемой моделью зависимости, то есть объясняющими переменными.Чем ближе он кВопрос №161,тем лучше выбранная модель.Основная задача в однофакторном дисперсионном анализе.Пусть имеется следующий набор измерений: = + ;где,- уровень фактора,(1) = 1, , = 1, - номер измерения.
Предполагается:1.- неслучайные вещественные числа;2.- имеют многомерное нормальное распределение3.- независимы для любых, . (0, 2 )∀, ;Запишем модель в новом виде:1 ∑︁ ;= = − ⇒∑︁ = 0=1Отсюда, = + + ,что эквивалентно (1).Основная задача: Есть ли различия в поведениина различных уров-нях. Более формально можно записать:Проверяется гипотеза:∀ ,1.0 : = 0 :2.1 : ∃ : ̸= 0Вопрос №17противОсновная задача в двухфакторном дисперсионном анали-зе.
Пусть имеется следующая модель измерений (для каждого сочетанияфакторов по одному измерению): = + ; = 1, ; = 1, ; = · Предполагается, что на исследование влияют 2 фактора:8(1)1.- уровень первого фактора;2.- уровень второго фактора;Преполагается, что :1.- константа;2.- случайные, независимые;3.- имеет многомерное нормальное распределение (0, 2 )Введем следующие обозначения:∙∙1 ∑︁ ;=1 ∑︁∙ = ;∙1 ∑︁= Тогда, := ∙ − ∙∙ - эффект столбца, а := ∙ − ∙∙ - эффект строки.Основная задача: Есть ли влияние факторов - эффект столбца илиэффект строки?Более формально, для эффекта строки, проверяется разница в среднихпо строкам.
Ещё более формально, проверяется:∙ 0 : 1 , 2 , . . . , = 0,против∙ 1 : ∃ : ̸= 0.Вопрос №18Основная задача дискриминантного анализа. Пусть каж-дый изучаемый объект характеризуется парой чиселполагается, что(1 , 2 )средними некоторой матрицей ковариаций1=2 = (1 , 2 ),имеет двумерное нормальное распределение со∑︀.Пусть имеется две совокупности, которые различаются средними(1)(1)(∑︀1 , 2 )и(2)пре-(2)(2) = (1 , 2 ),(1) =но имеют одну и ту же матрицу ковариаций.Основная задача: Отнести вновь поступивший объект(1 , 2 )к од-ной из этих совокупностей.Вопрос №19Кластерный анализ: постановка задачи.Пусть из некоторого множествано (генеральной совокупности) = (1 , . .
. , ). У каждого из этих объектов измеряетсянесколько характеристик = (1 , . . . , ) . Преполагается, что эти характеристи являются количественными. Пусть, есть результат измеренияобъектовотобра-9-й характеристики у объекта . Тогда = (1 , . . . , ) есть измерениявсех его характеристик у объекта . В итоге имеем матрицу измерений: = (1 , . . . , ).Далее каждый наборПусть < ,рассматривается как вектор в пространстветогда основная задача: на основе измерениймножество объектов1.
каждый объектнаклассов(кластеров)1 , . . . , ,R .разбитьтак чтобы:принадлежал одному и только одному классу;2. объекты внутри одного класса были бы3. объекты из разных классов были бы"сходными" ;"несходными".Интуитивно ясно, что объекты и нужно отнести в один класс, еслирасстояние между и будет достаточно малым, а между точками изразных классов достаточно большим.Вопрос №20Кластерный анализ: последовательное построение факторов(кластеров?).1. Сначала все объекты рассматривают как отдельные кластеры.2.
Выбирают 2 порогаи.3. Если все кластеры находятся на расстоянии более, чем,то проце-дура заканчивается.4. Если есть кластеры, которые ближе друг к другу, чем,то находимдва наиболее близких и объединяем их.5. Находим расстояния внутри кластеров и расстояния между кластерами.6. Процедура продолжается до тех пор, пока расстояния внутри всехкласетров не более чем,а между кластерами не более чем10..