Глоссарий статистических терминов для химфака МГУ (1115366)
Текст из файла
Глоссарий статистических терминов для химфака мгу. Версия 0.5.Первое слово в глоссарии – если вдруг вы решили начать читать этот глоссарий ссамого начала, то возможно вам нужно сначала посмотреть на слово Выборка, либоизучить игру в классики, которая находится в самом низу глоссария.Асимметрия (коэффициент асимметрии) – Теоретический показатель.
Отношениемодуля третьего центрального момента к дисперсии в степени 3/2 ((DX1 )3/2 = σ 3 ).31 −EX1 )Формула γ1 = E(X. Асимметрия показывает насколько случайная величина(DX1 )3/2отличается от нормальной. Для нормальной случайной величины γ1 = 0. Используяоценку асимметрии можно прикинуть является ли данная выборка нормальной илинет.Вариационный ряд – последовательность значений заданной выборки, расположенных в порядке неубывания: Так, для выборки 1,5,2,7,5,6,9,3,1 вариационным рядомявляется 1, 1, 2, 3, 5, 5, 6, 7, 9.Выборка – Выборка это набор наблюдений X1 , . . .
, Xn . На выборку можно смотреть сдвух точек зрения теоретической: в этом случае X1 , . . . , Xn являются независимымиодинаково распределенными случайными величинами (пример: Xi – н.о.р. монеткис вероятностью выпадения единицы p, и нуля 1-p), и практической: в этом случаеммы рассматриваем X1 , . . . , Xn как набор чисел, который уже получен в результатеисследований (пример: мы воздействовали на 10 мышей воздействием A, записалив табличку напротив каждой из мышей 1, если она погибла, или 0 если выжила).Замечание: элемент выборки может быть многомерное, пусть например X1 двумерный вектор, состоящий из компонент: мышь сдохла/выжила, температура на моментнаблюдения. На выборке построены понятия статистики и оценки.Выборочная дисперсия – Оценка для теоретической дисперсии случайной величины из выборки (DXi ).
Обозначается s2 . Формула может отличаться нормирующим коэффициентомв зависимости от условий на выборку. Стандартный видPs2 = n1 ni=1 (Xi − X)2 . Форма оценки, дающей ей свойство несмещенности s2 =Pn12Выборочная дисперсия также может быть расчитана при известi=1 (Xi − X) . Pn−112ном среднем s = n ni=1 (Xi − M X1 )2 .Выборочная функция распределения – это приближение теоретической функциираспределения, построенное с помощью выборки из него.
В то время как функцияраспределения F(x) есть вероятность, что значение случайной величины не превзойˆ есть доля (от 0 до 1) элементовдет x, выборочная функция распределения F (x)выборки не превосходящих x.Выбросы – элементы выборки, резко выделяющиеся из нее. Выброс может являтьсяследствием ошибки измерения, неверной записи наблюдения, неоднородности исследуемых данных. Например, если наугад измерять температуру предметов в комнате,получим цифры от 18 до 22 ◦ C, но радиатор отопления будет иметь температуру в70◦ .1Выборочное среднее – Оценка для теоретического математического ожиданияP случайной величины из выборки (M Xi ).
Обозначается X. Формула X = n1 ni=1 Xi .Выборочное среднее, рассмотренное как случайная величина имеет среднеквадратическое отклонение, эту величину (точнее её оценку) модуль Анализ Данных>Описательная статистика называет стандартная ошибка.Выборочное среднеквадратическое отклонение (СКО) – Выборочный параметр, равный корню из выборочной дисперсии. Оценивает теоретическое среднеквадратическое отклонение одной случайной величины из выборки.Доверительный интервал – Интервал значений, построенный по наблюдениям с неизвестным параметром, накрывающий этот неизвестный параметр с заданной вероятностью (так называемой доверительной вероятностью, обычно выбирающейся как90%, 95% или 99%). Доверительный интервал с одной и той же доверительной вероятностью обычно сужается при увеличении количества наблюдений, т.е.
возможнотем точнее оценить неизвестный параметр, чем большее количество наблюдений мыимеем.Достаточная численность – оценка количества наблюдений (элементов выборки),которые требуется произвести для получения заданной точности.Дисперсионный анализ – статистический метод, направленный на поиск различийв средних значениях различных выборок. В случае однофакторного дисперсионногоанализа, мы изучаем несколько выборок полученных из одной общей совокупностиизменением какого-либо фактора, и пытаемся определить имеет ли фактор влияниена среднее значение в этих выборках, при этом гипотеза H0 : средние во всех выборках равны, против альтернативы: в какой-то паре выборок средние различны.
Важноотметить, что однофакторный дисперсионный анализ работает только в предположении равенства дисперсий в выборках. Либо такое предположение должно бытьсделано исходя из постановки эксперимента, либо соответствующая гипотеза можетбыть проверена с помощью критериев Бартлетта и Кокрена.Значимость коэффициента линейно регрессии – Оценка коэффициента регрессииможет быть близкой к нулю, но ненулевой даже в том случае когда истиный коэффициент равен нулю. Для оценки значимости коэффициента следует использовать егоp-значение, расчитываемое модулем анализ данных. Это p-значение соответствуетпроверке гипотезы о равенстве нулю коэффициента регрессии против альтернативыо неравенстве его нулю.xИзотерма Ленгмюра – зависимость вида ax+b.
Один из видов нелинейной зависимости, применяемый как пример нелинейной регрессии. Вывод о наличии такого виданелинейности можно сделать исходя из физического смысла. Изотерма Лэнгмюренасоответствующая процессу, при котором происходит только адсорбция на поверхности и отсутствует капиллярная конденсация. Эту особенность обнаруживают молекулярные сита всех типов, что проявляется в высокой адсорбционной емкости вобласти низких давлений и достижении соответствующей насыщению емкости принизких парциальных давлениях адсорбата.2Изотерма Фрейндлиха – зависимость вида axb (степенная зависимость).
Еще одинпример нелинейной зависимости. Изотерма фрейндлиха соответсвует процессу, когдаприсутствуют и адсорбция на поверхности и капилярная фильтрация в равновесии.Интервальное оценивание – один из видов статистического оценивания, предполагающий построение интервала, в котором с некоторой вероятностью находится истинное значение оцениваемого параметра. Суть интервального оценивания в нахождениитаких чтобы по выборке, содержащей информацию об интересующем нас параметреθ, построить доверительный интервал, содержащий θ с заданной вероятностью.−EY )√√, характеризуетКорреляция теоретическая – величина Corr(X, Y ) = E(X−EX)(YDX DYзависимость случайных величин X и Y. Идея ковариации очень проста: если рассмотреть величину (X −EX)(Y −EY ), очевидно что она больше нуля в тех случаях когдаX и Y одновременно большие (больше своих средних) и когда они одновременно маленькие (меньше своих средних), в остальных случаях величина (X − EX)(Y − EY )меньше нуля.Коэффициент детерминации (R2 ) – коэффициент оценивающийкачество аппроксиP2(yˆi −yi )2, где ŷi = fˆ(xi )мации данных регрессионной зависимостью.
Формула R = 1− P(y−yi)– это оценка значения функции в точке xi (в случае линеной регрессии это âxi + b̂).Коэффициент детерминации показывает насколько разброс (строго говоря дисперсия) данных увеличился по сравнению с примитивным предсказанием, что Y равнаконстанте (оценивается средним значением) + шум.Критерий Бартлетта -– статистический критерий, позволяющий проверять равенство дисперсий нескольких (двух и более) выборок.
Нулевая гипотеза предполагает,что рассматриваемые выборки получены из генеральных совокупностей, обладающих одинаковыми дисперсиями. Критерий Бартлетта является параметрическим иоснован на дополнительном предположении о нормальности выборок данных. Критерий Бартлетта очень чувствителен к нарушению данного предположения.Критерий Кокрена (G-Кокрена) – статистический критерий, позволяющий проверять равенство дисперсий нескольких (двух и более) выборок. Нулевая гипотезапредполагает, что рассматриваемые выборки получены из генеральных совокупностей, обладающих одинаковыми дисперсиями. Критерий Кокрена является параметрическим и основан на дополнительном предположении о нормальности выборокданных.
Критерий Кокрена очень чувствителен к нарушению данного предположения.Критерий Колмогорова – критерий согласия Колмогорова (также известный, каккритерий согласия Колмогорова — Смирнова) используется для того, чтобы определить, подчиняются ли два эмпирических распределения одному закону, либо определить, подчиняется ли полученное распределение предполагаемой модели КритерийКолмогорова достаточно чувствителен к различиям в исследуемых выборках.
Например, использования критерия возможно для проверки нормальности, если предварительно оценить среднее и дисперсию (в этом случае необходимо использоватьмодифицированные значения статистики).3Критерий Стьюдента (t-тест) – критерий для проверки равенства средних значенийв двух выборках. Критерий Стьюдента предполагает нормальность выборок. Существуют версии критерия как предполагающие равенство дисперсий в выборках, таки не использующие такое предположение. Для применения наиболее эффективного в данной ситуации критерия стьюдента предварительно проводят тест равенствадисперсий.Критерий Фишера (F-Критерий) – Критерий сравнения дисперсий двух выборок,проверяет гипотезу о равенстве дисперсий против альтернативы о различии дисперсий. Статистика – отношение выборочной дисперсии первой выборки и второй выборки.
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.