Лекция 2 (1032385)

Файл №1032385 Лекция 2 (Лекции в электронном виде)Лекция 2 (1032385)2017-12-22СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла

16


Лекция 2.

3. СРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП. ДИСПЕРСИОННЫЙ АНАЛИЗ

Статистические методы используют для описания данных и для оценки статистической значимости результатов опыта. В предыдущем разделе мы занимались описанием данных. Мы ввели понятия среднего, стандартного отклонения, медианы и процентилей. Мы узнали, как оценивать эти показатели по выборке. Мы разобрались, как определить, насколько точна выборочная оценка среднего. Прежде чем перейти к методам оценки статистической значимости различий, давайте рассмотрим несколько терминов, которыми принято характеризовать медико-биологические исследования.

Экспериментальным называется исследование, в процессе которого исследователь сам формирует группы и сам оказывает то или иное воздействие.

Во время обсервационного исследования исследователь лишь наблюдает течение процесса.

Ретроспективным называется исследование, во время которого исследователь имеет дело с данными, полученными в прошлом (в отличие от проспективного).

В обсервационном исследовании нет гарантии, что данные отличаются только тем признаком, по которому они сформированы.

Исследование со случайно отобранной контрольной группой называется рандомизированным. А при наличии еще и воздействия со стороны исследователя - рандомизированным контролируемым клиническим испытанием или просто клиническим испытанием. Контролируемое испытание - это проспективное исследование а, кроме того, экспериментальное исследование.

Перейдем теперь к методам оценки статистической значимости различий (их называют критериями значимости, или просто критериями). Методов этих существует множество, но все они построены по одному принципу. Сначала мы формулируем основную (нулевую) гипотезу, то есть предполагаем, что исследуемые факторы не оказывают никакого влияния на исследуемую величину и полученные различия случайны. Затем мы определяем, какова вероятность получить наблюдаемые (или более сильные) различия при условии справедливости нулевой гипотезы. Если эта вероятность мала, то мы отвергаем нулевую гипотезу и заключаем, что результаты эксперимента статистически значимы. Это, разумеется, еще не означает, что мы доказали действие именно изучаемых факторов (это вопрос прежде всего планирования эксперимента), но, во всяком случае, маловероятно, что результат обусловлен случайностью.

Дисперсионный анализ был разработан в 20-х годах нашего столетия английским математиком и генетиком Рональдом Фишером. На дисперсионном анализе основан широкий класс критериев значимости, со многими из которых мы познакомимся в рамках курса. Сейчас мы постараемся понять общий принцип этого метода.

Рассмотрим такой пример: пусть однажды в небольшом городке (200 жителей) ученые исследовали влияние диеты на сердечный выброс. Случайным образом отобрали 28 человек, каждый из которых согласился участвовать в исследовании. После этого они, опять-таки случайным образом, были разделены на 4 группы по 7 человек в каждой. Члены первой (контрольной) группы продолжали питаться как обычно, члены второй группы стали есть только макароны, третьей группы — мясо, четвертой — фрукты. Через месяц у всех участников эксперимента измерили сердечный выброс. Каким же образом оценить, влияет ли диета на сердечный выброс.

Анализ данных мы начинаем с формулировки нулевой гипотезы. В данном случае она заключается в том, что ни одна из диет не влияет на сердечный выброс.

Чтобы оценить величину различий необходимо сравнивать разброс по каждой из выборок с разбросом выборочных средних, что можно сделать с помощью дисперсии. Однако необходимо отметить, что дисперсия характеризует разброс только в том случае, если исходная совокупность имеет нормальное распределение. Поэтому критерий, основанный на дисперсии, применим только для нормально распределенных совокупностей. Критерии основанные на оценке параметров распределения носят название параметрические.

Чем больше разброс средних и чем меньше разброс значений внутри групп, тем меньше вероятность того, что наши группы –это случайные выборки из одной совокупности. Оформим это утверждение количественно.

Дисперсию совокупности можно оценить двумя способами:

1. Дисперсия, вычисленная для каждой группы, - это оценка дисперсии совокупности. Поэтому дисперсию совокупности можно оценить на основании групповых дисперсий. Такая оценка не будет зависеть от различий групповых средних.

2. Во-вторых, разброс выборочных средних тоже позволяет оценить дисперсию совокупности. Понятно, что такая оценка дисперсии зависит от различий выборочных средних.

Если экспериментальные группы — это случайные выборки из одной и той же нормально распределенной совокупности (применительно к нашему эксперименту это значило бы, что диета не влияет на сердечный выброс), то обе оценки дисперсии совокупности дали бы примерно одинаковые результаты. Поэтому, если эти оценки оказываются близки, то мы не можем отвергнуть нулевую гипотезу. В противном случае мы отвергаем нулевую гипотезу, то есть заключаем: маловероятно, что мы получили бы такие различия между группами, если бы они были просто четырьмя случайными выборками из одной нормально распределенной совокупности.

Перейдем к вычислениям. Как оценить дисперсию совокупности по имеющимся k выборочным дисперсиям? Если верна гипотеза о том, что фактор (диета) не влияет на контролируемую величину (сердечный выброс), то любая из них дает одинаково хорошую оценку. Поэтому в качестве оценки дисперсии совокупности возьмем среднее выборочных дисперсий. Эта оценка называется внутригрупповой дисперсией; обозначим ее s2вну.

(7)

где k – число групп, s2i – выборочная оценка дисперсии в i-ой группе.

Дисперсия внутри каждой группы вычисляется относительно среднего для группы. Поэтому внутригрупповая дисперсия не зависит от того, насколько различаются эти средние.

Оценим теперь дисперсию совокупности по выборочным средним. Так как мы предположили, что все выборки извлечены из одной совокупности, стандартное отклонение выборочных средних служит оценкой ошибки среднего. На помним, что стандартная ошибка среднего связана со стандартным отклонением совокупности  и объемом выборки n следующим соотношением:

(8)

Тем самым, дисперсию совокупности σ2 можно рассчитать следующим образом:

(9)

Воспользуемся этим, чтобы оценить дисперсию совокупности по разбросу значений выборочных средних. Эта оценка называется межгрупповой дисперсией; обозначим ее s2меж.

(10)

где - оценка стандартного отклонения выборки средних.

Если верна нулевая гипотеза, то как внутригрупповая, так и межгрупповая дисперсии служат оценками одной и той же дисперсии и должны быть приближенно равны. Исходя из этого, вычислим критерий F:

Дисперсия совокупности, оцененная по выборочным средним

F =————————————————————.

Дисперсия совокупности, оцененная

по выборочным дисперсиям

или

(11)

И числитель, и знаменатель этого отношения — это оценки одной и той же величины — дисперсии совокупности σ2, поэтому значение F должно быть близко к 1.

Рис.4. F - распределение

Критическое значение F зависит от числа групп и числа членов каждой группы, определяющих внутригрупповое и межгрупповое число степеней свободы:

νвну=k(n-1)

νмеж=k-1,

где k – число групп, n – число членов каждой группы.

Математическая модель, на которой основано вычисление критических значений F, предполагает следующее.

• Каждая выборка независима от остальных выборок.

• Каждая выборка случайным образом извлечена из исследуемой совокупности.

• Совокупность нормально распределена.

• Дисперсии всех выборок равны.

При существенном нарушении хотя бы одного из этих условий нельзя пользоваться ни таблицей распределения F, ни вообще дисперсионным анализом.

В случае неравной численности групп пользуются следующими формулами:

А) Расчет по групповым средним и стандартным отклонениям.

Пусть имеется k групп, ni – численность i – й группы, - среднее в i – й группе, si – стандартное отклонение в i – й группе.

Б) Расчет по исходным данным.

ni – численность i – й группы, хij- значение признака у j – го больного i – й группы.

Число степеней свободы и величина F вычисляются как при расчете по групповым средним и стандартным отклонениям.

ЗАДАЧИ.

3.1. Если при родах шейка матки долго не раскрывается, то продолжительность родов увеличивается и может возникнуть необходимость кесарева сечения. Медики решили выяснить, ускоряет ли гель с простагландином Е2 раскрытие шейки матки. В исследование вошло 2 группы рожениц. Роженицам первой группы вводили в шейку матки гель с простагландином Е2, роженицам второй группы вводили гель-плацебо. В обеих группах было по 21 роженице; возраст, рост и сроки беременности были примерно одинаковы. Роды в группе, получавшей гель с простагландином Е2, длились в среднем 8,5 ч (стандартное отклонение 4,7 ч), в контрольной группе — 13,9 ч (стандартное отклонение — 4,1 ч). Можно ли утверждать, что гель с простагландином Е2 сокращал продолжительность родов?

3.2. Курение считают основным фактором, предрасполагающим к хроническим обструктивным заболеваниям легких. Что касается пассивного курения, оно таким фактором обычно не считается. Было проведено исследование, авторы которого усомнились в безвредности пассивного курения и исследовали проходимость дыхательных путей у некурящих, пассивных и активных курильщиков. Для характеристики состояния дыхательных путей взяли один из показателей функции внешнего дыхания — максимальную объемную скорость середины выдоха, которую измеряли во время профилактического осмотра сотрудников Калифорнийского университета в Сан-Диего. Уменьшение этого показателя — признак нарушения проходимости дыхательных путей. Данные обследования представлены в таблице.

Группа

Число обследованных

Максимальная объемная скорость средины выдоха, л/с

Среднее

Стандартное отклонение

Некурящие:

Работающие в помещении, где не курят

200

3,17

0,74

Работающие в накуренном помещении

200

2,72

0,71

Курящие:

Выкуривающие небольшое число сигарет

200

2,63

0,73

Выкуривающие среднее число сигарет

200

2,29

0,70

Выкуривающие большое число сигарет

200

2,12

0,72

Можно ли считать максимальную объемную скорость середины выдоха одинаковой во всех группах?

3.3. Низкий уровень холестерина липопротеидов высокой плотности (ХЛПВП) — фактор риска ишемической болезни сердца. Некоторые исследования свидетельствуют, что физическая нагрузка может повысить уровень ХЛПВП. Исследовали уровень ХЛПВП у бегунов-марафонцев, бегунов трусцой и лиц, не занимающихся спортом. Средний уровень ХЛПВП у лиц, не занимающихся спортом, составил 43,3 мг% (стандартное отклонение 14,2 мг%), у бегунов трусцой — 58,0 мг% (стандартное отклонение 17,7 мг%) и у марафонцев — 64,8 мг% (стандартное отклонение 14,3 мг%). Будем считать, что в каждой группе было по 70 человек. Оцените статистическую значимость различий между группами.

Характеристики

Тип файла
Документ
Размер
347,5 Kb
Тип материала
Высшее учебное заведение

Тип файла документ

Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.

Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.

Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.

Список файлов лекций

Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6418
Авторов
на СтудИзбе
307
Средний доход
с одного платного файла
Обучение Подробнее