Лекция 1 (1032384)
Текст из файла
9
Лекция 1.
ВВЕДЕНИЕ
Поиск новых методов диагностики и лечения, выбор наилучшего из уже принятых — везде статистические соображения играют не последнюю роль. Чтобы принять полноправное участие в обсуждении этих вопросов, инженер должен быть знаком с принципами и основными методами статистики.
До сих пор инженеры редко участвовали в обсуждении вопросов, выходящих за рамки сугубо технических и относящихся к врачебной практике. Однако по мере увеличения числа новых методов лечения и диагностики, развития медицинской техники, ужесточения требований к использованию ресурсов особую актуальность приобретает проверка их эффективности. Поэтому значительную помощь при обработке медико-биологических данных могут и должны оказывать медикам специалисты в области биомедицинской инженерии.
В рамках курса нами будут рассмотрены наиболее типичные вопросы и статистические задачи, возникающие в процессе проведения медико-биологических экспериментов: описание данных, сравнение нескольких групп под влиянием некоторого качественного фактора (дисперсионный анализ), анализ качественных признаков, вопросы чувствительности критериев, построение доверительных интервалов, анализ зависимостей, анализ повторных измерений, применение непараметрических критериев и т.д..
Рассмотрим типичный пример применения статистических методов в медицине. Создатели препарата предполагают, что он увеличивает диурез пропорционально принятой дозе. Для проверки этого предположения они назначают пяти добровольцам разные дозы препарата. По результатам наблюдений строят график зависимости диуреза от дозы (рис. 1А). Зависимость видна невооруженным глазом. Исследователи поздравляют друг друга с открытием, а мир — с новым диуретиком.
Рис. 1. А. У 5 добровольцев измерили суточный диурез после приема разных доз препарата (предполагаемого диуретика). Зависимость диуреза от дозы, казалось бы, налицо: чем больше доза — тем больше диурез. Можно ли считать диуретический эффект препарата доказанным? Б. Такую картину мы увидели бы, если бы могли исследовать связь дозы и диуреза у всех людей: зависимости нет и в помине. Пять человек, вошедших в первоначальное исследование, помечены черным. В данном случае мнимая зависимость порождена случайностью. С помощью статистических методов можно оценить вероятность подобной ошибки.
На самом деле данные позволяют достоверно утверждать лишь то, что зависимость диуреза от дозы наблюдалась у этих пяти добровольцев. То, что эта зависимость проявится у всех людей, которые будут принимать препарат, — не более чем предположение. Нельзя сказать, что оно беспочвенно — иначе зачем ставить эксперименты?
Но вот препарат поступил в продажу. Все больше людей принимают его в надежде увеличить свой диурез. И что же мы видим? Мы видим рис. 1Б, который свидетельствует об отсутствии какой-либо связи между дозой препарата и диурезом. Черными кружками отмечены данные первоначального исследования. Статистика располагает методами, позволяющими оценить вероятность получения столь «непредставительной», более того, сбивающей с толку выборки. Оказывается, в отсутствие связи между диурезом и дозой препарата полученная «зависимость» наблюдалась бы примерно в 5 из 1000 экспериментов. Итак, в данном случае исследователям просто не повезло. Если бы они применили даже самые совершенные статистические методы, это все равно не спасло бы их от ошибки.
Этот вымышленный, но совсем не далекий от реальности пример приведен не для того, чтобы указать на бесполезность статистики. Он говорит о другом – о вероятностном характере ее выводов. В результате применения статистического метода мы получаем не истину в последней инстанции, а всего лишь оценку вероятности того или иного предположения. Кроме того, каждый статистический метод основан на собственной математической модели, и результаты его правильны настолько, насколько эта модель соответствует действительности.
1. ОЦЕНИВАНИЕ ОСНОВНЫХ СВОЙСТВ СП
Корректность методов анализа СП, а также интерпретация результатов анализа в значительной степени зависят от его основных свойств: стационарности и эргодичности, нормальности и присутствия периодических составляющих.
Стационарность СП позволит использовать менее громоздкие, чем при анализе НСП, методы анализа. Информация о наличии периодических составляющих позволит избежать ошибок при интерпретации результатов анализа (устранить тренд).
Предположение о нормальности позволит существенно упростить аналитические исследования свойств СП (не содержащего периодические составляющие). Поэтому проверка этой гипотезы весьма желательна.
Оценивание этих трех фундаментальных свойств выполняется до детального анализа.
1.1.Проверка стационарности.
А) прежде всего целесообразно рассмотреть физическую природу СП, которому принадлежит реализация.
Если основные физические факторы, определяющие процесс не зависят от времени, то можно считать изучаемый процесс стационарным. Справедливость этого положения обусловлена ЦПТ.
В практически важных задачах такие простые соображения обычно отсутствуют.
Б) Анализ имеющихся реализации
- визуальный (опытный специалист).
-
стационарность процесса устанавливается по реализации.
При этом делаются следующие допущения:
-
любая реализация правильно отражает нестационарный характер СП, содержащих детерминированный тренд.
-
длина реализации больше периода самой низкочастотной составляющей процесса. Т.е., длина реализации должна быть настолько большой, чтобы можно было разделите нестационарный тренд и низкочастотные случайные колебания.
-
удобно сделать предположение: любые (представляющие интерес) нестационарные свойства СП полностью описываются медленными изменениями во времени 2. Изменения 2 означают, что ковариационная функция зависит от времени. Аналогичные рассуждения справедливы и для моментов более высокого порядка.
Последовательность действий, основанная на этих допущениях, для проверки стационарности СП по отдельной реализации выглядит следующим образом:
-
Реализация разделяется на N интервалов. При этом наблюдения в различных интервалах полагаются независимыми.
-
Вычисляются оценки среднего квадрата (или х, х2) для каждого интервала. Полученные оценки располагаются в порядке возрастания номера интервала:
-
Эта последовательность оценок среднего квадрата проверяется на наличие тренда или других изменений, которые не могут быть объяснены статистической изменчивостью оценок.
Проверка реализации на наличие тренда может быть выполнена с помощью критерия инверсий и критерия серий.
Для этого необходимо предположить, что последовательность оценок среднего квадрата есть выборка, составленная из независимых наблюдений стационарной случайной последовательностью со средним 2.
Если гипотеза верна, то изменения последовательности средних квадратов будет носить случайный характер, и не будет содержать тренда.
Следовательно, вероятное число инверсий будет таким же, как и для последовательности независимых наблюдений рассматриваемой СВ.
Если же число инверсий окажется существенно иным, то гипотеза стационарности должна быть отвергнута.
Такой метод проверки стационарности не требует знания спектральной ширины рассматриваемого интервала усреднения. Его применение не ограничено оценками 2. Можно использовать и для х, х2 и др.
Более того, анализируемые данные не обязательно должны быть свободны от вклада периодических компонент.
1.2.Проверка периодичности
Теоретически наличие периодических и (или) почти периодических составляющих в СП проявляется в виде -функций в его спектральной плотности. В практических реализациях в спектральной плотности часто встречаются пики, которые ошибочно можно приписать узкополосному случайному шуму.
Поэтому желательно устанавливать наличие периодических составляющих, чтобы не путать их с узкополосным случайным шумом, ширина спектральной плотности которого конечна.
Если периодические составляющие имеют большие амплитуды, то их наличие совершенно очевидно, однако из-за малых амплитуд периодические компоненты могут и не проявиться отчетливо. Их присутствие наиболее эффективно устанавливается при помощи методов анализа спектральной плотности СП.
Для решения этой задачи чаще всего используют оценки автоспектральной плотности.
В оценке автоспектральной плотности, вычисленной при высоком разрешении по частоте, периодические составляющие даже небольшой амплитуды проявляются в виде острых максимумов. Однако максимум автоспектра может отвечать и узкополосному случайному шуму. Увеличивая разрешение по частоте можно различить эти две ситуации, строя оценки автоспектра с все более высоким разрешением по частоте.
Если максимум отвечает гармоническому колебанию, то его ширина всегда будет совпадать с шириной полосы пропускания используемого для построения оценки фильтра, сколь бы малой она ни была, и высота максимума всегда будет расти пропорционально уменьшению полосы пропускания (рис.2).
Очевидно, такой метод детектирования даст иные результаты, если ширина элементарной полосы пропускания при спектральном анализе меньше возможной ширины спектра узкополосного СП.
1.3. Проверка нормальности
Наиболее просто осуществлять такую проверку, измерив плотность вероятности значений реализации и сравнив ее с теоретически нормальным распределением.
Если длина реализации велика и ошибки измерения малы по сравнению с отклонениями функции от нормальной кривой, то ее несоответствие нормальному распределению будет очевидно. Однако в этом случае необходимо знать частотную структуру процесса. Такие сведения получить достаточно трудно, поэтому обычно применяются непараметрические критерии нормальности распределения - критерий согласия 2.
1.2.Анализ данных
Схема оценивания статистических характеристик отдельных реализации представлена на рис. 3.
Блок А: Первый этап заключается в вычислении среднего значения и среднего квадрата или дисперсии. Необходимость вычисления определяется тем что:
1) среднее значение и средний квадрат определяют некоторый средний уровень СП.
2) вычисление среднего значения и среднего квадрата по коротким временным интервалам позволяет проверить стационарность реализации.
Рис.2. Оценки автоспектра смеси гармонического сигнала и шума.
Блок Б: Оценивание ковариационных функций.
Не содержит информации отличной от автоспектра. Обычно используют для определения эффективного времени корреляции. Часто опускают.
Блок В: Оценивание спектральной плотности.
Описывает частотный состав СП. Для линейных физических систем с постоянными параметрами спектр выходного процесса может быть найден как произведение спектра процесса на входе на квадрат амплитудной характеристики системы. Результаты измерения спектра дают информацию о динамических характеристиках системы. Общая площадь для кривой спектральной плотности как функция частоты равна среднему квадрату.
Блок Г : Последний основной этап процедуры анализа.
В настоящее время применяется редко, так как принято делать допущение, что СП подчиняются нормальному закону. Все-таки в некоторых случаях распределения СП существенно отличается от гауссова (например, когда он является результатом нелинейного преобразования другого процесса).
Рис. 3. Общая схема анализа отдельных реализации.
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.