rpd000003197 (1012246), страница 22
Текст из файла (страница 22)
Основные правила составления графических изображений числовых данных предполагают:
-
правильный выбор вида графического представления, отвечающего целям и задачам экспериментального исследования;
-
обязательное использование надписей, поясняющих графические изображения;
-
указание масштаба и размерностей величин, присутствующих на графическом изображении;
-
активное использование условных обозначений.
Виды графических изображений, которые находят применение в практике анализа числовых экспериментальных данных достаточно разнообразны. Одним из наиболее распространенных способов графического представления числовых данных является диаграмма. Диаграмма – графическое изображение, наглядно показывающее линейными отрезками ли геометрическими фигурами соотношения между различными величинами. Различают следующие типы диаграмм:
-
линейные диаграммы (графики, радиальные диаграммы);
-
плоскостные диаграммы, в том числе прямоугольные (столбиковые, ленточные,) и секторные (круговые), картограммы, картодиаграммы;
-
объемные (в виде шаров, кубов и т.д).
Линейные диаграммы, как правило, применяются для наглядного представления связей типа Y=Y(X) между анализируемыми данными, временной динамики Y(t) изменения тех или иных показателей, характеризующих состояние объекта исследования. На линейной диаграмме могут представляться как абсолютные значения показателей, так и их усредненные значения. Графически линейная диаграмма представляется в виде кусочно-линейной зависимости (рис. 2.1).
Радиальные (полярные) диаграммы являются удобным способом представления и анализа комплекса показателей X1,X2, X3,…. Xk, отражающих состояние объекта экспериментального исследования, значения которых ограничены:
0 Ximin Xi Ximax
Неудобство может состоять в том, что показатели Xi, i=1,…k могут иметь различные размерности, измеряться в разных шкалах. Для удобства графического представления таких показателей в виде радиальной диаграммы целесообразно использовать нормирующее преобразование
указанное нормирующее преобразование отображает отрезок
Ximin Xi Ximax
в
0 Zi 1.
При построении радиальной диаграммы, учитывая предварительное нормирующее преобразование, окружность единичного радиуса делят на равное количество частей, определяемой числом k отображаемых параметров. Очевидно, что окружность локализует предельно-допустимые значения параметров. На единичные радиусы окружности наносится шкала, на которой наносятся текущие значения Zi, i=1,…k нормированных параметров, полученные в процессе исследований (рис. 1.2).
Рис. 1.2. Пример представления радиальной диаграммы
Плоскостные диаграммы могут быть прямоугольными (столбиковыми, ленточными) и секторными (круговыми). Столбиковые диаграммы используются для представления абсолютных или средних значений анализируемых показателей в виде вертикально расположенных столбцов. При этом снование столбца располагается на оси абсцисс, а высота столбца равна значению показателя в выбранном масштабе. Ширина столбиков и расстояние между ними могут быть одинаковыми или произвольными. На рис. 1.3 приведен пример представления столбиковой диаграммы, отражающий временную динамику изменения показателя, характеризующего состояние экспериментального объекта.
Ленточные диаграммы (рис. 1.4) по своему содержанию и смыслу аналогичны столбиковым, с той лишь разницей, что для достижения лучшего визуального эффекта столбики располагаются не вертикально а горизонтально.
Секторные и круговые диаграммы используются для изображения структуры явления, относительной степени влияния отдельных факторов на состояние объекта исследования. В секторной диаграмме (рис. 1.5) угловая мера окружности (360 гр) принимается за 100% . Процентный вклад каждого фактора в структуре исследуемого явления пропорционален угловой мере соответствующего ему сектора
Рис. 1.5. Пример представления секторной диаграммы
В отличие от секторной для круговой диаграммы вклад фактора определяется не угловым размером соответствующего ему сектора, а его площадью.
1.2. Технология статистической обработки данных экспериментальных исследований с использованием программных статистических пакетов.
Использование статистических методов обработки и анализа экспериментальных данных позволяет в условиях присутствия случайных факторов выявлять объективные закономерности, присущие объекту экспериментального исследования, и делать на их основе обоснованные выводы и прогнозы.
В качестве эффективного практического инструмента для решения задач статистического анализа данных экспериментальных исследований можно использовать персональный компьютер, оснащенный одним из статистических программных пакетов. Статистические программные пакеты делают методы анализа данных более доступными и наглядными, освободив пользователя от необходимости выполнения большого объема трудоемких расчетов, возложив на него лишь функции постановки задачи, выбора метода их решения и интерпретации результатов в терминах конкретной задачи экспериментального исследования [13,14,32].
Однако, правильной выбор метода решения, отвечающего целям исследования и характеру экспериментальных данных, грамотная интерпретация результатов невозможна без знакомства с основными понятиями теории вероятностей и математической статистики. Принципиально важным при использовании статистических пакетов, как инструмента анализа, является правильная организация процесса статистического исследования. Заметим, что дальнейшее изложение не предполагает исчерпывающее изложение основ теории вероятностей и математической статистики. Оно в большей степени ориентировано на изложение последовательности решения задач статистического анализа с использованием такого мощного практического инструмента, каким являются современные статистические программные пакеты.
Ясно, что многообразие задач статистического анализа данных экспериментальных исследований, обусловленное разнообразием целей и методов исследований не позволяет создать универсальный алгоритм подобного анализа, одинаково пригодный во всех практических ситуациях. Однако, к настоящему времени накоплен обширный опыт проведения статистического анализа экспериментальных данных и выработаны практические рекомендации, выполнение которых является обязательным элементом любого статистического выборочного исследования.
Рассмотрим последовательность типовых действий, выполняемых в процессе статистического анализа результатов, и их реализацию на базе статистических пакетов.
1.2.1 Влияние условий проведения эксперимента на достоверность результатов статистического анализа данных.
Достоверность результатов статистического анализа экспериментальных данных в равной степени зависит как от правильного выбора метода их обработки, так и от условий проведения исследований. В процессе анализа условий проведения экспериментального исследования следует обратить внимание на следующие моменты:
- использованные данные и способ их получения;
- совокупность, которую представляют используемые в исследовании выборки.
Поясним более подробно смысл перечисленных выше условий проведения исследования. Общей целью статистического анализа данных любого экспериментального исследования, независимо от его конкретных целей, является выявление объективных закономерностей, присущих объекту исследования. То есть закономерностей, которые присущи всему множеству подобных объектов, называемых генеральной совокупностью, на основе исследования их ограниченной группы, именуемой выборкой или выборочной совокупностью.
Естественно, для того чтобы результаты анализа адекватно отражали исследуемые закономерности, необходимо, чтобы выборка наилучшим образом представляла генеральную совокупность, то есть была репрезентативной. Явление, когда выборка представляет не всю совокупность, а лишь какую-то её часть, называется смещением выборки. Смещение выборки может стать одним из источников ошибок статистического анализа данных экспериментальных исследований. Таким образом, репрезентативность выборки – одно из необходимых условий, которым должны удовлетворять данные, для того, чтобы выводы, которые будут получены в результате статистического анализа, обладали необходимой достоверностью.
Другим необходимым условием является представительность выборки. Дело в том, что любой статистический метод исходит из предположения, что выборка извлечена из генеральной совокупности случайно. Если это условие не выполняется, никакой, даже самый совершенный статистический метод не даст правильного результата. Приемы, направленные на то, чтобы обеспечить случайный характер выборочных данных, называются рандомизацией.
Рандомизация экспериментальных данных, прежде всего, предполагает максимальное исключение субъективного влияния специалиста-исследователя, что является достаточно сложным. Влияние человека может присутствовать на всех этапах подготовки данных для их последующего статистического анализа. Это, прежде всего – формирование групп данных (экспериментальной и контрольной), для их последующего сравнения. Утверждение, что групповые данные извлечены из генеральной совокупности случайно, в данной ситуации предполагает, что любой элемент генеральной совокупности может с одинаковой вероятностью попасть в любую из групп при условии, что их объемы равны. Поэтому, еще на стадии подготовки экспериментального исследования, предполагая дальнейший статистический анализ результатов, следует продумать, как максимально ослабить субъективное влияние участников исследования на формирование сравниваемых групп. Задача рандомизации заключается в том, чтобы обеспечить такие условия проведения исследований, при которых контрольная группа ни чем не отличалась от экспериментальной, кроме некоторого фактора, влияние которого должно быть оценено в результате статистической обработки результатов.
1.2.2. Статистическое описание числовых данных экспериментальных исследований
Приступая к процедуре анализа случайных данных, мы сталкиваемся с необходимостью их статистического описания. Существуют разные способы статистического описания случайных показателей. Исчерпывающей характеристикой любой случайной величины является закон ее распределения. Поясним смысл этого понятия.
Каждая случайная величина задает распределение вероятностей на множестве своих значений. Следовательно, чтобы дать полное математическое описание случайной величины необходимо указать множество её значений и соответствующее распределение вероятностей на этом множестве. Существуют разные формы представления законов распределения случайных величин [2,22]
1. Функция распределения случайной величины. Функцией распределения F(x) случайной величины X называется вероятность события X х:
То есть для того, чтобы на основе опытных данных найти выборочные значения функции распределения (рис. 1.6) при данном значении аргумента x, достаточно подсчитать число опытов, в которых случайная величина X принимала значения xi,i=1,..,N меньшие или равные x, и разделить его на общее число опытов N:
где i- индикаторная функция; i =1, если xi x, 0 – в противном случае.
Функция распределения – наиболее универсальная статистическая характеристика случайных величин. Она существует как дискретных, так и для непрерывных случайных величин. Функция распределения полностью характеризует случайную величину с вероятностной точки зрения.
2. Ряд распределения. Многоугольник распределения. Исчерпывающей количественной характеристикой распределения дискретной случайной величины является многоугольник распределения. Будем полагать, что в результате эксперимента случайная величина Х может принимать лишь конечное число возможных значений х1,...,хN, то есть может произойти одно из полной группы несовместных событий: {Х= х1}; {Х= х2};....{Х= хN}. Обозначим частоты этих событий как pi, i=1,..,N, где pi = P{X=xi}. Правило, устанавливающее соответствие между каждым из событий {Х= хi} и его вероятностью pi, называется законом распределения дискретной случайной величины. Наглядной формой представления закона распределения дискретной случайной величины является ряд распределения, представляющий собой таблицу, в которой перечислены возможные значения случайной величины и соответствующие им вероятности. Другой наглядной формой представления закона распределения дискретной случайной величины является многоугольник распределения.