179320 (685658), страница 2
Текст из файла (страница 2)
Построение ряда с равными интервалами предполагает наличие вариационного ряда по группировочному признаку. Построение искомого ряда включает следующие операции:
определение размаха ряда – разности между крайними значениями ряда Хmax – Xmin;
обоснование числа групп вторичного ряда распределения n, которое зависит от объема выборки. Эта зависимость имеет опытно-статистический характер, применяется в зависимости от сферы изучаемого явления и декларируется специальными статистическими таблицами;
определение величины интервала
;
построение интервалов прибавлением к минимальному значению признака
: Xmin + i = X1. Таким образом, последовательно получаем интервалы [Xmin – X1], [X1 – X2] = [X1 – (X1 + i)] и т.д., пока не придем к максимальному значению признака.
Параметры ряда i и n взаимосвязаны: чем больше длина интервала, тем меньше интервалов. Число интервалов зависит от объема выборки, размаха и некоторых других характеристик ряда. В зависимости от объема выборки N можно принимать следующее число интервалов n:
| N | До 10 | До 10-30 | 30-100 | 100-500 | 500-3000 | Более 3000 |
| n | 3 | 3-4 | 4-8 | 8-9 | 9-13 | 13-18 |
Построение интервального ряда завершается распределением единиц совокупности по выделенным интервалам.
После того, как найдены частоты интервального ряда, строится их график, причем по оси абсцисс откладывают интервальные значения признака, а по оси ординат – частоты. Если полученный график близок к прямой или параболе, группировку можно заканчивать, она качественна. Для рядов с неравными интервалами данный график будет точнее, если вместо частот использовать плотность распределения.
Построению рядов с неравными интервалами предшествует анализ динамики признака по совокупности и регистрация моментов накопления объема признака. Совмещение этих двух направлений анализа сопровождается обычно вторичной группировкой. При первичной группировке этот процесс возможен только путем построения интервального ряда с равными интервалами.
Таким образом, процедура первичной группировки выглядит следующим образом:
1. Формируется ряд (с равными интервалами) на базе ряда распределения.
2. Выполняется графическая проверка полученного результата. График строится следующим образом: по оси абсцисс откладывают интервалы ряда с регистрацией их средних, по оси ординат – частоты (частости). Точки графика получают на пересечении срединных значений уровней ряда и соответствующих ординат.
3. Проводится анализ полученного графика посредством построения линии тренда. Если линия тренда представляет собой прямую линию или параболическую кривую (второго порядка), то полученные результаты являются достаточно надежными (качественными) и группировку можно закончить. Если линия тренда представлена гиперболической или синусоидальной кривой, то результаты группировки нельзя признать надежными и процедуру следует продолжить. Как правило, последующие стадии группировки заканчиваются построением рядов с неравными интервалами.
4. Осуществляется процедура проверки рядов с неравными интервалами:
1) по исходным данным определяется плотность распределения признака в пределах интервала по единицам совокупности;
2) строится график, в котором по оси абсцисс откладывают интервалы ряда с регистрацией середины; по оси ординат – плотность распределения;
3) проводится анализ полученного результата.
Кроме того, результатами группировки могут быть смешанные ряды, когда одни уровни представлены интервальными значениями, а другие – дискретными (геостатистика, гидрометеорологические исследования).
4. Графическое изображение рядов распределения
Любой ряд распределения может быть представлен в виде статистического графика. При этом по оси ординат показываются частоты (частости, плотности распределения), по оси абсцисс – значения признаков.
Построение статистических графиков отличается от построения математических рядом особенностей:
1. Для большей наглядности допускаются разные масштабы по осям координат.
2. Статистические графики могут быть уровневыми и интегральными. Уровневые замыкаются числом или пределами частот, что позволяет комплектовать уровневые статистические графики взаимосвязанных показателей на одном листе.
3. Статистические графики могут строиться как в абсолютном, так и в относительном измерении (по признаку). Последние предпочтительнее для функциональных признаков.
4. Интегральные статистические графики предполагают суммирование не только значений признака, но и частот. При этом возможно полное суммирование последних или их суммирование в ограниченных пределах (интервалах).
5. Статистические графики в зависимости от цели исследований читаются слева направо (прямой порядок) и справа налево (обратный порядок).
6. Статистический график всегда ломаная линия или диаграмма.
4.1 Уровневые графики (гистограмма, полигон распределения)
Для таких графиков важно соблюдать два правила их построения:
1. Количественное значение группы должно следовать за изменением количественной характеристики признака (распространение признака по оси абсцисс первично).
2. При равных интервалах признака по оси ординат откладываются частоты, при неравных – плотность распределения.
Характерными представителями уровневых графиков являются гистограмма (рис.1) и полигон распределения.
Для общего вида гистограммы характерно следующее:
предельная высота ограничена максимальной частотой, максимальной частостью или плотностью распределения;
гистограмма характеризует не только интервалы распределения признака (основания прямоугольников), но и распределение объема признака для тех или иных интервалов (площадь прямоугольника);
вид линии, ограничивающей гистограмму сверху, определяет ресурсы по объему признака;
вся площадь прямоугольника S по максимальной высоте гистограммы для всего распределения признака характеризует матрицу объема признака.
Гистограмма наглядно иллюстрирует распределение признака, причем двояко:
долей площади каждого прямоугольника
;
матрицей
, где S – площадь матрицы.
Гистограмма показывает как изменяется объем признака. Для оценки изменений площади соседних прямоугольников суммируются (возможно нарастающим итогом) и эта сумма относится к общему объему признака (сумме площадей всех прямоугольников).
Правильно построенная гистограмма (в пределах установленных масштабов) позволяет выделить генеральную совокупность по объему признака прямым или обратным порядком. Прямой порядок выделения генеральной совокупности сопряжен с нарастающей динамикой объема признака (S1 + S2 + S3 + S4), обратный (S4 + S3 + + S2 + S1) – с убывающей.
Построить гистограмму можно только для интервального ряда распределения, и в этом состоит специфичность гистограммы.
Более универсальным является второй вид уровневого графика – полигон распределения. В дискретных рядах каждому определенному значению признака соответствует своя частота (частость), что отражается на оси абсцисс точками, а не интервалами, а по оси ординат – целыми значениями частоты или дробными частости. В этом случае полигон распределения будет представлен ломаной линией.
Для интервального ряда получение полигона распределения предполагает соединение середин верхней линии гистограммы.
Для смешанного ряда построение полигона распределения предполагает соединение середин верхних линий гистограмм с высотой дискретного значения признака.
Если есть возможность закодировать цифрами стандартную номенклатуру по атрибутивному признаку, то эти цифры могут быть зарегистрированы на оси абсцисс, и это позволит построить полигон распределения (так называемый кодовый полигон распределения).
Универсальность этих графиков снижает их потенциальные возможности по сравнению с гистограммами. Полигон также характеризует распределение признака, но не так конкретно, как гистограмма (затруднен процесс расчета всех площадей). Изменение объема признака регистрируется в целом и нарастающим итогом, поэтому полигон распределения не позволяет выделить генеральную совокупность.
Тем не менее, полигон распределения регистрирует точку или момент перехода количества в качество в процессе нарастания объема признака.
4.2 Интегральные графики
Интегральные графики в экономике представлены главным образом кумулятами. Общей особенностью построения кумулят является накопление не только признака, но и частот по абсциссе и ординате. Различают следующие виды кумулят: полная и неполная; восходящая (прямая) и убывающая (обратная).
Кумуляты аналогичны по виду полигона распределения, а поэтому применимы для всех вариантов рядов распределения.
Полные кумуляты строятся для всех рядов с полным нарастанием частот (без ограничений). Неполные кумуляты строятся и для интервальных рядов, и для смешанных. Первые формируются либо в пределах всего ряда, либо учитываются только характерные группы интервалов (выделенные по минимальному, серединному или максимальному значению интервала), вторые – в пределах всего ряда, но учитываются не все частоты, а только те, которые выше установленного регламента.
Пример. По геологически однородному участку золотой россыпи получены следующие результаты опробования (447 проб):
| Содержание, г/т | 0 | 0-0,1 | 0,1-1 | 1-2 | 2-3 | 3-5 | 5-10 | 10-20 | |
| Число проб | 13 | 32 | 51 | 84 | 116 | 96 | 32 | 13 | |
| Содержание, г/т | 18,7 | 18,8 | 19,4 | 19,9 | 20 | 29,5 | 47,1 | 92 | 193,4 |
| Число проб | 1 | 1 | 2 | 1 | 1 | 1 | 1 | 1 | 1 |
Определить критическое содержание1 золота в пробе, полностью учитываемое при подсчете запасов по этому участку (избыточное содержание будет отнесено к запасам всего месторождения). Установить кондиции для балансовых и забалансовых запасов. Оценить достоверность графиков для подсчета категории запасов.
Решение. Все эти задачи можно решить графически путем построения двух полных кумулят: прямой и обратной. Построение кумулят требует проведения предварительной очистки данных от ложных («грязных») проб, а также обоснования критического содержания по отношению к среднему. Примем, что критическое содержание выше среднего в 10 раз. Кроме того, необходимо выделить ураганные пробы, в которых содержание выше критического.
Необходимую информацию и результаты расчетов сведем в таблицу, где столбцы 1 и 3 содержат исходную информацию, а остальные – расчетную (полужирным шрифтом выделены искомые значения).
Статистический анализ результатов опробования однородного участка золотой россыпи
| Содержание золота, г/т | Среднее по классу, г/т | Число проб в классе | Сумма со-держаний в классе, г/т | Нарастающая сумма | Убывающая сумма | |||
| г/т | % | г/т | % | |||||
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | |
| 0 | 0 | 13 | 0 | 0 | 0 | 1742,9 | 100 | |
| 0-0,1 | 0,05 | 32 | 1,6 | 1,6 | 0,1 | 1742,9 | 100 | |
| 0,1-1 | 0,55 | 51 | 28,1 | 29,7 | 1,7 | 1741,3 | 99,9 | |
| 1-2 | 1,5 | 84 | 126 | 155,7 | 8,8 | 1713,2 | 98,3 | |
| 2-3 | 2,5 | 116 | 290 | 445,7 | 25,6 | 1587,2 | 91,3 | |
| 3-5 | 4 | 96 | 384 | 829,7 | 47,6 | 1297,2 | 74,4 | |
| 5-10 | 7,5 | 32 | 240 | 1069,7 | 61,5 | 913,2 | 52,4 | |
| 10-20 | 15 | 13 | 195 | 1264,7 | 72,5 | 673,2 | 38,5 | |
| 18,7 | 18,7 | 1 | 18,7 | 1283,7 | 73,7 | 478,2 | 27,5 | |
| 18,8 | 18,8 | 1 | 18,8 | 1302,2 | 74,6 | 459,5 | 26,3 | |
| 19,4 | 19,4 | 2 | 38,8 | 1341 | 77,0 | 440,7 | 25,4 | |
| г/т | % | г/т | % | |||||
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | |
| 19,9 | 19,9 | 1 | 19,9 | 1360,9 | 78,1 | 401,9 | 23,0 | |
| 20 | 20 | 1 | 20 | 1380,9 | 79,3 | 382 | 21,9 | |
| 29,5 | 29,5 | 1 | 29,5 | 1410,4 | 81,0 | 362 | 20,7 | |
| 47,1 | 47,1 | 1 | 47,1 | 1457,6 | 84,6 | 332,5 | 19,0 | |
| 92 | 92 | 1 | 92 | 1549,5 | 88,9 | 285,4 | 15,4 | |
| 193,4 | 193,4 | 1 | 193,4 | 1742,9 | 100 | 193,4 | 11,1 | |
| _________________________________ Примечание. Такая запись указывает на то, что исходная информация не содержит грязных проб, а распределение содержания по уровням ряда соответствует геологической классификации проб. Тем самым пробы, представленные в столбце 3, являются чистыми. | ||||||||
Заполнение столбцов в расчетной части таблицы выполняется следующим образом:
















