Диссертация (1141527), страница 11
Текст из файла (страница 11)
Приэтом, влияние каждой из случайных величин по отдельности мало по сравнению свлиянием всех остальных. Плотность вероятности нормального распределенияопределяется по формуле [22]:,(3.3)где – среднее значение случайной величины х; – стандартное отклонение.При логарифмически нормальном распределении случайной величины хнормальное распределение имеют ее натуральные логарифмы. Плотностьвероятности логарифмически нормального распределения имеет вид [22]:,(3.4)где =ln (x); – среднее значение случайной величины ; – стандартноеотклонение.Логарифмическинормальноераспределениепреобразовываетсявнормальное распределение, поэтому к выборкам, имеющим логарифмическинормальное распределение применимы методы параметрической статистики.Известно, что большинство гидрологических характеристик ассиметричныи коррелированны по времени.
Асимметрия гидрологических характеристик, какправило, положительна, это связано с тем, что речной сток принимает толькоположительныезначения[40].Внастоящеевремядлямоделирования62гидрологических характеристик стока используется целый ряд аналитическихраспределений непрерывных случайных величин. Логарифмически нормальноераспределение используется при определении максимального паводочного стока.Максимальные расходы дождевых паводков описываются распределениемГумбеля [85]. В качестве стандартной кривой для гидрологических расчетов вРоссии нормативными документами рекомендована кривая Крицкого-Менкеля(трехпараметрическое гамма-распределение).
К особенностям этой кривойотносятся положительная асимметрия, нулевое значение в качестве нижнегоправого предела и отсутствие ограничений по верхнему пределу случайнойвеличины [91]. В руководстве Совета водных ресурсов США частота наводненийопределяется лог-распределением Пирсона типа III [121].Несмотря на то, что случайная величина, подчиняющаяся нормальномузакону, имеет область определения на интервале (–, +), нормальноераспределение также используется в гидрологической практике.
Основнаяособенность нормального распределения– ему подчиняются случайныевеличины, представляющие собой сумму независимых или слабозависимыхслучайных величин с дисперсиями, меньшими, чем дисперсия результата [93].Нормальное распределение удобно применять в тех случаях, когда истинныйзакон распределения исследуемой величины известен, но вычисления по немузатруднительны, в то время как аппроксимация параметра нормальнымраспределением не приведет к большим ошибкам.Особенностью возникновения заторов и зажоров на реках являетсямногофакторность исследуемого процесса, что равнозначно влиянию нагидрологическую характеристику, как случайную величину, множества другихслучайныхвеличин,заторообразования.переменные,которыебылиперечисленывышекакфакторыВполне возможно, что перечисленные дискриминантныехарактеризующиезаторно-зажорныеявления,могутиметьнормальный или логарифмически нормальный закон распределения.
Этопредположение будет проверено ниже.63Данные описательной статистики переменных х1..х4 приведены в Таблице3.1.Таблица 3.1Описательная статистика дискриминантных переменныхПеременнаяСреднее значениеСтандартное отклонениеХ10,4740,156Х21,8280,733Х31,0530,189Х40,2760,072Для проверки сложной гипотезы о виде распределения дискриминантныхпеременных были использованы непараметрические критерии (то есть критерии,не основанные на параметрах распределения). Параметры распределения (среднеезначение и стандартное отклонение) были получены по выборочным данным.Происходилапроверканулевойгипотезы«ГенеральнаясовокупностьХраспределена по нормальному (логарифмически нормальному) закону».Первым из статистических критериев использовался критерий согласияПирсона или критерий 2, вторым из критериев был критерий Крамера-МизесаСмирнова 2 и Колмогорова-Смирнова.
Последние два критерия являютсяасимптотическими непараметрическими критериями, рекомендованными ГОСТ[28], так как они более эффективны при проверке сложных гипотез, работают навыборках меньшего объема (от 16-ти вариант) и используют все данныенаблюдений, в отличие от критерия Пирсона, в котором в результатеинтервальных группировок может теряться часть информации.
Критерий 2 иКолмогорова-Смирнова был вычислен в пакете STATISTICA, критерий 2 вэлектронных таблицах Excel. Результаты расчетов приведены в Таблице 3.2.При проверке статистических гипотез в инженерных расчетах обычнопринимают уровень значимости =0,05 или 5%. Он представляет собойвероятность отклонения нулевой гипотезы, если она верна. Во многихстатистических пакетах программ используется не заранее заданный уровеньзначимости, а вычисляется выборочное значение статистики критерия ивероятность того, что случайная величина превышает это значение, если нулеваягипотеза верна. Эта вероятность обозначается какр -значение[94].
Если64полученное р- значение больше принятого уровня значимости, то нулевуюгипотезу принимают.Таблица 3.2Проверка гипотезы о виде распределения генеральной совокупностиПеременнаяпараметрХ1Х2Х3Х4/ Проверяемоераспределениер – значение для р – значение для р – значение длястатистикистатистики 2статистики 2КолмогороваСмирнова0,6460,4770,8020,3940,0010,3780,5780,9120,3080,4390,7790,2700,0370,2600,7100,716нормальноенормальноелогнормальноенормальноенормальноелогнормальноеАнализ данных о повторяемости заторов для участков рек бассейнаСеверной Двины был выполнен на основании данных [41], включающих сведенияозаторно-зажорных участках с подпором и без него.
Период наблюденийсоставлял от 10 до 93 лет.Аналитическая статистика частот заторов в позволила сделать вывод о том,что переменная х1 не противоречит нормальному распределению. Гипотеза былапринята на уровне значимости в зависимости от критерия =0,477…0,802.Переменнаях2непротиворечитлогарифмическинормальномураспределению на уровне значимости =0,578…0,912.Переменная х3 не противоречит нормальному распределению на уровнезначимости =0,308…0,799.Переменнаях4непротиворечитлогарифмическинормальномураспределению на уровне значимости =0,71.На рисунках 3.1 – 3.3 приведены эмпирические и теоретические кривыенормального (логнормального) распределения, полученные для дискриминантныхпеременных при интервальных группировках и без них.Выполненные проверки показали, что все переменные могут бытьиспользованы при проведении дискриминантного анализа, так как имеютнормальное (логнормальное) распределение.65Рисунок 3.1 – Критерий 2 при проверке нормальности распределениядискриминантных переменных х1 и х3Рисунок 3.2 – Критерий Колмогорова-Смирнова при проверке соответствиядискриминантных переменных х2 и х4 логарифмически нормальномураспределениюПроекции элементов совокупностей на плоскости Х10Х2, Х30Х2, Х20Х4 иХ10Х4, проходящиечерезприведены на рисунке 3.4.началокоординат(трехмерноепространство),66Рисунок 3.3 – Гистограммы и функции плотности вероятности теоретическогораспределения дискриминантных переменныхНесложно увидеть, что для речных участков, испытывающих и неиспытывающих влияние подпора со стороны нижележащего участка, проекциимножества точек, характеризующие конкретные значения переменных, образуютв большинстве случаев различные группы.КорреляционнаяматрицаприведенавТаблице3.3.Этасимметрична относительно главной диагонали.Таблица 3.3Корреляционная матрица дискриминантных переменныхХ1Х2Х3Х4Х1Х2Х310,510-0,6090,3811-0,4630,2461-0,409Х41матрица67Рисунок 3.4 – Факторные поля сочетаний дискриминантных переменныхНа уровне значимости 0,05 не значимым является только коэффициент rx2x4.Расположение точек на факторных полях позволяет сделать вывод о линейнойкорреляции дискриминантных переменных.
Ковариационные матрицы группприведены в Таблицах 3.4 и 3.5.Таблица 3.4Ковариационная матрица участков без подпораХ1Х2Х3Х4Х10,0140,004-0,010-0,001Х2Х30,1490,006-0,0140,042-0,002Х40,003Таблица 3.5Ковариационная матрица участков с подпоромХ1Х2Х3Х4Х10,0290,067-0,0180,007Х2Х30,495-0,0510,0240,020-0,007Х40,00668Как видно из ковариационных матриц условие примерного равенстваэлементовсодинаковыминомерамивыполняется.ПеременныеХ1…Х4удовлетворяют основным условиям применения дискриминантного анализа.3.3.
ПОСТРОЕНИЕ И КРОСС-ПРОВЕРКА КЛАССИФИКАЦИОННЫХФУНКЦИЙНеобходимо было найти такую линейную комбинацию переменных х 1…х4,которая разделила бы все участки речного бассейна на две группы: в первойгруппе возникает влияние подпора в период вскрытия от льда; во второй группеподпор от нижележащих участков отсутствует.В этом случае вид дискриминантной функции для всех речных участков:(3.5)где d – значение функции для m-того объекта (участка реки) в группе k=1 (свлиянием подпора) или k=2 (без влияния подпора); – коэффициент, значениекоторого необходимо определить; х – значение каждой из 4-х дискриминантныхпеременных для m-ого участка реки в группе 1 или 2.Внашемслучаедискриминантныерассматривалосьфункциичетырепредставлялисобойпеременных,поэтомугиперповерхностивчетырехмерном пространстве.В результате проведения дискриминантного анализа коэффициенты вфункции (3.5) необходимо выбрать так, чтобы центроиды двух групп участковимелинаибольшиеразличия,амежгрупповаядисперсиябылабольшевнутригрупповой.Дискриминантный анализ состоит из двух процедур: дискриминации (илиинтерпретации различий между группами) и классификации (разнесениянаблюдений по группам).
В гидрологической практике наиболее актуальнойбудет вторая процедура, которая позволит, используя перечисленные факторныепеременные, отличить участки с влиянием подпора от участков, в которых подпор69отнижерасположенныхстворовотсутствует.Именнопостроениеклассификационных функций представляло собой цель дальнейших расчетов.ДискриминантныйанализбылвыполненвсистемеSTATISTICA.Группирующая переменная х5 имела два значения «подпор» и «нет (отсутствиеподпора)», использован стандартный метод выбора значимых переменных.Обучающая выборка включала 15 участков без влияния подпора и 12 участков, вкоторых подпор оказывал влияние на процесс вскрытия реки (всего 66% от числаучастков с заторно-зажорными явлениями).