Айвазян С.А., Бухшгабер В.М., Енюков И.С., Мешалкин Л.Д. - Прикладная статистика (1027378), страница 40
Текст из файла (страница 40)
6.4.2. Процедуры, базирующиеся на методе моментов. Речь идет о процедурах решения системы уравнений метода моментов!! 1, соотношения (8.25)! применительно к рассматриваемой в данной главе модели смеси распределений. При составлении системы уравнений метода моментов реализуется следующая схема: !) используя знание общего вида фуикпии плотности (полигона вероятностей) смеси !' (Х) (см. формулу (6.6")), пычнсляют, в терминах неизвестных параметров р,, ..., р„, 8„..., 8ю всевозможные теоретические моменты компонентов х<0 исследуемого многомерного признака Х вЂ” (хц>, х<'), ..., хоо): первые моменты тгц -- Ехгп, вторые моменты тг"0 =- Е (хи > ° хпп) и т.
д. в количестве, равном с общей размерности оцениваемого параметра (э (если размерность параметра О, определяющего распределение внутри класса, равна и, то общая размерность оцениваемого пара- 202 метра <э при заданном числе компонентов смеси й составит й — 1+ йд); 2) по выборке классифицируемых наблюдений (6.7) подсчитываются соответствующие выборочные моменты тД>, та ~*> и т. д.; 3) составляется система вида тбч (6) = ти> ти ьп (В) = т(п <л (6. 15) ., 1, 1„1»,...=-1, 2, ..., р, где левые части уравнений суть известные функции от неизвестных значений параметров 0 — (р„ри Рь- ' О< , О„), а правые части уравнений — известные числа.
Дальнейшие усилия направлены на решение системы (6 15), которое в каждом конкретном случае (при конкретизации общего вида компонентов 1 (Х, О,) в (6.6")) имеет свои специфические вычислительные трудности. <Узкимн местами» данного подхода являются чрезмерная громоздкость (а подчас практическая невозможность) его вычислительной реализации в случае многомерных анализируемых распределений 1 (Х, О,) и большого числа й смешнваечых классов, весьма скромное качество слатистическнх свойств получаемых при этом оценок 8 (в частности, дисперсия оценок т, для в ) 2, а соответственно и дисперсия получаемых решений В остается слишком большой даже при возрастании объема выборки п).
В работах (312, 178, 205, 2911 содержатся примеры использования этого подхода для решения задачи расщепления смеси распределений, предпринимаются попытки преодолеть отмеченные выше трудности. П р и м е р 6.6 Исследование весового распределения хлопкового волокна по длине (1591. При решении некоторых задач из области технологии текстильной промышленности и, в частности, в задачах о вытягивании, смешивании, расчетах прочности пряжи, опенки неровности полуфабрикатов и т. п. необходимо исследовать весовое распределение хлопка по длине волокна.
Предпринимавшиеся ранее специалистами попытки описать это распределение с помощью кривых Гаусса, Шарлье, Пирсона, закона т» <работали» лишь как формальная аппроксимация банной (обрабатываемой) выборки волокон и теряли свою работоспособность при переходе к другим выборкам, поскольку не отражали самого механизма образования анализируемого распределения. Визуальный анализ эмпирических плотностей весового распределения хлопкового волокна по длине, построенных по различным выборкам, позволил выявить некоторые общие (присущие всем экспериментальным кривым) закономерности (см.
пунктирную кривую на рис. 5.3): каждая кривая имеет в зоне коротких волокон (в диапазоне от !5,5 до 21,5) небольшое, но устойчиво выраженное «плато» (близкое % »4 12 7,5 11,5 15,5 19,5 23,5 27,5 31,5 35,6 39,5 43,6 47,6 51,5 Г Рис. 6.3 Графики плотностей весового распределении хлопкового волокна по длине (Ьм 38,1; Ьь»=35,21 а= = 7 89) — —. — — — экспериментального, — Π— Π—— модельного Хз, — — модельного, представленного смесью двух нормальных законов к локальному максимуму) и, кроме того, четко выраженный глобальный максимум в диапазоне от 30 до 40,5 мм с формой кривой в этом диапазоне, близкой к нормальной. Это приз вело нас к гипотезе, что каждое из анализируемых распределений может быть представлено смесью двух нормальных распределений: первое из иих (коротковолокиистое)», (х) с относительно малым удельным весом ро неболыпим средним значением а» и относительно большим коэффициентом вариации определяет закон распределения волокон в их ко.
роткой зоне, а второе (основное) 7» (х) с преобладающим удельным весом рн = 1 — р„ средним значением а, -> а, и относительно малым коэффициентом вариации па = о,!аа определяет закон распределения волокон в их основной («длинной»» зоне, Итак, модель смеси (6.6") имеет здесь вид !(х) =р, ьрт(х; а„о',)+рягрз(х; ав, о',)> где !" — зФ гр;(х; аги оу) = з ! ава е тз $'2л от Поскольку нужно оценить пять неизвестных параметров рм а„о'„аз, о3, то для построения системы уравнений метода моментов вида (6.15) необходимо, с одной стороны, вычислить в терминах этих параметров первые пять теоретических моментов исследуемой случайной величины тч (0) (ь1=1, 2, ..., 5), а с другой — подсчитать те же самые моменты, но по имеющимся экспериментальным данным, т.
е. вычислить выборочные моменты М " ль ь те= ыз Здесь М вЂ” число интервалов группирования по длине волокон; ш, — вес волокон, отнесенных к з-му интервалу группирования; хз — длина волокна, соответствующая середине з-го интервала группирования.
Переходя для удобства от моментов к семиинвариантам', получаем следующую систему уравнений относительно неизвестных р„р, а,, а, о( и от: й, а, р йваз = лт; 1 й, йа (ая — а,)*+ й, о', + йяа', = Хв; й, йа (й — йа) (аа — а,)а+ Зйт й, (а — а,) (о', — о',) = Хз„ й, йз(й*,— 4йхйа+ й,') (а,— ах)з+ бй, й,(й,— йа) (а,— — а,)'(о,' — о*,)+Зй, йа(о',— о*,)=- Хч; й й,(йз 1!йзй +1!й йт — йз)(а — а)а+!Ой й (йз— — 4й, йа 1-й,') (а,— а,)з(о,,'— о',)+15й, й,(йа — йя) (аз— — ах) (о',— о,')з=- Ха. т Семиинварианты — некоторые вспомогательные характеристики распределения, определенным образом связанные с его моментами. В частности, для первых пяти семнинварнантов Хь, ..., Хз нмекл место следующие соотношения хь —— глх.
лз =- рз, ььз =- !ьз. лз = рз — Зиз н Хь =- рь — !О рзрз, где р — о-й центральный момент анализируемой случайной величины. В дальнейшем, правда, сисгема была несколько модифицирована: в последнем пятом уравнении вместо Ха использовалась связь теоретических и экспериментальнйх л!одальяых значений !х,„). При численном решении этой системы мы воспользовались методикой, номограммами и таблицами, предложенными в !312). В табл. 6.! приведены результаты 30-кратной численной «прогонки» этой системы: решалась задача расщепления 30 разных выборок. Таблица 63 24,70 26, 63— 30,47— 25, 30~ 24, 50— 22,65— 19, 62— 27, 55— 26,52— 926.73— 39,44— ЗЗ, 90— 49,10— 40,45— 39, 19— 41, 90~ 42,60— 44, 10— 67,40 45 70 56, 80— 50,69— 56,25 63, 68 51, 80 78.10 62,25— 66,26— 69,89 59, 00 Для всех 30 выборок независимо от селекционного сорта и модальной длины хлопкового волокна экспериментальные и теоретические (модельные)кривые плотностей графи- 1 2 3 4 5 б 7 8 9 10 11 12 13 14 15 16 17 18 19 20 о! 22 23 24 25 26 27 28 29 30 25,0 25,1 26,0 26,2 26,2 26,6 26,8 26,8 27,2 27,7 30,5 30,6 30,7 30,8 31,9 31,9 31,9 32,3 32,5 32,6 36,6 36,6 36,7 37,6 37,6 38,0 38,1 38,2 38,9 40,5 23,5 23,9 24,6 24,7 24,9 25,1 25,7 25,5 25,6 25,9 28,2 26,6 28,3 29,9 29,1 29,6 29,0 30,5 30,3 32,6 33,6 33,3 34,2 34,4 34.9 35,2 34,2 35,9 — 80,3 78,4 137,2 87,2 110,7 107,5 99,6 133,7 128,3 128,0 228,5 163,5 223,4 254,9 249,9 255,7 169,8 295,8 — 184,0 — 319,5 404,8 403,9 †4,35 515,4 †3,16 — 559.
4 539, 3 572,7 — 660, 4 — 598,8 2136,2 2248,7 3428,2 2192,4 2346,1 2232,6 2088,7 3191,6 2921,2 3012,8 5864,1 4420.0 6740,0 5760,8 6592,5 6390,5 6012,2 7248,5 11829,2 8375,1 10923,7 11539,0 11639,8 15699,4 10383.7 20922,5 16307,7 16833,5 18780,5 18148,3 0,86 0,82 0,86 0,85 0,87 0,865 0,82 0,81 0,82 0,80 0,86 0,84 0,70 0.856 0,88 0,83 0,75 0,79 0,70 0.85 0,82 0,89 0,85 0,86 0,86 0,83 0,87 0,83 0,85 0,90 24,8 25,2 26,0 26,2 26,2 26,5 27,0 27,0 27,5 27,5 30,55 30.1 30,5 30,2 31,5 31,4 32,0 31,5 33,0 32,5 35,1 35.34 35,7 36,6 37,5 37,5 36,9 38,4 40,2 3,72 4,05 4,07 3,58 3,48 3,09 2,87 3,66 З,аО 3,54 4,0 3,86 4,19 4,19 4,31 4,03 5,06 3,96 6,81 4,15 4,86 4,84 4,79 5,14 4,62 6,20 5,10 5,07 5, 5.17 0,14 0,18 0,14 0,15 0,13 0,135 0,18 0,19 0,18 0,20 0,14 0,16 0,30 О, 144 0,12 О,!7 0,25 0,21 0,30 0,15 0,18 0,11 0,15 0,14 0,14 0,17 0,13 0,17 ,15 0.10 15,5 17,9 16,1 16,3 15,9 16,2 19,7 19,0 19,5 19,6 16, 18,3 18,5 17,0 !8.0 18,0 23,5 !9,5 25 О 17,8 21,2 19,4 19,8 19,3 21,2 22,0 20,0 21,2 21,9 1,9 4,16 5,36 5,62 3,58 4,16 3,85 5,28 6,0 6,75 5,81 4,84 4,20 4,68 5,29 5,44 4,45 6,21 6.!! 8,41 4,86 6,84 6,62 5,52 5,95 6,14 8,20 6,18 7,76 6,07 7,76 чески хорошо совпадают как в центре диапазона, так и по краям.
Более того, выведенная таким образом модель смеси распределений получила «задним числом» и содержательное обоснование, исходящее из механизма роста волокон хлопка. Данный пример показывает, как статистическое исследование может «натолкнуть» специалистов на некоторые содержательные выводы о физической природе изучаемого явления. Построенная модель смеси позволила вывестп важные новые и уточнить имевшиеся ранее соотношения между базовыми характеристиками распределения хлопкового волокна по длине, используемые в технологии текстильной промышленности.
6.4.3. Другие методы оценивании параметров смеси распределений. Практически каждую из существующих процедур статистического оценивания параметров смеси распределений можно спиести к одному из двух подходов. В первом из них (подход «от оцепивания к классификации»)- исследователь начинает с решения задачи оцениваиия параметров смеси (6.6"), а затем переходит к собственно задаче классификации (если таковая стоит перед ним), причем решает ее, уже располагая оценками б, параметров б, каждого из компонентов смеси (1=-1, 2, ..., в), т.