Диссертация (1137055), страница 9
Текст из файла (страница 9)
Результатыэксперимента в таблице 2.9.Предлагаемый алгоритм оказался достаточно устойчивым к увеличениюразмерности. Значение точности стратификации методом LSQ оказалосьменьшим 90% лишь при размерности данных = 20. В тоже время точностьстратификации методом LS падает уже при значениях размерности больших пяти.Такая чувствительность к размерности для LS, по-видимому, объясняетсяособенностью алгоритма случайного поиска, который этот метод использует для54решенияоптимизационнойэффективнымпризадачи:увеличениислучайныйразмерности.поискстановитсяТочностьменеестратификациизначительно снижается с ростом размерности для методов LWO и PS.
АлгоритмAR показывает обратную тенденцию: точность стратификации с увеличениемразмерности возрастает. А для метода ВС точность стратификации остаетсяпримерно на одном и том же уровне для рассмотренных значений размерности.Таблица 2.9. Точность стратификации (среднее значение и стандартноеотклонение для 10 генераций) различными методами в зависимости размерностиданных M, остальные параметры генерации данных заданы по умолчанию (см.таблицу 2.7)МетодРазмерность данныхM=3M=5M = 10M = 15M =20LSQ0.84±0.021.00±0.001.00±0.000.96±0.110.95±0.00LS0.95±0.110.53±0.130.44±0.081.00±0.001.00±0.00BC0.90±0.020.73±0.030.78±0.030.83±0.040.88±0.01LWO0.98±0.010.65±0.040.47±0.030.45±0.041.00±0.00AR0.60±0.020.61±0.040.71±0.040.81±0.040.88±0.03PS0.99±0.000.36±0.020.33±0.010.32±0.020.32±0.042.3.3.
Влияние количества сгенерированных объектовВследующемэкспериментеисследуетсязависимоститочностистратификации при фиксированной высокой размерности = 20, в зависимостиот количества, сгенерированных объектов. Среднее значение и стандартноеотклонение точностистратификациипорезультатам десятиповторенийгенерации было вычислено для пяти значений числа сгенерированныхобъектов. Результаты экспериментов в таблице 2.10.По результатам эксперимента можно сделать вывод, что снижение точностистратификации методом LSQ при увеличении размерности может бытькомпенсировано объемом выборки. Из таблицы 2.10 видно, что уже при значениичисла сгенерированных объектов N=500 удается получить 100% точностистратификации алгоритмом LSQ.
Такой же эффект «компенсации» наблюдается идля LWO. Методы AR и BC остаются относительно не чувствительными к55изменению числа сгенерированных объектов. А для методов LS и PS снижениеточности стратификации при увеличении размерности не удается компенсироватьувеличением объема данных.Таблица 2.10. Точность стратификации (среднее значение и стандартноеотклонение для 10 генераций) различными методами в зависимости от количествасгенерированных объектов N при размерности данных M = 20, остальныепараметры генерации заданы по умолчанию (таблица 2.7)МетодЧисло сгенерированных объектовN = 200N = 300N = 500N = 800N = 1000LSQ0.65±0.270.75±0.221.00±0.001.00±0.001.00±0.00LS0.49±0.110.43±0.110.44±0.100.44±0.100.44±0.11BC0.87±0.030.88±0.020.88±0.020.88±0.010.89±0.02LWO0.38±0.040.44±0.030.63±0.040.79±0.030.84±0.01AR0.88±0.020.89±0.010.89±0.010.88±0.050.89±0.04PS0.33±0.040.33±0.020.33±0.020.34±0.010.34±0.012.3.4. Влияние интенсивностей стратСледующий эксперимент моделирует ситуации с различной численностьюобъектов в каждой страте.
Например, вариант θ2 имитирует широко применимое вABC-анализераспределениеПарето(20/30/50).Вэтомэкспериментеварьировались интенсивности страт θ и ориентации w. Для четырех значений θ(см. таблицу 2.3) и пяти w (см. таблицу 2.4) генерировалась выборка из 300объектов, с остальными параметрами заданными по умолчанию (таблица 2.7).Генерация повторялась 10 раз. В качестве результата в таблице 10 записывалисьзначения среднего и стандартного отклонения точности стратификации (15).Как можно видеть из результатов эксперимента, приведенных в таблице2.11, алгоритмы линейной стратификации LSQ и LS показали полнуюустойчивостькизменениюинтенсивностейстрат.Длявсехдвадцатиприведенных комбинаций точность стратификации этими алгоритмами быларавна 100%.
Все остальные алгоритмы показали сильную зависимость отизменения рассматриваемых параметров. Самое низкое качество стратификации56показал алгоритм PS, значение точности при θ = θ4 доходит до 5%. Возможноеобъяснение этому эффекту будет дано в следующем пункте.Таблица 2.11. Точность стратификации (среднее значение и стандартноеотклонение для 10 генераций) различными методами в зависимости отинтенсивностей θ и ориентации страт w, остальные параметры генерации данныхзаданы по умолчанию (таблица 2.7)Паттернинтенсивностистратθ = θ1θ = θ2θ = θ3θ = θ4Методw1LSQLSBCLWOARPSLSQLSBCLWOARPSLSQLSBCLWOARPSLSQLSBCLWOARPS1.00±0.001.00±0.000.75±0.030.99±0.010.60±0.040.36±0.021.00±0.001.00±0.000.77±0.030.95±0.030.67±0.030.20±0.031.00±0.001.00±0.000.56±0.110.88±0.050.65±0.060.09±0.021.00±0.001.00±0.000.50±0.140.69±0.130.59±0.070.06±0.01Варианты весовых коэффициентовw2w3w41.00±0.001.00±0.000.74±0.040.98±0.010.61±0.030.36±0.031.00±0.001.00±0.000.71±0.050.96±0.020.60±0.030.22±0.021.00±0.001.00±0.000.59±0.150.86±0.070.57±0.070.10±0.271.00±0.001.00±0.000.45±0.140.73±0.080.50±0.030.05±0.011.00±0.001.00±0.000.76±0.020.99±0.010.63±0.040.37±0.031.00±0.001.00±0.000.75±0.060.97±0.010.69±0.020.22±0.031.00±0.001.00±0.000.58±0.140.86±0.060.67±0.070.10±0.021.00±0.001.00±0.000.45±0.130.77±0.110.60±0.060.05±0.011.00±0.001.00±0.000.72±0.040.98±0.010.63±0.020.36±0.021.00±0.001.00±0.000.76±0.040.97±0.020.74±0.030.23±0.021.00±0.001.00±0.000.65±0.090.90±0.050.75±0.040.10±0.021.00±0.001.00±0.000.37±0.110.73±0.100.67±0.050.05±0.01w51.00±0.001.00±0.000.75±0.030.99±0.010.67±0.040.36±0.031.00±0.001.00±0.000.74±0.030.95±0.030.75±0.020.21±0.031.00±0.001.00±0.000.60±0.100.88±0.050.78±0.020.10±0.011.00±0.001.00±0.000.47±0.140.72±0.090.66±0.070.05±0.022.3.5.
Влияние размаха стратВ предыдущем эксперименте алгоритмы BC, AR и особенно PS показалинизкие результаты. Точность алгоритма PS в вышеописанном эксперименте непревысила 40%. Следующий эксперимент показывает, что данный факт,57возможно, связан с геометрическими свойствами страт и в частности спараметром, который в этой работе называется размахом страт.
Этот параметрзадает, насколько равномерно объекты «размазаны» по всей плоскости страты.Случай по умолчанию φ = 1 отражает ситуацию, в которой для одной и той жестраты могут быть сгенерированы объекты с небольшими значениями по однимкритериям, компенсируемые большими значениями по некоторым другим. Такиеобъекты будут находиться на краю страты. Значение φ = 0.01 относится к случаю,когда объекты имеют примерно одинаковые значения по всем критериям игруппируются в некоторой небольшой области в плоскости страты.Для эксперимента были взяты пять различных значений размаха φ,указанных в таблице 2.5. Все остальные параметры генерации устанавливались поумолчанию (таблица 2.7). По результатам десяти генераций вычислялось среднееи стандартное отклонение точности стратификации (15).Результаты эксперимента (таблица 2.12) показывают, что плохое качествостратификации некоторых алгоритмов связанно с их неустойчивостью кизменению размаха страт. При малых значениях φ все алгоритмы показываютдостаточно высокие результаты.
Но при увеличении этого параметра точность PSначинает значительно снижаться. В данном случае это может быть связанно соспецификой алгоритма, поскольку при фиксированном числе объектов иувеличение размаха верхние страты становятся более разреженными, ипоявляется много недоминируемых объектов из нижних страт.
По-видимому,именно эти объекты затем неправильно классифицируются, объединяясь собъектами из верхних страт. Особенно сильно этот эффект проявляется принизкой интенсивности верхней страты (см. таблицу 2.12). Не так заметно, но, темне менее, снижается и точность для AR и BC. В меньшей степени размах влияетна LWO и совсем не влияет на качество работы алгоритмов линейнойстратификации LS и LSQ.58Таблица 2.12. Точность стратификации (среднее значение и стандартноеотклонение для 10 генераций данных) различными методами в зависимости отразмаха страт φ, остальные параметры генерации данных заданы по умолчанию(таблица 2.7)МетодРазмах стратφ = 0.01φ = 0.05φ = 0.1φ = 0.2φ= 1LSQ1.00±0.001.00±0.001.00±0.001.00±0.001.00±0.00LS1.00±0.001.00±0.001.00±0.001.00±0.001.00±0.00BC0.97±0.010.96±0.010.95±0.010.84±0.020.74±0.03LWO0.99±0.001.00±0.000.99±0.010.99±0.010.98±0.01AR0.67±0.040.65±0.040.65±0.050.62±0.030.59±0.02PS0.96±0.020.93±0.030.86±0.040.46±0.060.36±0.022.3.6.
Влияние зашумленности (толщины) стратВ данном эксперименте проверялось, как толщина страты влияет наточностьстратификациитемилиинымалгоритмом.Алгоритмыбылипротестированы для 20 возможных комбинаций параметров толщины страты σ(см. таблицу 2.6) и ориентации w (см. таблицу 2.4). Для каждой пары значенийпараметров генерировалась выборка из 300 объектов с заданными по умолчанию(таблица 2.7) остальными параметрами. Генерация повторялась 10 раз, порезультатам вычислялось среднее значение и стандартное отклонение точностистратификации (15).
Результаты в таблице 2.13.По результатам, показанным в таблице 2.13, можно сделать вывод о том,что утолщение страт за счёт случайного отклонения объектов от плоскости ихстрат влияет на качество работы всех алгоритмов. Однако, не в равной степени.Алгоритмы на основе минимизации критерия линейной стратификации LSQ, LS,показывающие отличную точность при небольших значениях σ, с увеличением σначинают уступать алгоритму LWO, который оказался наиболее устойчивым кувеличениютолщиныстрат.По-видимому,вэтомсказаласьбольшаяпластичность метода за счет того, что веса критериев в этом методе могутизменяться в зависимости от сравниваемых объектов.59Таблица 2.13.
Точность стратификации (среднее значение и стандартноеотклонение для 10 генераций данных) различными методами, в зависимости оттолщины σ и ориентации страт w, остальные параметры генерации данных заданыпо умолчанию (таблица 2.7)Толщина МетодВарианты весовых коэффициентовстратw1w2w3w4w5LSQ1.00±0.00 1.00±0.00 1.00±0.00 1.00±0.00 1.00±0.00LS1.00±0.00 1.00±0.00 1.00±0.00 1.00±0.00 1.00±0.00BC0.76±0.03 0.76±0.05 0.75±0.03 0.74±0.04 0.75±0.03σ = 0.01LWO0.98±0.01 0.98±0.01 0.98±0.01 0.98±0.02 0.98±0.01AR0.59±0.03 0.60±0.02 0.62±0.03 0.66±0.04 0.70±0.05PS0.35±0.02 0.36±0.03 0.36±0.03 0.35±0.03 0.35±0.03LSQ0.99±0.01 0.99±0.01 0.98±0.01 0.99±0.01 0.98±0.01LS0.99±0.01 0.98±0.01 0.98±0.01 0.98±0.0й 0.98±0.01BC0.73±0.03 0.74±0.03 0.72±0.04 0.75±0.02 0.73±0.04σ = 0.05LWO0.96±0.01 0.97±0.01 0.97±0.01 0.95±0.02 0.96±0.01AR0.58±0.04 0.59±0.02 0.62±0.04 0.65±0.03 0.68±0.03PS0.38±0.02 0.37±0.03 0.36±0.04 0.37±0.03 0.37±0.03LSQ0.76±0.09 0.67±0.13 0.68±0.10 0.70±0.06 0.68±0.10LS0.77±0.09 0.70±0.11 0.63±0.08 0.65±0.07 0.60±0.07BC0.71±0.03 0.74±0.02 0.71±0.03 0.74±0.01 0.72±0.03σ = 0.1LWO0.90±0.02 0.89±0.01 0.89±0.02 0.89±0.01 0.90±0.02AR0.59±0.03 0.60±0.03 0.60±0.03 0.65±0.04 0.67±0.02PS0.42±0.03 0.42±0.04 0.42±0.03 0.41±0.04 0.41±0.03LSQ0.61±0.06 0.60±0.05 0.53±0.05 0.56±0.08 0.52±0.03LS0.63±0.05 0.59±0.07 0.54±0.04 0.51±0.07 0.49±0.05BC0.67±0.03 0.68±0.02 0.67±0.03 0.68±0.02 0.69±0.04σ = 0.2LWO0.82±0.03 0.82±0.03 0.81±0.03 0.82±0.03 0.82±0.02AR0.58±0.03 0.53±0.05 0.63±0.04 0.66±0.03 0.69±0.03PS0.52±0.03 0.36±0.05 0.51±0.06 0.50±0.04 0.53±0.032.4.