SAS EM. Лекция 4. Регрессионные модели (1185363), страница 4
Текст из файла (страница 4)
A l l r i g h t s r es er v e d .2 d grid(i , j ) hij ( x ) (t ) exp 2 2 (t ) ВИЗУАЛИЗАЦИЯ И ИНТЕРПРЕТАЦИЯ SOM•Два принципиально разных подхода (много вариантов):«Гибкая» сеть• Когерентные области••«Гибкая» сеть (компонента не умеет, но «нарисовать» кодомможно):Нейроны – центры кластеров в исходном пространстве.• Чем они там ближе, темкороче звено решетки• Простой пример –изображения• В общем случаеспроецироватьтяжело•C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .ВИЗУАЛИЗАЦИЯ И ИНТЕРПРЕТАЦИЯ SOM•Когерентные области:Близкие кластеры в исходном пространстве – рядом на решетке(свойство SOM) и одним (или спектрально близким) цветом• Группы кластеров – категории, области• Задача группировки и раскраски - отдельная•C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c .
A l l r i g h t s r es er v e d .ПРИМЕР (КОГЕРЕНТНЫЕ ОБЛАСТИ)•Входные данные:продуктбелкиуглеводыжирыApples0.411.80.1Avocado1.91.919.5Bananas1.223.20.3Beef Steak20.90.07.9Big Mac13.019.011.0Brazil Nuts15.52.968.3Bread10.537.03.2Butter1.00.081.0Cheese25.00.134.4Cheesecake6.428.222.7Cookies5.758.729.3Cornflakes7.084.00.9Eggs12.50.010.8Fried Chicken17.07.020.0Fries3.036.013.0Hot Chocolate3.819.410.2Pepperoni20.95.138.3Pizza12.530.011.0Pork Pie10.127.324.2Potatoes1.716.10.3Rice6.974.02.8Roast Chicken26.10.35.8Sugar0.095.10.0Tuna Steak25.60.00.5C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c .
A l l r i g h t s r es er v e d .SOM(10Х10):СВОЙСТВА SOM•Аппроксимация входного пространства••••Топологический порядок•Рядом в исходном пространстве => рядом на решетке и наоборот•Области исходного пространства с высокой плотностью отображаютсяв большие области на решетке и наоборотСоответствие плотностиВыбор признаков:••«Сжатие» информации, связь с методом LVQ (кластеризация наоснове теории информации, задача - выбрать кодовые слова-кластерытак, чтобы минимизировать возможное искажение)осуществляет нелинейную дискретную аппроксимацию главныхкомпонент (точнее главных кривых и плоскостей)Недостатки:Алгоритм простой, но мат.
анализу поддается плохо, в общем случаене доказана ни сходимость, ни даже устойчивость• Много неочевидных, но важных параметров, задаваемых априори,включая структуру решетки•C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d ..