Круглов В.В., Борисов В.В. - Искусственные нейронные сети (ИНС) Теория и практика (778918), страница 42
Текст из файла (страница 42)
Методы исследований. При выборе метода исследований необходимо учесть тот факт, что большинство из признаков — качественные, и поэтому имеющиеся данные требуют применения специальных приемов исследования. Между тем, современные инструментальные средства обработки статистической информации, например, пакет 8(айзйса, возможностями такого рода практически не обладают (кроме использования дисперсионного анализа). При анализе же псевдоколичественных данных необходимо принимать во внимание невозможность в большинстве случаев установления между ними отношений эквивалентности и предпочтения, что влечет трудности в определении мер сходства и т. и. Это, в свою очередь, при применении к ним приемов и формул обработки, разработанных для количественных переменных (например, регрессионного, корреляционного или дискриминантного анализов) приводит к крайне низкой достоверности получаемых результатов.
Поэтому выберем в качестве методов исследования менее чувствительные к выполнению вероятностных предпосылок нейросетевые методы, а в качестве инструментов исследования возьмем нейропакеты НейроПро и Ехсе) Меига) Рас)гаде Такой подбор инструментальных средств обеспечит перекрестную проверку получаемых результатов. Этапы исследований. 1) Определение признаков, наиболее существенно влияющих на выбранную выходную переменную (отклик). 2) Построение модели, отражающей причинно-следственные связи между откликом и входными признаками. 3) Интерпретация модели. 272 Полученные результаты.
1) Результаты первого этапа, характеризующие степень влияния факторов на отклик хтк (качественные признаки х,, х,, х, исключены из рассмотрения), представлены на рис. 6.2 (пакет НейроПро) и рис 6 3 (пакет Ехсе( Мецга~ Рас)каде) х Знлчимлсть Сигнлл ;и ЯЩ Щ~ Хо хт Я:ЩЩмЩ хо ° ЩЩЩЩ ХЗ ° ЩЩ АГНИИ ге о х|1 Х12 ~3И х12 Рис 6.2 Оценка значимости факторов (пакет Нейропро) 1 л и т зес ! ок Д Рис б 3 Оценка значимости факторов Гпвкет Ексе) Неига! Расхаре) 273 Из рис.
6.2 следует, что наиболее значимыми факторами являются х,, хтн х,, хих хсь а из рис. 6.3 — хц х„(седьмой по счету), Х11 ХЗ, ХВ Обобщая результаты, получим следующую упорядоченную по степени влияния на х„последовательность признаков: х, (возраст), х,„(доход), х„(сфера деятельности), х, (самооценка социального слоя), х,з (тип населенного пункта проживания) 2) Результаты второго этапа исследований, характеризующие проверку возможностей использования различных моделей для описания имеющихся данных социологического опроса с учетом полученной значимости признаков, показали, что в качестве таких моделей не подходят модели количественного характера типа регрессионных или классических нейросетевых.
Наиболее подходящей представляется модель в виде совокупности кластеров Такие кластеры, соответствующая информация о которых представлена в табл. 6.5, выявлены с помощью пакета Ехсе( Мецга! РасМаде при использовании самоорганизующейся карты Кохонена. Таблица 6 5 Ин мация а выявленных класте ах Центр класте а Класте 392 32 3 66,9 405 396 х, 1,56 1,45 1 78 1,51 1 48 хх 3,3 2,76 41 2 38 хз 3,25 25 1,75 1 58 10,4 11,7 3,58 3,24 9.88 хв 4,05 3,54 1,07 3,06 3,72 3 84 4,7 4,15 3,15 1,05 хи о09 1480 492 480 Э4В хн 1,47 3,06 1,1В 1,53 1,99 хм 1,63 1,53 1,27 191 хк 2,42 3 91 29 3 29 4,03 «х 204 377 279 384 Количество элементов в класте е 256 274 С учетом выявленных кластеров и значимости факторов полученным результатам можно дать следующую интерпретацию. Во-первых, по социальной ориентации (т.е.
по усредненной величине показателя х,4) все опрашиваемые лица могут быть разделены на три группы: ° разделяющие социалистические и коммунистические идеи и взгляды; ° капиталистической ориентации; ° национально-патриотической ориентации, полагающие, что Россия должна развиваться своим особенным путем Во-вторых, первая группа, в свою очередь, включает в себя две подгруппы, соответствующие кластерам 4 и 5.
Кластер 5 — зто пенсионеры (среднее значение х, = 66,9 лет), как мужчины, так и женщины, со средним или специальным средним образованием, имеющие невысокую пенсию (хп = 480 руб ), проживающие, в основном, в небольших городах и поселках городского типа. Кластер 4 образован лицами, наиболее активно поддерживающими коммунистические взгляды Особенность его состава средний возраст х, = 40,5 лет, мужчин и женщин — поровну, образовательный ценз — низкий, профессии — рабочие, заработки очень низкие (х„= 348 руб.), проживающие в поселках городского типа Кластеры 4 и 5 объединяют примерно 40'/«опрошенных лиц.
В-третьих, вторая группа включает в себя кластеры 1 и 3. Класгпер 1: средний возраст около 40 лет, поровну мужчин и женщин, образование высшее или незаконченное высшее, специалисты или руководители, работающие на предприятиях, принадлежащих государству или городу, высокий средний доход (1480 руб.), проживание в городах Кластер 3 средний возраст около 30 лет, поровну мужчин и женщин, образование среднее специальное и/или высшее, работники сферы обслуживания и рабочие, средний доход — 609 руб, проживание — в городах Лица данной подгруппы настроены наиболее «прокапиталистически». Кластеры 1 и 3 объединяют чуть менее 40'/«опрошенных. В-четвертых, третья группа образована лицами, отнесенными к кластеру 2.
Его характеристики: средний возраст около 40 лет, в основном женщины с высшим и незаконченным высшим образованием, специалисты, с невысоким доходом (492 руб.), проживание — в городах и поселках городского типа. В данный кластер входят несколько более 20'/«опрошенных. Итак, к коммунистическому (социалистическому) злекторату относятся, в основном, пенсионеры или люди среднего возраста с низкими доходами. В рассматриваемом регионе общее количество лиц данных категорий — около 40'/« Факторами, определяющими «прокапиталистические» взгляды, является высокий уровень образования и доходов. 275 Выводы.
Использование чисто статистических подходов для анализа социологических процессов представляется не вполне надежным. Предсказание социальной ориентации отдельной персоны по косвенным показателям с удовлетворительной точностью сделать, по-видимому, невозможно. Гораздо легче прогнозировать поведение группы лиц. Наиболее подходящей моделью для рассматриваемого типа задач является модель в виде совокупности кластеров. Выявление наиболее влияющих на социальную ориентацию признаков и кластеров по группам лиц может быть использовано для прогнозирования их социального поведения 6.3.
Выявление показателей, влияющих на валовую прибыль предприятия Таблица б б Исходные данные к анализ показатели за 1998 г. Наименоеа. Един ние фактора измере- ния 6 1! 12 З 4 10 Объем тмс реализации рублей без НДС 277 302 з!а 327 г!! 263 168 278 292 354 305 326 го 27 за !а Зт в том числе бю мет тмс блей Затраты в том числе 208 172 га! 255 319 251 215 203 323 гег 239 475 тыс лей 53 58 44 63 38 и зз 50 39 58 зг 45 матеРиалы тыс блей заработная плата 102 76 62 63 218 126 74 !гг 126 104 62 63 !!г !гз !от тмс лей численност чел 62 62 62 59 63 Производи- рубмел тельность 4474 4798 згбз бааз Ьяае 3410 Ьгзт гауз 5002 5273 711 833 Цена ед По КИИ а,оа 0,08 0,08 0,06 0,06 0,15 а,ат о.оа а,оа 0,12 а,!о .15 Рентабель.
ность 20 4 52,0 26. 3 7,4 4,1 11,5 38,9 10,4 20,1 10 Курс 5 6,1 6,1 6.2 6,2 7,9 !6,! 17,9 16,0 6,! -!49 Прибыль валовая 55 -4 .42 51 !!г 29 .45 99 30 ть!с блей 276 6.3.1. Постановка задачи Требуется: на основании экспертных данных, отраженных в табл. 6.6, выявить факторы, наиболее влияющие на ежемесячную прибыль предприятия. 6.3.2. Анализ технического задания Изучение содержательной часто задачи. Учитывая малое количество (12 — за 12 месяцев 1998 и) наборов экспериментальных данных, на первом этапе исследования было проведено изучение представленных показателей.