Айвазян С.А., Бухшгабер В.М., Енюков И.С., Мешалкин Л.Д. - Прикладная статистика (1027378), страница 105
Текст из файла (страница 105)
В графе «Манипуляция» приведены оценки возможностей пакетов по работе с файлами — слияние и разделение файлов по переменным и объектам. В четвертой графе в аналогичной шкале оцениваются возможности, предоставляемые Таблица 2!.2 пользователю для создания новых переменных, преобразования переменных, перекодировки данных и т.д. В графе «Пропуски» оцениваются возможности по работе с пропусками в данных, присвоения весов объектам. В последней графе оценивается уровень документированности и консультаций !)»е!р). Возможности статистической обработки. Данные о реализации в пакетах процедур статистической обработки приведены в табл. 21.3, 21.4 Знак « — » в этих таблицах указывает па отсутствие соответствующей процедуры, « -»вЂ” наличие ее, а знак «.» — на то, что имеются ограниченные возможности.
Так, для пакета ВТАТПВАРН1С5 имеется лишь одна кластер-процедура !метод А-средних) и та реализована для небольшого числа объектов (п — 100). Следует отметить, что все пакеты хорошо приспособлены для получения дсскриптивной статистики одномерных данных и коэффициентов ассоциации !корреляций разных типов, корреляционных отношений, у»-статистик и т.д.). Наименьшими возможностями в этом отношении обладает пакет АВС.
Наиболее полный набор статистических процедур предоставляет пакет ВМ()Р!РС ((п11). Самым гибким в отношении управления данными является пакет Р-ШТАТ. БТАТС»цАРН1СЯ вЂ” сравнительно медленно работающий пакет, и его лучше использовать ыа более мощных ЭВМ типа 1ВМ АТ. Проблемы и опыт создания интеллектуализированного программного обеспечения по многомерному статистическому анализу 21.2.!.
Что такое «интеллектуалнзация программного обеспечения» и почему оиа нужна в прикладной статистике. Как известно', конечной целью общей программы разработки ЭВМ пятогп поколения является создание компьютеров, в которых будет реализован такой резкий скачок их интеллектуальных возможностей, в результате чего машина сможет непосредственно «понимать» задачу, поставленную перед ней непрофессиональным пользователем на естественном языке, т.
е. с помощью речи, чертежей, схем, графиков и т.п. В этой общей программе можно выделить четыре основных направления разработок: 1) развитие элементной базы (в частности, уже сегодня реально решение задачи достижения плотности «упаковки» порядка нескольких тысяч вентилей на одном кристалле); 2) разработка новой архитектуры (и в первую очередь архитектуры с многими параллельными потоками команд и обрабатываемых данных, предусматривающей, в частности, использование спецпроцессоров); 3) совершенствование программной технологии (и в частности, разработка языков высокого уровня для параллельной обработки данных); 4) интгллгктуализацил, т.
е. оснащение ЭВМ системой решения задач и логического мышления, обеспечивающей способность машины к самообучению, ассоциативной обработке информации и получению логических выводов, что в конечном счете позволит резко повысить уровень «дружелюбия» машины по отношению к пользователю. Именно в русле ключевых задач пятого направления лежат проблемы разного уровня интеллектуализации прн- Симоне Д»и.
ЭВМ пятого поколения: компьютеры 90-к годов: Пгр с англ. — М.: Финансы и статистика, 1985. — !72 е. кладного (проблемно- и методо-ориентированного) программного обеспечения (ППО). Эксиергплые сисгпемы принято относить к одной из основных форм высшего уровня интеллектуализации ППО. Их создание связано в первую очередь с разработкой методов и средств формализации и ввода знаний в компьютерные системы (круг этих вопросов составляет содержание специальной дисциплины — так называемой «инженерни знаний») и манипулирования введенными знаниями. Таким образом, проблематику, связанную с разработкой экспертных систем, можно отнести к кругу ключевых вопросоп решения общей программы создания ЭВМ пятого покол«пня. Однако следует подчеркнуть разницу в уровне дружелюбия, характеризующем экспертную систему и ЭВМ пятого поколения: услугами последней смогут пользоваться лица, не имеющие опыта работы с ЭВМ, в то время как для работы с экспертной системой все-таки должна быть определенная профессиональная подготовка.
В дополнение к сказанному необходимо остановиться иа еще одном факторе, стимулирующем развитие работ в области создания именно сл«атистичаских экспертнах систем (СЭС). Дело в том, что бурно возрастающие объемы информации, требующие грамотной статистической обработки, и почти столь же интенсивно растущее количество промышленного (и коммерчески распространяемого) статистического программного обеспечения (СПО), в основном в виде специализированных пакетов н библиотек (см., например, )309)), находятся в явном дисбалансе с относительно медленно растущей численностью квалифицированных специалистов в области прикладной статистики.
Это общая тенденция, но в СССР она проявляется особенно остро. В результате катастрофически нарастающее число лнц, не являющихся специалистами в области статистического анализа данных, использует СПО независимо от того, получили ли они одобрение специалистов по прикладной статистике и нужно ли это для успешного решения стоящих перед ним задач. Это в свою очередь является причиной развития опасного процесса роста доли неквалифицированного, порой безграмотно-спекулятивного использования СПО, что приводит к дискредитации аппарата прикладной статистики, наносит вред делу.
Распространение опыта специалистов по прикладной статистике в виде СЭС, нацеленных на подсказки и машинное асснстирование, в первую очередь в области предмодельного (разведочного) анализа данных, выбора подходя- 559 щих моделей и нужной последовательности применяемых методов, интерпретации промежуточных и конечных результатов статистического анализа ', позволит в какой-то мере ослабить развитие упомянутого опасного процесса роста неквалифицированного использования СПО и смягчить причину этого процесса-дисбаланса между потребностью в квалифицированных специалистах по прикладной статистике и их фактическим наличием. И наконец, о социальном аспекте проблемы создания СЭС. В этой связи следует упомянуть о наличии (в рядах специалистов по прикладной статистике) определенной доли скептиков и даже явных противников, которые считают, что СЭС снижают потребность в знаниях живых специалистов, в какой-то мере заменяют и вытесняют их, выступают в качестве их конкурентов; следовательно, необходимо устраниться от участия н работах по созданию СЭС.
В действительности СЭС позволяет существенно повысить лишь средний, так сказать «ширпотребовский», уровень использования статистических методов анализа данных. Им в настоян~ее время обладает выросшая в последние десятилетия целая армия особого рода пользователей— «смежников», которые, как правило, «поиемногу» ориентируются и в предметной области, в рамках которой решаются соответствующие статистические задачи (в экономике, социологии, медицине, геологии, технике и т.д.), и в инструментарии прикладной статистики, не являясь профессионалами ни там, ни здесь. Вот для этой армии работников кондиционные СЭС действительно представляют угрозу, так как при наличии хороших СЭС этих работников с пользой для дела целесообразно заменить спецналистами-профессионалами соответствующих предметных областей.
Что касается профессионалов-статистиков, то создание и распространение СЭС лищь позволит высвободить часть их рабочего времени, отводимого для выполнения функций специалиста средней квалификации (в основном рутинного характера), и переключить его на решение задач более высокого профессионального уровня. Если к этому добавить продуманную систему экономического стимулирования работ профессионалов-статистиков в области создания СЭС, ' Все зти вопросы относятся к основным «узким местам» в проведении статистического анализа слабо подготовленным (в области прикладной статистики) пользователем, а стандартные СПО, предоставляя пользователю в первую очередь набор нюк назылаемых счетных модулей, практически никак не помотают ему в преодолении »тих узких мест.
то их заинтересованность в развитии этих работ станет не только профессионально-органичной, но н активной 21.2.2. Интеллектуальные возможности статистической экспертной системы и основные вопросы„возникающие при ее создании. Создатели большинства известных к настоящему времени статистических экспертных систем' ставили перед собой задачу обеспечить пользователю СЭС машинное ассистирование по след> ющему кругу вопросов: 1) подсказки по существующим литературным, методическим и программным материалам, относящимся к специфике решаемой задачи, 2) советы н выработке адекватных исходных допущений о природе обрабатываемых данных и в выборе общего вида модели; 3) предложение «меню» подходящих методов статистической обработки с пояснением (в случае запроса пользователя) нх сущности, особенностей, сфер применимости; 4) подсказки в нос гроении технологической цепочки статистических процедур н алгоритмов, из которых должна состоять основная обрабатывающая (счетная) программа, и ее автоматическая реализация на ЭВМ; 5) помощь в проведении осмысления н интерпретации промежуточных и конечных результатов статистического анализа и (в случае необходимости) в выработке корректирующих управляющих команд к проведению дальнейшего статистического анализа; 6) помощь в выборе форм представления результатов проведенного статистического анализа Основной круг пользователей, на который рассчитаны подобные СЭС.