Айвазян С.А., Бухшгабер В.М., Енюков И.С., Мешалкин Л.Д. - Прикладная статистика (1027378), страница 106
Текст из файла (страница 106)
это прикладные статистики и математики разного уровня квалификации, а также специалисты предметных областей (экономисты, социологи, медики, инженеры и т. д.), обладаю!цне вероятностно-статистической подготовкой в объеме экономического или технического вуза. В процессе создания СЭС разработчикам приходится последовательно анализировать следующие вопросы (н уточнять их рещение): а) На какого именно пользователя (предметная область, уровень квалификации) ориентирована создаваемая статистическая экспертная система, каковы конечные прикладные х На1т б. У. Моге Яп(е111яеп1 ага(!е!!са| Яо(1яеге апо' о(е1!е11- се! Ехрег! вуе1епм: Ги1иге (У!гес!!опе (яць Ояпгпеп1 Ьу Р, Р.
Ч!!!етпап епе Л. %. Тоееу) Н Лп~ег, о(а!. — 1985. — '11о1. 39, 1.— Р. 1 — 16, цели разработки и требования к уровню ее интеллектуализацниз б) Какова структура функционального наполнения и сценария диалога СЭС? в) Какова главная концептуальная направленность (базовый методологический принцип) создаваемого машинного ассистирования (консультации в выборе н реализации используемых статистических методов, помощь в выборе стратегии статистического исследования н т д.)? г) Какие именно технические средства целесообразно привлечь для реализации создаваемой СЭС? д) Какие типовые и оригинальные программные средства и алгоритмические языки необходимы для создания СЭС? е) Какие средства интеллектуального ассистирования и интерактивного режима необходимы для построения СЭС? ж) В какой мере возмо кно использование существующих, а в какой — необходима разработка новых методов и средств формализации и ввода знаний в компьютерные системы.
манипулирования введенными знаниями? з) Как проводить апостериорную оценку уровня интеллектуализации созданной СЭС? 21.2.3. Серия методо-ориентированных статистических экспертных систем (серия МОСЭС)'. Серия методо-ориентированных статистических экспертных систем состоит из определенного числа автономных СЭС, каждая из которых может быть использована для решения задач различных предметных областей (экономики, социологии, медицины, техники и т п.), объгдинягмых лишь общностью нгобходимого для их решения статистического инструментария. Другими словами, каждая отдельная экспертная система серии реализует статистический инструментарий одного из разделов прикладной статистики: СЭС по регрессионному анализу, СЭС по классификации объектов и признаков, СЗС по разведочному статистическому анализу и т п., и в этом смысле может быть отнесена к мгтодо-оригнтироганным.
Допускается включение в серию и отдельных проблемно- и метода-ориентированных СЭС, т. е. СЭС, предназначенных для решения задач определенной предметной области. Но при этом онн требуют использования лишь однородного статистического инструментария (например, в экономике это могут быть СЭС по решению систем одновременных эконометрических урав- «Серия МОСЭС разработана, развивается н сопровождаетсн в Центральном экономико-математическом институте А1т СССР и совместном советско-американскоя предприятии «Диалог».
пений или по построению и анализу производственных функций: обе эти системы основаны, в инструментальном плане, на статистическом аппарате регрессионного анализа н анализа временных рядов). Общность различных автономных СЭС, составляющих серию, заключается в их совместимости, а также в возможности расширяемости серии. Совместимос«пь различных компонентов серии состоит в одинаковой ориентации на тип пользователя и уровень интеллектуализации; общности базового методологического принципа создаваемого в СЭС машинного асснстировання; общности технических и программно-инструментальных средств, на базе которых создается СЭС; возможности взаимных ссылок (т. е., например, пользователь СЭС по регрессионному анализу в процессе диалога с машиной может получить от нее на какой-то стадии решения своей задачи совет произвести такую-то процедуру статистическон обработки с помощью, скажем, СЭС по классификации из данной серии).
Возможность расширяемости серии, т. е. ее пополнения новыми СЭС, сопряжена лишь с необходимостью соблюдения при конструировании новой СЭС вышеупомянутых условий совместимости. Ниже приводится краткое описание функционального наполнения компонентов серии методо-ориентированных экспертных систем — «Серии МОСЭСм Прн выборе разделов прикладного статистического анализа разработчики руководствовались, помимо профессиональных пристрастий и имеющихся научных заделов, интересами экономических н социально-экономических приложений, 1.
МОСЭС-АВР— методо-ориентированная статистическая экспертная система по анализу временных рядов (см, например, [12, гл !2, !7) и др.). Необходимость текущего, оперативного анализа динамики показателей, характеризующих состояние или функционирование системы (экономической, технической и т. п.) — одна из наиболее распространенных черт характера деятельности многомиллионной армии плановых и управленческих работников на разных иерархических уровнях экономики. Такого же типа задачи постоянно возникают и в разнообразной практике исследовательской деятельности.
Здесь и задачи сглаживания временных рядов, их разложения на трендовую, периодическую (сезонную) и случайную составляющие, их экстраполяции (прогноз), улавливания моментов и характера резких структурных сдвигов и т.д. Именно на решение таких задач нацелена МОСЭС-АВР. 2. МОСЗС-РАЗВАД вЂ” методо-ориентированная статистическая экспертная система по разведочному анализу данных.
В практике статистических исследований сложилась печальная традиция (ей, правда, можно найти объективное историческое объяснение), в соответствии с которой важнейц>ий, ключевой этап формирования и обоснования исходных рабочих допущений, закладываемых в основание модели генерирования обрабатываемых статистических данных, лак правило, игнорировался Схема подобных исследований строилась примерно так «будем полагать (или «есть основания считать>), что анализируемая регрессионная зависимость линейна и характеризуется независимыми и нормально распределенными случайными остатками Тогда...». На самом деле обрабатываемые статистические данные могут быть не только не нормальными и не независимыми, но и не однородными (в регрессионном смысле) Именно мимо таких «натяжек» в исходных допущениях и приходилось проходить исследователям Интенсивно развиваемый в последние 1Π— 15 лет аппарат разведочного анализа и, в частности.
такие его методы, как целенаправленное проецирование многомерных данных, как раз и нацелены на всестороннее предварительное «прощупывание» исходных данных с целью формирования адекватных рабочих предположений об их вероятностной и геометрической природе, о механизме ил генерирования К настоящему времени в мире имеются считанные единицы программных ~ родуктов, реализующих этот аппарат (см., например, 1143!), ч ни одной (по нашим сведениям) экспертной системы Сказанное мотивирует выбор разведочного анализа в качестве «начинки» для одного из компонентов «Серии МОСЭС>.
В МОСЭСРАЗВАД, в частности, реализованы методология и значительная часть математического инструментария, описанного в разделах Н! и !Ъ' данной книги. 3 МОСЗС-РЕГРАН - методо-ориентированная статистическая экспертная система по регрессионному анализу. Статистический аппарат, позволяющий выявлять и описывать зависимость некоторого количественного результирующего показателя от набора объясняющих переменных, составляет содержание регрессионного анализа и относится, бесспорно, к наиболее широко и часто эксплуатируемому в разнообразных приложениях статистическому инструментарию Особая актуальность интерактивного диалогового режима общения с ЭВМ в процессе использования этого аппарата связана с реализацией таких его слабо формализованных этапов.
как подбор подходящих преобразований для переменных модели, выбор ее общего вида, исследование яв- ления мультиколлинеарносги, анализ влияния резко выделяющихся наблюдений и т.п. Именно в эти моменты «беседа» с СЭС н ее подсказки особенно пенны для пользователя В обоснование мотивировки выбора этого раздела прикладной статистики в качестве «начинки» одного нз компонентов «Серии МОСЭС» следует включить и необходимость программно-вычислительной реализапии последних теоретико- методических разработок в данной области и весьма высокую частоту ссылок па этот раздел других компонентов «Серии МО~.ЗС» В МС(СЗС-РЕГРАН реализованы методология и математический инструментарий, описанные в !121 4 МОСЭС-КЛАСС вЂ” методо-ориентированная статистическая экспертная система по классификации объектов и признаков Наряду с регрессионным анализом статистические методы классификации (распознавания образов, дискриминантного анализа, автоматической классификапин, кластер-анализа и т п ) относятся к наиболее широко и часто эксплуатируемому в приложениях, н в первую очередь в экономических и социально-экономических приложениях, статистическому инструментарию Задачи выявления типологии и типообразующих признаков, технической и медицинской диагностики, предварительной обработки массивов информации с пелью их разделения на однородные (в определенном смысле) порции и многие др.
обслуживаются методами именно этого раздела ПСА Продвинутость отечественных теоретико-методических разработок в данной области позволяет рассчитывать на достаточно высокую конкурентоспособность (по меньшей мере по своему функциональному наполнению) данного программного продукта В нем, в частности, реализованы методология и математический инструментарий, описанные в разделах 1 я П данной книги 5 МОСЭС-СЭУ вЂ” — проблемно- и методо-ориентированная статистическая экспертная система по решению и анализу систем одновременных эконометрических уравнений.
В ней реализованы методология и математический инструментарий, описанные в [12, гл 14). 6 МОСЭС-ПАПРОФ вЂ” — проблемно- и методо-ориентированная статистическая экспертная система по построению н анализу производственных функций. Производственные функции, как известно, позволяют в сжатой математической форме представить характерные для анализируемой экономической системы (предприятия, отрасли, всего народного хозяйства) соотношения между объемом выпускаемой продукции, с одной стороны, и размерами основных производственных ресурсов (включая факторы научно-техниче- ского прогресса) — с другой. Используемый для их построения и анализа статистический аппарат — это регрессионный анализ и анализ временных рядов.
Конечный пользователь «Серии МОСЭС» и характер ее интеллектуализации. «Серия МОСЗС» адресуется как статистику, так и пользователю нестатистику, который, с одной стороны, уже располагает постановкой задачи и четко представляет себе конечные прикладные цели исследования, а с другой стороны, может иметь лишь общее поверхностное представление об аппарате прикладной статистики (на уровне знания основных определений и понятий, таких, как модель регрессии и назначение регрессионного анализа, временный ряд и его тренд, содержание задачи классификации в условиях наличия или отсутствия обучающих выборок, многомерное наблюдение и его проекция на плоскость и т. п,), В эту категорию пользователей попадает, в частности, значительная доля (более 50 'й) специалистов той предметной области, к которой относится решаемая задача. Таким образом, среди пользователей «Серии МОСЗС» могут быть как статистики (разного уровня квалификации), так и нестатистики — специалисты соответствующих предметных областей (экономисты, социологи, инженеры, медики и т.д.), имеющие минимальную статистическую подготовку.