Айвазян С.А., Бухшгабер В.М., Енюков И.С., Мешалкин Л.Д. - Прикладная статистика (1027378), страница 107
Текст из файла (страница 107)
При пояснении характера и направленности интеллектуализации описываемых МОСЗС примем следующее условное разложение технологии статистического исследования на элементы. Элемент 1 (стратегически-постановочный): уточнение постановки задачи и конечных прикладных целей исследования. Элемент 2 (тактико-мепшдический): выбор подходящего статистического инструментария, включая определение состава и последовательности реализации статистических процедур, используемых для обработки исходных данных.
Элемент 3 (счетный): вычислительная реализация выбранного комплекса методов статистического анализа данных. Элемент 4 (интернрепшционныи): интерпретация промежуточных и итоговых результатов статистической обработки данных, формулировка выводов, в том числе по поводу направлений дальнейших исследований. Из этих четырех основных элементов технологии статистического исследования экспертные системы «Серии МОСЗС» претендуют на частичную автоматизацию и машин- ное ассистирование лишь трех последних: тактико-методи- ческого, счетного и интерпретационного. При этом акцент делается на помощь пользователю в выработке адекватных исходных допущений (гипотез) о вероятностной и геометри- ческои природе обрабатываемых статистических данных и в правильном подборе и описании модели, генерирующей эти данные («МОСЭС-РАЗВАД> целиком предназначена для ре- шения этих вопросов, а в остальных компонентах «Серии» этому аспекту уделяется существенное внимание).
Общая логическая схема построения диалога «пользова- тель-ЭВМ». Диалог строится в компонентах «Серии» по принципу «от общего к все более узко метода-ориентиро- ванному», а именно: на «входе» в систему †«паспорт> задачи; !-й уровень диалога: ЭВМ вЂ” «имеет ли задача статистическую природу?»; пользователь — «да» или «нет»; 2-й уровень диалога: если «нет», работа СЭС заканчивается; если «да», то к какой из нижеперечисленных (в «меню») областей ПСА она относится: регрессионный анализ, классификация, временные ряды и т.д.; 3-й уровень диалога: (при работе, напрймер, с системой «МОСЗС-КЛАСС» т. е.
при ответе «классификация» ~ на предыдущем уровне): «в какой форме представлены исходные данные?» «меню> возможных форм; 4-й уровень диалога: (если данные представлены в виде многомерных наблюдений): «располагаете ли Вы обучающими выборками?» й-й уровень диалога: если «нет», то «известно ли Вам число искомых классов?»; 6-й уровень диалога; если «нет>, то «желаете ли Вы произвести целенаправленное проецирование исходных данных с целью выработки гипотез о возможном числе классов?», 7-й уровень диалога: если «да», то обратитесь к «МОСЭСРАЗВАД» и т.
д. Каждый вопрос ЭВМ сопровождается вспомогательным «примечанием — вопросом> типа: «если какое-нибудь нз понятий, участвующих в нашем вопросе, требует разьясне. ння, сделайте соответствующий запрос». Инструментальные средства, использованные прн создании «Серии МОСЭС».
Каждый из компонентов «Серия МОСЭС» оперирует с базой знаний, содержащей не более 400--500 правил и утверждений. Это позволило использовать в качестве технической базы персональные компьюте- ры 1ВМ РС!ХТ илн 1ВМ РС АТ (или полностью с ними совместимые 16-разрядные персональные ЭВМ). В качестве базовых алгоритмических языков использовались языки «С», «1.1ЬР» и некоторые другие (специальные). Операционная система — МЬ-(»ОБ. выводы 1.
В настоящее время происходит интенсивное развитие ПО сгатистнки для ПЭВМ. Большинство известных зарубежных пакетов программ (среди них ВМОР, ЬР55, Р-ШТАТ, БАБ) имеет в настоящее время версии для ПЭВМ (модели 1ВМ РС ХТ,!ВМ РС АТ, 1ВМ Р$-2). Эти пакеты в основном являются приспособлением к возможностям ПЭВМ версий этих пакетов для больших ЭВМ.
В частности, по этой причине они в меньшей степени используют возможности ПЭВМ для создания интерактивного взаимодействия с помощью меню и возможности графики. Специально разработанные с учетом возможностей ПЭВМ пакеты, такие, как БТАТА (!ц)1) ЬЪЯТАТ н ЯТАТЯ~АРН!С5, с другой стороны, предоставляют меньшие возможности собственно статистической обработки. В целом же следует отметить, что ПО по статистике для ПЭВМ сейчас является достаточно развитым, в том числе и для задач сокращения размерностей и классификации.
2. Перспективной линией развития ПО статистики является разработка интеллектуальных систем статистической обработки данных, в том числе статистических экспертных систем, имеюьцих широкие возможности машинного ассистирования статистиков-исследователей разного уровня подготовки во время проведения статистического исследования. В настоящее время известно несколько образцов экспертных систем в некоторых областях статистического анализа (см. п.
21.2.1). Их можно рассматривать как первые опытные образцы в этом направлении. Развитие интеллектуального ПО для статистики в рамках «Серии МОСЭС», рассмотренной в п. 21.2.2, позволит создать ряд интеллектуальных статистических систем. охватывающих большинство разделов статистической обработки данных. СПИСОК ЛИТЕРАТУРЫ 1. Лепин В. И. Развитие капитализма в России // Полн. соб, соч.— Т.
3. — 791 с 2. Абусев Р. А. К задаче классификации групп многомерных нормальных наблюдений И Прикладная статистика Ученые записки по статистике — М Наука, 1983.— Т. 45.— С 371 — 372. 3. Абусев Р,д О сравнении поточечной и групповой классификации в случае многомернога нормального распределения И Статистические методы — Пермь. 1982 — С. 3 — 7. 4. Абусев Р. А., Лумельский Я.И Несчещенные оценки и задачи классифнкагпщ многомерных нормальных совокупностей // Теория вероятностей н ее применения — 1980.— № 2. — С. 381 — 389. 5. Айвазян С. А. Многомерный счвтистнческнй анализ в социально- экономических исследованиях И Экономика и математические методы.
— !977.— Т 13 — Вып. 5. — С. 968 — 985. 6, Айвазян С. А Об опыте применения знсперчпо.статистического метода построения аг известной целевой функции // Многомерный статистический аналит в социально. зкономических исследованиях — М. Наука, 1974.— С. 56 — 86. 7. Айвазян С. А. Статистическое исследование зависимостей.— М.: Металлургия. 1968.— 227 с 8. Айвазян С А. Экстремальная формулировка основных проблем прикладной статистики //Программно-алгоритмическое обеспечение прикладного многомерного статистического анализа: Всесоюз. школа, Ереван, сент. 1979. — С. 24 — 49.
9. Айвазян С. А., Беюаева 3. И., Староверов О.В. Классификация многомерных наблюдений. — М.. Статистика. 1974 — 240 с. Нд Айвазчп С. А., Бухштабер В. М Анализ данных, прикладная статистика и построение общей теории автоматической классификации // Методы анализа данных /Пер. с фр. — Мл Финансы и статистика, 1985.— Вступ ст. — С 5 — 22. 11. Айвазян С. А., Екюков И. С .
Меитлкик Л. Л. Прикладная статистика. Основы моделирования и первичная обработка данных. — М. Финансы и статистика, 1983.— 472 с. 12. Айвиэяп С. А., Бкюков И С., Мешалкик Л. Л. Прикладная статистика. Исследование зависимостей.— Мл Финансы и статистика, 1985 —. 488 с. 13. Айзермаи М. А., Браверман Э.М., Роэопоэр Л. И. Метод потенциальных функций в теории обучения машин. — Мл Наука, 1970.— 384 с. 14. Алгоритмы и програл~мы восстановления зависимостей/ Под ред. В. Н. Вапиика. — Мл Наука, 1984.— 816 с. 15.
Альберт А. Регрессия, псевд<>регрессия и рекуррентное оценивание /Пер. с англ.— М.. Наука, 1977.— 224 с. 16. Андерсон Т. Введение з многомерный статистический анализ/ Пер. с англ. — М. Физл>атгиз, 1963. — 500 с. 17. Андерсон Т. Статистический анализ временных рядов /Пер. с англ. — Мс Мир, 1976. — 755 с. 18. Андерсон Т. Статистический анализ временных рядов в экономике /Пер. с англ. — М. Статистика, 1972. — 755 с.
19. Андрукозич П, Ф. Некоторые свойства метода главных компонент Н Многомерный статистический анализ в социально-зкономических исследованиях. — Мл Наука, 1974.— С. 189 — 228. 20. Архаров Л. В. О предельных теоремах для характеристических корней выборочны< ковзриационных матриц прн больших размерностях /' Статистические методы классификации. — Мл Изд-во МГУ, 1972. 21.
Афифи 4., Эйзен С Статистический анализ. Подход с использованием ЭВМ /Пер. с англ. — Мг Мнр, 1982 — 488 с. 22. Барабанюк Т., Шлезингер М. Об одном алгоритме обучения и оценке качества обучения НСтатнстнческие проблемы управления. — Вильнюс, 1976. — Вып 14. — С.
93 — !04. 23. Барсов Д. М. Минимизация ошибки классификации при использовании смещенных дискриминантных функций Н Статистика, вероятносгь, экономика.— М.. Наука, 1985.— С 376-379. 24. Благовещенской Ю Н. Классификация упорядоченных классов Н Применение многомерного статистического анализа в экономике и оценке качества продукции Тез. докл. 11 Всесоюз. науч -техн. конференции, Тарту, 198! — С. 255 — 261. 25. Бяигогг>ценский Ю. Н., Мгшаякин Л.
Д. Линейная классификация распределений с поверхиос>ями постоянного уровня плотности, состоящими из концентрических эллипсов Д Статистические методы классификации. — Мл Изд-во МГУ, !969.— Выя. 1. — С 21 — 24. 26. Благовещенский Ю. Н., Мгшаякии Л, Д. Некоторые объекты н проблемы анализа статистических данных Н Применение многомерного статистического анализа в экономике и оценке качества продунпии: 7ез. докл. 111 Всесоюа. науч.-техн. конферен.
ции, Тарту, !985 — Ч. 1. — С. 27 — 32. 27. Бягкгр П. М., Кгяьбгрт М. Я. Доказательство сходимости алгоритма «Форелю Н Прикладной многомерный статистический анализ. — М.: Наука, !978. — С. 358 — 361. 28. Ьоигард М. М. Проб >емы узнавания. — Мл Наука, 1967. 320 с. 29. Боннер Р. Е. Некоторые методы классификации Н Автоматический анализ изображений. — Мл Мир, 1969. — С. 205 — 234. 30.