Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 93
Текст из файла (страница 93)
В пакете Мезозавр ре"ализована оригинальная система экспертной оценки сложных моделейвременных рядов. Система Эвриста включает ряд уникальных мето"дов анализа финансовых рынков и выделяется живо и изобретательнонаписанной документацией, которая читается как захватывающее пове"ствование о возможностях статистических методов.Все эти пакеты аккумулируют передовой опыт российской науки,что не удивительно: их создавали ведущие специалисты Академии науки Московского государственного университета. Они стабильно распро"страняются и эксплуатируются тысячами пользователей на начиная сначала 90"х годов минувшего века. За это время их основные процедурыи операции тщательно верифицированы и отшлифованы. Методы анали"за сгруппированы в пунктах меню по содержательному принципу, а непо малозначащим для пользователя фамилиям авторов, как это имеетместо во многих западных пакетах.Явным недостатком отечественного рынка является малочислен"ность российских пакетов.
Они не могут удовлетворить всех специ"фических запросов пользователей. Так, российские социологи и пси"хологи наряду с отечественными пакетами вынуждены использоватьпакет SPSS, предоставляющий очень удобные возможности для ввода иобработки весьма специфичных данных социологических анкет.474Замечание. Периодически на научных конференциях, выставках и семи"нарах можно встретить и новые российские программы анализа данных. Ихразработка ведется в учебных и научных центрах прежде всего для конкрет"ных собственных нужд.
Например, в Томском государственном университетеразработан и используется для обучения студентов пакет MATSTAT. Такиепакеты, как правило, либо вовсе не выходят на рынок, либо не выдерживаютжестких условий выживания на рынке наукоемких разработок и вскоре исче"зают из широкой маркетинговой сферы. Кстати, самоокупаемость западныхстатистических продуктов (кроме нескольких ведущих) также недостаточно вы"сока, поэтому большинство из них создаются не компьютерными фирмами, ауниверситетами за счет различных дотаций.1.6. WindowsРис.
П1.1. Вид электронной таблицы в пакете STADIA 6.0В середине 90"х годов статистичеcкие пакеты для среды Windows по"степенно вытеснили предшествующии им DOS"версии. Windows"версиипоявились у традиционных производителей статистических пакетов,многие из которых начинали свою деятельность с создания программ ибиблиотек для больших машин (SPSS, SYSTAT, STADIA и др.). Мно"жество новых пакетов было разработано именно для среды Windows(STATISTICA и др.). Эта среда позволила разрешить ряд традиционныхдля всех статистических пакетов проблем и заметно улучшила качествопрограмм.Покажем, как возможности среды Windows отразились на качествестатистических пакетов.Интерфейс.
Интерфейс статистического пакета неизбежно объеди"няет в себе электронные таблицы, текстовый и графический редакторы,а также многочисленные процедуры ввода данных и параметров, различ"ные для разных статистических методов. Таким образом, по сложностии разносторонности он превосходит интерфейсы большинства другихпрограмм.Работая в DOS, пользователи при переходе с одного статистиче"ского пакета (скажем, STATGRAPHICS) на другой (например, SPSS)вынуждены были с нуля изучать загадочный интерфейс нового паке"та.
В Windows"версиях статистических пакетов произошла унификациябольшинства процедур интерфейса. Работа с данными, графиками итекстами стала выполняться примерно так же, как в других Windows"программах. Это позволило намного быстрее осваивать эти пакетытем, кто уже хоть немного поработал с Windows"программами. Нарис.
П1.1—П1.2, в качестве примера, приведен вид электронных таблицстатистических пакетов STADIA и SPSS.475Рис. П1.2. Вид электронной таблицы в пакете SPSSЗаметной унификации подверглись пункты меню панели управленияпакетов. Здесь пользователь практически всегда обнаружит заголовки:Файл (File), Преобразования (Transform), Статистика (Statistics), График (Graphs), Окна(Window), Помощь (Help).
Открывая в любом из этих пакетов пункт менюФайл, пользователь найдет привычные для Windows"программ опцииНовый, Сохранить, Печать, Принтер, Выход и т.д. Конечно, отдельные деталименяются от пакета к пакету, но общего стало значительно больше,чем различий.Объемы обрабатываемых данных. Расширение возможностей ра"боты с памятью в Windows привело к тому, что в ряде пакетов программ"ные ограничения на объемы обрабатываемых данных или сняты вообще(SPSS), или заметно ослаблены (STADIA 6.0, STATGRAPHICS).476Многооконность. Возможности многооконной работы в Windowsкак нельзя лучше отвечают потребностям статистического анализа.
Ведьрешение статистической задачи часто требует возвращения на предыду"щие этапы для коррекции данных или изменения стратегии обработки.Например, при изучении графика остатков или графика автокорреляци"онной функции временного ряда обычно возникает необходимость уточ"нения подбираемой модели, при выявлении неоднородности совокупно"сти — необходимость разбить ее на части или удалить тренд. Графи"ческое или расчетное обнаружение грубых, нехарактерных наблюденийвлечет за собой коррекцию данных или выбор процедур, устойчивых кподобным эффектам. Подобные, порой многократные, возвраты назадтипичны при решении задач статистического анализа.Для упрощения этой работы большинство статистических пакетовпредлагает возможности многооконного режима. Они могут выводить наэкран окно данных, окно графиков, окно статистических процедур, окноитоговых результатов.
В отдельных пакетах к ним могут добавляться идругие окна (например, окно команд в SPSS). В одних пакетах эти окнамогут присутствовать на экране одновременно, в других — вызыватьсяпо очереди с помощью меню или «закладок» (как листы рабочей книгитабличного процессора). При этом каждое окно сохраняет информацию,введенную на последнем шаге. Однако стоит заметить, что чрезмерноеувлечение окнами, когда результат каждой промежуточной обработкивыводится в отдельное окно (как это принято в пакете STATISTICA/w),засоряет экран и затрудняет работу.Качественное улучшение графического редактирования и вы?вода. Ясное и четкое представление результатов является одним изважнейших элементов статистической обработки данных.
Это особенноважно, если на основе статистического анализа руководство должнопринимать принципиальные решения, а также если результаты стати"стического анализа должны быть доведены в доступной форме до мас"совой (не профессиональной) аудитории. Практически все DOS"версиистатистических пакетов можно было подвергнуть критике за те илииные недостатки графического вывода (например, крайне сложное ин"терактивное редактирование графика, невозможность или трудность на"стройки его различных элементов и т.д.). Ситуация заметно измениласьв Windows"версиях статистических пакетов. Здесь настройка элементовграфического вывода обычно сводится к указанию мышью требуемогообъекта на графике и заданию его атрибутов (размера, толщины, цвета,шрифта и т.п.) в открывающихся меню.477Использование шрифтов.
Шрифтовое разнообразие среды Win"dows позволило заметно улучшить оформление выводимых графиков,а также содержание и внешний вид гипертекстовых справочников пометодам прикладной статистики, позволяя в привычном виде воспроиз"водить специальные математические символы и формулы (см. п. П1.7).1.7. &… Особенности документации статистических пакетов. Докумен"тация статистических пакетов существенно отличается от документа"ций других широко используемых программных средств. Это связано стем, что кроме общего описания порядка установки и эксплуатации, онадолжна содержать информацию о каждом из многочисленных и поройвесьма специфических методов статистики, содержащихся в пакете. Вхорошей документации для каждой статистической процедуры должныбыть подробно описаны назначение процедуры, порядок заполнения по"лей ввода данных, выбора параметров, протокол выдачи результатов,приведены формулы для рассчитываемых величин, указаны ограниче"ния метода, даны ссылки на первоисточники.
Очень удобно, если ис"пользование статистических процедур в документации иллюстрируетсяна содержательных примерах.Привычка многих отечественных пользователей осваивать програм"мы без изучения документации или в лучшем случае по многочисленнымпереводным и отечественным книгам не приносит желаемых результа"тов, когда они сталкиваются со статистическими пакетами. Дело втом, что выяснить назначение и свойства многих статистических про"цедур большинству отечественных пользователей попросту негде. Ведьприкладные методы статистики в последние десятилетия довольно ин"тенсивно развивались. Например, были созданы робастные (устойчи"вые) методы оценивания, методы, свободные от распределения и т.д.Много нового за это время появилось в анализе временных рядов имногомерных данных.
Эти методы, многие из которых реализованы всовременных статистических пакетах, значительно раздвинули границыприменимости статистики по сравнению с классическими методами. Абазовая подготовка специалистов в наших вузах по"прежнему включаетлишь классические методы анализа, выработанные в первой полови"не XX века и ранее (хотя в последние два"три года здесь наметилисьнекоторые изменения, см. [70], [71]).
Нет никаких сведений о совре"менных прикладных статистических методах и практически в большин"стве книг по статистике, доступных на русском языке. Поэтому даже478выпускники кафедр теории вероятностей и математической статистикиведущих университетов страны, в силу узкой и в основном теоретиче"ской специализации своего образования, оказываются беспомощными,сталкиваясь с массой новых незнакомых терминов и критериев. В чутьлучшем положении находятся экономисты.