Главная » Просмотр файлов » Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере

Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 92

Файл №1115311 Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере) 92 страницаЮ.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311) страница 922019-05-09СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 92)

Отли"чительной чертой таких пакетов является отсутствие или слабая методическаяпроработка документации.По"видимому, использование неполных пакетов общего назначения вряд лиможет быть целесообразным, так как при практической работе почти наверняка(и, скорее всего, очень быстро) потребуются те методы, которые разработчи"ки не смогли включить в пакет.

Образно выражаясь, неполный пакет общегоназначения похож на автомобиль, рассчитанный, скажем, на работу при тем"пературе только от 15 до 20 градусов — иногда его можно использовать, аочень часто нельзя.1.3. "ƒ›… … ƒ ……Вследствие большой популярности (к сожалению, имеется в видупопулярность на Западе) статистических методов обработки данныхсоответствующие средства стали включаться в табличные процессорыобщего назначения (например, в Excel, Lotus 1–2–3 и т.д.), а также внекоторые базы данных. Наиболее часто в таких пакетах встречают"ся средства описательной статистики, методы регрессионного анализа,средства анализа временных рядов, сглаживания и прогнозирования.Несмотря на полезность этих средств, мы хотим самым серьезнымобразом предостеречь читателя от чрезмерного доверия к ним.

Речь,разумеется не идет о том, что в табличном процессоре или в базе данныхневерно считается среднее или дисперсия — формулы для вычисленияпростейших статистик, естественно, в них заложены правильные. Од"нако для более сложных задач типа проверки согласия или регресси"онного анализа табличные процессоры и базы данных очень часто со"держат грубейшие ошибки, приводящие к неправильным выводам. Этоне удивительно — при создании этих программ статистические методыобычно включаются как некое очередное украшение, наравне со встраи"ванием в них двадцатого или тридцатого типа графиков и пятисотой илишестисотой встроенной функции.

Поэтому обычно программированиестатистических методов для таких программ сводится к переписываниюиз какого"либо справочника по статистике соответствующих формул470без учета их предназначения и границ применимости, что и приводитк указанным выше последствиям.•Непрофессионализм в статистике создателей подобных программ способенсказаться и во многом другом. Например, проведя регрессионный анализ, Выможете получить совсем не те результаты из"за того, что где"то в матрицеданных случайно забыли ввести одно число, а программа не исключила соот"ветствующее наблюдение из обработки, не выдала сообщение об ошибке, апросто посчитала пропущенное число нулевым — просто потому, что таковыбыли заложенные в нее «соглашения».

Ясно, что возможность подобных ситуа"ций требует крайней осторожности при использовании статистических методов,заложенных в табличные процессоры и базы данных.•Таким образом, надежнее не использовать продвинутые статисти"ческие возможности табличных процессоров и баз данных, а экспорти"ровать анализируемые данные и обрабатывать их с помощью статисти"ческих пакетов. Если же это неудобно, то следует сравнить на однихи тех же наборах данных результаты вычислений той статистическойпроцедуры табличного процессора или базы данных, которую Вы хотитеиспользовать, и аналогичной процедуры статистического пакета.

Еслирезультаты для нескольких наборов данных в обоих случаях совпадают,то пользоваться статистической процедурой табличного процессора илибазы данных можно. Однако, при этом следует тщательно следить заправильностью подготовки исходных данных, так как обычно при каких"либо ошибках в этом случае Вы получите не сообщение об ошибке, анеправильный результат.Далее мы будем рассматривать наиболее распространенные и уни"версальные статистические средства — статистические пакеты общегоназначения.1.4. Š… * …ƒ……Для того, чтобы статистический пакет общего назначения был удо"бен и эффективен в работе, он должен удовлетворять многочисленными весьма жестким требованиям. В частности, необходимо, чтобы он:•••содержал достаточно полный набор стандартных статистическихметодов;был достаточно прост для быстрого освоения и использования;отвечал высоким требованиям к вводу, преобразованиям и орга"низации хранения данных, а также к обмену с широко распро"страненными базами данных (Excel, dBase и т.п.);471•имел широкий набор средств графического представления дан"ных и результатов обработки: картинка порой отражает сутьдела лучше, чем любые статистические показатели;предоставлял удобные возможности для включения в отчетытаблиц исходных данных, графиков, промежуточных и оконча"тельных результатов обработки;имел подробную документацию, доступную для начинающих иинформативную для специалистов"статистиков.Наконец, немаловажное значение имеет цена пакета.

Профессио"нальные западные статистические пакеты (SPSS, SAS, BMDP и т.д.)обычно стоят от 1 до 10 тысяч долларов и более. Эти пакеты позволяютобрабатывать гигантские объемы данных, включают средства описаниязадач на встроенном языке и дают возможность построения на их основесистем обработки информации для целых предприятий.Пакеты, рассчитанные на массового пользователя, стоят дешевле —обычно 500–1500 долларов.

Эти пакеты отличаются от профессио"нальных прежде всего ориентацией на индивидуального пользователя:преимущественно диалоговым режимом работы, наличием ограниченийпо объему обрабатываемых данных и т.д. Имеются и более дешевыепакеты (200–300 долларов и ниже), но они обычно обладают весьмаскромными возможностями.Отечественные статистические пакеты стоят существенно дешевле,как правило, их цена составляет от 50 до 300 долларов.1.5. #ƒ ƒ… Главной и наиболее отличительной чертой российских пакетов от за"падных является их ориентация на отечественных пользователей.

След"ствием этого является их простота освоения, продуманный интерфейс,более содержательная контекстная подсказка по сути статистическихметодов. Одной из причин подобного различия является ориентация со"здателей зарубежных пакетов на западную культурно"информационнуюсреду, отличающуюся от российской, по крайней мере, в следующихаспектах:•472наличием значительно более высокой статистической подготов"ки у пользователей, которая закладывается обязательным изуче"нием прикладной статистики и методов анализа данных практи"чески во всех университетах, школах бизнеса и техническихколледжах, а в ряде стран — и в старших классах школ;••наличием многочисленной специальной и популярной литерату"ры по анализу данных, которую можно без труда найти в любомближайшем книжном магазине;наличием многочисленных консультационных фирм, где по те"лефону за несколько минут можно получить исчерпывающуюконсультацию по применению вычислительных методов, а принеобходимости — заказать решение и более сложных проблем.Все перечисленное наложило весьма существенный отпечаток назападные статистические пакеты.

Их документация нередко отличает"ся запутанностью и необозримым объемом (SAS) или же отсутствиемнеобходимых сведений типа списка формул, по которым можно про"верить корректность производимых выводов. Приятным исключениемздесь является пакет SPSS, документация которого всегда представляласобой своеобразный эталон понятного и систематического учебника поиспользованию статистических методов.Другой особенностью многих западных пакетов является ориента"ция на командный язык, как один из главных инструментов пользова"теля. Наличие подобного языка значительно расширяет возможностипакетов, позволяя пользователю реализовывать нестандартные подходык обработке данных и добавлять новые процедуры.

Доля и функциикомандного языка в различных пакетах могут варьироваться. Так вдовольно популярном в научно"исследовательских центрах на Западепакете S"plus (версия для Windows) командный язык играет доминиру"ющую роль. Даже для проведения простейших стандартных вычисле"ний пользователь должен составить программу из нескольких строк наспециальном языке. Весьма характерен командный язык и для паке"та SPSS, часть возможностей которого реализуется только через него.Командный язык имеется и в пакетах STATGRAPHICS и STATISTICA.Таким образом, для использования западных статистических паке"тов пользователь должен обладать высокой квалификацией в статисти"ке, а часто и в программировании.

Он должен быть готовым к тща"тельному изучению объемистой и не всегда ясно написанной докумен"тации, а также к добыванию малодоступной западной статистическойлитературы.Широкое распространение современных версий западных статисти"ческих пакетов в России сдерживается прежде всего их высокой це"ной — от 700–800 до нескольких тысяч долларов, а также невысо"кой общей статистической квалификации пользователей и отсутствиемдоступа к западной литературе по современным прикладным методаманализа данных.

Чаще всего в подобной ситуации пользователь дажеприблизительно не может сказать, для чего предназначена та или иная473процедура анализа. Мы более подробно остановимся на этом вопросев П1.7, рассказывая о документации современных статистических паке"тов. В последние годы это положение стало постепенно выправляться,и на русском языке появились книги, разъясняющий использованиезападных статистических пакетов [20"23], [35], [44], [80] и др.В отличие от западных, многие отечественные пакеты в гораздобольшей степени подходят для нужд среднего российского пользова"теля. Здесь основные операции обычно сразу обозримы из головныхменю, а рутинные процедуры выполняются с минимумом действий иразветвлений по принципу: «прямым путем — к понятному результа"ту». Вся сопутствующая информация содержится в самой программнойсистеме, включая справочник и интерпретатор выводов.

Так, скажем,устроены наиболее популярные отечественные статистические системыSTADIA, Эвриста, Мезозавр.Наиболее развитой системой контекстной экранной помощи, вклю"чающей объемный справочник"гипертекст и экспертную систему по вы"бору метода статистического анализа, обладает пакет STADIA. Здеськаждый числовой статистический вывод сопровождается короткой ипонятной интерпретацией (впрочем, более искушенный в статистикепользователь может сделать интерпретацию результатов сам, благо вседанные для этого также выводятся на экран).

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6376
Авторов
на СтудИзбе
309
Средний доход
с одного платного файла
Обучение Подробнее