Н.А. Спирин, В.В. Лавров - Методы планирования и обработки результатов инженерного эксперимента (1062945), страница 34
Текст из файла (страница 34)
Для более детальногознакомства с процедурами компьютерной обработки результатов статистических исследований заинтересованным читателям можно рекомендовать специальный справочник [20]. Ниже в табл. 7.1 представлены адреса ресурсов Internet, на которыхрасположена информация по некоторым распространенным статистическим пакетам.Таблица 7.1Статистические пакетыАдресНазваниеРазработчикпрограммы123www.statsoft.ruSTATISTICAStatSoft Inc., СШАwww.spss.ruSPSSSPSS Inc., СШАwww.stat-graphics.comSTATGRAPHICSPlusManugistics Inc.,www.sas.comStatViewSAS Institute Inc.,www.ncss.comNCSSNCSS Statistical Software,www.minitab.comMinitabMinitab Inc.2157.
КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …окончание табл. 7.1123www.insightful.comS-PLUSInsightful Corp.statsoft.msu.ruSTADIAНПО «Информатика и компьютеры», Россияwww.softsite.ruStat-MediaЦентр интеллектуальных систем «Метод», Россияwww.megaputer.ruPolyAnalyst«Мегапьютер Интеллидженс», РоссияОтметим, что многие поставщики предлагают пользователям пробные и демонстрационные версии статистических программ, как правило, отличающиеся тем, чтопробная версия представляет собой полнофункциональный продукт с ограниченнымсроком использования, а демонстрационная версия в большинстве случаев напоминает электронную презентацию.Следующий параграф посвящен краткому описанию основных статистическихфункций электронных таблиц Microsoft Excel с комментариями по их использованиюв теории инженерного эксперимента для статистической обработки экспериментальных данных и анализа результатов наблюдений.
Некоторые из этих функций использовались нами в предыдущих главах данного пособия при изложении соответствующих разделов теории инженерного эксперимента и иллюстрации примеров. Предполагается, что читатель уже имеет некоторые навыки работы на компьютере в средеэлектронных таблиц Microsoft Excel, поэтому может использовать данный материалв качестве справочного пособия для статистического анализа данных.Затем мы рассмотрим материал, посвященный знакомству с возможностямиинтегрированнойсистемыстатистическогоанализаиобработкиданныхSTATISTICA. Наш выбор обусловлен тем фактом, что данная система является насегодня одной из лидирующих на рынке программного обеспечения для статистической обработки данных.
Кроме этого, важным моментом является наличие русскоязычной версии программы и множества публикаций, посвященных этому пакету, например [21].7.2. Статистические функции Microsoft ExcelПакет Microsoft Excel не предназначен для комплексного статистического анализа данных в отличие от специализированного статистического программногообеспечения, например, пакета STATISTICA. Однако и на базе электронных таблицможно провести некоторую статистическую обработку данных для большинства ин2167.
КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …женерных задач. Функции, реализующие статистические методы обработки и анализа данных, в Microsoft Excel реализованы в виде специального программного расширения – надстройки «Пакет анализа», которая входит в поставку данного программного продукта и может устанавливаться по желанию пользователя.Установка надстройки «Пакет анализа» производится из меню «Сервис/Надстройки», после чего в диалоговом окне «Надстройки» (рис. 7.1) необходимоотметить флажок пункта «Пакет анализа» и нажать кнопку ОК.Рис.
7.1. Установка пакета анализа в Microsoft ExcelЕсли процесс установки завершен успешно, то в меню «Сервис» появляетсяеще один пункт – Анализ данных (рис. 7.2), а также при создании формул становитсядоступной новая группа функций – статистические.Рис. 7.2. Окно анализа данных, вызываемое из меню«Сервис/Анализ данных…»2177. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …В рамках Microsoft Excel с помощью встроенных статистических команд можнопровести:•описательный статистический анализ;•ранжирование данных;•графический анализ данных;•прогнозирование данных;•регрессионный анализ и др.В табл.
7.2 приведены в алфавитном порядке некоторые статистическиефункции, позволяющие пользователю реализовать обработку данных непосредственно на листе электронной таблицы.Таблица 7.2Статистические функции пакета Microsoft ExcelФункцияНазначение функции и ее аргументы12ВЕРОЯТНОСТЬВозвращает вероятность того, что значение из интервала находитсявнутри заданных пределов. Если верхний_предел не задан, то возвращается вероятность того, что значения в аргументе x_интервал равняются значению аргумента нижний_предел.ВЕРОЯТНОСТЬ(x_интервал; интервал_вероятностей; нижний_предел;верхний_предел).ДИСПОценивает дисперсию по выборкеДИСП(число1; число2; ...)ДИСПРВычисляет дисперсию для генеральной совокупностиДИСПР(число1; число2; ...)ДОВЕРИТВозвращает доверительный интервал для среднего генеральной совокупностиДОВЕРИТ(альфа; станд_откл;размер)КВАДРОТКЛВозвращает сумму квадратов отклонений точек данных от их среднегоКВАДРОТКЛ(число1; число2;...)КВПИРСОНВозвращает квадрат коэффициента корреляции Пирсона для точек данных в аргументах известные_значения_y и известные_значения_xКВПИРСОН(известные_значения_y; известные_значения_x)КОРРЕЛВозвращает коэффициент корреляции между интервалами ячеек массив1 и массив2КОРРЕЛ(массив1; массив2)2187.
КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …Продолжение табл. 7.21ЛГРФПРИБЛ2В регрессионном анализе вычисляет экспоненциальную кривую, аппроксимирующую данные, и возвращает массив значений, описывающий этукривую. Поскольку данная функция возвращает массив значений, онадолжна вводиться как формула для работы с массивами.
Уравнениекривой следующее:y = b⋅mx или y = (b⋅(m1x1)⋅(m2x2)⋅…⋅(mnxn)) (при наличии нескольких значений x), где зависимые значения y являются функцией независимых значений x. Значения m являются основанием для возведения в степень x,а значения b постоянны. Отметим, что y, x и m могут быть векторами.Функция ЛГРФПРИБЛ возвращает массив {mn;mn-1; ... ;m1; b}.ЛГРФПРИБЛ(известные_значения_y;известные_значения_x;конст;статистика)ЛИНЕЙНРассчитывает статистику для ряда с применением метода наименьшихквадратов, чтобы вычислить прямую линию, которая наилучшим образом аппроксимирует имеющиеся данные. Функция возвращает массив,который описывает полученную прямую. Поскольку возвращается массив значений, функция должна задаваться в виде формулы массива.ЛИНЕЙН(известные_значения_y; известные_значения_x; конст; статистика)МАКСВозвращает наибольшее значение из набора значенийМАКС(число1;число2; ...)МЕДИАНАВозвращает медиану заданных чиселМЕДИАНА(число1; число2; ...)МИНВозвращает наименьшее значение в списке аргументовМИН(число1; число2; ...)МОДАВозвращает наиболее часто встречающееся или повторяющееся значение в массиве или интервале данныхМОДА(число1; число2; ...)НАКЛОНВозвращает наклон линии линейной регрессии для точек данных в аргументах известные_значения_y и известные_значения_x.
Наклон определяется как частное от деления расстояния по вертикали на расстояние по горизонтали между двумя любыми точками прямой, то есть наклон – это скорость изменения значений вдоль прямойНАКЛОН(известные_значения_y; известные_значения_x)НОРМАЛИЗАЦИЯВозвращает нормализованное значение для распределения, характеризуемого средним и стандартным отклонениемНОРМАЛИЗАЦИЯ(x; среднее; стандартное_откл)2197. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …Продолжение табл. 7.21НОРМОБР2Возвращает обратное нормальное распределение для указанного среднего и стандартного отклоненияНОРМОБР(вероятность; среднее; стандартное_откл)НОРМРАСПВозвращает значение нормальной функции распределения для указанного среднего и стандартного отклоненияНОРМРАСП(x; среднее; стандартное_откл; интегральная)НОРМСТОБРВозвращает обратное значение стандартного нормального распределения uНОРМСТОБР(вероятность)НОРМСТРАСПВозвращает стандартное нормальное интегральное распределение.
Этораспределение имеет среднее, равное нулю, и стандартное отклонение,равное единице. Эта функция используется вместо таблицы для стандартной нормальной кривойНОРМСТРАСП(u)ОТРЕЗОКВычисляет точку пересечения линии с осью y, используя известные_значения_x и известные_значения_yОТРЕЗОК(известные_значения_x;известные_значения_y)ПИРСОНВозвращает коэффициент корреляции Пирсона r (выборочный коэффициент корреляции), безразмерный индекс в интервале от -1,0 до 1,0включительноПИРСОН(массив1; массив2)СРГЕОМВозвращает среднее геометрическое значений массива или интервалаположительных чиселСРГЕОМ(число1; число2; ...)СРЗНАЧВозвращает среднее арифметическое своих аргументовСРЗНАЧ(число1; число2; ...)СРОТКЛСреднее абсолютных значений отклонений точек данных от среднегоСРОТКЛ(число1; число2; ...)СТАНДОТКЛОНОценивает стандартное отклонение по выборкеСТАНДОТКЛОН(число1; число2; ...)СТАНДОТКЛОНПВычисляет стандартное отклонение по генеральной совокупностиСТАНДОТКЛОНП(число1; число2; ...)СТЬЮДРАСПВозвращает t-распределение СтьюдентаСТЬЮДРАСП(x; степени_свободы; хвосты)СТЬЮДРАСПОБРВозвращает обратное распределение Стьюдента для заданного числастепеней свободыСТЬЮДРАСПОБР(вероятность; степени_свободы)2207.
КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …Окончание табл. 7.21ТЕНДЕНЦИЯ2Определяет предсказанные значения в соответствии с линейным трендом для заданного массива (методом наименьших квадратов)ТЕНДЕНЦИЯ(известные_значения_y;известные_значения_x;но-вые_значения_x; конст)ТТЕСТВозвращает вероятность, соответствующую критерию СтьюдентаТТЕСТ(массив1; массив2; хвосты; тип)ФИШЕРВозвращает преобразование Фишера для аргумента xФИШЕР(x)ФИШЕРОБРВозвращает обратное преобразование ФишераФИШЕРОБР(y)ХИ2ОБРВозвращает значение обратное к односторонней вероятности распределения χ2 (хи-квадрат)ХИ2ОБР(вероятность; степени_свободы)ХИ2РАСПВозвращает одностороннюю вероятность (Р) распределения χ2 (хиквадрат, распределения Пирсона)ХИ2РАСП(x; степени_свободы)ЧАСТОТАВычисляет частоту появления значений в интервале значений и возвращает массив цифрЧАСТОТА(массив_данных; массив_карманов)ЭКСЦЕССВозвращает эксцесс множества данныхЭКСЦЕСС(число1; число2; ...)FРАСПВозвращает F-распределение вероятности (распределение Фишера)FРАСП(x;степени_свободы1;степени_свободы2)FРАСПОБРВозвращает обратное значение для F-распределения вероятностей(критерий Фишера)FРАСПОБР(вероятность;степени_свободы1;степени_свободы2)7.3.
Краткое описание системы STATISTICASTATISTICA – это универсальная компьютерная интегрированная система,предназначенная для статистического анализа и визуализации данных, а также разработки пользовательских приложений, содержащая широкий набор процедур анализа для применения в научных исследованиях, технике и бизнесе.
Отличительнойчертой системы STATISTICA является то, что в ней реализован так называемыйграфически-ориентированный подход к анализу данных. Смысл подхода состоит втом, чтобы получать всестороннее визуальное представление данных на всех эта2217. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …пах статистической обработки и на основе этого представления выбирать следующий шаг анализа.