Пояснительная записка (1218768), страница 2
Текст из файла (страница 2)
Основная особенность языка MATLAB точно описывается фразой его разработчиков «Think vectorized» – язык обладает широким функционалом, предназначенным для работы с матрицами [6].
Oбoлoчкa MATLAB включает командную строку, историю использованных команд, рабочее пространство, где отображается список используемых переменных, а также текстовый редактор co встpoeнным oтлaдчиком (рисунки 2-3).
Рисунок 2 – Компоненты графического интерфейса MATLAB
В виду того, что данный программный продукт создавался для упрощения paботы с функциями и процедурами линeйнoй алгебры, один из встроенных в MATLAB наборов функций содержит алгоритмы именно этого раздела математики [7].
Рисунок 3 – Текстовый редактор MATLAB
Помимо функций линейной алгебры MATLAB также содержит методы для paботы с пoлинoмaми, фyнкции числeннoгo peшения диффepeнциальных уравнений, быcтpoго пpeoбразования Фypьe, фyнкции бaзoвoй cтaтиcтики и т.д.
В соответствии с информацией, предоставляемой разработчиками данного программного продукта, вce вcтpoeнныe фyнкции ядpa MATLAB являются оптимизированными, а потому не уступают, а в некоторых случаях, превосходят в скорости работы те же алгоритмы, разработанные на языке C или С++ [7]. MATLAB представляет универсальный инструмент для решения шиpoкoгo спeктpa прикладных и научных задач.
2.3 Описание структуры разрабатываемых модулей
В виду того, что техническое задание предполагает разработку трех отдельных блоков, решающих определенные задачи, не существует единого приложения или интерфейса для выполнения реализованных функций. Однако, в основе их работы лежит единая для всех структура функционирования, описываемая ниже. Взаимодействие оператора и разрабатываемых модулей на концептуальном уровне отражено на рисунке 4.
Рисунок 4 – Диаграмма вариантов использования
Данная схема, созданная для начального этапа проектирования модулей, отражает их планируемое поведение: основная задача заключается в проведении анализа данных, однако она будет выполнена только в случае загрузки входных данных, предварительной настройки модуля, выводе результатов исследования и сохранении этих результатов (в тех модулях, где это необходимо).
На вход каждого модуля подается перечень файлов, необходимых для определенного вида анализа. После обработки данных на выходе появляется выходная информация, которую следует представить в виде, удобном для оператора.
Набор файлов, требуемых для проведения анализа, будет загружаться вручную оператором. Загрузка всех файлов в модуль должна происходить одновременно для повышения скорости и удобства работы оператора.
Переходы потока управления от одной деятельности к другой представлены в диаграмме деятельности. Разложение спецификации исполняемого поведения в виде координированного последовательного и параллельного выполнения подчиненных элементов приложения на составные части представлено на рисунке 4. Подчиненные элементы – вложенные виды деятельности и отдельных действий, соединенные между собой потоками, идущими от выходов одного узла ко входам другого.
Как указывалось в разделе 1.2, в файлах содержатся не только значения определенного параметра на всем маршруте следования тепловоза, но и информация о дате, времени и номерах позиций записей. В связи с этим, необходимой является предварительная обработка входных данных, подразумевающая удаление любой избыточной информации, не требуемой для работы модуля. Таким образом, каждый разрабатываемый блок начинается с процедуры обработки входной информации.
Основной частью каждого блока является заложенный в него алгоритм анализа, который должен решать одну из задач, выделенных в разделе 2.1.
Рисунок 4 – Диаграмма деятельности
Представление выходной информации является крайне важным аспектом, поскольку от этого зависит степень понимания оператором технических процессов, отражаемых результатами работы модуля. В соответствии с этим, каждый модуль должен включать процедуры обработки результатов исследования для приведения их к удобному для восприятия виду. В качестве основных методов отображения выходных данных выбраны построение графиков и таблиц значений.
2.4 Построение доверительных интервалов
Одной из первых задач, поставленных в рамках данной работы, является оценка времени перехода дизельного двигателя тепловоза на новый режим работы при смене позиции контроллера. Фактически, задача сводится к определению момента времени, при котором происходит стабилизация значений функции перехода. Одним из лучших способов решения подобных проблем является метод построения доверительного интервала, в основе которого лежит теория математической статистики.
В теории математической статистики присутствует ряд понятий, которые следует определить прежде, чем продолжать описание алгоритма. Известно, что основной задачей статистики является получение обоснованных выводов о характеристиках генеральной совокупности из анализа извлеченной из нее выборки.
Генеральная совокупность представляет множество всех возможных значений случайной величины [8].
Исходя из этого, выборку
можно определить, как множество значений, которые приняла случайная величина в повторных независимых испытаниях. В приведенном обозначении выборки:
- варианты выборки,
– ее объем. Основным свойством выборки является ее способность представлять генеральную совокупность в целом – репрезентативность [8].
Учитывая предположение о том, что собранная выборка значений измеряемой величины обладает свойством репрезентативности, на ее основе можно вычислить оценки различных параметров генеральной совокупности. Существует два класса оценок указанных параметров: точечные и интервальные [9].
Точечные оценки представляются числом и, после их вычисления, используются вместо оцениваемого параметра. Точечные оценки должны быть выбраны таким образом, чтобы были выполнены свойства несмещенности, состоятельности и эффективности для исследуемой случайной величины и обрабатываемого объема выборки.
Интервальные оценки выражаются посредством двух чисел: началом и концом интервала, внутри которого находится оцениваемый параметр. В отличие от точечных оценок, интервальные – позволяют определить надежность и точность оценки.
При оценке математического ожидания генеральной совокупности обычно применяется выборочное среднее [9]:
или
если значениям, присутствующим в исследуемой выборке, соответствуют различные частоты их появления.
Для вычисления оценки варьирования значений используется выборочная дисперсия:
или
Выборочная дисперсия является состоятельной, но не является несмещенной оценкой дисперсии генеральной совокупности [10].
2.4.1 Построение доверительного интервала для математического ожидания при известной дисперсии
Предположим, что необходимо построить доверительный интервал для математического ожидания
, основываясь на выборке значений нормально распределенной случайной величины достаточно большого объема,
, и с учетом заранее заданной доверительной вероятности
. В качестве оценки математического ожидания используется выборочное среднее
(1), закон распределения которого близок к нормальному (распределение суммы независимых случайных величин с конечной дисперсией асимптотически нормально) [11].
Границы доверительного интервала зависят от требуемой надежности оценки математического ожидания: для абсолютной надежности границы будут бесконечными, в других же случаях их можно регулировать, оценивая риск возможной ошибки с помощью уровня значимости:
. Значения доверительной вероятности
обычно выбирают близкими к 1: 0.95, 0.99 и т.д.
Доверительная вероятность определяется из выражения:
где
– абсолютная погрешность оценивания.
Закон нормального распределения полностью определяется двумя величинами: математическим ожиданием
и дисперсией
. В виду того, что параметр
является несмещенной, эффективной и состоятельной оценкой математического ожидания, он используется в качестве точечной оценки [11]. В данном пункте рассматривается случай построения доверительного интервала с известной дисперсией
, где
– нормально распределенная случайная величина с параметрами
. Вероятность попадания данной случайной величины на интервал, симметричный относительно математического ожидания, выражается с помощью функции Лапласа:
где
.
Для заданной надежности
можно найти приближенное решение уравнения
с помощью таблицы значений функции Лапласа или встроенной в MATLAB функции.
При известном значении величины
можно определить значение абсолютной погрешности:
Симметричный интервал для математического ожидания на основе (3) примет вид:
Учитывая (5) можно сказать, что построенный доверительный интервал
покрывает неизвестное математическое ожидание с вероятностью
, а точность оценки математического ожидания составляет
[11].
Из формулы оценки точности (4) следует, что с увеличением надежности
границы доверительного интервала становятся шире, то есть растет значение ошибки оценки математического ожидания. Для снижения ошибки следует увеличить объем выборки [12].
2.4.2 Построение доверительного интервала для математического ожидания при неизвестной дисперсии
В большинстве случаев гипотеза о том, что случайная величина
имеет нормальное распределение, является приемлемой при объеме выборки
, а сама величина
пригодна для использования вместо
Однако, с заменой дисперсии
на выборочную дисперсию
(2) все несколько сложнее. При объеме выборки
, закон распределения приведенной оценки среднего арифметического нельзя считать нормальным [12]. Его следует аппроксимировать посредством распределения Стьюдента
, где
– число степеней свободы, равное
. Однако, подобная аппроксимация приемлема только в случае, когда генеральная совокупность
имеет нормальное распределение [12].
Для построения доверительного интервала используются следующие случайные величины:














