85799 (Регресійний аналіз інтервальних даних)

2016-07-29СтудИзба

Описание файла

Документ из архива "Регресійний аналіз інтервальних даних", который расположен в категории "". Всё это находится в предмете "математика" из , которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "остальное", в предмете "математика" в общих файлах.

Онлайн просмотр документа "85799"

Текст из документа "85799"

МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ

ДНІПРОПЕТРОВСЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ

ДИПЛОМНА РОБОТА

Регресійний аналіз інтервальних даних

Виконала: студентка групи МС-03-1

Припутень Ю.А.

Дніпропетровськ

2008

Реферат

Об’єкт дослідження: алгоритми регресійного аналізу пристосовані для обробки інтервальних даних.

Мета роботи: розробити програму, яка здійснює знаходження інтервалів для коефіцієнтів регресії. Програма повинна дозволяти подавати результати у вигляді зручному для користувачів, мати інтерфейс та бути зручною у користуванні.

Одержані висновки та їх новизна: в роботі був створений алгоритм для знаходження інтервальних оцінок коефіцієнтів та розроблено програмне середовище, що дозволяє досліджувати роботу цього алгоритму.

Результати дослідження можуть бути застосовані для обробки статистичної інформації.

Перелік ключових слів: лінійна регресія, метод найменших квадратів, інтервальні дані.

Зміст

Вступ

Розділ І. Лінійна багатовимірна регресія

Розділ ІІ. Довірчі інтервали регресії. Похибка прогнозу

Розділ ІІІ. Лінійний регресійний аналіз інтервальних даних

3.1 Метод найменших квадратів для інтервальних даних

3.2 Метод найменших квадратів для лінійної моделі

3.3 Парна регресія

Розділ IV. Програмний продукт «Інтервальне значення параметрів»

4.1 Текст програми

4.2 Опис програми

4.3 Результати роботи програми

Висновки

Список використаних джерел

Вступ

Перспективний і швидко прогресуючий напрямок останніх років – математична статистика інтервальних даних. Мова йде про розвиток методів математичної статистики в ситуації, коли статистичні дані - не числа, а інтервали, породжені накладенням помилок виміру на значення випадкових величин.

Дана дипломна робота складається з чотирьох розділів. Перші три розділі мають реферативний характер. В першому розділі викладені деякі поняття класичної теорії регресійного аналізу. В другому розділі розглянуті довірчі інтервали для коефіцієнтів регресії. В третьому розділі наведені ідеї і підходи лінійного регресійного аналізу інтервальніх даних. В четвертому розділі викладені результати дипломної роботи. Тут наведено алгоритм, текст та опис розроблених програм, які здійснюють знаходження нотни та оцінок коефіцієнтів регресії в класичному вигляді та в інтервальних даних.

За допомогою розроблених програм в цьому ж розділі наведено результати експериментального дослідження залежності величин інтервалів, які накривають коефіцієнти регресії в залежності від об’єму вибірки та величин інтервалів в яких знаходяться значення координат вибірки.

Програми створені за допомогою середовища Maple, так як воно по всім параметрам (швидкість, надійність, простота у використанні) підходить для написання цих програм.

Постановка задачі. В роботі необхідно розв’язати такі задачі:

1. Розробити програму. Програма повинна працювати з вибірками довільної вимірності і довільними векторами найбільших похибок для кожної координати.

2. Провести чисельно дослідження залежності верхньої та нижньої меж інтервалів, що накривають коефіцієнти регресії, в залежності від об’єму вибірки і векторів найбільших похибок для кожної координати.

Розділ І. Лінійна багатовимірна регресія

Нехай - деяка випадкова величина, флуктує навколо деякого невідомого значення параметра , тобто , де - флуктуація або похибка. Наприклад, похибка може бути властива самому експерименту, або похибка може виникати при вимірювані невідомого параметра .

Припустимо тепер, що можна представити у вигляді

де - відомі постійні величини, а – невідомі параметри, які потрібно оцінити.

Якщо величина змінюється і при цьому змінна набуває значень , тобто можна записати

(1.1)

У матричному вигляді, отримаємо:

Або

(1.2)

де .

Означення: Матриця розміру називається регресійною матрицею. При цьому її елементи обираються таким чином, щоб , тобто число лінійних незалежних стовпців дорівнювало , також матрицю називають матрицею повного рангу.

Але в деяких випадках приймає лише два значення 0, 1, тоді можливі випадки коли в матриці деякі рядки або стовпці збігаються, тобто є лінійно – залежними. В цьому випадку називають матрицею плану. Змінні називають регресорами (j=1,…,p-1), або предикторними змінними, а - називають відкликом.

Модель (1) або (2) лінійна відносно невідомих параметрів. Тому її називають лінійною моделлю.

Перед тим як оцінювати вектор , замітимо, що вся теорія будується для моделі (2).

Для оцінки невідомих параметрів використовують метод найменших квадратів (МНК), який полягає в мінімізації суми квадратів залишків. Необхідно мінімізувати величину:

(1.3)

за параметрами . Вираз (1.3) запишеться так:

(1.4)

Шукаємо градієнт :

Розв’язуємо рівняння:

Таким чином

(1.5)

Необхідно перевірити, що знайдена стаціонарна точка є точкою мінімуму функції . Справедлива така тотожність

Перевіримо цю рівність:

Ліва частина тотожності мінімальна якщо .

Регресію будемо позначати .

Залишок

Мінімальне значення суми квадратів залишків називають залишковою сумою квадратів (RSS).

Застосуємо формулу (2.1), RSS перепишеться:

Якщо застосувати формулу (2.2), отримаємо:

.

Оцінки та єдині.

Розділ ІІ. Довірчі інтервали регресії. Похибка прогнозу

Нехай прогнозоване значення визначається по рівнянню регресії з оціненими параметрами

(2.1)

В силу того, що - незміщені оцінки деяких невідомих параметрів відповідного взаємозв'язку, - одне з можливих значень прогнозованої величини при заданих значеннях , точніше - це оцінка середнього значення . Оскільки випадкова величина, то і оцінка також випадкова і має дисперсію. Визначимо її значення.

Використавши теорему про дисперсії суми залежних величин, одержимо:

Перепишемо у вигляді:

де - вектор заданих значень незалежних змінних. Звідки одержимо:

Оскільки значення нам відомо, то введемо в останню формулу її оцінку , звідки дисперсія буде:

(2.2)

Таким чином, середнє значення лежить у межах:

(2.3)

Розділ ІІІ. Лінійний регресійний аналіз інтервальних даних

Перейдемо до багатомірного статистичного аналізу. Спочатку з позиції асимптотичної математичної статистики інтервальних даних розглянемо оцінки методу найменших квадратів (МНК).

Статистичне дослідження залежностей - одне з найбільш важливих задач, які виникають у різних галузях науки й техніки. Під словами "дослідження залежностей" мається на увазі виявлення і опис існуючого зв'язку між досліджуваними змінами на підставі результатів статистичних спостережень.

Якщо яка-небудь група об'єктів характеризується змінними і проведений експеримент, що складається з n досвідів, де в кожному досвіді ці змінні вимірюються один раз,то експериментатор одержує набір чисел: .

Але процес виміру не дає однозначний результат. Реально результатом виміру якої-небудь величини Х є два числа: - нижня границя і - верхня границя. Причому , де - істинне значення вимірюваної величини. Результат виміру можна записати як . Інтервальне число X може бути представлене іншим способом, а саме, , де . Тут - центр інтервалу (як правило не співпадає з ), а Δx - максимально можлива похибка виміру.

3.1 Метод найменших квадратів для інтервальних даних

Нехай математична модель задана:

(3.1.1)

де х = (х1, х2,..., хm) - вектор впливаючих змінних, що піддаються виміру; - вектор оцінюваних параметрів моделі; у - відгук моделі (скаляр); Q(x, )- скалярна функція векторів х і ; і ε - випадкова похибка.

Нехай проведено n досвідів, причому в кожному досвіді обмірювані (один раз) значення відгуку (у) і вектора факторів (х). Результати вимірів можуть бути представлені в наступному виді:

де Х - матриця значень обмірюваного вектора (х) в n досвідах; Y - вектор значень обмірюваного відгуку в n досвідах; Е - вектор випадкових помилок. Тоді виконується матричне співвідношення:

, (3.1.2)

де , причому - n-мірні вектора, які становлять матрицю

Введемо міру близькості між векторами і . В МНК в якості береться квадратична форма зважених квадратів нев'язань

,

тобто

де - матриця ваг, що не залежить від . Тоді як оцінка можна вибрати таке , при якому міра близькості d(Y,Q) приймає мінімальне значення, тобто

.

У загальному випадку рішення цього екстремального завдання може бути не єдиним. Тому надалі будемо мати на увазі одне із цих рішень. Воно може бути виражене у вигляді:

причому неперервні і дифференційовні по (Х,Y) Z, де Z - область визначення функції f(X,Y). Ці властивості функції f(X,Y) дають можливість використати підходи статистики інтервальних даних.

Перевага методу найменших квадратів полягає в порівняльній простоті й універсальності обчислювальних процедур. Однак не завжди оцінка МНК є самостійною, що обмежує його застосування на практиці.

Важливим частковим випадком є лінійний МНК, коли Q(x, ) є лінійна функція від :

Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5160
Авторов
на СтудИзбе
439
Средний доход
с одного платного файла
Обучение Подробнее