Главная » Просмотр файлов » Айвазян С.А., Бухшгабер В.М., Енюков И.С., Мешалкин Л.Д. - Прикладная статистика

Айвазян С.А., Бухшгабер В.М., Енюков И.С., Мешалкин Л.Д. - Прикладная статистика (1027378), страница 98

Файл №1027378 Айвазян С.А., Бухшгабер В.М., Енюков И.С., Мешалкин Л.Д. - Прикладная статистика (Айвазян С.А., Бухшгабер В.М., Енюков И.С., Мешалкин Л.Д. - Прикладная статистика) 98 страницаАйвазян С.А., Бухшгабер В.М., Енюков И.С., Мешалкин Л.Д. - Прикладная статистика (1027378) страница 982017-12-21СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 98)

ПИ (19.39) инвариантен относительно преобразований масштаба в пространстве Л и аффинноинвариантен относительно преобразований в пространстве Х. Однако относительно вращений в пространстве Л этот ПИ неинвариантен, поскольку при этом могут меняться маргинальные функции плотности 1! (г('>). Можно получить некоторую «разумную» аффинноннвариантную относительно преобразований Л разновидность ПИ (19.39), заменив маргинальные плотности 1! (г(!)) плотностями нормального распределения. При этом, учитывая инвариантность (19.39) относительно линейных преобразо- ваннйХ, можно заранее перейти в пространстве Х к махаланобисовой метрике (см.

9 5.2). Векторы У>, ..., У«будем выбирать ортонормированными. Соответствующий критерий будет иметь внд « '1 9 9(У,Х) 1(Р(Х) — П 9(Рц, 9, 1)) РХ (19491 (=! где (р (г; 0,1) — плотность стандартного нормального расцределения. Этот критерий направлен на поиск (1-мерных проекций, индуцированное распределение для которых наиболее сильно отличается от стандартного (1-мерного нормального распределения с независимыми компонентами. !7 Заказ № 291 Поскольку, как указывалось в $19.1, известно, что невыразительные проекции имеют, при широких предположени. ях, нормальное распределение, критерий (19.40) будет обладать достаточной общностью. Для поиска одномерных проекций такой критерий предлагается в!65).

Нормальное распределение с независимыми компонентами в (19.40) выступает, таким образом, в качестве эталона бесструктурности. Возможна дальнейшая полезная модификация критерия (! 9.40) на основе следующего приема. Если случайные величины г распределены по закону Уч(0, 1ч), то случайные ве- личины уьо — Ф(,и!), где Ф (г) — функция нормального стандартного распределения, распределены равномерно в единичном кубе с вершинами (О, ..., 0), (1, О, ..., 0) и т. д. Интеграл (19.40) после преобразования (19.4!) переходит (с точностью до множителя, не зависящего от неизвестных векторов Ун ..., (/ч) в 6((7, Х)=~ (р(У) — 1)'дУ, (19.42) П где р ()') — плотность распределения, а область интегрирования — единичный куб.

Здесь в качестве эталона однородности выступает рае. номерное распределение в единичном кубе. Элементарное преобразование (!9.42) приводит снова к критерию типа среднего значения степени плотности Еи, Х)=~р (У)дУ, и (19.42') 6!4 поскольку проекции, максимизирующие (!9.42) и (19.42'), совпадают. Критерий, аналогичный (19.42), предложен в !227).

19.6.2. «Наивные» ПИ на основе параметризации вида зависимости. Хотя сами случайные величины г<'>, ..., гьо линейно независимы (т. е. сот (г<'>, г<'>) =- 0 при 1 ~ 1), можно по. пытаться установить наличие зависимости между ними, используя некоторые функции от них и изучая линейную зависимость между этими функциями. Пусть о = 2. Будем искать функции чь (гьв) и ф,(гов), такие, чтобы коэффициент корреляции между ф, (г!П) и ф, (г<'>) был бы максимальным.

Решение этой задачи дано в ~ 18.3. Однако, если ограничиться конкретным классом функций, например полиномов от г'>, можно получить рещение задачи максимизации коэффициента корреляции в аналитическом виде, что, конечно, существенно удобнее для реализации вычислительных процедур по максимизации критерия. В частности, ограничиваясь двумя степенями от г<'>, можно использовать такие ПИ: ) <1< Ф, Х) = гк(г«>, ут)+г'(у„г<г>); (19.4З) ! <~ ((7, Х)=(),((7, Х)+г'(у„у,), (19.43') где у; == (г<'>)', г (, ) — соответствующий коэффициент корреляции. Приведем аналитическое выражение как функцию компонент векторов проецирования, например для г (г<'>, уг). Для упрощения обозначений положим, что г<'> = (!>'Х), г<'> = (У'Х).

Кроме того, будем считать, что ((7'У) = О, ЕХ = О, $ =- 1„(махаланобисова метрика). Тогда Ег<'> = = Ег<'> = О, Пг<» = 0г<"> = 1, Еу, = Еу,—.- 1, ПУэ = Е (У> — — 1)т =- Е У3 — 1. Далее Еу,'= — Е(У' Х)х= ~ пп и;, о;„о;, >< «,. „<,, <~==1 х Е !х«> х«> х<'> х<' >!. (!9.44> Коэффициент корреляции г (г<'>, у,) = Ег, (у, — !) <"у' !)у,.

Отсюда получаем Р > (г<'>, ум'= '~' о<, и<, ип Е !хп > х<О> х«>)Д/Еу,' — 1, «,, ,. «, . (19 45) где значение Еу$ определяется формулой (!9.44). Аналогичные формулы полу.чаются и для остальных коэффициентов корреляции. Зто дифференцируемые функции от компонент (7 и У. Для вычисления производных нужно знать значения смешанных третьих и четвертых моментов компонент вектора Х (на практике используются их оденки) ! 9.7. Регрессия на основе целенаправленного проецирования Пошаговая адднтнвная процедура аппроксимации функции регрессии. Подход для аппроксимации функции регрессии с использованием ЦП предложен в работе [229!.

Пусть име- <7* 5!5 ется выборка объема а из (р + 1)-мерного распределения вектора )' и необходимо восстановить функцию регрессии уся+ н-й компоненты на р первых компонент вектора. Далее для упрощения формул будем употреблять обозначение у вместо усР и и Х для вектора, составленного из р первых компонент вектора ['. Предположим„что функцию регрессии можно представить в виде у = ~ йс (У, Х) !-е, (19.46) с=с где яс (.) — неизвестные функции: Ус — неизвестные векторы; с/ — число проекций, которое также неизвестно. Уравнение (19.46) может рассматриваться как развитие обобщенной линейной модели [12[.

Вычислительная процедура состоит в следующем. На первом шаге ищут такую функцию с/с (.) и вектор У,, чтобы (19.47) б',= ~э~~ (у/ — йс(У[ Х/))*=~го[и. с=! Этот поиск осуществляется следующим образом. Задавая некоторую проекцию У,, ищут непараметрическую оценку функции дс (.), например с помощью сплайн-аппроксимации, минимизирующую бс. Далее при фиксированной функции яс (.) ищут новый вектор У,. Затем снова настраивается функция яс ( ) и т.д. до тех пор, пока значение бс (У,, д,) не стабилизируется.

После этого от величин ус переходят к остаткам ус = у, — я, (Ус, Х;). Поиск вектора У„и функции й', ( ) проводится теперь из условия минимизации величины 6,' = ~~~~ (у; — яс (У, Х/) ) с'=! описанным выше способом. Данный процесс итерируется до тех пор, пока остаточная сумма квадратов 6"; для некоторого с/ нс станет меньше' порогового значения. Доказано [631[, что регрессия в форме (19.46) точно восстанавливает истинную функцию регрессии, если последняя имеет вид полинома некоторой степени от компонент Х.

В качестве примера в [229[ рассмотрен случай, когда р = 2 и истинная зависимость между у и хен и хсв имеет вид у= хсс>хссс. Тогда легко проверить, что яс ~ — !/4, я, = 1/4, У,' = (1,1), Ус = (1,— !) точно восстанавливают функцию регрессии. 516 Этот же пример использован и для иллюстрации работы предлагаемого алгоритма при наличии выборки Другие возможные подходы. В отличие от работы (229), где делается попытка прямой аппроксимации функции регрессии, будем искать подпространство арап (О„..., У„), для которого достигает максимума значение ПИ: Яр,„(К Х)= ! Хх(ы"-~(ф(У, Я) — ~р (у)~(Л)) 6Ъ)у, (19.48) Восстановление плотности и связь с томографией 19.8.

19.8.1. Оценка плотности методом целенаправленного проецирования. Пусть имеется выборка Х~ю = (Х,, ..., Х„) р-мерных наблюдений объема и. Опишем итерационную процедуру получения оценки плотности )' (Х) в виде )„(Х) х ~~Пд (8' Х). Здесь 1, (Х) — начальная плотность, которая задается вместе с некоторой р-мерной выборкой Хьч1= = (Хпь ..., Х„,,) из нее, и,)) и. На М-м шаге процедуры строится оценка в виде плотности )м (Х) = )м - ~ (Х) фм (йм Х) (19.49) вместе с выборкой Х и = (Х,м, ..., Х„мм) из нее. Поправочиая функция лм(у) и направление 6м с )ср, )(Эм!! = 1, вы- где ф (р, Я) — плотность совместного распределения случайных величин Я = (гы>, ..., гел)', г<п = [l,'Х;1 (г) — маргинальная плотность распределения только Х; ~р (у)— маргинальная плотность распределения у; Хх — матрица ковариаций Е, ПИ (19.48) инвариантен относительно линейных преобразований Л, поэтому без ограничения общности можно считать, что компоненты вектора 2 некоррелированы.

В случае махаланобисовой метрики в пространстве Пр (Х) это эквивалентно обычной попарной ортогонаньности векторов !I;, поэтому без ограничения общности можно считать, что !Хх! = 1. ПИ (19.48) является мерой расхождения модели «случайная величина р независима от Л» с ситуацией, имеющей место на самом деле. Максимизируя (19.48), ищут подпространство, где это расхождение максимально, т. е. такое, где у наиболее сильно зависит от Л. бираются так, чтобы они минимизировали значение функ- ционала относительной энтропии Н (~(Х),7(Х)) =~!ой — '' ~(Х) дХ 7(х) в классе всех плотностей ~ (Х) вида ~м, (Х) я (6'Х).

Име- Н()(Х), Гм-~ (Х)6(8'Х))=Н(1(Х), 1м — ~(Х))— — ~ 1ои я (6' Х) !'(Х) дХ = Н (((Х), ~м, (Х))— — ~!пад(у)7 (у, 6)оу, где ~ (у,й)= )г ~(Х)дХ. ед=д Далее, из условия ) ~д Х = 1 следует, что ) ~м ~ (у, 6) х Хд (у) Йу = ! . Положим Ж (8, я (у)) = ! 1ои я (уЦ (у, 6) ду. Таким образом, ям (у) и 6м являются решением задачи: найти (19.50) агд шах%'(6, д(у)) а.а при условии ( ~м- ~ (у, 6) я(у) ду = 1 При каждомфиксированном 8 задача (!959) будет стандартной вариационной задачей, решением которой является функция йа(д) =цд, йу~,(д, 6).

(19.51) Таким образом, дм (у) = ли (у), где ба — решение следующей задачи целенаправленного проецирования: найти (19. 52) ьгдшах%'(8, 1(9, 6)Нм ~(у, 6)). е Наряду с выборкой Хоо = (Х„..., Х„), по предположению индукции, имеется выборка Х™ ' = (Х,, м Х„ч,, м — ~). Опишем, как при помощи этих выборок получить оценку ~начения функционала %'(8, 1' (у, 6))/~м ~ (у, 8)) каждого 6. Фиксируем некоторый алгоритм оценки <р (у) плотности ф (у) одномерной случайной величины по выборке р„..., ул.

Например, ф(у) =-„' '~'Ь(р — В; Ь), ! Ь вЂ”, если (у)л, "—; а' 2 ' где Ь(у; Ь)= О, если (у(= 2 Тогда можно положить лм, ,'~~л (у — 8' Х,; л) ив (У)— лм л ~ч; а(у — в'х. „,,гл) 1 (19.53) л!9 В (!9.53) остается свободным параметрЬ. В !631! рекомендуется Ь выбирать зависящим от у так, чтобы условию (у— и — 6'Х,. м-1 ! -~ — удовлетворяло ровно а пм 1 точек Х,,м,, где а=сопя!, например, О,1; 0,05 и т.д.

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6417
Авторов
на СтудИзбе
307
Средний доход
с одного платного файла
Обучение Подробнее