Главная » Просмотр файлов » Секей Г. Парадоксы в теории вероятностей и математической статистике (1990)

Секей Г. Парадоксы в теории вероятностей и математической статистике (1990) (1151962), страница 21

Файл №1151962 Секей Г. Парадоксы в теории вероятностей и математической статистике (1990) (Секей Г. Парадоксы в теории вероятностей и математической статистике (1990)) 21 страницаСекей Г. Парадоксы в теории вероятностей и математической статистике (1990) (1151962) страница 212019-07-28СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 21)

В математической статистике оценкой для корреляции г, как правило, является выборочный коэффициент корреляции, который строится по независимой выборке (Х!, У!), (Хв У!), ..., (Х„, У,) следующим образом: В ряде случаев г хорошо характеризует связь между Х и У, но уже на рубеже веков вычислялись зависимости, лишенныс смысла; например, корреляция между числом гнезд аистов и числом младенцев. Понятие корреляции постепенно мистифицировалось и некоторые «внутренние» (вообще говоря, случайные) связи стали считать существующими, если была велика корреляция (т.

е. близка по абсолютной величиня к !). Вот почему возникли совершенно абсурдные результаты, и это чуть не дискредитировало всю статистику. Как правило, игнорировался тот факт, что большая корреляция для Х и У может быть результатом влияния какой-то третьей величины. Например, в Англии и Уэльсе заметили, что с увеличением числа радиослушателей возрастало число сумасшедших и умственно отсталых людей. Однако такая интерпретация совершенно ошибочна, так как нельзя психически заболеть от того„что слушаешь радио. Дело лишь в том, что с течением времени растет и число радиослушателей, и число случаев психических заболеваний, но между ними нет никакой причинной зависимости. К сожалению, неверные толкования не всегда столь очевидны, например, в технических или экономических приложениях. Сравнение вероисповедания и роста людей дает еще один пример надуманной зависимости, согласно которой при движении от Шотландии к Сицилии доля католиков в населении постепенно возрастает и в то же время средний рост людей убывает.

Однако какая-либо причинная связь здесь совершенно невозможна. (В фашистской расовой теории еще более нелепые идеи провозглашались здравыми и даже научными.) Рассмотрим лишь некоторые из существующих парадоксов корреляции. 6) Парадоксы (!) Пусть случайная величина Х равномерно распределена на интервале ( — 1, !) и У = )Х). Очевидно, что между Х и У существует тесная связь, однако их корреляция г(Х, У) = О. (Корреляция для Х и У = (Х( всегда равна О, когда Х вЂ” случайная величина с конечной дисперсией и симметричным относительно О распределением.) (В) Пусть величины Хь Хь ..., Х„ обозначают температуру в комнате в и различных моментов времени и Уь Уь ... У, — количество топлива, использованное для обогрева в те же моменты времени (точнее, за данный промежуток времени; например, в течение часа до рассматриваемого момента).

Логично считать, что чем больше топлива использовано, тем теплее будет в комнате. Это означает, что корреляция для Х и У строго положительна. Однако корреляция может оказаться отрицательной, что можно было бы интерпретировать так: чем больше топим, тем холоднее становится. (ш) Пусть случайный вектор (Х, У) распределен нормально, т. е. его плотность имеет вид ! вяр»ре !IТ вЂ” гх ( 2(1 — гх) !Л О» / Эг (Х вЂ” Л»! (У вЂ” Ле) à à — Уе Л ~ р„р„(, ре +( где Е„, Р„Е„и Є— математические ожидания и дисперсии величин Х и У, а г — их корреляция. Предположим, что абсолютная величина корреляции строго меньше 1. При неизвестной корреляции г мы можем оценить ее через г, используя л элементов выборки. Если Е„ и Е„ известны, то целесообразно в формуле для г заменить Х и У соответственно на Е, и Е„.

Таким путем получим новую оценку г. Поскольку й использует больше информации (а именно, знание величин Е„ и Е,) можно было бы ожидать, что дисперсия у г меньше, чем у г. Однако А. Стюарт вычислил, что Р' (б) = —, (1 — г')', тогда как Р' (г) = — (1 + г'); 'л л таким образом, последняя дисперсия больше. в) Объяснение ларадоксов (1) Если Х и У независимы, то г(Х, У) = О, но обратное утверждение неверно. Некоррелированные случайные величины могут быть сильно зависимы, как в указанном выше примере, когда У = ) Х~!.

Поэтому «некоррелированность» не следует понимать как независимость. С другой стороны, можно доказать, что если Х и У некоррелированы и х~ < Х < хъ у|< < У < уь то каковы бы ни были числа х~ < х, и у1 < уь величины Х и У независимы. (!!) Нельзя забывать о влиянии температуры вне комнаты! Корреляции часто получаются совершенно невероятными, потому что вычисляемый коэффициент корреляции для двух случайных величин искажается третьей «извне влияюшей величиной».

Как раз для того, чтобы избежать этих помех, было введено понятие частной корреляции, Если корреляция для Х и У вычисляется только после того, как влияние величины Я ликвидировано, то результат перестает быть парадоксальным. Пусть гьь гы и г„ обозначают корреляции г(Х, У), г(Х, Х) и г(У, Л) соответственно. Тогда частная корреляция для Х и У без влияния Я равняется гм — гага В частном случае, когда г1а = газ= О частная корреляция для Х и у совпадает с корреляцией гм. Когда г~а, г1а, гаа неизвестны, их можно оценить по выборке аналогично тому, как это происходило для г.

С помощью этих оценок получим оценку коэффициента частной корреляции. (ш) Парадокс Стюарта можно рассматривать с разных точек зрения. Главное заключается в том, что Р и Р не являются несмещенными оценками для г, т. е. тождества Е(Р)= — г и Рнс. 9. Рассмотрим случайные величины Х, У н Х как векторы. Тогда корреляцня для случайных величии Х н У равна косинусу угла между векторами Х н У, а нх частная корреляция — косинусу угла между проекциями этих лекторов на плоскость, перпендикулярную к вектору Х. Е(г) — г неверны, поэтому нецелесообразно считать лучшей ту оценку, у которой дисперсия меньше.

В то же время обе оценки г и г смещены несильно (они являются асимптотически несмещенными), следовательно„для объяснения парадокса требуется дополнительный анализ. (См. замечания ниже и статью Стюарта.) г) Замечания (() Смещение оценки г (в случае двумерного нормального распределения) равно Е(г — г) = + о (а-'), и где о(н-') обозначает выражение, которое будучи умноженным на и, все же сходится к О. Таким образом, смещение достаточно быстро стремится к О (при увеличении объема выборки п).

С другой стороны, интересно отметить, что агсз|пР есть несмещенная оценка для агсь!пг и, если Е(и(г))= = Е(я(г)) для некоторой функции д, не зависящей от п, то д(г) = а-агсэ!пг+ Ь, где а, Ь вЂ” произвольные постоянные. В 1958 г. И. Олкин и Лж. Пратт доказали, что если оценка коэффициента корреляции г явным образом зависит от и, то можно указать несмещенную оценку для г, а именно и — г г'= РР( —, —, —, 1 — Рс), хя я я где Р— гипергеометрическая функция, определяемая формулой г(к, а, Ь, с)= +ч а<а+В...<с+ь — ць<ь+ц...<ь+ь — ц с',.с Ь!с(с+ ц ...

(с+а — ц ь ! где а, Ь, с (с Ф О, — 1, — 2, ...) являются параметрами. А среди несмещенных оценок уже следует предпочесть те, у которых дисперсия минимальна. Можно показать, что оценка г' не только является несмещенной, но и имеет наименьшую дисперсию. Однако для практических применений оценка г' достаточно сложна, поэтому рекомендуется использовать ее аппрок- 1- Г' симацию Р ~1 + э ) . (Б) Следующий факт не является парадоксом, тем не менее удивительно, что при выборе наугад т чисел из множества 1, 2, ..., п(выборка без возвращения, т.

е. число равновозмож/п !'! ных исходов равно ~ Л коэффициент корреляции для наихт)) меньшего и наибольшего среди выбранных чисел равен 1/т, т. е. он не зависит от и (т = 1,2, ..., и — 1). Более того, если Хь Хь ..., Х обозначают возрастающую последовательность из т выбранных значений, то / ! (т + 1 — !) г(Х„Х!)= т/ . + что также не зависит от и. [Следующий результат принадлежит Т. Мори. Возьмем выборку с возвращением объема п из множества 1, 2, ..., т+ 1 и обозначим через У, число элементов выборки, величина которых не больше, чем Ь Тогда г(уь У;)=г(Х;,Х;).] Другой задачей похожего типа является следующая.

Если Х! ( с Хс -= ... ( Х есть возрастающая последовательность независимых равномерно распределенных случайных величин (еупорядоченная выборкав), то г(Хг, Хг) = г(Хг, Х!); если равномерное распределение заменить любым другим распределением, для которого г(Хг,Х!) существует, то г(Хг, Х!)( г(Хг, Хг), т. е. указанное свойство является экстремальным свойством равномерных распределений (см. статью Мори, Секея).

В действительности можно доказать больше. Пусть максимальная корреляция для двух случайных величин (7 и У определяется как зпрг(7((7),я(У)), где ( и и пробегают множество инте!,в грируемых в квадрате действительных функций от () и У соответственно: шахсогг((), У)=варги(()) й'(У)). !. в Используя это обозначение, можно доказать, что игах согг (Х„Х!) = г (Х„Х!). Равенство следует из того факта, что игах согг((7, У) = г((7, У), когда регрессия () на У (определение регрессии см. в следующем разделе) и регрессия У на (7 линейны (и не равны тождественно постоянной).

Это как раз тот случай, когда коэффициент корреляции является хорошей мерой близости. д) Литература Копая! М. 6., 5(пег! А. Тав Аг(оаясег( Тавоту о] В!агапов, Чо). 2, ОгиИп, ).опаоп, 1961. (Имеется перевод: Кевдвви М. Дж., Стьюарт А. Ствтвствческве выводы я связи. — Мл Наука, 1973.] Мог) Т. Р., $вь)ге!у Сг. Д "Ап ех1гюпв! ргорег1у о( тес(впкп!вг 01в1г!ЬпИопв", Згазыисз агпт Ргоьаьапу Евг(вгз, 3, 107 — 109, (1935). О!Мп 1., Ргеи Д %. "()пыевеа езиаеиап о! сег1в(п согге1еИоп соеИ)с1- еп(в", Аппо!и о] Ма(А Йе((з!., 29, 201 — 211, (1958). 5(пвг( А.

"А рвгваох гп з(вивисв! евиювиоп", В1огпеггйа, 42, 527 — 529, (1955). 6. Парадоксы регрессии а) История ларадонсоз Коэффициеат корреляции описывает зависимость между двумя случайными величинами одним числом, а регрессия выражает эту зависимость в виде функционального соотношеаия и поэтому дает более полаую информацию.

Например, регрессией является средний вес тела человека как функция от его роста. Понятие ерегрессиив ввел Гальтон, который в конце прошлого века сравнивал рост родителей с ростом их детей. Он обааружил, что рост детей у высоких (или низких) родителей обычно выше (или ниже) среднего, но ае совпадает с ростом родителей. Линия, показывающая, в какой мере рост (и другие характеристики, к которым мы позже вернемся) регрессируют (возобновляются) в среднем в последующих поколениях, была названа Гад»тоном линией регрессии.

Позднее регрессией стали называть любую функциональную зависимость между случайными величинами. Вначале регрессионный анализ применялся в биологии и важнейшим научным журналом, Рис. 1О. Линия регрессии Ген»тона. в котором освещалась эта тема, был журнал «Биометрика» ("Рйотпе1г1йа"), выходящий с октября 1901 г.

Между 1920 и 1930 гг. большое значение приобрело использование регрессионного анализа в экономиие н возникла новая область науки: эконометрика (термин, принадлежащий Р. Фришу (1926), которому позднее была присуждена Нобелевская премия) со своим журналом «Эконометрина» ("Есопоте1г(иа"), впервые вышедшим в 1933 г. От изучения частных регрессионных задач исследователи постепенно перешли к регрессионному анализу структуры, присущей глобальным экономическим системам (Дж.

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6458
Авторов
на СтудИзбе
304
Средний доход
с одного платного файла
Обучение Подробнее