С.С. Валландер - Лекции по статистике и эконометрике (1160549), страница 2
Текст из файла (страница 2)
При этом возможныразличные понимания случайности и механизма ее возникновенияв рассматриваемом явлении, а потому и различные трактовки понятияслучайной величины. Остановимся на этом более подробно. Начнем содного часто встречающегося типа задач.Простой случайный выбор ([8]). Предположим, что вполе зрения исследователя находится конечная совокупность12Глава 1объектов (чаще всего, большая и, может быть, труднообозримая).Каждый из этих объектов (индивидуумов, фирм,. . .
) может бытьохарактеризован одним или несколькими числами. Выбирая случайнымобразом один объект из совокупности, исследователь измеряет егохарактеристики (предполагается, что это возможно) и, тем самым,получает "эмпирические данные". Выражение "выбирая случайнымобразом"подразумевает активное участие исследователя в выборе,т.е. организацию им некоторого случайного механизма реализацииэтого эксперимента, а термин "простой выбор"означает, что всеобъекты рассматриваемой совокупности считаются равноправными,т.е. выбираются с одной и той же вероятностью.Цель статистического исследования — сделать по эмпирическимданным тот или иной вывод об изучаемом явлении, процессе ит.д.
В рассматриваемом примере по характеристикам выбранногообъекта исследователь, видимо, хочет судить о всей совокупностиизучаемых объектов. Разумеется, это трудно сделать по одномуобъекту, и практически всегда подобный выбор "повторяется".Организовать повторения можно по-разному. Один из наиболеераспространенных способов организации так и называется — "повторныйвыбор". Он характеризуется тем, что выбранный объект каждыйраз "возвращается"в изучаемую совокупность, а следующий выборсовершается независимо от всех предыдущих. О других способахорганизации повторений будет сказано чуть позже.Примером повторного выбора является изучаемая в курсе теориивероятностей последовательность симметричных испытаний Бернулли.Каждое испытание при этом следует понимать как выбор одного из двухисходов (скажем, одной из двух сторон монеты).
Испытания Бернуллипо определению независимы, так что выбор действительно являетсяповторным. Для статистики последовательность симметричныхиспытаний Бернулли неинтересна, т.к. изучаемая совокупность из двухобъектов ("герб"и "решка") очень проста и, собственно, изучать-тонечего1 . Повторный выбор обычно используется в тех ситуациях, когдаизучаемая совокупность действительно большая, а по относительнонебольшой выборке удается достаточно содержательным образом судитьо всей, как говорят иногда, "генеральной"совокупности.1Другое дело, что предположение симметричности может оказаться сомнительным — тогда егоследует проверять, а это уже типичная статистическая задача, к тому же, не вполне тривиальная.Основания статистики3Мынезаметноподошликобсуждениютрадиционнойстатистической терминологии, порожденной обсуждаемым примером.Последовательность выбираемых объектов называется (случайной)выборкой, в обсуждаемом случае повторного выбора — повторнойвыборкой, а вся совокупность объектов, из которой производитсявыбор — генеральной совокупностью.
Фактически же термин"выборка"относится к характеристикам выбранных объектов, т.е.к эмпирическим данным. Семантически мы трактуем, следуя [8],"выбор"как процесс, а "выборку"как результат этого процесса. Ванглийской терминологии выбор — это sampling, выборка — sample (random sample), а генеральная совокупность — population.
Вучебной литературе по общей статистике можно найти разъясненияи практические рекомендации по организации выбора в различныхреальных задачах (см., например, [5]). Мы упомянем лишь такназываемый "бесповторный"выбор, при котором ранее выбранныеобъекты не возвращаются в генеральную совокупность. Если объемвыборки пренебрежимо мал по сравнению с объемом всей генеральнойсовокупности, различиями между повторным и бесповторным выборомможно пренебречь.
Заметим также, что в более общих моделяхстатистических данных зависимые наблюдения (бесповторный выбор— простейший случай зависимости) широко распространены (см.,например, [20]).Подводя итог обсуждению модели простого случайного выбора, ещераз подчеркнем, что случайность в этой модели возникает извне, поволе исследователя, а понятие случайной величины нам, по существу, непотребовалось. Во многих социально-экономических задачах подобныеактивные эксперименты невозможны, а часто и само представление огенеральной совокупности становится крайне расплывчатым. Поэтомумы сейчас рассмотрим более общую и, как следствие, более абстрактнуюмодель случайности, приспособленную для описания значительноболее широкого круга явлений. В отличие от предыдущей, весьмапрагматичной, эта модель имеет в первую очередь концептуальныйхарактер.
Подобная тенденция типична для современных изложенийтеории вероятностей и математической статистики (см., например, [12],[1]). Мы, впрочем, не собираемся углубляться в сложные математическиеконструкции и постараемся обойтись необходимым минимумом.Удобно иметь в голове конкретный пример, достаточно сложный,чтобы мотивировать общность модели, и достаточно наглядный, чтобы4Глава 1его можно было обсуждать и на полубытовом уровне. Итак, рассмотримэволюцию обменного курса рубля к доллару, устанавливаемого в какомлибо конкретном финансовом учреждении, или эволюцию стоимостикакой-либо ценной бумаги на соответствующем финансовом рынке. Длянас существенным будет лишь то обстоятельство, что на формирование,скажем, завтрашнего курса или завтрашней стоимости оказываютвлияние столь многочисленные факторы, что ни перечислить, ни, темболее, учесть их оказывается невозможным.
Тем самым, завтрашнеезначение выбранной характеристики оказывается (сегодня) по меньшеймере не определимым. Принимаемая нами концепция в двух словахсостоит в том, что это завтрашнее значение можно трактоватькак случайное, а завтра нам станет известным реализовавшеесязначение этой случайной величины.Для более подробного и точного описания этой случайностимы постулируем (и это есть уточнение выбранной концепции),что изучаемое нами явление описывается некоторым множеством(часто говорят — пространством) элементарных событий (исходов)Ω, представляющих возможные варианты состояния изучаемого мира(например, финансового рынка). Эти элементарные исходы чащевсего непосредственно не наблюдаются (и именно поэтому нашпостулат является частью теоретической концепции), но некоторуюинформацию о состоянии изучаемого мира можно извлечь, отслеживая,происходят ли те или иные наблюдаемые события, или измеряя ту илииную наблюдаемую величину.
Стоит подчеркнуть, что элементарныйисход нужно понимать как нечто действительно не подлежащееуточнению, т.е. знание этого исхода (если бы оно было возможно)однозначно определяло бы все значения всех характеристик (прошлых,настоящих и будущих) изучаемого явления.На математическом уровне событие отождествляется с множествомблагоприятствующих ему элементарных исходов, т.е. с подмножествомпространства Ω. Запас событий определяется желанием ивозможностями исследователя приписывать им осмысленныевероятности. Практически всегда предполагается, что система событийявляется алгеброй множеств, т.е. объединение, пересечение и разностьсобытий снова являются событиями.
Более того, предполагается,что эта алгебра счетно-замкнута, т.е. пределы монотонныхпоследовательностей событий также являются событиями. Счетнозамкнутая алгебра множеств часто называется сигма-алгеброй (≡ σОснования статистики5-алгеброй). О вероятностях событий в статистических задачах будетсказано дальше.В большинстве своем обсуждаемые события связаны с определеннымихарактеристиками нашего явления.
Мы только что видели, что этихарактеристики являются функциями элементарного исхода, т.е.состояния изучаемого мира. Функции, определенные на пространствеэлементарных исходов Ω, называются случайными величинами. Темсамым, понятие случайной величины является органической частьюпринятой концепции.Сделаем еще несколько уточняющих замечаний о случайныхвеличинах и событиях.
Нам потребуются только числовые случайныевеличины, т.е. функции, принимающие значения в множествевещественных чисел R, и их многомерные варианты, иногда называемыеслучайными векторами. Точное математическое определение включаеттребование определенной согласованности между запасом событийи запасом случайных величин. Именно, случайными величинаминазываются измеримые функции на пространстве Ω. По определениюфункция X : Ω −→ R измерима, если для любого замкнутогопромежутка [a, b] ⊂ R прообраз этого промежутка относительноотображения X —X −1 ([a, b]) = {ω ∈ Ω : X(ω) ∈ [a, b]}является событием (более наглядно, но менее точно, это событиеможно обозначить {X ∈ [a, b]}).
С точки зрения пользователяэто требование выполняется почти автоматически, хотя возможныпатологические или казуистические контрпримеры. В подробных курсахтеории вероятностей доказывается, что в этом определении замкнутыепромежутки можно заменить открытыми или даже произвольнымиборелевскими множествами (последние нам не потребуются, такчто мы не даем точного определения). Можно доказать, чтоосновные арифметические операции над случайными величинами сновадают случайные величины (с обычной оговоркой о невозможностиделения на 0), а также что (поточечный) предел последовательностислучайных величин снова является случайной величиной.
С точкизрения пользователя эти свойства являются, конечно, сами собойразумеющимися.Важное преимущество трактовки случайных величин как функцийс общей областью определения Ω заключается в том, что совместное6Глава 1их рассмотрение (например, обсуждение их совместных распределенийвероятностей — см. следующий параграф и [12]) не создает никакихпроблем. Так, мы можем две числовые случайные величины X1 иX2 "склеить"в случайный вектор X = (X1 , X2 ). При этом события{Xi ∈ [ai , bi ]}, i = 1, 2 автоматически породят событие, относящееся кслучайному вектору X:{X ∈ [a1 , b1 ] × [a2 , b2 ]} = {X1 ∈ [a1 , b1 ], X2 ∈ [a2 , b2 ]}= {X1 ∈ [a1 , b1 ]} ∩ {X2 ∈ [a2 , b2 ]}.Сейчас самое время обратить внимание читателя на запятую в центресреднего выражения.
По общепринятому соглашению она понимаетсякак знак пересечения (или, что, по существу, то же самое, как логическаясвязка "И") — ср. с последним выражением. Подобное использованиезапятой будет часто встречаться в следующих разделах.Ванглоязычнойлитературетермину"случайнаявеличина"соответствует "random variable". Здесь мы сталкиваемсяс некоторым расхождением в терминологии, причем русскийвариант выглядит более предпочтительным. Вообще, термином"переменная"злоупотреблять не стоит, поскольку он вызываетвесьма расплывчатые догадки и, возможно, вопросы о причинах"переменности"этой величины — "кто и как ее меняет"(а термин"величина"возник у нас, между прочим, как бы сам собой!).