В.И.Тихонов Статистическая радиотехника (2-е издание, 1982) (1092037), страница 83
Текст из файла (страница 83)
Требуется оценить неизвестную функцию распределения Р (х) случайной величины $ или ее плотность вероятности р (х), если $ — непрерывная случайная величина. Эту задачу можно распространить на многомерные функции распределения и плотности вероятности. 427 Таким образом, в результате преобразования (34) плотность вероятности Коши с параметром а переходит в плотность вероятности Коши с параметром (ори, т. е.
плотность вероятности Коши замкнута относительно преобразования (34). Оценка неизвестных параметров закона распределения. Пусть на основании физических или общетеоретических соображений можно заключить, что случайная величина $ имеет функцию распределения определенного вида, зависящую от нескольких параметров, значения которых неизвестны. На основании наблюдений величины $ нужно оценить значения этих параметров.
Задачу оценки параметров и характеристик случайного процесса можно ставить вне связи с функцией распределения. Например, требуется оценить математическое ожидание, дисперсию или моменты случайной величины К амплитуду, частоту или фазу радиоимпульса, наблюдаемого на фоне шума; корреляционную функцию или спектр стационарного случайного процесса и т.
д. Статистическая проверка гипотез. Обычно эта задача формулируется следующим образом. Пусть на основании некоторых соображений можно считать, что функция распределения исследуемой случайной величины $ есть г(х). Спрашивается, совместимы ли наблюденные значения с гипотезой, что случайная величина $ действительно имеет распределение г(х). Для наших целей этой задаче можно придать несколько другую формулировку. Пусть наблюдаемые значения случайной величины порождаются двумя или несколькими различными событиями (гипотезами). В результате наблюдения случайной величины $ нужно решить, какой из гипотез порождены полученные значения величины $.
Для конкретизации приведем следующий пример. Пусть на вход радиоприемного устройства поступает случайное колебание $ (г), которое в каждый момент времени является либо суммой сигнала з (г) и помехи и (Г) (гипотеза Н,), либо одной помехи и (г) (гипотеза Не).
В некоторый фиксированный момент времени произведено измерение величины $. По полученному числовому значению х нужно решить наилучшим образом, присутствовал ли на входе сигнал е (1), т. е. выбрать одну из двух гипотез Н,: х =- з + и или Н,: х = и. Из определения и смысла основных понятий теории вероятностей следуют и методы их определения по экспериментальным результатам. Так, за вероятность события можно принять его относительную частоту при очень большом числе опытов, за математическое ожидание случайной величины — ее среднее арифметическое значение и т. д.
Однако число опытов или измерений практически всегда ограничено, причем результаты опытов случайны. Ввиду этого в математической статистике говорят о подходящих оценках интересующих величин. Все характеристики (параметры), подлежащие определению по результатам опытов или измерений., принято называть статистическими характеристиками (параметрами), .а любая функция результатов опытов, которая может быть принята за подходящее значение неизвестной статистической характеристики (параметра), называется оценкой етой статистической характеристики (параметра).
Разработка методов нахождения оценок и исследования точности их приближения к неизвестным статистическим характеристикам (параметрам) составляет содержание одного из важнейших разделов математической статистики. Примеры приведены ниже. 428 Отметим, что при практическом определении статистических характеристик можно различать два случая: 1) имеются зарегистрированные (уже собранные) данные о значениях случайной величины или реализации (записи) случайных процессов; 2) в распоряжении исследователя имеется непосредственно исходное явление или процесс и его можно многократно повторить при интересующих условиях. Хотя математические правила (алгоритмы) нахождения оценок тех или иных статистических характеристик в обоих случаях являются общими, однако практически они часто определяются по-разному: в первом случае с помощью вычислений, а во втором — соответствующей измерительной аппаратурой. В математической статистике результаты каких-либо однородных наблюдений (чаще всего независимых) принято называть выборкой.
В некоторых случаях принципиально можно осуществить сколь угодно большое число наблюдений (например, при измерении дальности до неподвижной цели или при измерении ее угловых координат). Однако практически всегда ограничиваются конечным числом наблюдений. Прн этом фактически полученные результаты можно считать выборкой из бесконечного множества возможных результатов, называемых генеральной совокупностью.
Для решения практических задач нужна не сама генеральная совокупность, а лишь те нли иные характеристики, которые ставятся ей в соответствие. Статистическое наблюдение, при котором исследованию подвергают не все элементы генеральной совокупности, а только некоторую, определенным образом отобранную часть, называется выборочным наблюдением. Отобранная часть элементов совокупности (выборка) будет представлять всю совокупность с приемлемой точностью при выполнении двух условий: 1) она должна быть достаточно представительной (многочисленной), чтобы в ней могли проявиться закономерности, существующие в генеральной совокупности, и 2) элементы выборки должны быть отобраны объективно, так, чтобы каждый из них имел одинаковые шансы быть отобранным.
Согласно теории вероятностей выборка будет правильно отражать свойства всей совокупности, если выбор производится случайно, т.е. так, что любая из возможных выборок заданного объема и из совокупности объема йГ (число таких выборок равно А'!!и! (Л! — и) !) имеет одинаковую вероятность быть фактически выбранной. На практике наиболее часто используется выбор без возвращения (бееповторная выборка), когда каждый отобранный объект перед выбором следующего объекта в исследуемую совокупность не возвращается (такой выбор применяется, например, при статистическом контроле качества). Статистический метод исследования общих свойств совокупности каких-либо объектов на основе изучения свойств лишь части этих объектов, взятых на выборку, называется выборочным методом.
Свойства совокупности, исследуемые выборочным методом, могут быть качественными и количественными. Примером первого типа может служить задача определения количества М объектов совокупности, обладающих каким-либо признаком (например, при статистичес- 429 Таблица 4.1 Результаты измерений — 20! — 15 — 1О; — 5 — !5: — !О Ошибка (акь!. м — 5;О О:5 5'1О 1О; 15 15; 20 Число ошибок в интервале пь Относительная частота я~а Относительная плотность ра, 1!м 6 0,06 24 26 13 0,24 0,26 0,13 0,048 0,052 0,026 8 17 0,08 0,17 4 0,04 2 0,02 0,0!2 0,008 0,004 0,016 0,034 *Если при группировке наблюдений имеется значение, которое лежит точно на границе двух интервалов, то к соответствующим числам одного интервала следует прибавить 1/2. 430 ком контроле часто интересуются количеством М дефектных изделий в партии объема Л1). В случае количественного признака обычно имеют дело с определением различных средних значений совокупности, например среднего значения совокупности т1 = (х, + х, + ...
+ х„)1п, где х„х„..., х„— те значения из исследуемой совокупности, которые принадлежат выборке. С математической точки зрения первый случай обычно можно рассматривать как частну1о разновидность второго, если принять М величин х„равными единице, а остальные Лг — М равными нулю.
Если изучению подлежит какой-либо количественный признак, то его статистические характеристики по выборке из и объектов можно найти, перечислив непосредственно наблюденные значения признака: х„х„..., х,. Если все х, расположены в порядке возрастания их величины, т. е. х, ( х, < ... < х„, то полученная возрастающая последовательность называется вариаг4ионнылг рядом, число и — объемом вь1борки, х, — наименыиим (нижним) значением, х„— наибольшим (верхним) значением, а разность х„— х! — размахом или широтой вь!борки.
Однако при больших и (порядка сотен) такой способ громоздок и в то же время не выявляет существенных свойств статистического распределения. При больших и на практике обычно не составляют полных таблиц всех наблюденных значений хг, а прибегают к группировке наблюденных значений по надлежаще выбранным неперекрывающимся интервалам (разрядам) Лх„Лх„..., Лх„. Часто все интервалы Лхь берут одинаковыми. После того как интервалы Лхь выбраны, подсчитывают число наблюдений п„попавших в интервал Лха. По значениям пь подсчитывают соответствующие относительные частоты (частости) г тл = п„1п, удовлетворяющие, очевидно, соотношению ~~'.р4 = 1. Поз=! лученные данные заносят в таблицу, в которой указывают интервалы Лхь и соответствующие относительные частоты.
В качестве примера в табл 4.1 приведены ошибки 100 результатов измерений дальности до цели радиодальномером, когда Ах взято равным 5 м. В рамках математической статистики вопрос об интервалах группировки может быть рассмотрен только с формальной стороны: полноты математического описания распределения, точности вычисления средних значений по сгруппированным данным и т.
д. Обычно группировка по10 — 20 интервалам, в каждый из которых попадает неболее 15 — 2004 значений х;, оказывается достаточной для довольно полного выявления всех существенных свойств распределения и надежного вычисления по группированным данным основных характеристик распределения (см. также с. 435). 4аь ОЦЕНКА ЗАКОНА РАСПРЕДЕЛЕНИЯ Чтобы получить представление о распределении наблюдений, поступают следующим образом.
Область экспериментальных значений случайной величины разбивают на г обычно одинаковых интервалов длины Ах и вычисляют относительную плотность точек в каждом интервале (отпошение частоты попадания в этот интервал к его длине Ах): ~1 ль р1 —.. — = —, Й=!,2,..., г, Ах ллх (4.2.1) где иь — число экспериментальных точек в й-м интервале. Подсчитанные таким образом значения можно представить графически в виде ступенчатой кривой: по оси абсцисс откладывают соответствующие интервалы и на каждом из них, как на основании, строится прямоугольник, высота которого равна относительной плотности р1. Полученная ступенчатая кривая называется гистограммой.