Теория вероятности. Вентцель Е.С (4-е издание) (1082431), страница 25
Текст из файла (страница 25)
д. При очень большом количестве опытов вычисление хзрактеристик по формулам (7.4.1) — (7.4.5) становится чрезмерно громоздким, и можно применить следующий прием: воспользоватьса теми же разрядами, на которые был расклассифицнрован статистический материал для построения статистического ряда или гистограммы, и считать приближенно значение случайной величины в каждом разряде постоянным и равным среднему значению, которое выступает в роли «представителя» разряда.
Тогда статистические числовые характе- ристики будут выражаться приближенными формулами: гик= М (Х) = ~~'.~~ х1р,*, 1=! А !Г), =1) [Х( = ~ (хг — т))! р,', (7.4,9) А р,*(Х) =,),'! (х1 — »1*„)' р*н (7.4,10) (7 4.8) где х, — «представитель» Г-го разряда, р,' — частота Г-го разряда, й — число разрядов. Как видно, формулы (7.4.7) — (7.4.10) полностью аналогичны формулан и'и' 5.5 и 5.7, опред ля!Он!!!ч математическое ожчаанне, дисперсию, начальные и центральные моменты прерывной случайной Соотношения между центральными и начальными моментами также сохраняются: и ~ (х! — т„) к ° Ра = А)к = П 142 .- законы гхсппвдялвння слкчхпных вплмчнн 1гл, т величины Л, с той только разницей, что вместо вероятностей р, в них стоят частоты о",, вместо математического ожидания и„— статистическое среднее ш„, вместо числа возможных значений случайной величины — число разрядов.
В большинстве руководств по теории вероятностей н матемзтической статистике приуассмотрении вопроса о статистических аналогиях для характеристик случаиных величин применяется терминология, несколько отличная от принятой в настоящей книге, а именно, статистическое среднее именуется «выборочным средним», статистическая дисперсия — «выборочной дисперсией» и т. д. Происхождение этих терминов следующее. В статистике, особенно сельскохозяйственной и биологической, часто приходится исследовать распределение того или иного признака для весьма большой совокупности индивидуумов, образующих статистический коллектив (таким признаком может быть, например, содержание белка в зерне пшеницы, вес того же зерна, длина или вес тела какого-либо из группы животных и т.
д.). Данный признак является случайной величиной, значение которой от индивидуума к индивидууму меняется. Однако, для того, чтобы составить представление о распределении этой случайной величины или о ее важнейших характеристиках, нет необходимости обследовать каждый индивидуум данной обширной совокупности; можно обследовать некоторую в ы б о р ну достаточно большого объемз дли того, чтобы в ней были выявлены существенные черты изучаемого распределения. Та обширная совокупиостгь из которой производится выборка, носит в статистике название генеральной созокулиости.
При атом предполагается, что число членов (индивидуумов) ДГ в генераяьиой совокупности весьма велико, а число членов и в выборке ограничено. При достаточно большом Ю оказывается, что свойства выборочных (статистических) распределений и характеристик практически не зависят от дг; отсюда естественно вытекает математическая идеализация, состоящая в том, что генеральная совокупность, из которой осуществляется выбор, имеет бесконечный объем.
Прн этом отличают точные характеристики (закон распределения, математическое ожидание, дисперсию и т, д.), относящиеся к генеральной совокупности, от аналогичных им «выборочных» характеристик. Выборочные характеристики отличаются от соответствующих характеристик генеральной совокупности за счет ограниченности объема выборки и; при неограниченном увеличении л, естественно, все выборочные характеристики приближаюгся (сходятся по вероятности) к соответствующим характеристикам генеральной совокупности. Часто возникает вопрос о том, каков должен быть объем выборки л для того, чтобы по выборочным характеристикам можно было с достаточной точностью судить о неизвестных характеристиках генеральной совокупности илн о том, с какой степенью точности при заданном объеме выборки можно судить о характеристиках генеральной совокупности.
Такой мез отическвй ирнсм, состоящий и параллельном рассмотрении бесконечной генеральной совокупности, нз которой осуществляется выбор, и ограниченной по объему выборки, является совершенно естественным в зел областях статистики, где фактически приходится осуществлять выбор из весьма многочисленных совокупностей индивидуумов. Для практических задач, связанных с вопросами стрельбы и вооружения, гораздо более характерно другое положение, когда нзд исследуемой случайной величиной (или системой случайных вель«ии) производится ограниченное число оп.,тов с целью ойределить те или иные характеристики втой величины, иа. 1 имер, когда с целью исследования закона рассеивания при стрельбе производится некоторое количество выстрелов, или с целью исследования ошибки наводки производится серн опытоз, в каждом из которых ошибка наводки регистрируется с помощью фотопулемета, и т.
д. При этом ограни- (4З ВЫРАВНИВАНИЕ СТАТИСТИЧЕСКИХ РЯДОВ ценное число опытов связано не с трудностью регистрации н обработки, а со сложностью и дороговизной каждого отдельного опыта. В этом случае с известной натяжкой можно также произведенные л опытов мысленно рассматривать как «выборку» из некоторой чисто условной «генеральной совокупности», состоящей из бесконечного числа возможных или мыслимых опытов, которые можно было бы произвести в данных условиях.
Однако искусственное введение такой гипотетической «генеральиой совокупности» Вра данной постановке вопроса не вызвано необходимостью и вносит в рассмотрение вопроса, по существу, излишний влечент идеализации, ие вытекающий из непосредственной реальности задачи. Поэтому мы в данном курсе не пользуемся терминами «выборочное среднее», «выборочная дисперсия», «выборочные характеристики» и т. д., заменяя их терминами «статистическое среднее», «статистическая дисперсия», «статистические характеристики». 7.6. Выравнивание статистических рядов Во всяком статистическом распределении неизбежно присутствуют элементы случайности, связанные с тем, что число наблюдений ограничено, что произведены именно те, а не другие опыты, давшие именно те, а не другие результаты. Только при очень большом числе набл|одений зти элементы случайности сглаживаются, н случайное явление обнаруживает в полной мере присущую ему закономерность.
На практике мы почти никогда не имеем дела с таким большим числом наблюдений и вынуждены считаться с тем, что любому ста- тистическому распределению свойственны в большей илн меньшей. мере черты случайности. Поэтому при обработке статистического материала часто приходится решать вопрос о том, как подобрать для данного статистического ряда теоретическую кривую распределения, выражающую лишь существенные черты статистического материала, но не случайности, связанные с недостаточным объемом эксперимен- тальных данных. Такая задача называется задачей аыразнлваниа (сглаживания) статистических рядов, Задача выравнивания заключается в том, чтобы подобрать теоре- тическую плавную кривую распределения, с той или иной точки зрения наилучшим образом описывающую данное статистическое рас- пределение (рис. 7.5.!).
З.тю,а о паплучшеч вырззппззиин статнстпчсскчх рядов, кщ: и вообще задача о наилучшем аналитическом представлении эмпири- ческих функций, есть задача в значительной мере неопределенная,, и решение ее зависит от того, чтб условиться считать «наилучшим». Например, при сглаживании эмпирических ззвисимостей очень чзсто исходят из так называемого принципа или метода наименьших квадратов (см.
и- 14,О), считая, что наилучшим приближением к эмпи- Рической зависимости в данном классе функций является такое, при котором сумма квадратов отклонений обращается в минимум. При этом ьоирос о том, в каком именно классе функций следует искать наи- лучшее приближение, решается уже не из математических сообра- 144 3АкОны РАспРеделения случАйных величин 1гл. т жсний, а из соображений, связанных с физикой решаемой задачи, с учетом характера полученной эмпирической кривой и степени точности произведенных наблюдений. Часто принципиальный характер функции, выражающей исследуемую зависимость, известен заранее из теоретических соображений.
из опыта же требуется получить лишь некоторые численные параметры, входящие в выражение функции; именно вти параметры подбираются с помощью метода наименьших квадратов. Аналогично обстоит дело и с задачей выравнивания статистических рядов. Как правило, принципиальный вид теоретической кривой выбирается заранее из соображений, связанных с существом задачи, Ряс. 7.5.1, а в некоторых случаях просто с внешним видом статистическогО распределения, Аналитическое выражение выбранной кривой распределения аависит от некоторых параметров; задача выравнивания статистического ряда переходит в задачу рационального выбора тех значений параметров, при которых соответствие между статистическим и теоретическим распределениями оказывается наилучшим.
Предположим, например, что исследуемая величина Х есть ошибка измерения, возникающая в результате суммирования возяействнй кноизесзза независимых злсмен~зрпых ьщ 1бок; то~да нз теоретических соображений можно считать, что величина Х подчиняется нормальному закону: (7,5.1) и задача выравнивания перехолит в аадачу о рациональном выборе параметров лг н а в выражении (7.5.1). Бывают случаи, когла заранее известно, что яелнчщш Х распре- деляется статистически приблизительно равномерно на некотором 145 ВЫРАВНИВАНИЕ СТАТИСТИЧЕСКИХ РЯДОВ интервале; тогда можно поставить задачу о рациональном выборе параметров того закона равномерной плотности — при а е. х е. р, 1 7(х) = О при х<я илн х)Р, которым можно наилучшим образом заменить (выровнять) заданное статистическое распределение.
Следует при этом иметь в виду, что любая аналитическая функ- ция 7"(х). с помощью которой выравнивается статистическое распределение, должна обладать основными свойствами плотности распределения: 7'(х) )~ О; (7.5.2) / У(х) р7х=1. еь Предположим, что, исходя из тех или нных соображений, нами выбрана функция 7 (х), удовлетворяющая условиям (7.5.2), с помощью которой мы хотим выровнять данное статистическое распределение; в выражение этой функции входит несколько параметров а, Ь, ...; требуется подобрать эти параметры так, чтобы функция 7'(х) наилучшим образом описывала данный статистический материал. Один нз методов, применяемых для решения этой аздачи.— это так называемый мвтод моменвров.