85765 (597825), страница 4
Текст из файла (страница 4)
Функцію (t) називають нормованою функцією Лапласа або інтегралом імовірностей.
РОЗДІЛ 3. СИСТЕМИ ВИПАДКОВИХ ВЕЛИЧИН. ГРАНИЧНІ ТЕОРЕМИ ТЕОРІЇ ЙМОВІРНОСТЕЙ
1. Поняття та закон розподілу системи випадкових величин
До цього часу ми розглядали одномірну випадкову величину X. Однак в сучасній теорії математичної обробки результатів багаторазових повторних геодезичних вимірювань використовують багатомірні випадкові величини. Багатомірна випадкова величина може складатися із декількох компонентів і бути двомірною, тримірною і так далі. Так, наприклад, координати точки на площині визначаються двома випадковими величинами: абсцисою X та ординатою У; положення точки в просторі визначається вже трьома координатами - X, Y та висотою Н.
Сумісна дія двох чи більше випадкових величин приводить до системи випадкових величин. Умовимось систему декількох випадкових величин X, У, ..., N позначати (X, У, ..., N). При вивченні системи випадкових величин визначають характеристики як кожної випадкової величини, так і зв'язки та залежність між ними. А це вже більш складні задачі.
Домовимось, що систему двох випадкових величин (Х, У) ми будемо розглядати як випадкову точку на площині х0у з координатами X і У, або як випадковий вектор на площині з випадковими складовими X i У. Систему трьох випадкових величин (X, У, Z) - як випадкову точку в тримірному просторі або, як випадковий вектор в просторі. За аналогією, систему n -випадкових величин (X, У, ..., N) розглядають як випадкову точку в n-мірному просторі або, як n-мірний випадковий вектор.
Законом розподілу системи випадкових величин називають співвідношення, що встановлює зв'язок між областями можливих значень системи випадкових величин і ймовірностями появи їх в цих областях.
Закон розподілу системи випадкових величин можна задавати в різних формах. Покажемо табличний спосіб розподілу системи дискретних випадкових величин.
Якщо X та У - дискретні випадкові величини, значення яких дорівнюють (ХbУj), де і = , а j = (
), то їх розподіл системи можна характеризувати ймовірностями рij = Р(Х = х1; Y = y1. Це означає, що коли випадкова величина X приймає значення х1 одночасно і величина Y прийме значення уj
Всі можливі події (X = xі, Y = yj) і = , а j = (
) складають повну групу несумісних подій і тому
2. Система двох випадкових величин
В практиці геодезичних вимірів досить часто взаємодіють дві випадкові величини X та У, тобто двомірні випадкові величини. В попередньому параграфі ми наводили приклад з координатами точки. При лінійних вимірах взаємодіють - довжина мірного приладу та температура. При дослідженнях деформацій інженерних споруд взаємодіють — величина осідання та інтервал часу і так далі.
Закон розподілу системи двох випадкових величин задають функцією розподілу та щільністю розподілу.
Функцією розподілу системи двох випадкових величин називають функцію двох аргументів F (х,у), що дорівнює ймовірності сумісного виконання двох нерівностей Х<х і У < у, тобто
F(x,y) = P (X Геометричне функцією розподілу системи двох випадкових величин є ймовірність попадання випадкової точки (Х,У) в нескінченний квадрат площини з вершиною в точці (х,у). Функція розподілу має такі властивості: 1. Якщо один із аргументів наближається до плюс нескінченності, то функція розподілу системи наближається до функції розподілу випадкової величини другого аргументу, тобто 2. При наближенні обох аргументів до плюс нескінченності функція розподілу F (х,у) наближається до одиниці: 3. При наближенні одного чи обох аргументів до мінус нескінченності функція розподілу наближається до нуля: Практичне значення мають системи неперервних випадкових величин, розподіл яких характеризують щільністю розподілу Щільність розподілу системи двох випадкових неперервних величин визначають як другу змішану часткову похідну від функції F(х,у), тобто Функція розподілу F(х,у) визначається за формулою Щільність розподілу системи двох випадкових величин має властивості: 1. Щільністю розподілу є функція 2. Подвійний інтеграл з нескінченними межами від функції щільності розподілу дорівнює одиниці: Геометрично це свідчить про те, що об'єм тіла, відмежованого поверхнею розподілу і площиною х0у, дорівнює одиниці. Щільності розподілу величин х та у, що входять в систему, визначають за формулами: Тобто, для визначення щільності розподілу однієї із системи випадкових величин, треба проінтегрувати в необмежених межах щільність розподілу системи Якщо відомі щільності розподілу окремих випадкових величин системи і випадкові величини х та у незалежні між собою, то можна визначити закон їх сумісного розподілу за формулою Поняття залежності та незалежності випадкових величин має велике значення в теорії ймовірностей та при математичній обробці результатів вимірів. Випадкова величина X буде незалежною від випадкової величини У, якщо закон розподілу величини X не залежить від прийнятого значення величини У, тобто і навпаки, для випадкової величини Y маємо Якщо вони взаємно залежні між собою, то Випадкові величини Х і У незалежні, якщо щільність сумісного розподілу Додамо, що при розкладанні, функції Між випадковими величинами виникає функціональна або стохастнчна (ймовірна) залежність. Функціональною залежністю між випадковими величинами X і У називають таку залежність, коли кожному значенню X відповідає точне значення У. Стохастичною (ймовірною) залежністю між випадковими величинами X і У називають таку залежність, при якій кожному значенню х можна вказати розподіл величини у, яке змінюється при зміні х. Така залежність в практичній діяльності зустрічається досить часто. Наприклад, зріст та вага людини, висота і товщина дерева в лісі, величина деформації інженерних споруд, час їх експлуатації і т.д. Тобто у випадку ймовірної залежності на кожне точне значення аргументу х можна вказати значення випадкової величини у з певною мірою ймовірності (Ру). Система двох випадкових величин може підкорятися різним законам розподілу. Проте в практиці геодезичних вимірювань найбільше розповсюдження має нормальний закон розподілу. 3. Числові характеристики системи двох випадкових величин. Кореляційний момент, коефіцієнт кореляції і рівняння регресії Найбільш повними ймовірними характеристиками системи двох випадкових величин є закон розподілу. Однак в практичній діяльності не завжди є можливість визначити його. Тому при дослідженнях систему двох випадкових величин характеризують їх числовими характеристиками: початковими та центральними моментами. Початковим моментом Для системи дискретних випадкових величин Між випадковими величинами X і У може виникати зв'язок. Кореляційний момент Х і Y характеризує силу або щільність зв'язку. Відомо, якщо між випадковими величинами існує ймовірний зв'язок (залежність), то зі зміною випадкової величини X змінюється закон розподілу випадкової величини У. В той же час закон розподілу задають кривою розподілу у = Кореляційну залежність часто називають кореляцією. Кореляційний момент має розмірність, яка залежить від розмірності випадкових величин X і У. Тому для оцінки сили зв'язку між випадковими величинами системи (X, У) використовують не коефіцієнт зв'язку Кху, а безрозмірне відношення яке називають коефіцієнтом кореляції випадкових величин Х і У. Коефіцієнт кореляції змінюється в межах від -1 до +1, тобто Якщо r > 0, то маємо позитивну кореляцію, тобто із збільшенням абсциси х, збільшується величина ординати у і навпаки при r < 0 . Якщо випадкові величини X і Y незалежні, то кореляційний момент і коефіцієнт кореляції дорівнює нулю, тобто Кху = 0 і rxy = 0. Дві корельовані випадкові величини завжди є взаємозалежними, але дві залежні величини не завжди є корельованими. Прикладом цього може бути система випадкових величин (X, Y) рівномірно розподілена в межах кола з центром на початку координат. Розрахунки показують, що величини X і У залежні, а кореляційний момент Кxу = 0, а це означає, що і rxy = 0. Випадкові величини X і У називають корельованими, якщо ГЛАВА II. ЕЛЕМЕНТИ МАТЕМАТИЧНОЇ СТАТИСТИКИ. СТАТИСТИЧНА ОЦІНКА ПАРАМЕТРІВ РОЗПОДІЛУ 1. Основні поняття і задачі математичної статистики. Генеральна сукупність та вибірка Математична статистика - дисципліна, яка займається регістрацією, збором, описом і аналізом експериментальних даних з метою вивчення закономірностей масових випадкових явищ. Таким чином, всі задачі математичної статистики зводяться до визначення методів обробки результатів експериментальних досліджень (спостережень) масових випадкових явищ. Найбільш типовими задачами математичної статистики є: 1. Оцінка невідомої функції розподілу за результатами вимірів. Якщо за результатами досліджень випадкової величини X одержано значення x1, x2, … xn то необхідно приблизно оцінити невідому функцію розподілу Р(х). 2. Оцінка точності невідомих параметрів розподілу. При вирішенні цього питання обчислюють параметри функції розподілу випадкової величини на основі отриманих результатів експерименту і оцінюють їх значення. 3. Статистична перевірка гіпотез. Якщо за результатами експерименту визначено функцію розподілу Р(х) випадкової величини X, то вирішується питання: чи дійсно випадкова величина X має розподіл Р(х) ? При дослідженнях випадкових явищ виконують досить велику кількість випробувань (експериментів) - N. Генеральна сукупність - це сукупність значень результатів досліджень (вимірів). Досить часто мають на увазі, що число N може бути нескінченним. Проте практично виконати нескінченну кількість дослідів (вимірів) або обстежити нескінченну кількість виробів неможливо, і економічно невигідно. В цьому випадку із всієї генеральної сукупності відбирають обмежене число результатів експерименту. Вибірковою сукупністю або просто вибіркою називають сукупність випадково вибраних результатів чи об'єктів. Проте вибірка може як досить точно характеризувати досліджуване випадкове явище, так і ні. Представницькою або презентабельною вибірковою називають об'єм вибірки n із генеральної сукупності N, який дозволяє повною мірою визначити характеристики генеральної сукупності. Інформація буде більш імовірною, коли результати досліджень, що складають вибірку, будуть незалежними. 2. Розподіл статистичних рядів Практично, до початку досліджень випадкового явища, заздалегідь невідомо, якому закону розподілу будуть підпорядковуватися результати експерименту. Для його визначення над випадковою величиною X виконують низку незалежних експериментів (вимірів). Статистична таблиця є початковою формою запису статистичного матеріалу, який може оброблятися різними методами. Однак при великій кількості експериментів (вимірів) їх результати практично неможливо показати в статистичній таблиці. Тоді результати спостережень розділяють на групи. Кожна група містить деяку кількість (частоту) результатів, що належать визначеному інтервалу. Довжина інтервалу розраховується за формулою Г.А.Стерджеса де n - кількість результатів спостережень. Можна задати число інтервалів k. Тоді довжину інтервалу визначають за формулою Значення інтервалу l заокруглюють до зручного цілого значення так, щоб число їх було в межах П для 1-ої групи для 2-ої групи для k-ої групи де Для кожної групи підраховують частоту результатів Vi, які попадають в граничні значення причому V1 + V2 + ...+ Уk = n; р1 + р2+... + рk = 1. За допомогою статистичної таблиці або статистичної сукупності можна побудувати статистичну функцію розподілу випадкової величини X. 3. Оцінювання параметрів закону розподілу Відомо, що випадкова величина X характеризується законом розподілу, що має деякі невідомі параметри a(a1, a2, …, аk). Якщо в результаті виконаного експерименту нами отримано статистичний ряд Х1, Х2, ..., Х3 то очевидно можна знайти надійну оцінку параметра а. Припустимо, що на основі обробки статистичного ряду отримано параметра, який буде оцінкою невідомого параметра Таким чином і обчислений параметр а буде випадковою величиною, закон розподілу якого залежить від закону розподілу випадкової величини X і від числа експериментів n. При цьому оцінка а буде мати практичну цінність, якщо володіє властивостями: 1 . Незміщеності. При цьому повинна виконуватися умова де а - істинне значення параметра. 2. Обгрунтованості. Тобто за ймовірністю вона зводиться до оцінюваного параметра при нескінченному збільшенні кількості дослідів, тобто де 3. Ефективності. Це означає, що дисперсія оцінки а повинна бути мінімальною, тобто При цьому буде мінімальна ймовірність появи грубої помилки при визначенні наближеного значення невідомого параметра. Таким чином при розробці методів обробки статистичних даних для визначення оцінок наближених значень невідомих параметрів треба виходити з їх властивостей. Оцінки параметрів закону розподілу, що відповідають всім трьом властивостям називають доброякісними.
або
(х, у). За допомогою неї більш просто знаходять імовірність попадання в різні області, а опис розподілу системи випадкових величин стає більш наочним.
(х,у) за аргументом другої випадкової величини.
;
(х,у) можна визначити у вигляді добутку двох множників, кожен із яких утримує тільки величини х та у, тобто
,
(у) з точністю до постійної множників збігаються з щільностями розподілу
1(х) і
2(у).
порядку s, q системи (X, У) називається математичне сподівання від добутка Xs на Y9.
. Характер кривих може бути різним, тому і відрізняють декілька типів імовірної залежності. Одним із найбільш розповсюджених типів є кореляційна залежність, за якої заміна аргументу х призводить до зміни математичного сподівання величини у. В першому випадку ми маємо прямолінійну кореляцію. При дослідженнях можуть виникнути й інші типи кореляційної залежності.
,
i при
- некорельованими.
.
отім визначають граничні значення інтервалів за формулами
,
- відповідно початкове та кінцеве значення абсциси х (результатів вимірів).
і
, і статистичну ймовірність
за формулою
,
. Разом з тим, він буде функцією від випадкових величин Х1, Х2, ..., Х3 тобто
- як завгодно мале позитивне число.