Астрономический календарь. Постоянная часть (1981) (1246623), страница 116
Текст из файла (страница 116)
Вся область изменения и делится на равные интервалы, число которых подбирается в зависимости от количества наблюдений. Чаще всего берут от 10 до 20 интервалов. Границы интервалов и значения и, соответствующие серединам интервалов, нужно брать так, чтобы в них было мало значащих цифр; особенно вто существенно в серединах интервалов. 542 Совершенно такую же работу нужно выполнить с областью значений второй величины в. После зтого построим сетку прямоугольных координат, проводя координатные линии через границы интервалов.
Прямоугольная область возможных значений а и и разобьется на прямоугольные ячейки. Их число равно проивведеяию чясла интервалов области значений а на число интервалов области о. Если яоследнне числа порядка десяти, то число ячеек будет порядка сотни, Каждой ячейке соответствуют некоторые интервалы и и о. Подсчитаем количество обьектов, попадакицих в каждую ячейку, т.
е.' имеющих и и о в границах, соответствующих ячейке. Запишем в таблицу результаты подсчета. В результате получится таблица такого вида, который в примере занимает центральную часть вычислительной схемы, ограниченную снизу и справа жирными линиями (см. с. 548), В виде заголовков наверху и слева у середин ячеек етавятоя значения и и о в серединах соответствующих интервалов.
Справа таблица дополняется столбцом, содержащим суммы чисел в гбизонтальных полосах, что дает распределение величины 6. низу добавляетея горизонтальная полоса, в которой даютйз буммы чисел, стоящих в столбцах таблицы; вта полоса содержит распределение одной величины и (прн всех о). Сумма чисел в присоединенном столбце должна равняться сумме чисел в добавленной полосе, что используется для контроля подсчетов. Расширенная корреляционная таблица содержит н распределение совокупности величин в основной части и (на краях внизу и справа) распределения каждой из величин в отдельности. Хотя.для вычислений нужны эмпирические вероятности, но их на практике не определяют, все вычисления производят над численностями, а де.
ления на общее число случаев выполняют в конце. Существенно отметить, что вся обработка ведется при следующем упрощении: число объектов в ячейке принимается за число случаев, когда и имело среднее значение интервала по и (аналогично н для о). Для записи в п. 111, 3 рабочих формул будем пользоваться следующими обозначениями: и — общее число наблюдений; о — число интервалов величины и, их номера от 1 до о; з — число э э о, » э от1доз; пм — число объектов, попавших в й-й интервал по и и, вместе а тем, в 1-й интервал по о; иэ — значение и в середине и-го интервала; У~ э О э э 1-го э; а Е ям =лэ~ — численность в распределении одной величины э ! и при о=и„ ~„ и„ лээ — численность в распределении одной величины 1-1 и при и = иэ.
б43 ,2. Введение условных 'единиц измерен и я. Вычисления заметно упрощаются, если для каждой из величин ввести начало отсчета и масштаб так, чтобы получить в новых единицах числа с малым количеством значащих цифр, За новое начало отсчета величины и, которое мы назовем условным нулем, примем значение и в середине того интервала, в который попадет среднее значение и. По большей части зто тот интервал, в котором численность наибольшая, если по обе стороны примерно одинаковое число случаев, т. е.
нет заметной асимметрии в распределении одной величины и, которое находится в дополнительной нижней строке. При наличии заметной асимметрии условный нуль берется в середине соседнего интервала в той стороне, где численность больше. Неудачный выбор условного нуля не влияет на результаты, но несколько усложняет вычисления.
После выбора места условного нуля шаг величины и, т. е. длина интервала величины и, принимается за единицу. С величиной о поступаем точно так же. Рассматривается дополнительный столбец справа, содержащий распределение величины о, отмечается середина того интервала, в котором число объектов наибольшее. Это значение и принимается за условный нуль, если нет заметной асимметрии в численностях по обе стороны от указанного интервала. Масштаб величины о тоже изменяется: величина шага принимается за единицу. После введения условных нулей и масштабов величины и и н заменяются величинами х и у, которые связаны с заданными величинами равенствами но оо х= — у=— 1 Л о Ы где ио н по — значения, соответствующие условным нулям, у и Ь вЂ” длины интервалов.
Введение величин х и у удобно тем, что зти величины принимают отрицательные и положительные целые аначения по обе стороны от условного нуля. Пусть, например, распределение одной величины и имеет такой вид: Значения и в серединах интервалов Численности Значения х ! 4 12 20 28 36 44 3 13 26 10 5 1 — 2 — 1 0 +1 +2 +3 В качестве условного нуля принимаем середину третьего интервала, где наибольшая численность 26, т.
е. ио = 20. Значения х выписаны в третьей строке. Переход от величин х и у обратно к и и о потребуется только для определения средних й, й и о„, оо по формулам й ив+ух, б =по+тоу, о„=до„о,=топя, где х и у — средние значения и и о в условных единицах. Так как коэффициент корреляции — величина безразмерная, то его достаточно вычислить, пользуясь значениями х и у. 3, Р а боч не форм улы. а) Вычисление средних значений ведется па формулам 1 т~ х — г„поохь У = — Ь по~У~ о! л где хо и у, — целые отрицательные и положительные числа, как в приведенном выше иллюстративном примере. Поэтому вычисление средних выполняется легко и быстро.
Столбец произведений чисел лм на у, и строку произведений чисел лоо на числа хо надо выписать, так как обе линии будут нужны на следующем этапе вычислений. б) Вычисление средних отклонений: о 1 % 2 -2 а,= ~ ~~ ловко — х, л о ! т1 о -о а„= ~г — „~~ "ооУо — У ° л о в) Вычисление коэффициента корреляции: ! гз тз р„= — ~, г, л„,х„у, — ху, ° й Ь"1 Ип аоао Вычисление двойной суммы для оцчределения величины р„можно выполнить двумя способами. Простейший (но не лучший) способ — в каждую ячейку основной таблицы вписывается произведение чисел л*, на хо и у„ соответствующие ячейке; числа надо вписать не тем.цветом чернил, каким вписаны числа по,.
Все эти произведения складываются по всей таблице, и получается упомянутая двойная сумма. Сложение лучше выполнить сначала по строчкам и выписать суммы в дополнительном столбце справа. Затеи произведения складываются по столбцам основной корреляционной таблицы и записываются в дополнительной строке внизу. Сложение всех чисел в дополнительном столбце даст двойную сумму; тот же результат дает сложение чисел дополнительной строки.
Второй способ заключается в том, что в каждой горизонтальной полосе числа по, умножаются на числа хо и складываются. Обе операции делаются к уме, и результаты записываются в столбце (после стодбца, содеРжащего числа пм Уо~);полУченные числа в.. Р -.-: яйко',для последовательных о умножаются на ум и произведения аапийывоавтев.в'ЯоледУкнцем сп)лбце. СЛожение всех.'чисел этого сурлбцао 'и "Мает,;нужную !двойную сумму. Совершвняр:;аналогично, с заменой з)оачков й иа 1 и чисео) хо на уо заполняются две стрбки внизу; и каждом столбце числа! пм 1а Аоорееелеовооев оеооелеее 543 умножаются на у, и произведения складываютоя; получается строка, заполненная числами ~ П~У1 Умножение этих чисел на хг дает е1це одну строку> сложение чисел которой дает двойную сумму второй раз, что обеспечивает контроль.
Второй способ удобен тем, что первая дополнительная строка позволяет легко вычислить эмпирическую регрессию средних у по х, а первый дополнительный столбец даст эмпирическую регрессию х по у. г) Эмпирическая регрессия в условных единицах. Предпоследний столбец, полученный при вычислении двойной суммы вторыь1 способом, дает 1 с~ х„— ~~ лмхд, вф1З 1 где х„есть среднее значение х при последовательных значениях у.
Полученный столбец чисел и дает эмпирическую регрессию х по у. Предпоследняя строка, полученная при вычислениях двойной суммы по второму способу, дает эмпирическую регрессию у по х. Если числа предпоследней строки поделить на числа строки пы (распределение х), то получим: в ° — Хииуи й ) 2," «Щ 1 д) Теоретические уравнения регрессии в условных единицах. Уравнения имеют вид у„- у=г — (х — х), х — х= г — (у — у). ое Эти уравнения регрессии и нужно сравнивать с эмпирической регрессией, когда хотят выяснить более детально пригодность линейных уравнений регрессии.
Для этого в первое уравнение вместо х подставляют последовательные значения х, и вычисляют по УРавнению значеннЯ У„,з1 они сРавниваютсЯ о числами У„ эмпирической регрессии. Аналогично в правую часть второго линейного уравнения регрессии подставляют последовательные значения у, и вычисляют х,й эти числа нужно сравнить с эмпирическими х . е) Уравнения регрессии в основных единицах. Линейные уравнения регрессии можно использовать как эмпирические формулы для исследования связи в среднем.
Для этой цели удобно иметь их в тех единицах, в каких обычно измеряются исследуемые величины. Они имеют вид г —,(и-й), й,— й=г„" (о — о) И ~9 4. П р н и е р и,с к е м а в ы ч и с л е н н й. Иссиедуетси корреляция между относительной влажыостью по психрометру ы гигрожтру. Вычислеииа вые схемы: Средние 2 -(- — + 0,308» 74 240 у- + — -0,225, 54 240 й 65+0,308 10-68,08, б = 65+ 0,225 10 67,25. Средние отяеонения: о„ = 240 — (0,308) 4,347> 3 1066 2 а — — (0,225) 4,374, 2 1062 2 е 240 а» 2,085, ои — — 20г85, ор 2,092, ор ~ 20,92, Коэффициент коррееяции: о»ае — 4,362, Ху = 0,0693, р»! — — — 0,690 = 4,289, г = — * = 0,983, !046 4,289 240 4,362 Урааыния регрессии: — Д- 1г003г ໠— 0,997 г о» а„ вЂ” 66 = 4 ( — 3) + 24 ( — 2) + 6 ( — 1)'! +93 = 2 1+ 41 2+ 3 3.