Б.Л. ван дер Варден Математическая статистика (1960) (1186203), страница 30
Текст из файла (страница 30)
8 ~ 24 Гслп в начальный момент то солнце имело угловую координату О (т. е. находилось н точке О эксцентрика), то в точку эксцентрика с угловой координатой Л, отсчитываемой по эклиптике, оно придет в момент иремеки Р и с. 20. 1(зижение по экс. центрику. , Т Т Т о= то ! (а+ х о>о+з!) =- то+ )' 1 (о> о>о) 2а 2п 2я гле T = 365,25 лия — период обращения солила, Очевидно, что величина Т Л)2к раз>а времени осрсднекного движения солнца из точки О в точну с координатой Л (осрелнснное лвижсние — движение по эклиптике с постоянной скоростью).
Моменты времени т; отличак>тся от соответствую>цих момен~оп 1! византийских таблиц неизвестными ошибками йь возникшими в результате ои>нГ>ок вы >ислений, описок в тексте и округления. Танин образом, в кажлои точке с координатой Л, имеет место соотношение Т Т то Л>' (х> хо) = й>з (16) 2л 2п Если в (16) вместо и! и зоо подставить ранее найденные выражения (15), то получим уравнения Т >; — т,— — Л; — а(вшх; — в)п.то) — Ь(в>пЗх> — в)пЗ.т,) =- й>, (11) 2л гдс а=- — >в+ — в), Ь= — — — в = — св з з 2х! 8 ! 2>з 24 й 33.
Оценка дисперсии от 173 и с — известная постоянная. Если„кроме того, воспользоваться равенствами а! = — Аг — а, то система (17) преобразустсн к вкду Т О вЂ” т — — >н — а [зш(А> — а) + вша] — 6[ашЗ(А; — а) + зшЗа] = 1!. (18) 2л Система (18) состоит из 12 уравнений с тремя неизвестными е, а н тз. В качестве приближенных значений этих параметров выберем такис числа е, а и тр, для которых сумма квадратов й>+...
+ 1>>принимает наименьшеее значение. Вычисления станут особенно удобными, сс;>и сначала пренебречь малыми слагаемыми, содержащими Ь. После того как найдено приближениое значение е, можно вычислить Ь = — с ез и найти второе приближение, считая Ь постоянным и равным Ь. При этом окажется, что второе приблнжснис для а н точности равно первому приближению, так как при построении нормальных ураннений члены, содержащие з>п За, взаимно уничтожаются, Та>гим образом, в (18) можно сразу отбросить члены с Ь и записать систему уравнений так; 7 г> — т, — — А; — а н!па — а соз а в!пА, — а вша сов>м =- 1ь (19) 2л Если внести новые переменные и = а сов а, о = — а зш а, ю = та + а щп а =- те — с, то (!9) преобразуется в систему !2 линейных уравнений Т !.
— А ) — у. Зш) — с с'он А ' — ю = 1', 2>т (20) которой соотвстстаует система нормальных уравнений [аа]и + [аЬ]з + [ас(ю = [а>х], [Ьа]и+ [ЬЬ]о + [Ьс]ю = [Ы], [са]и + [с6]н + [сс]н> =- [сс(]. (21) Вычисление коэффициентов системы (21) нс представляет труда и поэтому, н данном случае, нормальные уравнения можно записать совсем просто: Т 2л Т бо = Ъ'1г! — — )н) совА;, 2л Т 12и= Ъ" ~Г> — — А,). [аа] =- к вше А, = 6, [аЬ] = ~,'ншдг сов А; = [66] = ~~ ооа'Аг:= 6, [ас] = ~ в>пА> = О, [ее] = ч"'1 = 12, [6с] = ~ санд! =- О, Т О, [аЫ] = Ъ ( — — А>) щп)н, 7 [и] = У 1  — — А;) сов Ао 2л 7 [8]= Ъ(г, А,), 2л Гл, Е11.
Метод наименьших квадратов 174 В Указанной выше таблице величины 1, Равны 1; — ь е — УД;/2Я— — йч(2, поэтому, если воспользоваться очевидными равенствами ~'зшдь = ~~ совке = О, то последние три уравнения можно будет записать так: би = У, 1; и йм бе = чэ (г соайг, (22) 12~ш — (1 е+ — ~1= ~1, Если решения (22) й, е и ю найдены, то и, а и ть можно определить из уравнений агава = и, аяша =- — е (23) и, наконец, е — из уравнения 1 2я е — -еь = — а. 8 Х (24) В данном случае ~~ (гвшйе = 142 87, ~ 1е совД = — 316 61, ~1; =- — 631, поэтому, согласно (22), (23) и (24), е =.
0,04157, а = 65'40', т„— 1, = 178 дн. 5ч. 39м. Гиппарх ц Птолемей — создатели теории эксцентриков — гюлагали 1 е = — -= 0,04167, а == 65'30', 21 Согласие следует признать отличным. Таким образом, нужно считать, что византийские таблицы вычислены на основе модели дезиженни солнца, предложенной Гиппархом. Если бы мы вычислили по формуле (5) выборочную среднюю ошибку е моментов нступлсния солнца в каждую отдельную часть зодиака при п =- 12 и г -= 3, то нашли бы, что е приближевно равна 20 мин.
Однако эта оценка очень неточна; так, знаменатель и — г = 9 не очень велик, Кроме того, ненадежность этой овен~ и обусловлена отсутствием уверенности в том, что в византийских таблицах ошибки отдельных значений являются везаиисильыми. Если воспользоваться указанными выше точными значениями е и а и вычислить ошибки отдельных значений византийских таблиц, то окажется, что из двенадцати чисел шесть в точности соответствуют модели Гиппарха, а остальные шесть подвержены грубьш сшибкам от 30 до 50 мин.
При этом имеется два случая, когда моменты вступления солнца и дне соседние части заливка указаны с одинаковыми ошибками, соответственно равнымп 50 и 30 мин. По-видимому, в византийских таблицах отдельные значения нс вы ~полились независимо друг от друга.
Только что проведенные вычисления в конечном счете сводятся к гармоническому анализу периодичссной функции 67)„заданной в 12 точнах. Гармонический анализ является очень полезным вспомогательным сред- В 33. Линии регрессии ством исследования таких астрономических таблиц, закон составления которых неизвестен. Во многих случаях этот метод вносит полную ясность в рассматривавшийся вопрос'. 9 33, Линии регрессии Пусть у — случайная величина, распределение которой зависит от некоторой независимой переменной х. В экономической статистике х в большинстве случаев является временем, а у— величиной, имеющей статистическое истолкование. Примером такой величины может служить количество выплавлешюй стали, которое, хотя с течением времени и меняется определенным образом, но, с другой счороньс, помимо времени, зависит и от многих других факторов.
Обе величины х и у могут оказаться случайными с некоторой определенной зависимостью, как, например, количество браков в текущем году и число новорожденных в следующем году. Пусть в результате некоторого опыта наблюдались я пар значений (х„ у,),...,(х„, у„) величин х и у. Постараемся исследовать характер функциональной зависимости у от х и с этой целью предположим, например, что у и х связаны соотношением линейной регресс»си у — бе+ всх+ и, причем линия регрессии, уравнение которой имеет вид у = бе+ + Юсх, должна проходить достаточно близко от наблюденных точек с координатами (хи у,), так что «случайные отклонения» и в некотором смысле являются наименьшими, Можно сделать также и другие предположения: например, можно считать, что у является многочленом второй степени (квадратичная регрессия), а соответствующая линия регрессии — параболой.
Более общим является тот случай, когда у представляет собой многочлен более высокой степени («регрессия и-го порядка») у = 9« + псх +... + 9,хг + и, яли, при периодических колебаниях, тригонометрический много- член у = де+ Юссов сох+ 9»вш сох -( и, Остатком и измеряется отклонение истинного графика функции у(х) от соответствующей линии регрессии. Требование, согласно которому этот остаток должен быть по возможности малым, можно уточнить, воспользовавшись методом наименьших г Чпп г(ег Ъупегг(еп В, Ь,, Р1е Веневцпи йст поппе паоЬ кгш<Ывоьеп 1шй(пб)веьеп Твге1п, Ь(«аппязЬег.
Вауег. А)гвб. (гов«1ь-паем.) (1959), 919; К. г( в Ь п в В в и 1. Ч. лн, ТЬе й(о«(оп о( «Ье Иооп ш Твгт! Ал«гопоту, Сеп«вигов, 4 (19ов). Гж (тЫ. Мстод наименьшим квадраазов квадратов. Согласно этому методу, в качестве значений параметров ов, о,,... нужно выбрать такие числа, для которых величина квадратичной формы у г (3) будет наименьшей. Вычисления выполняются точно так же, как в з 26, Например, в случае линейной регрессии из условия ~~ иг = ~ (у, — д — д,х;)г = тш(шцш (4) зрз = 9Ъ зрз — ~р, — а рз, зрз = (рз то зрз узрь ' 1!рехпоавтветсн, что все та векторов(из(аг),..., фз(за!1 (!с = 1, 2... аз) аннсано невввнсниы. — Г!рим.
нарев. посредством дифференцирования получаем — ~у, +доя+йз~хз=О, — 'У у, х, + д ~ч,' хт + с, "У х,' = О или, в обозначениях Гаусса (см. З ЗО): я до + [х] д, = [у], [х] д + [хх] д, =- [ху]. 1 Лля линии регрессии г-го порядка аналогичным образом получается система (г+ 1) нормальных уравнений Я "о+ [х] бз —, ... + [хт] 6, = [У], [ ) ", [хг] б + + [ "], = [*у], (5) [х'] б, + [хтч-з] д, + ... + [х"] д, = [х'у].
Отыскание уравнения регрессии посредством решения системы (5) сопряжено с большим количеством утомительных вычислений. Правая часть уравнения регрессии представляет собой линейную комбинацию многочленов 1, х, х',..., х'. Если эти многочлены предварительно ортогонализированы, то при отыскании уравнения регрессии количество вычислений существенно сокращаетея. Две функции аг(х) и р(х), определенные в точках х,,..., х„, называются ортогональными, если ~ <р(х,) р(хт) = О.