Диссертация (1145387), страница 23
Текст из файла (страница 23)
Для измерений98в каналах eeCC и µµCC всего было использовано M = 171 мешающих параметра β m ,а в канале eeCF M = 105. Вторая категория мешающих параметров γ использовалась для учета систематических ошибок, возникающих из ограниченной статистикидля моделированных событий. В каждом интервале реконструированных переменныхZ,RecoReco(cos θCS, φReco) любой мешающий параметр γ n из набора γ = γ 1 , ..., γ Nbins ,CS , pTгде Nbins = 8 × 8 × 23 — число интервалов, используемых для проведения измерений по реконструированным переменным, равен единице для номинального значенияшаблонного распределения и нормализует ожидаемое количество событий для шаблонного распределения в интервале с номером n. Мешающие параметры γ распределеныnnn—), где Neff|γ n Neffв соответствии с функцией плотности вероятности Пуассона P (Neffэффективное число моделированных событий в интервале с номером n.
Эффективноечисло событий вводится, чтобы подчеркнуть, что вес моделированных событий не равенединице. Таким образом, формулу для числа ожидаемых событий (27) в интервале с ноZ,RecoRecoмером n = (m, k, l) для реконструированных переменных (cos θCS, φReco) можноCS , pTпереписать в следующем виде:nNexp(A, σ, θ) =( 23X"σj × L × tn8j (β) +j=17X#Aij × tnij (β) +bkgsXi=0)TBn (β)× γ n,(29)Bгде θ = {β, γ} — полный набор мешающих параметров, β — мешающие параметры дляучета экспериментальных и теоретических систематических ошибок, плотности вероятности которых являются единичной функцией Гаусса, γ — несущественные параметрыдля учета статистических ошибок, возникающих из-за ограниченной статистики моделированных событий, плотности вероятности которых описываются распределениемПуассона.Функцию правдоподобия (28) с учетом несущественных параметров можно записать в следующем виде:L(A, σ, θ|Nobs ) =NbinsYnnnn(A, σ, θ))P (Neff|γ n Neff)P (Nobs|Nexpn×MYG(0|β m , 1).(30)mЗначения мешающих параметров θ определяются исходя из условия максимума функции правдоподобия L(A, σ, θ|Nobs ) по переменным θ:∂L = 0.∂γ γ=γ0Для оценки ошибок параметров, то есть измеряемых коэффициентов A, выполняется99сканирование функции правдоподобия.
Для каждого параметра Aij строится отношениефункций правдоподобия:Λ(Aij ) =L(Aij , Â(Aij ), θ̂(Aij ))L(Â, θ̂).(31)Для функции правдоподобия, которая стоит в знаменателе формулы (31), ищется глобальный максимум для всех измеряемых и мешающих параметров, то есть:∂L ∂L == 0.∂A γ=γ̂,A=Â∂θ γ=γ̂,A=ÂДля функции правдоподобия, которая стоит в числителе формулы (31), ищется максимум только для одного параметра Aij . Максимум функции правдоподобия для остальных параметров  и γ̂ в общем случае является функцией, зависящей от Aij .
Для выполнения численной минимизации использовался набор программ MINUIT [116]. Используяотношение функций правдоподобия, можно построить новую переменную (статистику):qAij = −2 log Λ(Aij ).(32)По определению qAij ≥ 0. Функция плотности вероятности для этой переменной ассимптотически имеет распределение такое же, как χ2 — распределение с одной степенью свободы [117]. В этом случае интервал достоверности в одно стандартное отклонение ±1σ для коэффициента Aij определяется пересечением с функцией qA±ij = 1, где±A±ij ≡ Âij ± σ .4.4РегуляризацияМиграция событий между интервалами по переменной p``T приводит к антикорреляциям между коэффициентами Ai в соседних интервалах, которая приводит к усилению статистических флуктуаций. Для того чтобы уменьшить влияние этого эффекта,и тем самым выделить структуру зависимости коэффициентов Ai от pZT , выполняласьрегуляризация измеренных зависимостей.
Регуляризация выполняется путем умножения нерегуляризованной функции правдоподобия на штрафную функцию (англ., penaltyterm) Гаусса, которая является функцией статистической значимости производных более высокого порядка функции зависимости углового коэффициента Ai от переменнойpZT . Как известно, основная задача метода штрафных функций состоит в преобразовании задачи минимизации функции с соответствующими ограничениями, наложеннымина них, в задачу поиска минимума без наложения ограничений. При нарушении ограничений она «штрафует» функцию, которую минимизируют, то есть увеличивает её зна-100чение. В этом случае минимум функции будет находиться внутри области ограничений.Этот метод схож с регуляризацией Байесовской обратной свертки, где дополнительнаяинформация добавляется к модели путем введения дополнительного априорного распределения для параметров модели [118].
Выбор штрафной функции, в нашем случае,или выбор дополнительной информации, в Байесовском случае, должен приводить кразумному результату с минимальным смещением центральных значений коэффициентов.Выбор порядка производной, которая будет использоваться для регуляризации,базируется на ожидаемом уменьшении статистической неопределенности измерений ина возможном влиянии на результат, который вносит введенная схема регуляризации.Сокращение статистических флуктуаций происходит вследствие увеличения корреляций между коэффициентами, измеренными в соседних интервалах по pZT .
Производнаяn-го порядка определяется следующим образом:((n)Aij=(n−1)(n−1)Ai,j − Ai,j−1 ,(n−1)(n−1)Ai,j+1 − Ai,j ,n oddn even,(33)(0)где Aij ≡ Aij . Как видно из формулы (33), определение для производных четных инечетных порядков отличаются. Это позволяет определить производные более симметрично для каждого интервала по pZT . Ковариционная матрица Σ для коэффициентовAi строится из производных второго порядка функции правдоподобия [117]: Σ−1=ij∂L. Программа MINUIT [116], с помощью которой выполняется минимизация функ∂Ai ∂Ajции правдоподобия, вычисляет эти производные.
Зная ковариационную матрицу можноΣij, гдевычислить корреляции угловых коэффициентов следующим образом: ρij = σ(Ai )σ(Aj)σ(Ai ) и σ(Aj ) — ошибки параметров Ai и Aj . Для вычисления корреляционной матрицыиспользовались псевдоданные, полученные с помощью генератора Powheg + Pythia8.Результаты вычислений корреляционной матрицы представлены на рисунке 30.Для того чтобы преобразовать ковариционную матрицу коэффициентов в ковариационную матрицу их производных используется матрица Якоби J, которая опреде(n)∂Aляется следующим образом: Jij = Aij . Таким образом, штрафная функция A, котораяконтролирует регуляризацию, определяется следующим образом:no~ (n) (JΣJT )−1 A~ (n),T ,A(Areg ) = exp −0.5γ A(34)где параметр γ определяет силу регуляризации. При измерении коэффициентов во всехканалах применялась схема регуляризации, которая использует производные шестогопорядка.В пределе, когда параметр γ → ∞, схема регуляризации, которая используетATLAS Simulation0.80.6A0 correlationsUnregularised0.40.20-0.2-0.4-0.6-0.80123456789 10 11 12 13 14 15 16 17 18 19 20 21 22pZ binT-1T1012345678910111213141516171819202122pZ binTpZ bin1011012345678910111213141516171819202122ATLAS Simulation0.80.6A0 correlationsRegularised0.40.20-0.2-0.4-0.6-0.80123456789 10 11 12 13 14 15 16 17 18 19 20 21 22-1pZ binTРисунок 30 — Корреляционная матрица между разными интервалами по pZT для коэффициента A0 до (слева) и после (справа) регуляризации.производные n-го порядка, приводит к тому, что измеряемая зависимость будет полиномом порядка (n − 1).
Это продемонстрировано на рисунке 31, на котором показанаразность между коэффициентом A0 , регуляризованным по схеме, использующей производные шестого порядка и параметр γ = 100, и результатом фитирования зависимостикоэффициента A0 от pZT полиномом пятого порядка. Как видно из графика на рисунке 31, эта разница близка к нулю. Небольшое отличие, которое наблюдается на графике, связано с тем, что при регуляризации использовалось конечное значение γ = 100для параметра, определяющего силу регуляризации.
На том же рисунке показан результат, который получается, если фитировать коэффициент A0 полиномом четвертогопорядка. Видно, что в этом случае разность между результатами фитирования и регуляризации описывается полиномом пятого порядка. Оценка влияния регуляризации назначение коэффициента B[Aij ] (смещение центрального значения коэффициента из-зарегуляризации) выполнялась с помощью псевдоэкспериментов, основанных на разностимежду ожидаемым значением коэффициента после подгонки E[Aij ] и значением коэффициентов yij , используемых для рандомизации данных, то есть B[Aij ] = E[Aij ] − yij .Значения коэффициента yij извлекались путем подгонки полиномом шестого порядкареференсных коэффициентов, полученных для событий, моделированных генераторамиPowheg + Pythia8.На рисунке 32 показана ошибка, полученная для коэффициента A0 вследствиепроцедуры регуляризации, для измерений, выполненных в каналах eeCC и µµCC интегрально по быстроте y Z для разных значений параметра силы регуляризации γ вместес соответствующей статистической ошибкой для каждого значения параметра γ.