Совершенствование методов обоснования выборки в аудиторской проверке (1142757), страница 28
Текст из файла (страница 28)
1 1 1 1(2.4.45)1(2.4.46)144 Верхний предел ошибки находится путём нахождения квантиля с уровнемзначимости 1 бета-распределения, который должен быть умножен на Y – объемгенеральной совокупности в денежных единицах. Воспользуемся программой WolframMathematica для расчета оценки верхнего предела ошибки для трех коэффициентовискажений 10,15,16 выраженных в процентах, тогда:Clear["Global`*"] Y = 10000000; n = 56; \[Alpha] = 0.05; t = Sort[{10, 15, 16}, Greater]; z = {1, 1, 1}; z0 = 100 ‐ Total[z]; v = Length[t]; k = 5; p0 = 0.8; p100 = 0.101; pi = 0.001; k' = k + n; p0' = (k*p0 + z0)/k'; p199' = Table[(k*pi + z[[x]])/k', {x, v}]; pi' = (k*pi)/k'; p100' = k*p100/k'; o1 = ReplacePart[Table[j, {j, 100}], {Sequence @@ Table[t[[x]] ‐> t[[x]]*p199'[[x]]/pi', {x, v}], 100 ‐> 100*p100'/pi'}] o2 = ReplacePart[Table[j, {j, 100}], {Sequence @@ Table[t[[x]] ‐> t[[x]]*Sqrt[p199'[[x]]/pi'], {x, v}], 100 ‐> 100*Sqrt[p100'/pi']}]; eu = Total[Sum[i*pi'/100, {i, {o1}}]] vd = (Total[Sum[(i/100)^2*pi', {i, {o2}}]] ‐ eu^2)/(k' + 1); a = eu (eu (1 ‐ eu)/vd ‐ 1); b = (1 ‐ eu) (eu (1 ‐ eu)/vd ‐ 1); d = Y*Quantile[BetaDistribution[a, b], 1 ‐ \[Alpha]] Тогда для риска 5% и 10% оценка верхнего предела ошибки составит456 182 рубля и 373 930 рублей.
Зависимость оценки от параметра представлена нарисунке 15.Источник: составлено и рассчитано автором в программе Wolfram Mathematica [208].Рисунок 15 – Зависимость верхней предельной ошибки по методу «Дирихлеполиномиальные границы» от параметра К145 Е. Муцумура, Р. Планте, К. Цуй и П. Каннан сравнили полиномиальные границыи Дирихле-полиномиальные границы [115]. Они пришли к выводу, что если доступныинформационные технологии и методы вычисления вероятностей полиномиальныхграниц, то лучше использовать их, в противном случае, нужно использовать Дирихлеполиномиальные границы с параметрами 0.001, 0.101,которыеподходятдля5, 0.8, широкогоспектра…значенийкоэффициентов искажений.Существуетдругойквази-байесовскийметод,которыйиспользуетполиномиальное распределение вероятностей и гибридную форму теоремы Байеса длявычисления апостериорных вероятностей, разработанным Д.
МакКрейем в 1984 году[116].Данный метод использует теорему Байеса за исключением той части, гдефункция правдоподобия (likelihood function) заменена на вероятность максимальногоправдоподобия (maximum likelihood probability) [116]. Сама теорема Байесазаписывается в виде (2.4.47): | | (2.4.47)где – априорная вероятность гипотезы А (prior probability), | – условнаявероятность гипотезы А при наступлении события В, правдоподобие (likelihood), | – условная вероятность гипотезы А при наступлении события В, апостериорнаявероятность (aposterior probability), – полная вероятность наступления события B,вероятность данных (evidence).
А также, дадим определение гипотезе максимальногоправдоподобия (maximum likelihood hypothesis) – это набор параметров θ, которыймаксимизирует функцию правдоподобия |, , где – имеющаяся информация(тестовые примеры). Иначе говоря, гипотеза максимального правдоподобия – гипотеза,которая лучше всего описывает имеющиеся данные в текущих предположениях .Так как мы анализируем искажения в проверяемой совокупности, аудитору будетинтересен определенный параметр, а именно: верхний предел искажений приопределенном уровне риска. Обозначим его как , а определенные данные, полученныеиз выборочной совокупности как Data.
Тогда можно переписать теорему Байеса иопределить вероятность получения определенного параметра на основе данныхвыборочной совокупности, как (2.4.48):146 | | | | (2.4.48)Понятие вероятности (probability) и правдоподобия (likelihood) тесно связаны.Например, если сравнить два предложения:- Какова вероятность выпадения монеты одной стороной четыре раза подряд?;- Насколько правдоподобно, что монета не обработана специальным образом,если она выпала четыре раза подряд одной стороной?Можно сказать, что вероятность предсказывает неизвестные результаты,основанные на известных параметрах, в то время как правдоподобие позволяет оценитьнеизвестные параметры, которые основаны на известных результатах.Вероятность и правдоподобие имеют другое важное различие.
Для вероятности,сумма всех вероятностей каждого исхода должна быть равна 100% для любой даннойгипотезы. Это связано с тем, что для определенной гипотезы или модели существуетконечное число возможных результатов, и поэтому их вероятности должны составлять100%. Но, когда мы говорим о правдоподобии, существует потенциально бесконечноеколичество моделей, которые могли бы объяснить данные. В результате сумма всехправдоподобий обычно не равна 100% и может быть даже не конечным числом.В методе МакКрейя параметр – является параметром состояния общегоискажения (state of nature), который определяет суммы всех искажений (общуюошибку) в совокупности.
Аудитор генерирует множество значений , причемдолжно быть кратно достаточно большому числу в диапазоне 500-1000 длясовокупности порядка 1 000 000 и 5000-10000 для совокупности порядка 10 000 000, а также минимальное и максимальное значение должно быть,соответственно, меньше нижнего предела ошибки и больше верхнего предела ошибкив достаточной степени для формирования надежной оценки. Для каждого параметра вычисляется своя вероятность максимального правдоподобия.
Хотя в работе [116] неуказано, какое число параметров необходимо использовать, но определенно должнобыть сгенерировано достаточное количество параметров . Так для нашейсовокупности 10 000 000 c тремя коэффициентами искажений мы использовали100 параметров состояния общего искажения , хотя можно использовать большеечисло, а можно и меньшее, но не менее 60. Апостериорная вероятность для любогосостояния общего искажения будет ∙∑, однако если предполагается147 равномерное априорное распределение, то каждая дискретная априорная вероятностьявляетсянекоторойконстантой,тогдаапостериорнаявероятностьявляетсяотношением максимального правдоподобия к сумме максимальных правдоподобий повсем возможным параметрам состояния общего искажения (2.4.49) [116]. Тогда: ∑ ∙(2.4.49)где определено (2.4.50): ;…;|;…;!,…, ,…,(2.4.50)которое должно удовлетворять следующим условиям (ограничениям) (2.4.51), (2.4.52),(2.4.53):11000(2.4.51)(2.4.52)1(2.4.53)Данный квазибайесовский метод подразумевает наличие возможных искаженийот (–100) до +100 копеек/центов, на каждую денежную единицу с соответствующимивероятностями ;…; ; ; ;…;.
Так как априорно оценить вероятности весьма сложно, аудитор может использовать априорную информацию о наличииобщих искажений, благодаря которой можно найти вероятности предельногоискажения [96]. Данный метод оценки имеет схожие черты с полиномиальнымиграницами, однако можно сказать так, что с полиномиальными границами мыиспользовали индуктивный подход, где мы определяли вероятности дляопределения верхней предельной ошибки. То здесь мы используем дедуктивныйподход: известна величина общей ошибки, благодаря которой можно определитьвероятности и максимальную величину правдоподобия. В данном квазибайесовскомметоде используется частичная априорная информация. Под этим подразумевается, чтовероятность ∙квазибайесовскаяапостериорнаявероятности зависят только от одного параметра иаприорнаяфункция– состояния общего148 искажения в совокупности.
По традиционной байесовской формулировке аудитордолжен сформировать функцию всех возможных искажений в совокупностивероятностей , для этогоаудитор должен задать априорную функцию плотностивероятности для каждого искажения, что на практике сделать гораздо сложнее с темрезультатом, чтобы полученные результаты обладали достаточной надежностью.Поэтому в квазибайесовской модели берется так называемая «частичная априорнаяинформация» [96,116].В данном методе, нахождение максимума целевой функции может быть немногосложнее, чем нахождение максимума целевой функции в полиномиальных границах,так как максимумов для данного метода необходимо найти несколько и самовыражение целевой функции состоит из множителей, а не из слагаемых. Обычныеметоды по максимизации функции могут найти локальный максимум с экстремальнонизким значением для части параметров состояния общего искажения, в то времякак аудитору нужно найти глобальный максимум, и таких максимумов нужно найтипорядка 100, применяя данный метод для оценки искажений в совокупности.
Поэтомудля уточнения максимизации целевой функции, введем дополнительное ограничение(2.4.53), для оптимизации расчетов, полагая что значения не могут иметьэкстремально малых значений. В случае, когда параметр равен нулю, и всовокупности обнаружены коэффициенты искажений с положительным знаком, и необнаружены коэффициенты искажений с отрицательным знаком или наоборот. Данноеограничение должно быть равно нулю, так как вероятность максимальногоправдоподобия полного отсутствия искажений в генеральной совокупности, приобнаруженных искажениях в выборочной совокупности, не может иметь никакоезначение отличное от нуля, в противном случае это будет неправдоподобно.Призначении параметра b равного шести, условие ограничения целевой функции (2.4.54)будет достаточным, для исключения экстремально малых локальных максимумов.1!!, … , !, … , !1⁄10 , если 0;0, если 0 приопределенныхусловиях(2.4.54)В случае включения отрицательных коэффициентов искажений в оценку,вполне правдоподобно может быть, что среднее искажение может равняться нулю.












