Автореферат (1149593)
Текст из файла
На правах рукописиГученко Роман АлександровичПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТОВДЛЯ ДИСКРИМИНАЦИИРЕГРЕССИОННЫХ МОДЕЛЕЙСпециальность 01.01.07 —вычислительная математикаАвторефератдиссертации на соискание учёной степеникандидата физико-математических наукСанкт-Петербург — 2017Работа выполнена на кафедре статистического моделированияматематико-механического факультета Санкт-Петербургскогогосударственного университета.Научный руководитель:Мелас Вячеслав Борисович,доктор физико-математических наук, профессорОфициальные оппоненты:Кошкин Геннадий Михайлович,доктор физико-математических наук, профессор,Томский государственный университет,профессор кафедры теоретической кибернетикиСипин Александр Степанович,доктор физико-математических наук, доцент,Вологодский государственный университет,профессор кафедры прикладной математикиВедущая организация:Федеральное государственное бюджетное образовательное учреждение высшего образования«Московский государственный университет имени М.В.Ломоносова»Защита состоится «»201 г.
вчасов на заседании диссертационного совета Д 212.232.49 на базе Санкт-Петербургского государственного университета по адресу: 198504, Санкт-Петербург, Старый Петергоф,Университетский пр., д. 28, ауд. 405.С диссертацией можно ознакомиться в Научной библиотеке им. М. Горького Санкт-Петербургского государственного университета по адресу: 199034,Санкт-Петербург, Университетская наб., 7-9 и на сайте:https://disser.spbu.ru/files/disser2/disser/JdbBcV29JB.pdf.Автореферат разослан «»201 г.Ученый секретарь диссертационного совета,доктор физико-математических наук, профессорЧурин Ю.В.Общая характеристика работыАктуальность темы.Математическая теория планирования эксперимента предоставляет методологию для оптимального выбора условий проведения наблюдений при практических исследованиях, которая позволяет получать результаты, касающиеся числовых характеристик регрессионных моделей для изучаемых явлений, с заданной степенью статистической погрешности при наименьших затратах.
Название этому направлению в науке дала книга «The Design of Experiments» знаменитого английского статистикаР. Фишера. Базовый аппарат теории был разработан во второй половине прошлого века в трудах Дж. Элфвинга, Дж. Кифера, Дж. Вольфовица, К. Рао,В. Стаддена, В.В. Федорова, Г. Уинна и других авторов. Целью планированияявляется нахождение (приближенного) плана эксперимента — дискретной вероятностной меры, заданной на множестве всех возможных условий проведения измерений, оптимальной с точки зрения некоторого заранее заданногокритерия.Большинство работ по оптимальному планированию экспериментовпосвящено планам для оценивания неизвестных параметров регрессионныхмоделей. В этом случае предполагается, что функция регрессии задана с точностью до неизвестных параметров, которые необходимо оценить с некоторойточки зрения оптимально посредством выбора условий для проведения измерений.
Примерами оптимальных планов для оценивания параметров являются -оптимальные планы, минимизирующие объем доверительного эллипсоида для оценок неизвестных параметров в предположении о независимости,гомоскедастичности и нормальной распределенности случайных ошибок измерения, или -оптимальные планы, минимизирующие в том же эллипсоидедлину максимальной оси. Однако при проведении прикладных исследованийв различных областях знаний нередко возникает ситуация, когда вид регрессионной модели с точностью до параметров не известен a priori до проведенияэксперимента, но тем не менее у экспертов есть несколько гипотез о возможном виде модели.
В этом случае проводят эксперимент специального вида —дискриминационный эксперимент, планируемый таким образом, чтобы по егорезультатам можно было оптимально относительно некоторого критерия проверить гипотезу об истинном виде исследуемой регрессионной модели. Самы3ми популярными критериями, используемыми для решения задач дискриминации, являются критерий -оптимальности, введенный в работах Аткинсонаи Федорова, и различные его обобщения.Критерий -оптимальности для дискриминации двух конкурирующихмоделей предполагает наличие априорно заданного фиксированного значения параметров для одной из моделей. Это его свойство называется локальностью.
Современная статистическая практика требует нахождения планов,устойчивых относительно некорректного выбора фиксированного вектора параметров, таких как байесовские оптимальные планы, где вместо точечногофиксированного значения параметров берется некоторое распределение. Явный вид опорных точек и весов даже для локального -оптимального планаполучен в литературе только в случае дискриминации полиномиальных моделей, отличающихся на один или на два порядка. Отыскание же байесовскихпланов в явном виде обычно не представляется возможным.
Для численногонахождения дискриминационных планов обычно используют различные варианты алгоритма, предложенного Аткинсоном и Федоровым. В случае байесовских планов применение этого алгоритма становится проблематичным.Данная диссертационная работа посвящена разработке эффективных численных алгоритмов для нахождения дискриминационных планов, а также нахождению -оптимальных планов в явном виде для некоторых специальных паррегрессионных моделей.Степень разработанности темы.Первые работы по планированиюдискриминационных экспериментов появились в начале 70-х годов прошлого века и были связаны с дискриминацией вложенных моделей, когда однамодель является частным случаем другой при определенных значениях параметров.
Так в [1] для дискриминации между двумя вложенными полиномамипри стандартных предположениях об ошибках было предложено искать план,доставляющий минимум объему доверительного эллипсоида для тех параметров более общей модели, которые не входят в менее общую.Другой критерий оптимальности, -критерий, применимый для решения задачи о дискриминации двух конкурирующих регрессионных моделей в случае независимых нормально распределенных гомоскедастичныхошибок, не предполагающий вложенности этих моделей, был введен в [2].В этой же работе был предложен численный алгоритм для нахождения4 -оптимальных планов. Критерий -оптимальности тесно связан с задачейнаилучшей чебышёвской аппроксимации.
Наиболее полно соответствующиерезультаты изложены в [3], а в [4] они использованы для получения в явном виде -оптимальных планов для дискриминации двух полиномиальныхмоделей, отличающихся на два порядка.Базовый критерий -оптимальности имеет ряд существенных ограничений. Одно из ограничений заключается в требовании о нормальности и гомоскедастичности ошибок наблюдения. На случай дискриминации двух моделей при нормальных гетероскедастичных ошибках -критерий был обобщен в [5].
В [6] был предложен критерий -оптимальности, основанныйна расстояниях Кульбака–Лейблера и связанный с тестом отношения правдоподобия, не требующий нормальности и пригодный для дискриминациидвух произвольных конкурирующих моделей для плотностей ошибок. Критерии из работ [2] и [5] являются частными случаями -критерия. В [7]был введен полу-параметрический критерий, в котором функции регрессиидля всех конкурирующих моделей и закон распределения ошибок для однойиз них считаются известными, а закон распределения для оставшейся модели получается как решение специальной задачи вариационного исчисления.Другое ограничение -критерия состоит в количестве сравниваемых моделей.
Авторы оригинальной работы предложили в [8] вариант его обобщенияна случай дискриминации произвольного количества конкурирующих моделей. Симметричная версия -критерия для дискриминации многих моделей, -критерий, а также численный алгоритм для нахождения оптимальныхпланов, основанный на многомерной чебышёвской аппроксимации, были введены в [9]. Еще одно ограничение -критерия — зависимость от априорныхзначений для параметров одной из моделей, может быть компенсировано спомощью байесовского подхода, обсуждавшегося еще в [2].Цели и задачи работы.
Целью диссертации является исследованиеразличных критериев оптимальности для дискриминации конкурирующихрегрессионных моделей, а также разработка эффективных алгоритмов длячисленного нахождения соответствующих оптимальных планов. Для достижения поставленной цели необходимо было сформулировать и решить следующие задачи:51. Использовать аппарат теории чебышёвской аппроксимации для нахождения в явном виде -оптимальных планов в случае дискриминации полиномиальных моделей и моделей, отличающихся от полиномиальных добавлением простого дробно-рационального слагаемого.2. Предложить метод построения байесовских -оптимальных планов длядискриминации нескольких моделей, преодолевающий недостатки методаАткинсона и Федорова.3.
Обобщить этот метод на случай байесовских -оптимальных планов.4. Исследовать полу-параметрические критерии оптимальности и их связьс классическими критериями, разработать эффективные алгоритмы длячисленного нахождения соответствующих оптимальных планов.Научная новизна.Все результаты, представленные в диссертационной работе, являются новыми.Теоретическая и практическая ценность работы.Результатыработы имеют теоретическую ценность и могут быть использованы при планировании реальных экспериментов. В частности, на второй фазе клинических исследований для установления вида зависимости эффекта препаратаот дозы, а также для дискриминации моделей аналитической химии, описывающих прошедшую реакцию.Методология и методы исследования.В работе применяются методы теории аппроксимации, функционального анализа, математической статистики, вариационного исчисления и общие методы теории планированияэксперимента. Численные примеры выполнены с использованием статистического пакета R.Положения, выносимые на защиту.1.
В явном виде получены -оптимальные планы для дискриминации полиномиальных моделей и аналогичных моделей, содержащих дополнительное дробно-рациональное слагаемое.2. Предложен метод построения байесовских -оптимальных планов путемих сведения к локально оптимальным планам. Разработан двухэтапныйалгоритм для нахождения локальных -оптимальных планов, состоящийв чередовании обновления носителя плана и оптимизации по его весам. Доказана сходимость этого алгоритма. Для оптимизации по весам предложено две эффективные численные процедуры.
Проведено сравнение наибо6лее часто используемого в литературе алгоритма с разработанным алгоритмом, выявившее значительное преимущество последнего.3. Сформулирован байесовский критерий -оптимальности и теорема эквивалентности для него. Результаты, касающиеся байесовских -оптимальных планов, обобщены на случай байесовских -оптимальныхпланов.4. Предложен эффективный метод численного нахождения полу-параметрических оптимальных планов.
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.















