Автореферат (Разработка и программная реализация адаптивной модели геногеографического прогноза на основе методов оптимального оценивания и планирования эксперимента), страница 3
Описание файла
Файл "Автореферат" внутри архива находится в папке "Разработка и программная реализация адаптивной модели геногеографического прогноза на основе методов оптимального оценивания и планирования эксперимента". PDF-файл из архива "Разработка и программная реализация адаптивной модели геногеографического прогноза на основе методов оптимального оценивания и планирования эксперимента", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст 3 страницы из PDF
Предполагается, что для анализа доступны результатыэкспедиционных популяционно-генетических исследований, проведенных вограниченном числе i=1,..,m населенных пунктов популяции. Эти результатывключают в себя следующие данные: φi ,λi – соответственно широта и долготанаселенного пункта, в котором проведены генетические исследования, Ni –численностьнаселения,проживающеговэтомадминистративно*территориальном образовании, Ni – выявленное число носителей определеннойнаследственной патологии.
Необходимосинтезировать зависимость (1),которая позволяет на основе известных данных по численности населения N влюбомадминистративно-территориальномобразованиивграницахисследуемой популяции и его географической локализации φ, λ оценитьраспространенность наследственного заболевания N*.Для получения модели геногеографического прогноза использованоразложение функциональной зависимости N*(N, φ, λ) в ряд Тейлора вокрестности одного из известных значений Ni*=N*(Ni, φi, λi), i=1,...,m,полученных в ходе экспедиционных популяционно-генетических исследованийi-го административно-территориального образования.
В общем случае приналичииспектральных данных по m эталонным объектам возможнопостроение модели с переменными коэффициентами типа (1), за счетиспользования членов разложения в ряд Тейлора порядка,позволяющих учесть производные порядков до h включительно, которыехарактеризуют изменение значений интересующего нас генетическогопоказателя с учетом широты, долготы административно-территориальнойединицы (село, город, район) и численности проживающего на ее территориинаселения.
В вышеприведенном выражении- результат округлениязначениядо целого в меньшую сторону. Подобная общая модельгеногеографического прогноза приобретает вид:8N * (N, , λ) N * (N i , i , λi ) (N *N *N *2 N *)i ( N N i ) ()i ( i ) ()i (λ λi ) ()i ( N N i )2 NλN 2(2)2 N *2 N *h N *h N *h N *22hh()()()(λλ)...()(NN)()()()i (λ λi )hiiiiiiii 2λ 2N h hλhДля получения оптимальных оценок 3hm производныхNN *N *2N *2 N *2 N *hN *h N *h N *)i , ()i , ()i , ()i , ()i , ()i ,..., ()i , ()i , ()i , i 1,..., h,222hhNλNλNλ h*(в соответствии с методом наименьших квадратов (МНК) используетсявыражение,(3)в котором NNN N N NNNN N N N(4)a () ,() ,() , ..., () ,() ,() ..., () ,() ,() , ...., () ,() ,() * N*1*λ1h1N*hh1*hh1λ*h*1N*m*mλhmN*hhm*hhmλT*hmвектор размерности 3hm х 1, компонентами которого являются оцениваемыепроизводные. N * (N 2 , 2 , λ2 ) N * (N 1 , 1 , λ1 ) N * (N 3 , 3 , λ3 ) N * (N 1 , 1 , λ1 ) N * (N , , λ ) N * (N 1 , 1 , λ1 ) mmm N * (N 1 , 1 , λ1 ) N * (N 2 , 2 , λ2 ) Y *N * (N 2 , 2 , λ2 ) N (N 3 , 3 , λ3 ) N * (N m , m , λm ) N * (N 2 , 2 , λ2 ) N * (N , , λ ) N * (N , , λ ) m -1m -1m -1mmm вектор размерности, каждаякомпонента которого представляет собой попарные комбинации разностейзначений генетического показателя.
Матрица F имеет размери следующее блочное представление: F11FF 21....F m1F12F22....Fm2F1m F2m .... .... ..... Fmm ........(5)Диагональные блоки F11, F22 ,…, Fmm представляют собой матрицы размераи имеют структуру: (N 2 N 1 ) ( 2 1 ) (λ2 λ1 ) (N 2 N 1 )2 ( 2 1 )2 (λ2 λ1 )2 .......... ( N 2 1 )h( 2 1 )h (λ2 λ1 )h ( N 3 N 1 ) ( 3 1 ) (λ3 λ1 ) ( N 3 N 1 )2 ( 3 1 )2 (λ3 λ1 )2 ..........
( N 3 N 1 )h ( 3 1 )h (λ3 λ1 )h F11 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ( N N ) ( ) (λ λ ) ( N N )2 ( )2 (λ λ )2 ..........
( N N )h ( )h (λ λ )h 1m1m1m1m1m1m1m1m1 m ( N 1 N 2 ) ( 1 2 ) (λ1 λ2 ) ( N 1 N 2 )2 ( 1 2 )2 (λ1 λ2 )2 .......... ( N 1 N 2 )h ( 1 2 )h (λ1 λ2 )h ( N 3 N 2 ) ( 3 2 ) (λ3 λ2 ) ( N 3 N 2 )2 ( 3 2 )2 (λ3 λ2 )2 .......... ( N 3 N 2 )h ( 3 2 )h (λ3 λ2 )h F22 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ( N N ) ( ) (λ λ ) ( N N )2 ( )2 (λ λ )2 .......... ( N N )h ( )h (λ λ )h 2m2m2m2m2m2m2m2m2 m--------------------------------------------------------------------------------Fmm ( N 1 N m ) ( 1 m ) (λ1 λm ) ( N 1 N m )2 ( 1 m )2(λ1 λm )2 ..........
( N 1 N m ) h ( 1 m )h (λ1 λm )h ( N N m ) ( 2 m ) (λ2 λm ) ( N 2 N m )2 ( 2 m )2 (λ2 λm )2 .......... ( N 2 N m )h ( 2 m )h (λ2 λm )h 2- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ( N N ) ( ) (λ λ ) ( N N )2 ( )2 (λ λ )2 .......... ( N N )h ( )h (λ λ )hmm -1mm -1mm -1mm -1mm -1mm -1mm -1mm -1m m -19Все внедиагональные блоки матрицы F представляют собой нулевыематрицы размера.Конкретный вид зависимости (2) в существенной степени зависит отобъема результатов проведенных экспедиционных популяционно-генетическихисследований (количества обследованных административно-территориальныхобразований m). Анализ показывает, что в силу объективного наличиявременных и материальных ограничений, количество административнотерриториальных единиц, охваченных экспедиционными популяционнымиисследованиями, весьма ограничено.
Учитывая это, представляют интересследующие варианты моделей геногеографического прогноза, непосредственноследующие из общей модели (2):1) линейная модель геногеографического прогноза с переменнымикоэффициентами,(6)которая применяется, если число административно-территориальных единиц,охваченных экспедиционными популяционно-генетическими исследованиямисоставляет 4≤m≤6.2) квадратичная модель геногеографического прогноза с переменнымикоэффициентами,(7)которую целесообразно использовать, если при 7≤m≤9.3) кубическая модель геногеографического прогноза с переменнымикоэффициентами,(8)в случае, если m≥10.Дальнейшееусложнениеструктурымоделипредставляетсянецелесообразным, так как в практических условиях объем результатовфактически проведенных популяционных исследований, как правило,ограничен указанными значениями.После того, как выбрана структура модели (в виде (6), (7) или (8)) иполучены оптимальные оценки (3) параметров, с ее помощью может бытьосуществлен прогноз значений генетических показателей в любом населенномпункте популяции на основе данных о его географической локализации ичисленности населения.
Схему прогноза иллюстрирует рис.1.Используя, полученные в результате экспедиционных исследованийзначения Ni*=N*(Ni, φi, λi), i=1,...,m на основе модели (в виде (6), (7) или (8))рассчитываются прогнозные значения NiП*=N*(N,φ,λ), i=1,...,m генетическогопоказателя в населенном пункте с координатами φ, λ и численностью населенияN.10На основе совокупности полученныхпрогнозных значений рассчитываетсяокончательнаяоценказначенияпоказателянаосновеметодасредневзвешенной интерполяции:φ - широтаN*(Nm, φm, λm)N*(N1, φ1, λ1)N1П*(N, φ, λ)NmП*(N, φ, λ)N*(N, φ, λ)NiП*(N, φ, λ)(9)N*(Ni, φi, λi)где весовые коэффициентыляются по формуле:N2П*(N, φ, λ)N*(N2, φ2, λ2)вычис(10)N3П*(N, φ, λ)является обратной степеньювесовой функции и определяет,λ - долготазначениявблизкихРис.
1. Иллюстрация метода расчета прогно- насколькозируемых значений генетического показателя опорных точках сильнее влияют наповедение функции отклика, чем значения в удаленных опорныхточках. Выбор параметра α для каждого вида модели (в виде (6), (7) или (8))был сделан эмпирически на основе сравнения значений генетическихпоказателей, полученных в ходе экспедиционных исследований ряда районовРостовской и Кировской областей, со значениями тех же генетическихпоказателей, полученных с помощью моделирования. Причем окончательныеоценки значений генетических показателей для процедуры сравнениярассчитывались на основе метода средневзвешенной интерполяции, гдезначение параметра α варьировалось от 1 до 8.Оптимальными оказались следующие значения параметра α: для линейноймодели (6) α=6; для квадратичной модели (7) α=5; для кубической модели (8)α=4.Как следует из теории оптимального планирования экспериментаточность экспериментальной модели (2) зависит о того, какие именно точки(административно-территориальные единицы) использованы для дальнейшегопостроения модели.
Учитывая это, в диссертационной работе разработан методформирования оптимального плана экспериментальных исследований,позволяющийопределитьконкретныйнаборадминистративнотерриториальных единиц, являющихся объектами популяционно-генетическихисследований, таким образом, чтобы модель геногеографического прогноза,построенная на основе результатов этих исследований, обладала максимальнойточностью. В качестве основы разработанного метода использовался критерийD-оптимальности плана эксперимента, поскольку данный критерийобеспечивает сопоставимую точность по сравнению с другими критериями иего вычислительная реализация существенно проще, чем, например, реализациякритериев G- и Q-оптимальности, использование которых приводит кнеобходимости решения минимаксной задачи.Задача оптимального планирования эксперимента с целью построениямодели геногеографического прогноза рассматривалась в предположении о том,что в границах исследуемой популяции расположено ограниченное число nнаселенных пунктов с известной географической локализацией φj, λj иN*(N3, φ3, λ3)11численностью населения Nj, j=1,..,n, которые рассматриваются в качествепотенциальных объектов генетических исследований.
Допустим, чторасполагаемые материальные ресурсы и временные ограничения позволяютпровести экспедиционные генетические исследования в m населенных пунктах.Тогда, применительно, к задаче построения модели геногеографическогопрогноза матрица плана эксперимента представляет собой матрицу размера mх3с элементами: 1 1 N1 X m m N m (11)Тогда, использование D-оптимального плана приводит к необходимостирешения задачи оптимизации следующего вида:,(12)где X* - оптимальный план, W-множество территориально-административныхединиц в границах исследуемой популяции, F – матрица (5), конкретный видкоторой определяется в зависимости от структуры модели геногеографическогопрогноза, описываемой выражениями (6)-(8);– дисперсионнаяматрица.В вычислительном плане реализация условия оптимальности (12) приводит к необходимости отыскания минимума неявно заданной скалярной нелинейной функции в пространстве 3m переменных φi, λi, Ni, i=1,..,m, при наличииограничений.