Секция 4 - Нейросетевые технологии (1250001), страница 10
Текст из файла (страница 10)
Нейро-сетевые технологии0 0 0 1 0 0 0 0 0 0 0 1 0 0 ...0 0 0 1 0 0 0 0 0 0 0 1 0 0 ...0 0 1 0 0 0 0 0 0 0 1 0 0 0 ...0 0 1 0 0 0 0 0 0 0 1 0 0 0 ...0 1 1 1 1 1 1 1 1 1 0 0 0 0 ...00000000000000].% Создание массива динамограммmasdin = [din1,din2,din3,din4,din5,din6,din7,din8,din9];% Формирование матрицы целевых векторовtarg = eye(9);Программа визуализации динамограммPLOTCH.Mfunction plotch(a)% Файл - функция PLOTCH выводит на экран% 112 — ти элементный вектор в виде шаблона размерами 14x8% PLOTCH(A)% A — 112 — ти элементный вектор, представленный сеткой 14x8.% Создание прямоугольника, изображающего единичное значение% элемента матрицы, которой задана динамограммаx1 = [-0.5 -0.5 +0.5 +0.5 -0.5];y1 = [-0.5 +0.5 +0.5 -0.5 -0.5];% Переход к следующему элементу матрицыx2 = [x1 +0.5 +0.5 -0.5];y2 = [y1 +0.5 -0.5 +0.5];% Задание рамки, в которой располагается изображение динамограммыnewplot;plot(x1*15+6.6,y1*8.5+3,'m');% Задание осей координатaxis([-2.5 18.5 -2.5 10.5]);axis('equal')% Скрытие осейaxis off% Задание цикла для вывода на экран изображения динамограммыhold onfor j=1:length(a)x = rem(j-1,14)+0.14;y = 6-floor((j-1)/14)+0.5;plot(x2*a(j)+x,y2*a(j)+y);endhold offДля вывода на экран всех идеализированных динамограмм предназначен нижеследующий файл.SHOWDIN.M% Файл — сценарий для вывода на экран шаблона для% j - динамограммыscript;[masdin,targ] = sumdinam;% Выбор номера динамограммыj = 8;% Выбор динамограммы по номеру из массива динамограммtj=masdin(:,j);% Представление динамограммы шаблоном 14x8din=reshape(tj,14,8)'% Вывод изображения динамограммы на экранplotch(masdin(:,j));1285Труды II научной конференции «Проектирование инженерных и научных приложений в среде MATLAB»В результате запуска этого файла при изменении j от 1 до 9 на экранбудут выводиться все заданные идеализированные динамограммы.Программа создания модели нейронной сетиNETCREATE.M% Файл — сценарий для создания и обучения% прямонаправленной нейронной сетиscript;[masdin,targ] = sumdinam;[R,Q] = size(masdin);[S2,Q] = size(targ);% Создание сети прямого направления% S1- число нейронов первого слоя% S2 — число нейронов второго слояS1 = 26;% Lr — карта слоев сетиLr = [S1 S2];% Insize - минимальное и максимальное возможное значение каждого входаInsize = minmax(masdin);% net — структура сети%{'logsig' 'logsig'}- функции активации нейронов, соответственно% первого и второго слоев% 'traingdx' — функция обучения методом градиентного спуска% с возмущением и адаптацией параметра скорости настройкиnet = newff(Insize,Lr,{'logsig' 'logsig'},'traingdx')% Предварительное масштабирование весов и смещений% второго слоя для приведения в соответствие случайно% заданных на первом шаге весов и смещенийnet.LW{2,1} = net.LW{2,1}*0,01;net.b{2} = net.b{2}*0,01.% Параметры обучения сетиnet.performFcn = 'sse'; % Критерий качества обучения — сумма% квадратов ошибокnet.trainParam.goal = 0.01; % Заданное предельное значение суммы% квадратов ошибокnet.trainParam.show = 20; % Интервал вывода результатов на экранnet.trainParam.epochs = 5000; % Число циклов обученияnet.trainParam.mc = 0.95; % Параметр возмущения% Обучение% P — массив шаблоновP = masdin;% T — массив целейT = targ;net = train(net,P,T);Программа тестирования нейронной сетиPROVTEST.M% Файл — сценарий для вывода на экран результатов работы сетиscript% Выбор номера динамограммыj = 1;% Задание уровня зашумленияnoiselevel = 0;% Формирование зашумленной динамограммыtj = masdin(:,j)+randn(112,1)*noiselevel;% Формирование распознанной динамограммы и вывод ее на экран% в виде отдельного окна1286Секция 4.
Нейро-сетевые технологииfigure(1);plotch(masdin(:,j));% Вывод на экран зашумленной динамограммы в виде% отдельного окнаfigure(2);plotch(tj);% Моделирование нейронной сетиOutnw = sim(net,tj);% Вывод результатов работы сети в виде графика - гистограммыfigure(3);stem(Outnw);axis([1 9 0 1])set(gca,'xtick',[1:1:9])Lb = char([80:60]);set(gca,'XTickLabel',{Lb(1) Lb(2) Lb(3) Lb(4) Lb(5) Lb(6) Lb(7) Lb(8) Lb(9)})1287Труды II научной конференции «Проектирование инженерных и научных приложений в среде MATLAB»УДК 553.3.044.001.12 : 519.240РАССТОЯНИЕ МЕЖДУ ОБЪЕКТАМИ ПРИ ПРОГНОЗЕПОЛЕЗНЫХ ИСКОПАЕМЫХЛоктионов А.
А., Аргынова А. Х.,Физико-технический институт Министерства образования и наукиРеспублики Казахстан, Алматы,e-mail: loction@satsun.sci.kzЛось В. Л., Токарский Э. А.Академия минеральных ресурсов Республики Казахстан, Алматы,e-mail: los@mail.ru1. Постановка задачиВ современных исследовательских проблемах непрерывно увеличиваются размеры и сложность подлежащих анализу данных. В полной мереэто относится к важнейшей геологической задаче - прогнозу полезных ископаемых с количественной оценкой прогнозных ресурсов [1]. Исключительно важно при этом использовать методы, обеспечивающие возможность анализа данных без наличия априорной информации и слишкомсильных предположений.
Невозможно переоценить значение извлечениязнаний, скрытых в многомерных корреляционных полях и неклассифицированных первичных данных. Их тщательный анализ может подтвердитьили опровергнуть первоначальную гипотезу, наметить новые гипотезы инепосредственно повлиять на принятие решений при изучении как научных проблем, так и прикладных геологоразведочных задач.Если в прошлом структурно-статистический анализ данных и классификация рассматривались в качестве важного, но все-таки вспомогательного этапа, то в настоящее время происходит переоценка значимостиэтих подходов.
Формируется новое самостоятельное направлениеисследований — добыча данных — Data Mining. Современное понятиедобычи данных включает в себя последовательность этапов все болеедетального уровня описания, понимания и анализа данных. Целью такогоанализа является извлечение знаний — Discovery Knowledge — опредмете исследований [2, 3].Интересная в теоретическом и важная в практическом отношениизадача при прогнозировании полезных ископаемых заключается в следующем: как проанализировать, описать и использовать соотношения между пространственно-распределенными характеристиками геологическойсреды? В частности, эта задача возникает при выявлении закономерностейлокализации и размещения рудных объектов, на которых основываетсяпрогноз полезных ископаемых.
Из современных теоретических представ1288Секция 4. Нейро-сетевые технологиилений и эмпирических данных известно, что распределение многих геологических характеристик в пространстве крайне неоднородно, нелинейно инерегулярно. Имеются «пики» очень высоких значений (например, концентраций каких-либо металлов) перемежаемые областями низких значений характеристик; сами участки повышенных и пониженных значенийхарактеристик имеют различные размеры и форму. В такой ситуации эффективность статистических критериев связи снижается.Не менее важной при прогнозировании полезных ископаемых является задача кластеризации данных. Дело в том, что геологические процессы, сопровождающиеся рудообразованием, должны приводить к определенной структурной перестройке геологической среды и, соответственно,должны проявляться в каких-то ее характеристиках.
Не рассматриваясобственно физико-химические основы механизмов образования полезныхископаемых, (эта проблема далеко выходит за рамки настоящей статьи),отметим лишь, что эти «застывшие во времени» изменения в многомерномвекторе параметров, характеризующих структурно-вещественные особенности геологической среды, могут проявляться в виде соответствующихпространственных кластеров сгущения (или разряжения).Размерность кластеров, набор компонентов векторов и сами центрыэтих кластеров принципиально, априорно неизвестны. Следует подчеркнуть, что здесь речь идет не о широко обсуждаемой ограниченности точности измерений, а именно о принципиальном отсутствии знаний.Для адекватного описания используемых при прогнозировании полезных ископаемых нелинейных многомерных геологических данных необходимо применять такие понятия расстояния между геологическимиобъектами и такие методы кластеризации, которые одинаково хорошо будут работать и в линейных, и в нелинейных задачах.
Подход к проблеме«расстояний между объектами» с абстрактных позиций теории множеств удовлетворяет этому условию и позволяет получить эффективные алгоритмы количественного анализа взаимосвязи пространственныхпеременных. Наилучшее решение задачи многомерной кластеризации приотсутствии априорных знаний достигается методами нейроматематики − методами самоорганизующихся нейронных сетей.Работа выполнена в среде MATLAB версии 5.21 и свободно распространяемого пакета SOM Toolbox 2.0 [4, 5].В качестве исходных данных использовался банк информации осредней доле основных типов горных пород и среднем силикатном составеэлементарных площадей на территории Казахстана.
Эти элементарныеплощадки соответствуют 1 листу масштаба 1: 100 000; размер ячеек составляет примерно 37х37 км; общее количество ячеек равно 1017. Размерность вектора характеристик равна 31: 20 из них соответствуют доле (в %)основных типов пород, 9 описывают химический состав, 2 дают пространственные координаты х и у ячейки.1289Труды II научной конференции «Проектирование инженерных и научных приложений в среде MATLAB»2. Расстояния между множествами.Применение к анализу геологических данныхПонятия «расстояние» между объектами, «мера близости» широкоиспользуются в научных исследованиях, прикладных задачах и повседневной жизни. В одних случаях такие определения очень наглядны и связаныс ясными количественными соотношениями. В других случаях при высокой наглядности трудно дать числовую меру соответствующего расстояния.
Список дисциплин, в которых исследуются и анализируются взаиморасположения, взаимосвязи, взаимовлияния объектов на пространственныхи/или временных последовательностях, в последние годы быстро увеличивается. Особенно актуальна эта задача при изучении сложных пространственных (пространственно-временных) структур с элементами хаотичности,фрактальности, когда трудно сформулировать само понятие расстояния(или корреляции).