Многоагентная автоматизированная система адаптивной фильтрации потоков текстовой информации, страница 4
Описание файла
PDF-файл из архива "Многоагентная автоматизированная система адаптивной фильтрации потоков текстовой информации", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "остальное", в предмете "диссертации и авторефераты" в общих файлах, а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст 4 страницы из PDF
На рис. 3представлена общая структурная схемаалгоритма на каждом этапе: I – блокIIIIVVIIIопределения параметров НЭ; II – блокx(n)разделениявходнойобучающейIIIпоследовательности; III (пунктир) –ε(n)алгоритмсинтезамногослойнойIIIIVVнейронной сети на первом шаге,аналогично которому строятся блокиIII; VI - блок управления.IVVЗатем в разделе приводитсяРис. 3.
Структурная схема алгоритма последовательногоструктурнаясхемапрограммы,формирования кусочно-линейной разделяющейгиперповерхностиреализующей алгоритм построения10кусочно-линейной разделяющей поверхности.Поскольку логическая функция, построенная на основе системы логических деревьев,оказывается определенной не на всех НЭ, далее в разделе описывается методика еедоопределения с целью формирования обучающей выборки для последующих слоев.В разделе 2.3.2.6 определяется математический аппарат, использующийся при синтезе НЭв алгоритме раздела 2.3.2.5 Синтез НЭ заключается в оптимальном выборе коэффициентов ai в⎤⎡Nфункции y ( x) = sign[ϕ ( x)] = sign ⎢∑ ai xi ⎥ , реализующей данный НЭ.
Выбор коэффициентов⎦⎣ i =0должен обеспечивать минимум функционала среднего риска.Непосредственная минимизация этого функционала на поле коэффициентов ai встречаетсущественные сложности. Поэтому, вместо решения прямой задачи в работе используетсятеоретически обоснованный переход к одной из эквивалентных задач, имеющих болееестественное представление в пространстве коэффициентов НЭ. Для этого рассматриваютсяx a (n) = ε (n) − ϕ ( x(n)) - аналоговая ошибка НЭ; xд (n) = ε (n) − y ( x(n)) - дискретная ошибка.Далее в работе рассматриваются моменты и модули моментов первого и второго порядкааналоговой и дискретной ошибки:1.
x a (n)mn= ε ( n)mnN− ∑ a i x i ( n)mn;i =022. x a2 (n)mnmnmnN⎤⎡N= 1 + ⎢∑ ai xi (n) ⎥ − 2ε (n)∑ ai xi (n) ;⎥⎦⎢⎣ i =0i =0⎡N⎤3. xд (n) = ε (n) − sign ⎢∑ ai xi (n)⎥ ;⎣ i =0⎦2⎛⎤⎞⎡N⎜4. x (n) = ⎜ ε (n) − sign ⎢∑ ai xi (n)⎥ ⎟⎟ ,⎦⎠⎣ i =0⎝2дгде использование соотношения x(n)mnn1=mn∑ x(i)позволяет снизить уровень шумов вi = n − mnконтуре настройки.Далее в работе приводятся условия, при которых минимизация указанных выражений наполе коэффициентов, соответствует минимизации средней функции риска.
В проектируемойАСАФ НР в процессе ее настройки и обучения предоставляется выбор одного из указанныхкритериев.Минимизация приведенных выше критериев приводит к следующем рекуррентнымсоотношениям, позволяющим осуществить настройку НЭ:[1. a(n + 1) = a(n) + K * sign x a (n)mn2.
a(n + 1) = a(n) + 2 K * x a (n) x(n)]x(n)mnmn3. a(n + 1) = a(n) + K * sign[xд (n)]sign( xi (n) )4. a (n + 1) = a (n) + 2 K * xд (n) sign( xi (n) )где K* - матрица, определяющая скорость настройки алгоритма.В разделе 2.3.2.7 определяется метод синтеза последующих (второго и третьего) слоев.Данная задача определяется построением многомерной бинарной функции, которая должнареализовывать эталонную функцию z ( y ) = ( z1 ( y ), z 2 ( y ),..., z K ( y )) , заданную на множествебинарных векторов y, размерность которых совпадает с числом нейронов первого слоя H1.Поскольку осуществляется независимое построение отдельных компонент логическойфункций, реально решается задача построения одномерной бинарной функции, которая должна11совпадать с соответствующей zi(y). Для упрощения обозначений индекс опускается, т.е. вместоzi(y) записывается z(y).При синтезе z(y) определяется можно ли ее реализовать с помощью одного НЭ. Еслирезультат проверки оказывается положительным, то формируется нейронная сеть сединственным НЭ во втором слое.
Если результат проверки отрицательный, то формированиеz(y) осуществляется с помощью дизъюнктивно-пороговой сети.В разделе 2.3.2.8 приводится математический аппарат, использующийся для проверкиреализуемости эталонной функции z(y) на одном НЭ. Выходное значение НЭ определяется поH1формуле g (n) = ∑ ai yi (n) . Логическая функция z(n) реализуема на одном нейроне, если можноi =0так подобрать коэффициенты ai, что ∀y (n)(( z (n) < 0 ⇒ g (n) < 0)^ ( z (n) ≥ 0 ⇒ g (n) ≥ 0 )) .
ЭтоMH1Mn =1j =0n =1эквивалентно тому, что у функционала I (a) = ∑ g (n) − ∑ a j b j , b j = ∑ y j (n) z (n) , j=0,…,H1должен существовать минимум, в котором он обращается в ноль.Таким образом, задача проверки условия реализуемости сведена к классической задачиминимизации функционала.IIIIIIОставшаяся часть раздела посвящена описаниюметодаминимизацииданногофункционала.yПрименяется два подхода.
Во-первых, с использованием xлинейной аппроксимации, во-вторых, по таблицампороговых функций.Первый способ дает решение, при котором ai = bi ,∪……i=1,…,H1, a0 – варьируется для обеспечения минимумафункционала. Второй применяется в случае, если числонейронов до 7 в соответствии с поиском решения потаблицам.Рис. 4.
Трехслойная сеть из НЭЕсли решение не может быть получено сиспользованием только одного НЭ, переходят к синтезупорогово-дизъюнктивной сети.Раздел 2.3.2.9 посвящен вопросам построения порогово-дизъюнктивной двухслойнойсети. Первый ее слой состоит из обычных НЭ, а второй из единственного НЭ вырожденноговида, реализующего схему ИЛИ (см.
рис. 4).В основе применяемого метода синтеза лежит использование понятия монотоннойфункции. Синтез двухкаскадной сети с элементом ИЛИ на выходе состоит в выделении рядадопустимых конфигураций, таких, что все единицы логической функции “покрываются”.Допустимая конфигурация есть подмножество единиц данной логической функции, котороеможет быть реализовано одним НЭ из входного каскада. В работе подробно описываетсяалгоритм, позволяющий осуществить синтез подобной сети.Раздел 2.4 посвящен описанию математических методов, применяющихся для оценкикачества построенной системы классификации. Данные методы используют обучающие ипроверочные выборки с целью определения вероятности правильной классификации, которойдостигла нейронная сеть в процессе обучения.Третья глава посвящена созданию программно-аппаратного комплекса АСУ ИП,решающей задачу адаптивной фильтрации НР.В разделе 3.1 определены требования к проектированию и реализации, учитывающиеособенности АС данного класса.
Данные требования явились определяющими припроектировании размещения типовых компонент АСФ НР (раздел 3.2).Все функциональные блоки ЦАФ, а также БФ и частично БП всех АП реализуются на базесерверного аппаратно-программного комплекса, обслуживающего корпоративную систему ЭПв режиме 7x24. При этом функциональные блоки БП и БУ каждого АП реализуются на базеотдельного интеллектуального терминала в виде персональной ЭВМ конкретного пользователя.12В серверной части БП АП организуется хранилище сообщений (ХС), в которое попадаютсообщения после прохождения системы фильтров. В пользовательской части БП АПорганизуется доступ к сообщениям, хранящимся в ХС по запросу (протокол POP3 или IMAP4).При считывании сообщения из ХС предусмотрен вариант, когда сообщение остается в ХС, чтопозволяет многократно считывать одно и то же сообщение даже в том случае, когда ПЭВМпользователя отключена.В разделе 3.3 осуществляется выбор системного и стандартного прикладногопрограммного обеспечения.
Поскольку АСАФ НР являются развитием стандартных системобработки сообщений, то для сокращения затрат на разработку системы, в качестве основы дляАСАФ НР представляется целесообразным выбрать одну из существующих систем этогокласса. В разделе обосновывается выбор в качестве платформы для построения почтовогосервера системы Sendmail, а в качестве основы клиентской части – Microsoft Outlook.Далее в разделе осуществляется выбор ОС. Выбор в качестве платформы системыSendmail определяет выбор в качестве серверной ОС UNIX-подобную ОС. В работеанализируются другие полезные особенности ОС данного типа, в частности, указывается ихгибкость и масштабируемость, что позволяет построить достаточную по производительностиреализацию серверной части даже на базе недорогих аппаратных средств.
В качествеклиентской ОС рекомендуется Windows XP SP1. Выбор в основном определяется высокимипользовательскими качествами данных систем, дружественным интерфейсом и широкойраспространенности ОС данного типа, что гарантирует снижение затрат на внедрение иэксплуатацию системы.Далее осуществляется выбор и обоснование средств разработки. Посколькуразрабатываемые программные средства применяются в гетерогенной среде, то в целяхобеспечения программной совместимости и однородности модулей проекта, разработка должнаотвечатьтребованиямкросс-платформенности.Другимтребованиемявляетсямасштабируемость языковых средств, которая с одной стороны должна позволятьреализовывать дружественный интерфейс, с другой обеспечивать оптимальную реализациювысокопроизводительных многоитерационных алгоритмов.
Наиболее данным требованиямотвечает язык C, который, во-первых, имеет реализации в большинстве существующих систем;во-вторых, средства разработки позволяют с одной стороны построить оптимальный код, сдругой – обеспечивают средства быстрой разработки приложений (RAD) с пользовательскиминтерфейсом. Разработка основывается на стандартах ANSI, серверная часть следуетстандартам Posix на базе RTL Glib и стандартной спецификации взаимодействия с системойSendmail Milter, клиентская использует программный интерфейс приложений Win32, а такжестандартную библиотеку языка C, совместимую с Posix. Взаимодействие компонентов системыобеспечивается с помощью спецификации программного интерфейса сокетов, совместимую сPosix.Далее осуществляется выбор аппаратного обеспечения.
Анализируются различныеаппаратные платформы. В качестве рекомендуемой системы предложена система на базепроцесса Intel Pentium 4, 512Мб оперативной памяти, объем жесткого диска до 80Гб взависимости от числа пользователей.В разделе 3.4. описываются типовые реализации системы на базе выбранных программноаппаратных средств.В разделе 3.5 подробно описываются модули клиентской и серверной части, ихразмещение и методы взаимодействия между новыми и стандартными модулями,информационные потоки между отдельными подсистемами.