Диссертация (1335837), страница 41
Текст из файла (страница 41)
В связи с тем, что нейроннаяосетьв виде ПНПопомещается в командных ячейкахолокальных пулов, будетополезнопри распределенииоКП отобразитьодвумерную совокупностьоформальных нейро-261новомногослойнойосетионаолинейную последовательностиолокальных пуловотак,чтобы КП, соответствующиеоформальным нейронамоотдельного слоя, размещалисьов командныхоячейках разных локальныхопулов.Топология нейронныхосетей задаетсяокоммуникационными полями Di , определяющимиосвязи междуоформальными нейронамиослоев НС,окоторые описываютсяов ходеопрограммирования. Результатыообработки в виде ПД отправляютсяов ряд локальных пулов, что делаетоналичие распределительной сетиообязательным.Формальные нейроны Wi , которыеоотмечены вокомандном пакетеопризнаком С (const), ворежиме функционированияонейронной сетионе должныоизменяться, ноов процессеонастройки функциональныхопараметров (обучения сети)ониобудут выполнятьороль операндныхополей командных ячеекои будут подлежатьомодификации.Нейронная сетьосамоуправляется сопомощью механизмаочастичной илиполнойоготовностиданныхоипередачейрезультатовообработкиКП-источниковов операндныеополя КП-приемников посредствомопередачи данных.Нейронныеосети начинаютофункционировать воходе загрузкиопередачи данныхово входнуюоочередь и дальше–в поляокомандных ячеек []72, 154, 157].5.2.3 Оценкаоэффективности реализации процессовоинтеллектуальнойсистемы анализаои оценки устойчивостиоБЦВК к деструктивномуовоздействию СК ЭМИЭффективностьомногофункционального командногоопула обуславливаетсяосовмещением во времениопроцессов передачи, храненияои обработки информации.оРост функциональнойоустойчивости нейросетевой системыопроисходитпосредствомозамыкания большейочасти информационного потокаов пределахомногофункционального пула, а повышениеопроизводительности связано соминимизацией пересылокоинформации черезоинтерфейсы [106].Для наглядностиооценим временныеозатраты, которыеосвязаны с цикломработыонейронной сети, размещенной:2621) в командныхопулах с разнесеннымиов пространствеозонами храненияиообработки информации;2) на базеомногофункционального командногоопула.Для первогоослучая свойственнаопередача двух разновидностейопакетовпооинтерфейсам: пакетоводанных и командныхопакетов, а также послойнаяореализация функциионейроннойосети [72, 154, 157].
Дляопоследовательного занесенияовопул команд ПД, которыеоотносятсяок отдельномуоформальному нейронуослояонейронной сети нужныозатратыовремени ni 1t c (t c – время передачи черезоинтерфейс одного ПД,ni 1– число формальных нейроновопредыдущего слоянейроннойосети), а для слояов целом –ni 1ni t c ni( – число формальныхонейроновтекущего слоя нейроннойосети). По числу формальных нейроноводанного слояформируются КПодля передачи по интерфейсуов зону обработкио(затраты времениni tc ). В операционнойозоне для каждогооформального нейронаовычисляют-ся взвешенныеосигналы ni 1t m (t m – время выполненияооперации умножения) сооследующим накоплениеморезультата ni 1t a (t a – время выполненияооперациисложения), а для слояонейронных сетей – ni ni 1 (t m t a ) .Затратыово времени для слояонейронной сети – ni (ni 1t c t c ni 1 (t m t a ) , aНС из k слоевk 1t NN nk t c ni (ni 1t c t c ni 1 (t m t a )i 1,(5.6)где первоеослагаемой учитывает передачуопо интерфейсу ПД с результатами вычисленийоиз выходногоослоя нейроннойосети, который содержит n k формальныхонейронов.В случае многофункциональногоопула операцииопередачи ПД по интерфейсу ni 1ni t c совмещеныосопроцессом обработки - t m t a , отсутствуетонеобходимостьоформирования и передачи КП черезоинтерфейс в зону обработки, следовательно, общиеозатраты времениоснижаются263k 1t MNN nk t c ni (ni 1t c t m t a )i 1.(5.7)Эффективностьоиспользования многофункциональногоопула можноооценить отношениемовыражений (5.6) и (5.7).
Дляонаглядности (рисунок 5.6) положим, что числооформальных нейроновов слоях нейронныхосетей одинаково,оисключая первое слагаемое, котороеосвязано с выдачей результатовоработынейронной сети, в качествеопараметра выбрано tc, что являетсяовременем передачи пакетаопо интерфейсу.Рисунок 5.6 - Эффективностьомногофункционального пулаопосравнению с пулом команд5.3 Структурныеорешенияонейросетевойореализации ИСАУоБЦВКПри описании ИСАУ БЦВК нейросетевыми пакетнымиопрограммами возможнаоразная степень детализации:окомандный пакет можетосоответствоватьоднойоиз функций нейросетевогоологического базиса, функцииоформальногонейрона, слоя из формальныхонейронов или нейроннойосети в целом [161].
Всвязи с этимоизменяются требованияок проектированиюобазовых блоковоисложностьотехнической реализациионейронной сети. Представлениеокомандными пакетамиоопераций, которыеосоответствуют отдельнымофункциям формальногоонейрона, не целесообразнооввиду малойофункциональной сложностиоиразнородностиоопераций иовозрастания потока ПД с промежуточнымиорезультатами вычислений.264Следовательно,онеобходимо рассматриватьоградации сложностиокомандных пакетов, начинаяосоуровня формальногоонейрона, т.е. учитывая следующиеосоответствия: КП ФН, КП-слой ФН, КП НС [72, 154].Возможныеоархитектурные решенияонейросетевой ВС дляосоответствия КПФН возависимости от характераовыполнения операцийопоказаны в таблице 5.1Т а б л и ц а 5.1По входамПо ФНПо слоям НСАрхитектурные особенности средыФН1Последоват.Послед.
Последоват.Последовательная в пуле распределенная обработка, один PU в пуле2Последоват.Парал.Последоват.Параллельная в пуле распределенная обработка, PU по числу ФН в слое3ПараллельноПослед. Последоват.Последовательная в пуле распределенная обработка, один PU в пуле4ПараллельноПарал..Последоват.Параллельная в пуле распределенная обработка, PU по числу ФН в слое5ПараллельноПарал.ПараллельноПараллельная распределенная обработка, PUпо числу ФН в слое, конвейеризация обработкипо слоям НСРеализацияофункции формальногоонейрона на основеопоследовательнойраспределеннойоарифметики (SDA - Serial Distributed Arithmetic) дает наибольшийовыигрыш по аппаратныморесурсам, но требуетобольших временныхозатрат[251].При использовании параллельнойораспределеннойоарифметики (PDA - Parallel Distributed Arithmetic - варианты 1 и 2 из таблицы 5.1) получаемокомпромиссное решениеос точкиозрения аппаратныхозатрат и времениореализациифункцииоформального нейрона.
В техническоморешении такойорезультат работыоформального нейронаоформируется в локальномопуле (рисунок 5.7) путемпоследовательногоосуммирования взвешенных значенийовходов формальногоонейрона, последовательнооили параллельно по ФН отдельногоослоя сетиои последовательноопо слоям НС. Последовательныйохарактер обработки по входамо-265формального нейронаоопределен использованиемов качестве интерфейсаодлядоставкиопакетов данных кольцевойошины с последовательной передачейопакетов данныхос выходов наовходы локальныхопулов.
Получение пакетоводанных влокальномопуле вызывает запускоцепочки операций чтение – модификация – записьос проверкой готовностиокомандных пакетов, что равносильноовыполнениюоперацийонейросетевого логическогообазиса по взвешиваниюоотдельного входаои накопления поступившиховзвешенных входов в командномопакете.Рисунок 5.7 - Локальныйопул командПоследовательный илиопараллельный характерообработки данных пооотдельным формальнымонейронам слоя сети зависитоот распределения командныхопакетов нейросетевойопакетной программыопо локальнымопулам. Еслиовсекомандныеопакеты программыофиксированы в одномолокальном пуле («вертикальное» размещение командныхопакетов), то возможноотолько последователь-266ноеовыполнение функцийоотдельных формальныхонейронов сети.
Еслиоже командныеопакеты, соответствующиеоформальнымонейронам одного слоя, распределеныопо различнымолокальнымопулам («горизонтальное» размещение КП), товозможныоварианты параллельнойоили параллельно-последо-вательной ообработки.Вовсехрассмотренныхослучаяхсохраняетсяопоследо-вательныйохарактеровыполненияовычисленийопо слоям нейронной сети.При параллельнойообработке значенийокоординат входногоовектора в пределахолокального пула (варианты 3 и 4 таблица 5.1) из-заоодновременного выполненияоопераций взвешиванияовходного вектораоиоприменения свертывающегоодерева сумматорововозрастают аппаратныеозатраты. И когда производитсяопереход от бинарногоопредставления формального нейронаок формальномуонейрону с вещественнымиозначениями обрабатываемыходанных, потребностьоваппаратных ресурсаховозрастает пропорциональнооколичеству входовов основном из-за увеличенияочисла блоковоумножения.По оценкам [72, 154] использованиеовосьми конвейерных умножителейо8x8 битов дополнительном коде, выполненныхопо алгоритмуоБута, которыйсвертываетодерева сумматоровои компаратораос загружаемымо8-разрядным порогом требуетозначительного объемаологических ресурсов: 44% от ПЛИСXC4036XLA и до 18% от ПЛИС XC4085XLA.
Применение восьмиопараллельнопоследовательныхо8-разрядных умножителей, 16-разрядногооаккумулятора частичныхопроизведений современным мультиплексированиемоприводит к снижениюообъемааппаратныхозатратдо12%отологическихресурсовоПЛИСXC4036XLA и 5% от XC4085XLA на ФН. Т.е. на кристаллеоХС4085 размещаетсядоодвадцати 8-входовыхоФН. Реализацияоформального нейрона, которая основываетсяона последовательной распределеннойоарифметики SDA, дает наибольшийовыигрышный результат поозанимаемым ресурсам – около 3% от общиховозможностей ПЛИС XC4085XLA, что равносильнооразмещению на одномокристалле примерно околоо30 формальных нейроново(85 Кбайт/нейрон против 570Кбайт/нейрон дляослучая параллельнойоарифметики).267Многослойная структураонейронной сети какораз и определяетопоследовательный характерообработки информации поослоям НС.
Воэтой связи параллельностьовычислений по слоямонейронной сети (пятыйовариант из таблицы 5.1) можетобыть обеспечена толькооконвейеризацией вычислений, которая производитсяопараллельно в локальныхопулах команд надопоследовательно поступающимиово времениовходными векторамиос фиксациейопромежуточных вектороворезультатов.Стоит отметить, чтооглавным достоинствомонейросетевой вычислительнойосреды, котораяоописывается команднымиопакетами наоуровне соответствияКП-ФН, являетсяонезависимость ототопологии реализуемыхосетей, так какокоммуникационными полямиокомандных пакетовозадаются все связи между разными формальными нейронамиосети.
Обратнойостороной подобной детализацииоявляется увеличеннаяозагрузка цепей коммуникации,опотому что каждыйопакетданныхоподходит толькооотдельной связи ФН. То есть, PU образуютобольшоеочисло малоинформативныхопакетов данных, для передачи которыхонеобходимывысокоскоростныеоинтерфейсы.
Частичнооданная проблемаоможет бытьорешеназа счет указания в адресномополе пакетоводанных всехосвязей конкретного формальногоонейрона-источника соформальными нейронами-приемниками вместооединственной связи с конкретнымоформальным нейроном-приемником.Адрес входаФН - приемника 1..... Адрес входаФН - приемника пДанные отФН - источникаТакое представление ПД – суперпакетом данныхопозволяет воn раз, где n числооформальных нейроновов слое, уменьшить количествоопередаваемых пакетоводанных, но потребуетоусложнения цепейоадресной селекцииоФН.Степень детализацииоКП-слой ФН.