Диссертация (1335837), страница 43
Текст из файла (страница 43)
Применениеоподобного коммутатораов интеллектуальнойопамятиIRAMо[162]решаетпроблемуоразвязкимножествавнутреннихопотоковомногоразрядныходанныхоприовыполнении суперскалярныхои векторныховычислений вомонолитном функциональноозавершенном устройстве.5.3.2 Командныеопулы уровняослоя формальныхонейроновДля представленияонейронных сетей,одетализированных дооуровня слояоформальныхонейронов [72], следуетоотметить, что КП описываетооперации умноженияовходного вектораоX на матрицуовесовых коэффициентовоW и нелинейногоопреобразования над координатамиовыходного векторао NET XW .При этом объекты-данные передаютсяововидеопакетов данных, числоокоторых винтерфейсеоограничено и равнооколичеству слоевов представляемойонейроннойсети, воформате:Адрес входаВектор данныхслоя-приемникаот слоя – источникаРисунок 5.9 показываетовариант построенияонаращиваемой секцииобазового блокаонейросетевой реализации ИСАУ БЦВК, которыйосоответствует случаюообработки командныхопакетов последовательноопо входам ФН – параллельноопо ФН слоям – последовательноопо слоям НС.
Базовыйоблок образованорангом нейропроцессорныхоузлов PN,окоторые взаимосвязаныообщей магистральюоиоцепямиоадреснойоселекции DC. Наращиваниеофункциональной мощно-275стионейросетевого вычислителяовозможно заосчет увеличенияочисла ФНопутемсоединенияосекций базовыхоблоков «по горизонтали» при помощиосистемы интерфейсныхошин адресаоAdr, данных Data иоуправления Ctrl.Рисунок 5.9 - Нейросетеваяосреда с уровнемодетализации КП-слой ФНБазовыйоблок может выполнятьофункциюолокальногоопула команд в данныхослучаях: при параллельномовыполнении операцииослоя ФН, если числоонейронов в слоеонейронной сети не превышаетоколичества нейропроцессорныхузловоPN; при параллельно-последовательномовычислении выходного вектораослоя ФН [72, 154].Базовыйоблок образованоиз следующихомодулей памяти:- LM (Links Memory) – памятьосвязей – хранитотопологию нейроннойосети;так как командные пакетыореализуют одну базовуюофункцию - слоя формальныхонейронов, то LM содержит толькоокоммуникационную информацию;- WM (Weights Memory) – памятьовесов – предназначенаодля долговременного (на срок работыонейронной сети) храненияозначений весовыхокоэффициентовиопороговсрабатыванияоформальныхонейронов,формируютсяовопроцессеообученияонейроннойосети;которые276- DQ (Data Queue) – магазиннаяопамять, размещаемая наовходе пула команд- для буферизацииовходныхопакетоводанных;- RQ (Results Queue) – магазиннаяопамять, размещаемаяона выходеопула –для буферизации пакетоводанных сорезультатами обработки.Еслиов базовомоблоке размещеныокомандные пакеты, которыеовходят всоставоодной или несколькихонейросетевых пакетныхопрограмм, то пул командоне будет выполнятьопреобразованийоинформацииопока воовходнуюомагазинную памятьоне поступитохотя бы один пакет данных с входной шины данныхINBUS в форматеAdr.
Neural NetworkAdr. LayerNXI… XNЗанесениеопакета данных в DQ приводитокоактивацииоцепей адреснойселекцииоDC. Еслиополя адреса Adr. Neural Network, Adr. Layerоне соответствуютразмещеннымовобазовомоблокеокоманднымопакетам,тообразуетсявнутреннийосигналоизвлеченияоПДоизовходнойоочереди. В противном случаезапускаетсяоциклообработкиопакетоводанных во всех PN данногообазового блока. Сигнал адресной селекцииовызывает обнулениеоаккумуляторов АС, извлечениеоиз модулей WM значений пороговосрабатывания (смещений) Wi 0 , где i – номер PN, и ихофиксациюов АС. ДалееополеоN пакетаоданных, которое задаеторазмерностьовходногоовектораX,загружаетсяовосчетчикCnt,задающийномеровходаонейроновослояонейроннойосети.
Выходная шинаосчетчика Cntуправляетомультиплексором MS, которыйоосуществляет последовательную коммутациюополей X 1 ... X N магазиннойопамятионаошину Data. Процесс реализацииофункции формальногоонейрона происходитопутем повторенияоцикла накопленияорезультата. В соответствииосо значениемокода адреса, задаваемогоона шинеAdr полями Adr. Neural Network, Adr. Layer и N, производится выборкаозначенияочередногоовесового коэффициента Wij , где j – номеровхода формальногоонейрона,оумножениеWijна значениеополя Xj воумножителях Mulои добавлениеозначе-277X jWijнийопроизведениявнакапливающиеосумматоры,образованныеоизокомбинационныхосумматоров Sum и аккумуляторовоАС. ПоX jWijв аккумуляторы АС произ-водитсяооперацияодекрементаосчетчикаоCntоиповторениеоциклаонакопленияслеодобавленияозначенийопроизведениярезультатаодоотех пор, покаосчетчик Cnt неообнулится.
ОбнулениеоCnt разрешает работуомодуля памятиосвязей LM и табличныхопреобразова-телейоTab, реализующихофункциюоактивацииформальногоонейрона.ВрезультатеомодульвыходнойомагазиннойопамятиоRQ офиксируетопакет данных в вышеприведенномоформате, который поступаетона выходнуюошину данных OUTBUS.Процессобработкиоинформациивобазовомблокеонейросетевойвычислительнойосредыопроизводитсяопараллельно во всех PN иосовмещен вовремениос фиксацией воовходной очереди DQ вновьопоступающих пакетов данных. Хотяосам процессообработки информацииозаключается воциклическом выполненииовышеописаннойпоследовательностиооперацийиозавершаетсяпосигналуосчетчикаоCnt. Следуетоотметить, чтоовобазовомоблокеоотсутствует модульопамятиоиологическойосхемы готовности данных, которыеонеобходимы дляотслеживания поступленияонеобходимогооколичества операндов на входыоформального нейрона. Этаофункция аппаратноореализуется счетчиком Cnt.Рассмотренноеотехническое решениеорационально с учетомоаппаратныхзатратов пересчете наоФН нейроннойосети, каждыйоиз которыхосодержит по одномуоумножителю, сумматору иоаккумулятору; обладаетофункциональной гибкостьюоза счет возможности наращиванияопо «горизонтали» отдельными базовымиоблоками, и по «вертикали» – изменяяоразмерность входногоовектора X;характеризуетсяопоследовательнойообработкойоэлементововходного вектора X.Дальнейшееоснижение аппаратных затратов нейросетевойовычислительной средеос уровнемодетализации КП-слой ФН можетобыть достигнутооза счетоупрощения узла синаптическогоовзвешивания входныхозначений формальныхонейронов, представленныхологарифмической моделью (рисунок 5.10).278Рисунок 5.10 - Нейросетеваяосреда с логарифмическимовзвешиванием входовДляовзвешивания входныхосигналов вместо операцииоумножения самихзначенийоиспользуется операцияосложения логарифмовозначений, что равносильноозамене блокаоумножения менееоресурсоемкими сумматоромои табличнымофункциональным преобразователем.
Согласноологарифмической моделиоформального нейронаопри выполненииооперации синаптическогоовзвешиваниязадействованыодванелинейныхопреобразователя.Первыйоизнихо ( x) a ln bx, a 1, b 1, x 0 (на рисунке 5.10 соответствующийоблок обозначено ln x ) размещен на выходеонейропроцессорного блока PN (выходоаккумулятораАС) и выполняет вонейронной сетиофункцию масштабированияовыходных значенийоформальных нейронов.1mxВторойопреобразователь реализуетофункцию ( x) pe , p 1, m 1 , (наxрисунке 5.10 соответствующий блокообозначен e ), с помощьюокоторой в моде-лиорешаются две задачи: потенцированиеозначений логарифмаовзвешенныхозначенийоперед их суммированиемовотеле формальногоонейрона и дополнитель-279mamaноеонелинейное преобразование, ( x) kx , k pb , ma 1 , котороеов рас-сматриваемойомодели формальныхонейронов играетороль функцииоактивации.Т.е.
функция (x) , неявноореализуемая в синапсахоприосуперпозицииофункций 1 ( ( x)) заосчетосоответствующего подбораокоэффициентов, переноситооснов-ное нелинейноеопреобразование совыходаона входы формальногоонейрона.При переходеок схеме: параллельноопо входам формальногоонейрона – параллельноопооФНослоям – последовательноопо слоямоНС следуетоувеличениеаппаратныхозатрат, такокакопроцессыовзвешиванияоэлементов входногоовектора X потребуютоувеличению числаовышеперечисленных функциональныхоблоков пропорционально числуовходов формальногоонейрона.В данномослучаеобазовыйоблок нейросетевойовычислительной среды будетоиметь вид двумернойосистолической матрицы PN, «горизонтальное» измерениеокоторой будетосоответствоватьочислуоформальных нейронов слоя нейроннойосети, а «вертикальное» – количествуовходов формальногоонейрона.При выбореоархитектуры базовогооблокаонейросетевойореализации ИСАУБЦВК, соответствующейосхеме: параллельноопоовходам ФН - параллельно поФН слоям – параллельноопоослоямонейроннойосетиоследует полагаться наопослойную передачуос фиксациейопромежуточных результатововычислений вопроцессеоконвейеризацииоработы нейроннойосети.Следовательно,ообъединение функций храненияоиообработкиоинформациивомногофункциональныхпулахоупрощаетоструктуруонейросетевойреализа-цииоИСАУ БЦВК заосчет исключения частиокоммуникационныхоцепей, которыепредназначеныодляопередачиоготовыхокообработкеокомандных пакетов отолокальных пуловокоманд копроцессорным узлам,ои снижаетозагрузку интерфейсаомеждуобазовымиоблоками.