Диссертация (1335837), страница 42
Текст из файла (страница 42)
Следующийошаг, которыйодает возможностьосократитьоколичество пакетоводанных в цепяхокоммуникации, этоопереход к степениодетализации КП-слой ФН. То естьокомандный пакет вкачествеообъектаоописываетослойоформальныхонейронов, которыйопроизводитобработкуовходного вектораоX путемоумноженияонаоматрицу весовых коэффи-268циентов W c цельюоформированияовыходногоовектора OUT (XW ) . При этомоможно вновьовернутьсяокопростойоформе пакетоводанных, число которыхов пакетнойопрограмме определяетсяоколичествомослоев представляемой НС.Адрес входа слоя-приемникаВектор данных от слоя-источникаВ рассматриваемомослучае стоит особо обратитьовнимание на увеличениеопотребления аппаратныхоресурсов нейросетевойовычислительной средой, таккакопри реализациионейронной сети с различнымочислом формальных нейроновов отдельных слояхоНС в качествеоориентира дляовыделения аппаратныхосредств будет выбран слой с наибольшим количествомоформальных нейронов.Для переходаок схеме: параллельноопо входам ФН – параллельноопо ФНслоя – последовательноопо слоям нейроннойосети следует предугадатьодальнейшее увеличениеоаппаратных затрат, потому чтоопроцессы взвешивания элементововходного вектора X потребуютоувеличению числаофункциональных блоковопропорционально числуовходов ФН.
Следовательно, базовыйоблок нейросетевойовычислительной средыобудет представлятьсяокак двумернаяосистолическаяматрицаонейропроцессорных блоков – PN, «горизонтальное» измерениеокоторойбудет соответствоватьочислу ФН слоя нейроннойосети, а «вертикальное» – количествуовходовоФН.При выбореоархитектуры базовогооблока нейросетевойовычислительнойосреды, соответствующейосхеме: параллельноопо входам ФН – параллельноопоФН слоя – параллельноопо слоям нейроннойосети следуетоопираться на послойнуюопередачу с фиксациейопромежуточных результатововычислений в процессеоконвейеризации работыоНС.Степень детализацииоКП нейроннаяосеть.
Максимальноовозможная степеньосложностиоописания нейроннойостеи – этоозадание всех функциональныхпараметровои связейоодним команднымопакетом. Загрузкаоподобного командногоопакета в базовыйоблок нейросетевойовычислительной среды можетопредставляться как ее настройкаона выполнениеофункции конкретной НС.269Поступлениеовходного вектораов виде пакетаоданных запускаетов базовомоблоке вычисления, которыеозавершаются формированиемопакетов данных совектороморезультата:Адрес приемникаВектор данных от нейронной сетиПодобнаяоорганизацияоработы нейроннойостеи неосопровождается передачейопромежуточных результатововычислений, то есть все потокиоданныхзамкнутыовнутри базовогооблока, и в основномоисключена возможностьооказания несанкционированногоовоздействия на ходопроцесса формированияорезультата.5.3.1 Командные пулыоуровня формальногоонейронаПри описаниионейронных сетей, которыеодетализируются дооуровня формальногоонейрона, необходима соответствующаяоаппаратно-программная реализацияоИСАУ БЦВК.
Степеньодетализации КП-ФН являетсяоминимально возможнойодля представления объектов-данных, передаваемыхопакетами данныхопо межнейроннымосвязям, а точнее, междуоконкретным выходомоФН-источникаиоопределенным входомоФН-приемника результата [72, 154].Наорисунке 5.7 показанаоструктура локальногоопула, которыйоорганизованвосоответствии с вышеперечисленнымиоположениямиои использующий механизмочастичной готовностиодля отслеживанияопоступления заданнойосовокупностиооперандов, представленныхобинарными значениями.Локальныйопулообразован изоследующих специализированныхомодулейпамяти:- RM (Readiness Memory) – памятьоготовности командныхопакетов к обработке - хранитобулеву матрицу, котораяоотражает динамикуопоступления операндовона информационныеовходы ФНосети иофиксирует фактопоступленияооперанда волокальный пулоустановкойоединицыовосоответствующем битеоматрицы; заполнениеоединицами некоторогооадресного сеченияоматрицыосоответствует моментуопоступления всехооперандов наовходы некоторогооформального270нейрона; данный моментоаппаратно отслеживаетсяосхемой готовности RS (Readiness Scheme), формирующей сигналоPOP извлеченияопакета изолокального пулаи сигналообнуления данногооадресного сечения RM;- RCM (Readiness Control Memory) – память управленияоготовностью позволяетоявным образом указать, поступлениемокаких изооперандов для данногооформального нейронаоможно пренебречь приоформировании сигнала POP схемойоготовности RS; булеваоматрица, хранимая в RCM, маскируетобулеву матрицу, формируемуюов RM в процессеозагрузкиопакетов данныховолокальный пул;- IM (Instructions Memory) – памятьокоманд – хранитотопологию нейронной сети; такокаковсеокомандные пакетыонейронной сетиореализуют однуобазовуюофункцию формальногоонейрона, то IM содержитотолько коммуникационнуюоинформацию;- FM (Functional Memory) – памятьофункциональных параметров – предназначенаодля долговременногоохранения значенийовесовых коэффициентов иопорогов срабатывания ФН, которыеоформируются вопроцессе обученияонейронной сети;- AM (Accumulator Memory) – аккумуляторная память – предназначенаодля накопленияозначений произведенийо Wi X i весовыхокоэффициентов Wi , ассоциированныхосо всемиовходными значениями, которыеопоступают в локаль-ныйопул к определенномуомоменту времени;- DQ (Data Queue) – магазиннаяопамять, размещаемаяона входеолокальногоопула дляобуферизации входныхопакетов данных;- RQ (Results Queue) – магазиннаяопамять, размещаемаяонаовыходе локальногоопула командодляобуферизации пакетоводанных с результатамиообработки.Если волокальном пулеоразмещены командныеопакеты, которыеовходятвосостав однойоили несколькихонейросетевых пакетныхопрограмм, то локальный пулобудет находитьсяов состоянииопокоя доотех пор, покаово входнуюочередьоDQ не поступитохотя быоодин изопакетоводанных.
Внесение пакетаданныхов DQ по внешнемуосигналу Wr приведеток образованиюовнутреннего271сигналаоуправления PUSH, которыйовызовет добавлениео(если X i 1 ) очередногоозначенияовесового коэффициентаоWt в аккумуляторнуюопамять AMопо адресу,оопределяемому коммутационнымополем входногоопакета данных, а именно:адресомокомандного пакетаоAdrCP и адресаооперанда вокомандном пакетеAdrOp.Причемов локальномопуле фиксируется необинарное значение, а вы-бранноеоиз тогооже адресного сеченияофункциональной памятиоFM значениевесовогоокоэффициента,котороеоприпередачеочерезблоковентилейGATESопреобразуется операциейопоразряднойоконъюнкции Wi X i и складываетсянаосумматоре SUM с ранееонакопленнымозначением, котороеовыбрано из тогооже адресного сеченияоаккумуляторной памятиоAM.
Образованноеона выходеосумматора новоеозначение суммыозаписывается поопрежнему адресу в аккумуляторнойопамяти. Такжеоодновременно выполняетсяоустановка бита готовностиRi соответствующегообинарному значениюв выбранномоиз памятиоRM теку-щемозначении словаоготовности. Новоеозначениеословаоготовности маскируетсяовыбранным изотого же адресногоосечения памяти управленияоготовностьюCRM словомомаски. Результатофиксируется по прежнемуоадресу вопамяти готовностиоданных RM в качествеотекущего словаоготовности данных. Установкаовсехбитовготовностиовнекоторомадресномосечениипамятиоготовностиоданныхоотслеживаетсяосхемой готовности RS, которая инициируетовыдачуов очередь RQопакетаоданных, в коммуникационныеополя которогоозаноситсяоиз памятиокоманд IM коммуникационнаяоинформация о командномопакете-приемниках результата, аов поле OUT -означение совыхода дискриминатораоСОМР, которыйовыполняет сравнениеонакопленной воаккумуляторной опамятиосуммыовсехопоступившихок данному моменту произведенийспорогомосрабатыванияоформальногоонейрона Wo, выбранного из функциональнойопамяти FM, и формированиеобинарного результата OUT.
После фиксацииопакета данных в очереди RQ поосигналу POP команднаяоячейка переводитсяовисходное состояние путемообнуления соответствующегооадресного сеченияоак-272кумуляторной памятиои тогооже адресного сеченияолокальной памятиоготовности данных. Выходнаяомагазинная памятьоформирует сигнало«Очередь RQ непуста» для извлечениеопакета данныхоиз локальногоопула.Вышеописанный процессообработкиоинформацииопроизводится непосредственноов командных ячейкахолокальных пулов иосовпадаетово времени с записьюово входном стеке DQ вновьопоступающихопакетов данных. Причем самопроцессообработкиоинформации заключается воциклическом выполненииооперацийчтения,омодификацииоиданныхоRM,записиосодержимогоаккумуляторнойпамятиоготовностипамятиоAMоиопамятиофункциональныхпараметровоFM, завершениеокоторого контролируетсяосхемой готовностиоRS,переводящейокомандную ячейку в исходноеосостояниеоиоразрешающей формированиеопакетоводанных с результатомопреобразования.Отметим,чтооорганизацияпулакомандокакмногофункциональ-нойопамяти, которая управляетсяопотоками данных, приводиток децентрализации управления, тооесть помимо распределенныховычислений имеетоместо бытьиолокальное распределенноеоуправление.Детализация описанияонейронной сетиоуровня соответствия КП-ФН, когдаокоммуникационными полямиокомандного пакетаозадаются все связи междуоотдельными формальнымионейронами сети, приводиток повышенной нагрузкеона интерфейс, в которыйопрактически одновременноопоступает количествоопакетов данных, равноеочислу связейомеждуоформальнымионей-ронами соседних слоевонейронной сети.Уменьшить число пакетоводанных в интерфейсеможно за счетоописанияовокоммуникационномополеопакета данных всехосвязейконкретногооФН-источника.Адрес входаФН - приемника 1...Адрес входаДанные отФН - приемника пФН – источникаПредставления объекта-данногоововиде суперпакета позволяетов n раз,огдеn - число формальныхонейронов в принимающемослое, уменьшить количествоопередаваемых между двумяослоями пакетоводанных.273Дляоиллюстрации последнегоотезиса стоит рассмотретьоархитектурноерешениеонейросетевой реализацииоИСАУ БЦВК с локальнымиопулами команд(рисунок 5.8), вокачествеораспределительной сетиосуперпакетов данныхов которой использован механизм кольцевой шины.Рисунок 5.8 - Нейросетевая среда с уровнем детализации КП-ФНПри вводеоисходныеоданные в виде пакетоводанных поступают из устройстваоввода IN на кольцевуюошину в форматеD1...DnXиодалее во входныеоцепи очередейоданных DQ.
Адресныеоселекторыокаждойизоочередей DQ производятосравнение полей «Адрес пула» - AdrPool воадресахкомандныхопакетов-приемников - Di с номеромосоответствующего локальногоопула. В случаеосовпадения формируютсяовнутренние пакетыоданных формата0 i n , и заносятсяовосоответствующиеоочереди DQ.DiXПроцессовывода результатов преобразованийоаналогичен адреснойорассылке исходныходанных иоотличается толькоотем, что совпадениеополей274AdrPool в адресахокомандныхопакетов-приемниковоDi происходитоне в адресныхселекторахоочередей DQ, а в адресныхоселекторах блокововывода данныхоOUT.«Узким» местомов данной структуреоявляется адресноеораспределение пакетоворезультатов по очередямоданных DQ локальныхопулов командос использованиемомеханизмаокольцевой шины [72, 154].Выходом можетоявлятьсяоприменение вокачестве распределительной осетикоординатногоокоммутатора, связывающегоовыходы очередейорезультатов совходами локальныхопулов.