Попов И.И., Матвеев А.А., Максимов Н.В. Архитектура электронно-вычислительных машин и систем (2004) (1186255), страница 31
Текст из файла (страница 31)
Бум сетевых процессоров, окончательно176оформившийся в середине 1999 года, не был кратким, и в последующиегоды индустрия развивалась крайне бурно.Попрогнозамсамыхсмелыханалитиков,рыноккоммуникационных процессоров в 2004 году составит около $2,9 млрд.и с увеличением объемов специальные микросхемы будут вытесненыстандартными сетевыми процессорами. Более "умеренные" аналитикисчитают, что у сетевых процессоров, без сомнения, есть будущее, но онисмогут преобладать только на некоторых сегментах рынка, гденеобходимы укороченные циклы разработки, быстрота и гибкость.Прогнозируется, что на этом рынке не будет преобладать какаялибо одна компания, как, например, "Intel " на рынке ПК. Однакосчитается, что Intel все же будет одним из ключевых игроков, разделив$2,9 млрд. с IBM, Motorola и дюжиной других компаний.Новая серия коммуникационных процессоров INTEL IXP4xxпостроена на базе распределенной архитектуры XScale™ и включаетмощные мультимедийные возможности, а также развитые сетевыеинтерфейсы Ethernet.
Сочетание высокой производительности и низкогоэнергопотребленияпозволяетэффективноприменятькоммуникационные процессоры INTEL не только в классическихсетевых приложениях, но и для построения интернет-ориентированныхвстраиваемых систем промышленного назначения.Эффективность работы промышленных предприятий сегоднянапрямуюзависитотгибкостиприменяемыхсистемавтоматизированногоуправления.Крупныепроизводственныеустановки требуют использования нескольких децентрализованныхсистем управления, связанных друг с другом мощной информационнойсетью, способной работать в сложных промышленных условиях.Зачастую эти средства промышленной коммуникации призваныобеспечить возможность гибкого управления, программирования иконтроля работы распределенных систем управления из удаленныхдиспетчерских пунктов.
Осуществление этих целей возможно спомощью коммуникационных процессоров, предназначенных дляподключенияперсональныхкомпьютеровкпромышленныминформационным сетям.Дополнительныевозможности,обеспечиваемыекоммуникационными процессорами должны быть интересны, преждевсего, тем пользователям, которым необходимо осуществлять сложныетранзакции или наладить прямую голосовую и видео передачи в рамкахсетевой инфраструктуры.Процессоры баз данныхПроцессорами (машинами) баз данных в настоящее время принятоназывать программно- аппаратные комплексы, предназначенные длявыполнения всех или некоторых функций систем управления базами177данных (СУБД). Если в свое время системы управления базами данныхпредназначались в основном для хранения текстовой и числовойинформации, то теперь они рассчитаны на самые различные форматыданных, в том числе графические, звуковые и видео.
Процессоры базданных выполняют функции управления и распространения,обеспечивают дистанционный доступ к информации через шлюзы, атакже репликацию обновленных данных с помощью различныхмеханизмов тиражирования.Современные процессоры баз данных должны обеспечиватьестественную связь накапливаемой в базах данных информации сосредствамиоперативнойобработкитранзакцийиInternetприложениями. Это должны быть системы, которые дают пользователямвозможность в любой момент обратиться к корпоративным данным ипроанализировать их, вне зависимости от того, где эти данныеразмещаются.Решение таких задач требует существенного увеличенияпроизводительности таких систем. Однако традиционная программнаяреализация многочисленных функций современных СУБД на ЭВМобщего назначения приводит к громоздким и непроизводительнымсистемам с недостаточно высокой надежностью.
Необходим поискновых архитектурных и аппаратных решений. Интенсивныеисследования, проводимые в этой области в настоящее время, привели кпониманию необходимости использования в качестве процессоров базданных специализированных параллельных вычислительных систем.Создание такого рода систем связывается с реализацией параллелизмапри выполнении последовательности операций и транзакций, а такжеконвейерной потоковой обработки данных.Потоковые процессорыПотоковыми называют процессоры, в основе работы которыхлежит принцип обработки многих данных с помощью одной команды.Согласно классификации Флинна они принадлежат к SIMD (singleinstruction stream / multiple data stream) архитектуре.
Технология SIMDпозволяет выполнять одно и то же действие, например вычитание исложение, над несколькими наборами чисел одновременно. SIMDоперации для чисел двойной точности с плавающей запятой ускоряютработу ресурсоемких приложений для создания контента, трехмерногорендеринга, финансовых расчетов и научных задач. Кроме того,усовершенствованы возможности 64-разрядной технологии MMX(целочисленных SIMD-команд); эта технология распространена на 128разрядные числа, что позволяет ускорить обработку видео, речи,шифрование, обработку изображений и фотографий. Потоковыйпроцессор повышает общую производительность, что особенно важнопри работе с 3D-графическими объектами.178Может быть отдельный потоковый процессор (Single-streamingprocessor — SSP) и многопотоковый процессор (Multi-StreamingProcessor - MSP).Ярким представителем потоковых процессоров являетсясемейство процессоров Intel, начиная с Pentium III, в основе работыкоторых лежит технология Streaming SIMD Extensions (SSE, потоковаяобработка по принципу "одна команда - много данных").
Эта технологияпозволяет выполнять такие сложные и необходимые в век Internetзадачи, как обработка речи, кодирование и декодирование видео- иаудиоданных, разработка трехмерной графики и обработкаизображений.Бесспорными представителями класса SIMD считаются матрицыпроцессоров: ILLIAC IV, ICL DAP, Goodyear Aerospace MPP, ConnectionMachine 1 и т.п. В таких системах единое управляющее устройствоконтролируетмножествопроцессорныхэлементов.Каждыйпроцессорный элемент получает от устройства управления в каждыйфиксированный момент времени одинаковую команду и выполняет еенад своими локальными данными.Другими представителями SIMD-класса являются векторныепроцессоры, в основе которых лежит векторная обработка данных.Векторная обработка увеличивает производительность процессора засчет того, что обработка целого набора данных (вектора) производитсяодной командой.
Векторные компьютеры манипулируют массивамисходных данных подобно тому, как скалярные машины обрабатываютотдельные элементы таких массивов. В этом случае каждый элементвектора надо рассматривать как отдельный элемент потока данных. Приработе в векторном режиме векторные процессоры обрабатываютданные практически параллельно, что делает их в несколько раз болеебыстрыми, чем при работе в скалярном режиме.
Максимальная скоростьпередача данных в векторном формате может составлять 64 Гб/с, что на2 порядка быстрее, чем в скалярных машинах. Примерами системподобного типа является, например, процессоры фирм NEC и Hitachi.Нейронные процессорыОдно из наиболее перспективных направлений разработкипринципиально новых архитектур вычислительных систем тесносвязано с созданием компьютеров нового поколения на основепринципов обработки информации, заложенных в искусственныхнейронных сетях (НС).Первые практические работы по искусственным нейросетям инейрокомпьютерам начались еще в 40-50-е годы.
Под нейронной сетьюобычно понимают совокупность элементарных преобразователейинформации, называемых «нейронами», которые определенны образом179соединены друг с другом«синаптическими связями».каналамиобменаинформацииб)а)Рис. 16. Нейрон (а), нейросеть (б)Нейрон, по сути, представляет собой элементарный процессор,характеризующийся входным и выходным состоянием, передаточнойфункцией (функция активации) и локальной памятью. Состояниянейронов изменяются в процессе функционирования и составляюткратковременную память нейросети.
Каждый нейрон вычисляетвзвешенную сумму пришедших к нему по синапсам сигналов ипроизводит над ней нелинейное преобразование. При пересылке посинапсам сигналы умножаются на некоторый весовой коэффициент. Враспределении весовых коэффициентов заключается информация,хранимая в ассоциативной памяти НС. Основным элементомпроектирования сети является ее обучение.
При обучении ипереобучении НС ее весовые коэффициенты изменяются. Однако ониостаются постоянными при функционировании нейросети, формируядолговременную память.НС может состоять из одного слоя, из двух слоев, из трех ибольшего числа, однако, как правило, для решения практических задачболее трех слоев в НС не требуется.Число входов НС определяет размерность гиперпространства, вкотором входные сигналы могут быть представлены точками илигиперобластями из близко расположенных точек. Количество нейроновв слое сети определяет число гиперплоскостей в гиперпространстве.Вычислениевзвешенныхсумми выполнение нелинейногопреобразования позволяют определить с какой стороны от той или инойгиперплоскости находится точка входного сигнала, в гиперпространстве.Возьмемклассическуюзадачураспознаванияобразов:определение принадлежности точки одному из двух классов.
Такаязадача естественным образом решается с помощью одного нейрона. Онпозволит разделить гиперпространство на две непересекающиеся и180невложенные гиперобласти. Реально, входные сигналы в задачах,решаемых с помощью нейросетей, образуют в гиперпространствесильно вложенные или пересекающиеся области, разделить которые спомощью одного нейрона не возможно. Это можно сделать, толькопроведя нелинейную гиперповерхность между областями. Ее можноописать с помощью полинома n-го порядка. Однако, степенная функцияслишком медленно считается и поэтому очень неудобна длявычислительной техники.