Вопрос_63_Нечаев (1006304), страница 2
Текст из файла (страница 2)
исследований, а именно тех, которыми занимается нейрофизиология.
Основным нейрофизиологическим подходом к исследованию мозга в
настоящее время служит микроэлектродная методика. Ее суть заключается в
том, что в живую ткань мозга вживляются микроэлектроды, с помощью которых
регистрируется электрическая активность отдельных клеток. Однако
использование этой методики для изучения высокоразвитых животных связано с
рядом трудностей. Размеры электродов по сравнению с микроскопически малыми
телами клеток велики, а возможности их миниатюризации ограничены. Поэтому
микроэлектродные исследования могут искажать нормальную работу изучаемых
структур. Вживление электродов осуществляется вслепую и не всегда ясно,
работу каких клеток характеризуют снятые с них сигналы. Кроме того, клеток
много, а электродов мало. Поэтому получаемая с их помощью информация
является фрагментарной.
С целью преодоления отмеченных трудностей в нейробиологии вообще и в
нейрофизиологии в частности широко применяют метод биологического
моделирования. В соответствии с этим методом для изучения сложных структур
мозга высокоразвитых животных используют достаточно простые нервные системы
таких беспозвоночных, как черви, моллюски, кальмары, раки и т. п. Нейронные
структуры беспозвоночных содержат сравнительно мало нейронов, упакованных в
нервные узлы - ганглии. Ганглии, в свою очередь, содержат от 100 до 1000
клеток. Сами клетки у беспозвоночных крупнее, чем у млекопитающих, а их
положение в ганглиях и межнейронные связи более определены.
Рассмотренный подход к изучению нервной системы внешне напоминает
хорошо известный в технике метод физического моделирования. В соответствии
с этим методом сложный для изучения объект заменяется менее сложным, но
эквивалентным исходному по сути изучаемых явлений.
Однако в случае нейробиологии о собственно физическом моделировании
можно говорить лишь в том случае, когда исследуются такие свойства нервной
ткани, как электропроводность внутриклеточной среды, электрическая емкость
и сопротивление мембран, механизм генерации спайков и т. п. Эти свойства,
судя по всему, являются фундаментальными и не зависят от вида животного. В
то же время механический перенос данных о структуре и свойствах нейронных
сетей простых животных, например беспозвоночных, на нервную систему
высокоразвитых млекопитающих вряд ли является корректным. Поэтому для
изучения информационных процессов в сложных нейронных сетях необходимы
современные методы математического и кибернетического моделирования. Причем
результаты экспериментов на простых организмах могут использоваться в
данном случае в качестве исходных гипотез для построения адекватных
кибернетических моделей мозга.
Такой подход позволяет уже сейчас создавать искусственные нейронные
сети и строить кибернетические модели информационных процессов в мозге
более сложных животных вплоть до человека. Учитывая то, что экспериме6нты
на мозге людей нельзя проводить по морально-этическим соображениям, путь
создания кибернетических моделей с целью получения экспериментальных
сведений о структуре и функциях человеческого мозга представляется весьма
перспективным. Конечной целью при этом могут служить не только новые
сведения о мозге, о механизмах его самооптимизации, самоорганизации,
самопрограммирования, но и новые идеи, необходимые для построения
нетрадиционных мозгоподобных суперЭВМ – нейрокомпьютеров.
Искусственный нейрон
Искусственный нейрон имитирует в первом приближении свойства биологического нейрона. На вход искусственного нейрона поступает некоторое множество сигналов, каждый из которых является выходом другого нейрона. Каждый вход умножается на соответствующий вес, аналогичный синаптической силе, и все произведения суммируются, определяя уровень активации нейрона. На рисунке представлена модель, реализующая эту идею. Хотя сетевые парадигмы весьма разнообразны, в основе почти всех их лежит эта конфигурация. Здесь множество входных сигналов, обозначенных x1, x2,:, xn, поступает на искусственный нейрон. Эти входные сигналы, в совокупности, обозначаемые вектором X, соответствуют сигналам, приходящим в синапсы биологического нейрона. Каждый сигнал умножается на соответствующий вес w1, w2,..., wn, и поступает на суммирующий блок, обозначенный ?. Каждый вес соответствует "силе" одной биологической синаптической связи. (Множество весов в совокупности обозначается вектором W.) Суммирующий блок, соответствующий телу биологического элемента, складывает взвешенные входы алгебраически, создавая выход, который мы будем называть NET. В векторных обозначениях это может быть компактно записано следующим образом:
NET = XW.
Нейрокомпьютер – совокупность программных и аппаратных средств для реализации моделей нейронных сетей.
3 основных направления нейрокомпьютеров:
-
Создание нерокомпьютеров в виде ЭВМ общего назначения с соответствующим комплектом программного обеспечения (только программная реализация)
-
Создание со-процессоров (нейроакселераторы) для ЭВМ общего назначения
-
Создания нейрокомпьютеров на базе нейрочипов (чисто аппаратная реализация)
Активационные функции
Сигнал NET далее, как правило, преобразуется активационной функцией F и дает выходной нейронный сигнал OUT. Активационная функция может быть обычной линейной функцией
OUT = K(NET),
где К - постоянная, пороговой функции
OUT = 1, если NET > T,
OUT = 0 в остальных случаях,
где Т - некоторая постоянная пороговая величина, или же является функцией, более точно моделирующей нелинейную передаточную характеристику биологического нейрона и представляющей нейронной сети большие возможности.
Если функция F сужает диапазон изменения величины NET так, что при любых значениях NET значения OUT принадлежат некоторому конечному интервалу, то F называется "сжимающей" функцией. В качестве "сжимающей" функции часто используется логистическая или "сигмоидальная" (S-образная) функция. Эта функция математически выражается как F(x) = 1/(1 + е-x). Таким образом,
OUT=1/(1+e-NET)
По аналогии с электронными системами активационную функцию можно считать нелинейной усилительной характеристикой искусственного нейрона. Коэффициент усиления вычисляется как отношение приращения величины OUT к вызвавшему его небольшому приращению величины NET. Он выражается наклоном кривой при определенном уровне возбуждения и изменяется от малых значений при больших отрицательных возбуждениях (кривая почти горизонтальна) до максимального значения при нулевом возбуждении и снова уменьшается, когда возбуждение становится большим положительным. Гроссберг (1973) обнаружил, что подобная нелинейная характеристика решает поставленную им дилемму шумового насыщения. Каким образом одна и та же сеть может обрабатывать как слабые, так и сильные сигналы? Слабые сигналы нуждаются в большом сетевом усилении, чтобы дать пригодный к использованию выходной сигнал. Однако усилительные каскады с большими коэффициентами усиления могут привести к насыщению выхода шумами усилителей (случайными флуктуациями), которые присутствуют в любой физически реализованной сети. Сильные входные сигналы в свою очередь также будут приводить к насыщению усилительных каскадов, исключая возможность полезного использования выхода. Центральная область логистической функции, имеющая большой коэффициент усиления, решает проблему обработки слабых сигналов, в то время как области с падающим усилением на положительном и отрицательном концах подходят для больших возбуждений. Таким образом, нейрон функционирует с большим усилением в широком диапазоне уровня входного сигнала.
Рассмотренная простая модель искусственного нейрона игнорирует многие свойства своего биологического двойника. Например, она не принимает во внимание задержки во времени, которые воздействуют на динамику системы. Входные сигналы сразу же порождают выходной сигнал. И, что более важно, она не учитывает воздействий функции частотной модуляции или синхронизирующей функции биологического нейрона, которые ряд исследователей считают решающими. Несмотря на эти ограничения, сети, построенные из этих нейронов, обнаруживают свойства, сильно напоминающие биологическую систему. Только время и исследования смогут ответить на вопрос, являются ли подобные совпадения случайными или следствием того, что в модели верно схвачены важнейшие черты биологического нейрона.
Обучение искусственных нейронных сетей
Среди всех интересных свойств искусственных нейронных сетей ни одно не захватывает так воображения, как их способность к обучению. Их обучение до такой степени напоминает процесс интеллектуального развития человеческой личности, что может показаться, что достигнуто глубокое понимание этого процесса. Но, проявляя осторожность, следует сдерживать эйфорию. Возможности обучения искусственных нейронных сетей ограниченны, и нужно решить много сложных задач, чтобы определить, на правильном ли пути мы находимся.
Цель обучения
Сеть обучается, чтобы для некоторого множества входов давать желаемое (или, по крайней мере, сообразное с ним) множество выходов. Каждое такое входное (или выходное) множество рассматривается как вектор. Обучение осуществляется путем последовательного предъявления входных векторов с одновременной подстройкой весов в соответствии с определенной процедурой. В процессе обучения веса сети постепенно становятся такими, чтобы каждый входной вектор вырабатывал выходной вектор.
Обучение с учителем
Различают алгоритмы обучения с учителем и без учителя. Обучение с учителем предполагает, что для каждого входного вектора существует целевой вектор, представляющий собой требуемый выход. Вместе они называются обучающей парой. Обычно сеть обучается на некотором числе таких обучающих пар. Предъявляется выходной вектор, вычисляется выход сети и сравнивается с соответствующим целевым вектором, разность (ошибка) с помощью обратной связи подается в сеть, и веса изменяются в соответствии с алгоритмом, стремящимся минимизировать ошибку. Векторы обучающего множества предъявляются последовательно, вычисляются ошибки и веса подстраиваются для каждого вектора до тех пор, пока ошибка по всему обучающему массиву не достигнет приемлемо низкого уровня.
Обучение без учителя
Несмотря на многочисленные прикладные достижения, обучение с учителем критиковалось за свою биологическую неправдоподобность. Трудно вообразить обучающий механизм в мозге, который бы сравнивал желаемые и действительные значения выходов, выполняя коррекцию с помощью обратной связи. Если допустить подобный механизм в мозге, то откуда тогда возникают желаемые выходы? Обучение без учителя является намного более правдоподобной моделью обучения в биологической системе. Развитая Кохоненом и многими другими, она не нуждается в целевом векторе для выходов и, следовательно, не требует сравнения с предопределенными идеальными ответами. Обучающее множество состоит лишь из входных векторов. Обучающий алгоритм подстраивает веса сети так, чтобы получались согласованные выходные векторы, т. е. чтобы предъявление достаточно близких входных векторов давало одинаковые выходы. Процесс обучения, следовательно, выделяет статистические свойства обучающего множества и группирует сходные векторы в классы. Предъявление на вход вектора из данного класса даст определенный выходной вектор, но до обучения невозможно предсказать, какой выход будет производиться данным классом входных векторов. Следовательно, выходы подобной сети должны трансформироваться в некоторую понятную форму, обусловленную процессом обучения. Это не является серьезной проблемой. Обычно не сложно идентифицировать связь между входом и выходом, установленную сетью.
Основные направления реализации нейросетей
Нейросети используются для решения задач объединенных 3 признаками
-
Известно как эти задачи решаются людьми
-
Могут быть представлены примеры выполнения задач
-
Каждая задача включает ассоциацию объектов одного множества с объектами другого множества
НС используются для решения задач для, которых не существует формализованного алгоритма или решение или решение по алгоритму занимает слишком много времени, а также при обработке неполной или нечетной информации.
Основные направления реализации
-
Распознавание образов
Эта задача состоит в соотнесении входного набора данных , представляющего распознаваемый объект, к одному из заранее известных классов
-
Кластеризация данных
Эта задача состоит в группировке входных данных по присущей им близости















