Синергетические принципы работы головного мозга
ГЛАВА V. Синергетические принципы работы головного мозга
ОСНОВНЫЕ ПОНЯТИЯ СИНЕРГЕТИКИ:
ПАРАМЕТРЫ ПОРЯДКА И ПРИНЦИП ПОДЧИНЕНИЯ
Факторы, определяющие эволюцию во времени
Сложные системы, которые встречаются в физике и химии, биологии и медицине, в экономике, экологии и других науках состоят из многих компонентов, подсистем, элементов и частей.
Рассмотрим сложную систему методами теории динамических систем.
Компоненты системы будем различать по индексу j = 1,...,N, где N может быть очень большим числом, а активность j-й компоненты условимся описывать переменной q. Такой активностью может быть, например, скорость возбуждения нейрона, а также множество других интерпретаций – в зависимости от разновидности системы. Чтобы охарактеризовать активность всех частей системы, необходимо составить их перечень. Удобно объединить их в вектор состояния q═(q1,q2,....,qn).
Иногда компоненты можно считать непрерывно распределенными. Например, жидкость вполне допустимо рассматривать как континуум. В таких системах мы заменяем дискретный индекс j пространственной координатой х, а qj – функцией q(х). Примером q(x) может служить плотность молекул жидкости, которая изменяется как функция пространственных координат х. Во многих случаях состояние системы изменяется со временем, т.е., вектор состояния системы q становится функцией времени q = q (t).
В синергетике, для того чтобы исследовать изменение вектора состояния во времени предполагают, что оно определяется несколькими факторами:
Рекомендуемые материалы
текущим состоянием q системы, связями между компонентами qj, управляющими параметрами α и случайными событиями.
Рассмотрим эти различные факторы более подробно.
1. Текущее состояние. Примером может служить передемпфированное движение точечной массы, прикрепленной к пружине, т. е., движение в присутствии большой силы трения. Пусть существует некоторое равновесное положение этой массы. Растягивая и отпуская пружину, приводим массу в движение. При обычных условиях, она начинает совершать колебания. Но если предположить, что эти колебания происходят, например, в густой патоке, то трение может оказаться настоль ко сильным, что никаких колебаний не будет. Обозначив отклонение от положения равновесия через q, уравнение движения можно записать в виде q́ = -kq, где k – постоянная. Ясно, что изменение отклонения q́ зависит от текущего отклонения q.
2. Связи между qj. Примером может служить пружина, соединяющая две точечные массы (1) и (2), занимающие, соответственно, положения qx и q2 (см. рисунок). Если а – равновесное расстояние между точечными массами, то
на точечную массу (1) действует сила F= –k(q2 -q1- a), где k – коэффициент упругости пружины.
Как показывает этот пример, в уравнение движения входят величины двух совершенно различных типов, а именно, с одной стороны, переменные q, а с другой стороны – характерные постоянные, такие, как k и а.
С аналогичной ситуацией мы встречаемся и в гораздо более сложных случаях, например, когда речь идет о синоптических связях между двумя нейронами. В непрерывно распределенных средах, таких, как жидкости или реакционные среды в химии, где мы оперируем зависящими от пространственных координат концентрациями q(x) молекул, связи могут зависеть от градиентов величин q(x) или от их производных более высокого порядка по пространственным координатам.
3. Управляющие параметры. Рассмотрим кювету с жидкостью, подогреваемой снизу и охлаждаемой со свободной поверхности . Из-за подогрева и охлаждения между нижней и верхней поверхностями жидкости устанавливается
некоторая разность температур а = Т1 – Т2. Как показывает эксперимент, эта разность температур удивительным образом влияет на поведение жидкости. Если разность температур меньше некоторого критического значения ас, то жидкость пребывает в состоянии покоя. Но как только разность температур превосходит критическое значение, внезапно становится видимым макроскопическое движение жидкости, например в форме валов, как на рисунке. Можно сказать, что параметр а управляет макроскопическим поведением системы, поэтому а получил название управляющего параметра.
Аналогичные резкие изменения наблюдаются в химических реакциях. Например, в проточном химическом реакторе с непрерывным подводом реагентов и отводом продуктов реакции при повышении концентрации реагентов выше некоторого критического значения могут внезапно возникнуть колебания. Реакционная смесь может изменять цвет, например, из красной становится синей и т.д. В этом случае управляющим параметром служит концентрация подводимого реагента.
Управляющие параметры удается выделить даже в самых сложных системах, таких, как мозг. Их роль могут играть, например, концентрации принимаемых лекарственных препаратов или гормонов. Применяя понятие управляющих параметров к биологическим системам, необходимо соблюдать известную осторожность. В физических и химических системах извне фиксируют значения одного или нескольких управляющих параметров, налагая соответствующие экспериментальные условия, например, регулируя интенсивность подогрева жидкости, в рассмотренном выше примере. В биологических системах управляющие параметры часто вырабатываются самой системой, и их, в определенном смысле, можно рассматривать как переменные.
4. Случайные события. Во многих областях науки господствует идея о том, что случайных событий не существует и что все процессы полностью детерминистические. Но в ряде важных процессов случайные события играют важную роль. Случайные события во множестве встречаются в квантовой механике, где с ними связано поведение атомов и молекул. Примером может служить радиоактивный распад ядра атома. Если ядро обладает естественной радиоактивностью или становится радиоактивным в результате столкновений с другими ядрами, то невозможно предсказать, когда именно произойдет радиоактивный распад ядра с испусканием элементарной частицы, например, электрона или γ-кванта. То же справедливо и относительно спонтанного испускания света атомами. Находясь в возбужденном состоянии, он может испускать световую волну, или, на языке квантовой теории, фотон, но предсказать, когда именно это произойдет, невозможно. Строго говоря, все элементарные процессы в химических реакциях имеют квантовомеханическую и, следовательно, случайную природу. Согласно современным физическим представлениям, случайные события носят фундаментальный.
Существует, однако, случайность другого рода, а именно: случайность тепловых флуктуации, например, флуктуации плотности в газах, жидкостях или твердых телах или флуктуации электрического тока в полупроводниках и металлах. Такие флуктуации происходят, даже если пренебречь квантовой природой молекул, т.е., если рассматривать их как классические частицы. В случае тепловых флуктуации случайные события, обусловлены неполнотой нашего знания точных положений молекул. Таким образом, за исключением квантовой теории ответ на вопрос о том, можно или нельзя говорить о случайных событиях, зависит от выбранного нами уровня описания. Например, движение атомов газа можно рассматривать в рамках классической механики, т.е., полностью детерминистической теории. Тем не менее, возможно учитывать флуктуации плотности так, как если бы они были случайными событиями, описываемыми статистическими теориями. Имеются веские основания полагать, что случайные события происходят и в нашем мозге. Такими событиями могут быть спонтанное открывание пузырьков в нейронах, случайное возбуждение нейронов или возникновение тремола. Но при современном уровне знания важных микроскопических процессов в мозге остается неясным, имеют ли флуктуации в мозге фундаментальную, квантовомеханическую природу или зависят лишь от нашего уровня описания.
Рассмотрим более подробно пример с образованием конвективных валов в жидкости. Начнём со значения а0 управляющего параметра, при котором состояние системы неизвестно. Обозначим это состояние через q0. Изменяя значение управляющего параметра, можно внезапно перевести жидкость в новое состояние. При дальнейшем увеличении управляющего параметра движение жидкости становится все интенсивнее, или, иначе говоря, скорость вращения валов со временем возрастает. Это свидетельствует о неустойчивости.
Вновь развивающееся движение возникает из малых флуктуации, таких, как флуктуации плотности молекул жидкости или локальных флуктуации скоростей жидкости. Первый шаг анализа состоит в изучении поведения жидкости при значении параметра, лишь слегка превышающем критическое (точку потери устойчивости). Оказывается, в системе могут возникать совершенно различные коллективные движения. Особый интерес для последующего анализа представляет амплитуда, нарастающей конфигурации, так как именно она определяет эволюционирующие со временем макроскопические структуры, например, конфигурацию валов или другие паттерны. Когда структуры только начинают формироваться, амплитуды очень малы. Это позволяет нам исследовать рост и затухание отдельных конфигураций независимо друг от друга. И только при дальнейшем росте амплитуд конфигурации начинают влиять одна на другую. Например, в одних случаях конфигурации могут конкурировать друг с другом, и та единственная конфигурация, которая одержит верх над остальными, подавит их всех. В других случаях конфигурации могут сосуществовать и даже стабилизировать одна другую. Амплитуды нарастающих конфигураций называются параметрами порядка. Они описывают макроскопический порядок, или, если говорить в более общем плане, макроскопическую структуру системы. Состояние q системы может быть описано как суперпозиция всех, т.е., нарастающих и затухающих конфигураций.
Если число компонент системы велико, то, соответственно, велико и множество отдельных конфигураций. Это означает, что информация, необходимая для описания поведения системы, не сводится к разложению на ее конфигурации: именно здесь и появляется на сцене центральная теорема синергетики. Она утверждает, что не только поведение нарастающих конфигураций, но и поведение затухающих конфигураций однозначно определяется параметрами порядка. Как следствие, общая пространственно-временная эволюция состояния q удовлетворяет параметрам порядка (или подчиняется параметрам порядка). В этом состоит принцип подчинения. Так как в общем случае число параметров порядка гораздо меньше числа компонент системы, принцип подчинения позволяет достичь резкого сокращения числа степеней свободы, или, иначе говоря, происходит сильное сжатие информации. Оказывается, что своим коллективным действием отдельные компоненты системы влияют на параметры порядка. Это явление получило название круговой причинности. Принцип круговой причинности позволяет предложить еще одну интерпретацию принципа подчинения. Так как отдельные компоненты системы определяют или даже порождают параметры порядка, которые, в свою очередь, подчиняют себе компоненты, последние определяют эволюцию параметров порядка кооперативно.
Центральная роль параметров порядка
Мы рассмотрели класс систем, обладающих следующими свойствами: при изменении одного параметра порядка или, может быть, нескольких параметров порядка система становится неустойчивой. Иначе говоря, система выходит из своего прежнего состояния и начинает формировать качественно новое макроскопическое состояние. В окрестности точки потери устойчивости возникают коллективные конфигурации различного рода; одни из них растут, другие после возникновения под воздействием флуктуации затухают. Исследуя растущие и затухающие состояния, можно провести различие между неустойчивыми и устойчивыми конфигурациями и в результате придем к конфигурациям, управляемым параметрами порядка. Как уже говорилось, параметры порядка определяют поведение компонент системы через принцип подчинения. Таким образом, поведение сложных систем может быть описано и понято в терминах параметров порядка. Параметры порядка – абстрактные величины, но во многих случаях они обретают свое конкретное содержание.
В то же время отпадает необходимость рассматривать действия или поведение отдельных частей, поскольку открывается возможность описания всей системы в целом с помощью параметров порядка. Таким образом, принцип подчинения, лежащий в основе описанной выше взаимосвязи, приводит к колоссальному сжатию информации, которым мы воспользуемся как средством изучения мозга, поведения и когнитивной деятельности. В огромном числе случаев число параметров порядка очень мало, и мы можем рассматривать поведение системы в терминах именно этих немногих параметров порядка. Например, в лазере число атомов достигает 1018, в то время как имеется только один параметр порядка – напряженность электрического поля моды, победившей в конкурентной борьбе другие моды. Кроме того, можно утверждать, что через этот единственный параметр порядка движение электронов становится сильно коррелированным. Аналогично при исследовании головного мозга мы имеем дело с мириадами нейронов, но число паттернов в поведении (сколь они ни многочисленны!) гораздо меньше.
Принципы синергетики проиллюстрированы на примерах из физики, отсюда, однако, не следует, что синергетика представляет собой раздел физики. В синергетике исходят из абстрактных математических соотношений, которые затем применяют к множеству систем различной природы, в том числе и физическим. Но поскольку физические системы относительно просты по сравнению с биологическими системами, они лучше всего подходят в качестве примера для иллюстрации смысла математических принципов синергетики.
МОЗГ КАК КОМПЬЮТЕР
Компьютер и мышления
Разумеется, что такое «мыслить», знает каждый из нас. Но когда требуется дать более строгое определение тому, что мы подразумеваем, когда говорим о способности мыслить, то это оказывается трудной задачей. Прежде всего совсем просто определить такие действия, которые по всеобщему мнению не основаны на мышлении. К числу таких действий относятся рефлексы. Например, мы закрываем глаза, если какой-нибудь объект быстро приближается к нашему лицу, или наша нога дергается, если кто-нибудь стукнет нас молоточком по колену. Предполагается, что инстинкты не связаны с мышлением, и даже очень сложное поведение насекомых часто объясняют инстинктами. (Однако может возникнуть и новое понимание поведения насекомых.) Мышление не участвует в таких бессознательных действиях, как, например, ходьба или плавание, управляемых мозжечком и спинным мозгом.
О мышлении мы с полным основанием говорим, когда речь заходит о высших формах активности головного мозга, в понимании и производстве речи, анализе сцен, картин и т.п., то есть, во всех случаях, когда зрительным или слуховым паттернам приписывается какой-то смысл. Мышление участвует в анализе ситуаций, будь то постановка врачом диагноза или изучение домашней хозяйкой ассортимента товаров в супермаркете. Значительная часть мышления основана на проведении аналогий, на ассоциациях и на классификации. Планирование и принятие решений сопряжены с мышлением. Мышление лежит в основе создания теорий о физических, химических, социальных и многих других процессах или решения технических задач. В самом общем плане можно утверждать, что в процессе мышления мы создаем мысленные картины, или представления, внешнего мира.
При исследовании мысленных представлений говорят о внутренних картах, аналогичных, например, картам городов или окрестностей. Мышление связано с сознанием и интроспекцией – двумя большими областями, остающимися во многом неисследованными вопреки многочисленным попыткам. Вопрос о том, могут ли животные мыслить, или обладают ли животные сознанием, и многочисленные эксперименты, показавшие, что совершенно различные виды действительно могут мыслить, стали результатом огромного интереса к этому кругу проблем.
Существуют целые книги, посвященные проблеме интеллекта и установлению количественных мер интеллекта. Широко известным примером может служить показатель развития интеллекта, или IQ, для определения которого испытуемым предлагается ответить на несколько четко поставленных вопросов. В последнее время эти процедуры подвергаются все большим сомнениям. По мнению ученых, вопрос об интеллекте и о его измерении более тонок потому, что интеллект может оказаться сильно связанным с решением задач. Одни люди обладают способностями к решению задач одного рода, другие – другого. Кроме того, возможно, существует своего рода иерархия интеллектов, когда мы сравниваем интеллект в мире животных с человеческим интеллектом. Современные компьютеры все еще далеки от выполнения задач, которые свидетельствовали бы об интеллекте, поэтому IQ для компьютеров еще не установлен.
Неэлектронные компьютеры
Механизация процессов мышления имеет давнюю историю, восходящую к Готфриду В. Лейбницу и создателям механических калькуляторов. Такие устройства были созданы для выполнения арифметических действий. Большой шаг вперёд был сделан с появлением электронных компьютеров. В варианте архитектуры, предложенном Джоном фон Нейманом, компьютер состоит из процессора и памяти. Аналогичную архитектуру имеет машина Алана М. Тьюринга.
Безотносительно к материальному носителю отдельные элементы компьютера представляют собой логические элементы, которые могут реализовать математические операции булевой алгебры. Интересно, что речь идёт не о арифметических операциях, например, операции умножения, а о логических операциях, таких, как «И» и «ИЛИ». Пример того, как такие операции могут быть реализованы простым механическим устройством на трубках с водой, показан на рисунке, на котором изображён простой пример реализации логической функции «ИЛИ» с помощью соединяющихся сосудов, которые можно наполнять водой. Справа перечислены различные возможные варианты наполнения.
Взаимосвязь между логическими операциями булевой алгебры и арифметическими операциями умножения, сложения, вычитания и деления может быть легко установлена, если перейти к двоичной системе счисления. Правила умножения в двоичной системе полностью воспроизводит изображённый на рисунке водяной компьютер, если пустой сосуд отождествить с нулем, а полный – с единицей. В то же время водяной компьютер реализует логическую операцию «ИЛИ»: нижние сосуды становятся полными, если полны либо левый, либо правый верхние сосуды, либо оба верхних сосуда. Аналогичным образом можно воспроизвести и другие алгебраические и логические правила, например, задающие арифметическую операцию сложения (логическую операцию «И»).
Важным понятием теории вычислений и, как теперь выясняется, некоторых теорий мозга служит понятие универсальной машины Тьюринга. Такая абстрактная машина была впервые предложена знаменитым английским математиком А. М. Тьюрингом в 1936 году. Она состоит из ленты, которая (по крайней мере теоретически) может быть бесконечно длинной. Головка, перемещающаяся вдоль ленты, может печатать на ней или стирать цифры нуль или единица. Головка снабжена программой. Следуя этой программе и считываемой с ленты цифре, головка может заменить одну цифру другой или оставить цифру неизменной и может передвинуться вправо или влево. В новой позиции головка снова стирает старую цифру и впечатывает новую или оставляет цифру на ленте неизменной и снова перемещается в новое положение. Программа также может быть закодирована цифрами. Прежде чем машина Тьюринга начинает действовать, на ленте уже напечатана последовательность цифр. Эти числа служат и программой, считываемой головкой, и начальными значениями, над которыми программа производит предписанные команды. Предполагается, что машина работает в течение какого-то времени, затем останавливается и считывает окончательный результат с ленты. Математическая проблема называется вычислимой, если при решении ее машина Тьюринга останавливается через конечное время. Так машина Тьюринга играет важную роль при анализе и в доказательствах вычислимости.
Чтобы проиллюстрировать понятие вычислимости, представим себе несколько символов, например, символы А, В и С. Рассмотрим всевозможные комбинации из букв А, В и С. Каждая такая комбинация называется «словом». Определим определяющие соотношения, такие, как АВ = 1, т.е., положим некоторые комбинации букв равными единице. Ясно, что вследствие определяющего соотношения АВ = 1, получаем некоторые другие соотношения, например, ABC = C. Проблема тождества слов состоит в ответе на вопрос, тождественны ли два слова (например, ABC = С) с учетом определяющих отношений (таких, как АВ = 1). Рассмотрим общий случай: произвольный набор букв, или алфавит и некоторый набор определяющих отношений. Можно ли указать общую процедуру, или общий алгоритм, позволяющий решить, тождественны ли два данных слова или нетождественны.
Проблема тождества слов может быть переведена в соответствующую проблему для машины Тьюринга. Доказано, что для этой проблемы невозможно определить, остановится ли машина Тьюринга или нет. Иначе говоря, не существует общего алгоритма, который позволил бы решить проблему тождества слов в теории групп. Проблема остановки машины Тьюринга тесно связана с теоремой Гёделя о неполноте.
В вопросе о природе активностей мозга машина Тьюринга и теорема Гёделя играют важную роль. Это связано с проблемой остановки машины Тьюринга. В этой проблеме остановки существует немало тонкостей, о которых упоминал еще Норберт Винер в 1948, в книге «Теория самовоспроизводящихся автоматов».
Если, например, предложить машине Тьюринга решить проблему распознавания неоднозначных фигур и спросить может ли машина Тьюринга решить, «видит» ли она вазу или два профиля. Ясно, что решение будет осциллирующим, т.е., машина Тьюринга никогда не остановится. Следовательно, на этом уровне проблема «ваза или два лица» неразрешима. Но природа недвусмысленно учит нас, как решать такую проблему – с помощью осцилляции. Поэтому стоит лишь нам перевести исходную проблему на более высокий уровнь и спросить: «Существуют ли осцилляции?», как машина Тьюринга сразу же даст утвердительный ответ и остановится. Хотя этот пример чрезвычайно прост, он позволяет нам прийти к некоторым интересным заключениям. Разрешима проблема или нет, зависит не только от процесса решения, но и характера и/или, в частности, от нашего интуитивного представления о том, что мы приемлем в качестве решения. Вспомним хотя бы открытие мнимой единицы i, равной квадратному корню из минус единицы. Мы признаем i в качестве приемлемого решения уравнения i2 = –1, если расширим понятие числа.
Если принять всерьез эти комментарии, то можно со всей определенностью утверждать, что наш мозг действует не так, как машина Тьюринга. Иначе говоря, если машина Тьюринга производит в качестве решения математической проблемы набор чисел, то человек придает этим числам смысл, или если машина Тьюринга находит проблему неразрешимой, то человек может обнаружить, что именно происходит.
Искусственный интеллект
Вскоре после того как был изобретен электронный компьютер, стало ясно, что эта машина может не только манипулировать числами, но и работать с символами. С другой стороны, следует понимать, что производимые этим процессором операции над словами все еще весьма примитивны и заведомо не связаны с проявлениями компьютером элементов мышления. Цель создания искусственного интеллекта далека от простой обработки слов. В основе лежит идея о том, что объекты и действия представлены в нашем мозгу символами. Создатели будущего искусственного интеллекта полагают, что мышление представляет собой обработку этих символов по определенным правилам. На основе этой идеи были созданы компьютерные программы, которые должны были показать, что ряд проблем действительно может быть решен таким способом.
Примером применения искусственного интеллекта может служить создание шахматных компьютеров, достигших ныне весьма высокого уровня игры и иногда выигрывающих партии даже у гроссмейстеров. Секрет успеха шахматного компьютера – в его быстродействии: за короткое время он успевает проанализировать огромное количество ходов. Способ действия шахматного компьютера полностью отличается от того, как действует квалифицированный шахматист: компьютер действует не столько интеллектом, сколько грубой силой.
Еще один пример – знаменитая компьютерная программа «Элиза», созданная Вайценбаумом (1966). «Элиза» могла в какой-то мере подражать психоаналитику: она задавала вопросы и действовала в зависимости от реакций пациентов. В действительности в основу программы были положены некоторые трюки, заимствованные из типичных вопросов, задаваемых психоаналитиками. Например, если пациент упоминал о своей матери, со стороны компьютерной программы следовала просьба: «Расскажите о вашей матери подробнее». Сам Вейценбаум весьма скептически относился к избранному им подходу и полностью сознавал ограниченные возможности компьютеров и присущего им типа «мышления».
Еще одно применение компьютеров известно под названием экспертных систем. Например, некоторые врачи заинтересованы в создании компьютерных программ, которые смогут ставить диагноз пациентам вместо человека. Но практикующим врачам известно, что такой подход отягощен чудовищными трудностями из-за сложности постановки диагноза. Одни и те же симптомы могут быть вызваны совершенно различными болезнями, и если желательно исследовать все возможности или исключить наиболее невероятные случаи, то число вопросов и решений, которые необходимо принять, становится необычайно большим. Кроме того, следует иметь в виду, что практически во всех случаях эффективность, или возможности, компьютера основана не на его способности мыслить, а на интеллекте программиста.
Опыт, накопленный на основе всех этих систем, позволяет прийти к следующему общему заключению: предпосылкой для функционирования любого современного компьютера служат конечное число вполне определенных объектов и вполне определенные правила. Компьютеры не могут а если могут, то с трудом, работать с объектами, нечетко определенными, неоднозначными и т.п. По-видимому, мозг использует совершенно другие стратегии.
Нейрокомпьютеры и коннективизм
Сравнивая быстроту, с которой выполняют типичные задачи повседневной человеческой жизни компьютеры и человеческий мозг, легко обнаружить большое различие между ними. Например, когда мы рассматриваем какую-нибудь сцену, нашему мозгу и глазам (а глаза – это часть мозга) приходится обрабатывать миллиарды битов. С другой стороны, хорошо известно, что элементарные компоненты головного мозга, а именно нейроны, работают медленно – в диапазоне миллисекунд. Несмотря на медленность срабатывания элементов, наш мозг в ничтожно малую долю секунды успевает обрабатывать огромное количество информации. В отличие от него, элементы компьютера обладают высоким быстродействием, но обычно компьютер распознает сцены медленно или вовсе неспособен их распознавать. По этим причинам головной мозг не может обрабатывать информацию последовательно, как стандартный компьютер, а работает в параллельном режиме.
Концепция параллельного компьютера была сформулирована в классической работе У.Мак-Каллоха и У.Питтса в 1943 году. В предложенной ими модели предполагается, что сеть состоит из индивидуальных моделей нейронов, каждый из которых может находиться в одном из двух состояний – покоя и возбуждения. Если нейрон, находящийся в состоянии покоя, получает сигналы от других нейронов, то он останется в состоянии покоя, если сумма сигналов меньше некоторого критического значения, называемого порогом возбуждения. В противном случае нейрон переходит в возбужденное состояние и, в своею очередь, испускает сигнал. У.Мак-Каллох и У.Питтс показали, что сеть, состоящая из связанных между собой нейронов такого типа, может выполнять все логические операции булевой алгебры, если связи между нейронами выбраны подходящим образом. Р. Розенблатту в 1962 году удалось реализовать нейронную сеть Мак-Каллоха–Питтса в своем персептроне.
Прогресс был достигнут благодаря трехуровневым адаптивным фильтрам.
Первый слой фильтра – входной. Информация от него передается ко второму слою, содержащему так называемые скрытые переменные, а от него – к выходу. Основная проблема состоит в задании проекций одного слоя на следующий. Эти проекции зависят от входных сигналов, испускаемых каждым нейроном в отдельности, а также от веса, с которым передается сигнал. Основная проблема состоит в определении весов сигналов, или синаптических сил (термин «синаптические» выбран по аналогии с процессами, происходящими между реальными нейронами). Чтобы задать синаптические сигналы, широко используется понятие обратного распространения сигналов.
Рассмотрим это понятие более подробно. Известно, что нейронная сеть обучается на примерах. Нейронной сети задают ряд задач, решения которых известны. Синаптические силы в сети первоначально распределены случайным образом. Решения, предложенные сетью, сравниваются с известными правильными решениями. Цель сравнения состоит в том, чтобы путем последовательного подбора синаптических сил минимизировать ошибку. Так как процедура проделывается в обратном порядке – от выходного слоя к среднему и от среднего слоя к выходному, – она получила название обратного распределения.
Знаменитым примером обратного распределения может служить работа Сейновского и Розенберга (1987), которые научили сеть читать вслух английские тексты. Как известно, в английском языке произношение гласных и согласных зависит от того, в каком слове они встречаются. Им удалось достичь результатов, сравнимых с успехами школьников первого и второго классов. Следует подчеркнуть, что при этом компьютер обучался не семантике, а только правилам, которых нужно было придерживаться при произношении английских слов.
Исследователи обычно сравнивают функционирование нейронной сети и головного мозга человека при решении задач обучения. Такого рода параллели наталкиваются по крайней мере на две трудности: до сих пор не существует общей теории обучения или теории создания нейронных сетей, которая давала бы рекомендации относительно числа компонент в различных слоях, равно как не существует общего понимания того, как в действительности работает нейронная сеть. Мы можем варьировать синаптические силы и даже визуализовать их, но это не позволяет нам ни на шаг продвинуться в понимании общих принципов установления состояния всей сети в целом и того, как следует адекватно описывать нейронную сеть.
Представляет интерес сравнение нейрокомпьютеров с синергетическими компьютерами. Несмотря на некоторые формальные аналогии (параллельная обработка информации, трехуровневые реализации), между ними имеется ряд фундаментальных различий. Основные различия, помимо детальных свойств нейронов, сводятся к следующему.
1. В ряде случаев существуют, так называемые, состояния-призраки, т.е., процесс распознавания попадает в ловушки – состояния, которые не соответствуют реально хранимым паттернами или паттернам, которые становятся доступными системе в результате обучения. Чтобы обойти трудности, связанные с попаданием в ловушки, была разработана сложная и сопряженная с большими затратами времени процедура, получившая название стимулированного отжига. В ходе этого процесса шарик, скатывающийся по рельефу потенциала, подвергается случайным толчкам, и эти толчки не дают ему застрять в ловушке-призраке, а вынуждают скатываться в лежащие ниже состояния, которые соответствуют паттернам, реально обретенным в результате обучения. Синергетический компьютер полностью избегает этой трудности, так как для него не существует ни состояний призраков, ни каких-либо других нежелательных состояний. Маловероятно, что головной мозг человека использует стимулированный отжиг или какой-нибудь другой процесс в том же роде.
2. В случае синергетического компьютера понятия параметра порядка и принцип подчинения позволяют нам характеризовать состояния сети в целом и даже приписывать им определенный смысл. В случае нейрокомпьютеров возможность интерпретации состояний отсутствует.
3. В реализациях нейрокомпьютеров до сих пор не удавалось использовать более нескольких сотен нейронов.
4. В случае синергетического компьютера мы имеем теорию обучения, позволяющую определить синаптические силы и устанавливать их связь с
паттернами прототипами. В случае нейрокомпьютеров такая теория обучения отсутствует.
Хотя создание нейрокомпьютеров, несомненно, стало важным этапом в моделировании активности нейронов, считается, что синергетический компьютер, разработанный на основе понятий синергетики, позволяет ближе подойти к достижению главной цели – пониманию того, как работает головной мозг человека.
Могут ли компьютеры мыслить
Как можно было бы проверить, может ли компьютер мыслить? Идея теста, позволяющего ответить на этот вопрос, предложена нами А.Тьюрингом в 1950 году.
Представьте следующий опыт. По одну сторону стены находится некто, за стеной – человек или компьютер. Находящиеся по разные стороны могут общаться между собой по телетайпу или факсу. Человек, находящийся по «эту» сторону стены может задавать находящемуся по «ту» сторону вопросы и получать на них ответы. Можно ли по характеру ответов установить, кто (или что) находится по «ту» сторону стены – человек или компьютер? Во всех без исключения опытах такого рода, проведенных к настоящему времени, тому, кто находился по «эту» сторону стены, удавалось безошибочно определить, ведет ли он переговоры через стенку с компьютером или с человеком. Впрочем, способность компьютеров вести себя наподобие человека зависит не столько от их собственного интеллекта, сколько от интеллекта их программистов. Забавно, что тот же тест можно использовать и противоположным образом – как доказательство того, что по другую сторону стены находится компьютер. Например, существуют задачи, решить которые за короткий срок человеку не под силу, таково, например, умножение больших чисел. Компьютер же справляется с решением таких задач очень быстро и тем самым «выдает», что за стеной находится компьютер, а не человек, разумеется, если он не запрограммирован так, чтобы отклонять подобные задачи или медлить с ответом. Однако и в этом случае предвидение программиста играет большую роль, чем интеллект компьютера.
Резюмируя накопленный нами опыт работы со всевозможными компьютерами, можно утверждать следующее. То, что когда-то казалось очень трудным, например, игра в шахматы, стало простым, а то, что некогда казалось простым, например, распознавание паттернов, лиц или выражений лица, анализ сцен, восприятие устной речи, стало трудным. По мнению некоторых исследователей, существуют убедительные свидетельства того, что имеется своего рода неформализуемый опыт. В жизни наше поведение в некоторых ситуациях основано не столько на алгоритмах, сколько на интуиции. Трудности возникают и в других, казалось бы, простых задач, например, при переводе. Очень часто слова и предложения имеют двоякий смысл. Может ли компьютер распознать двойной смысл или иронию, заключенную в некоторых предложениях?
Однако существует огромный потенциал трансформации неформа-лизуемого опыта. Последнее утверждение допускает и то, что существуют колоссальные возможности усовершенствования компьютеров.
С другой стороны, существующим ныне компьютерам предстоит проделать долгий путь, прежде чем они действительно смогут мыслить, и исследования головного мозга могут открыть здесь широкие горизонты.
СЕТИ МОЗГОВ
Индивидуальное и коллективное
Основная тема синергетики – согласованное действие, или кооперация частей системы. Рассмотрим, как осуществляется взаимодействие между мозгами различных людей.
Именно согласованное действие большого числа людей позволило человеческой расе занять господствующее положение в мире животных. Новое качество – в первую очередь язык – стало возможным только в результате согласованного действия большого числа мозгов. Происхождение языка и поныне представляет собой проблему, но некоторые соображения на эту тему, по-видимому, все же не слишком далеки от истины.
На ранних стадиях толчком к возникновению языка могли стать случайные события, когда те или иные слова первоначально случайным образом связывались с какими-то объектами или явлениями. Когда же эти слова принимались группой людей и закреплялись за одними и теми же объектами и событиями, мог возникнуть примитивный язык. Как ни странно, такая ситуация напоминает то, что происходит в лазере, где сначала случайным образом испускается несколько фотонов, и это в конечном счете приводит к возникновению когерентной волны – лазерного параметра порядка. В то же время не подлежит сомнению, что мозг мог хранить слова и ассоциации с объектами и событиями и вспоминать их в контексте с объектами и явлениями. Придание смысла словам могло происходить только через контекст. В этом нетрудно убедиться, если понаблюдать за маленькими детьми, овладевающими основными элементами языка. Сначала дети осваивают отдельные слова, обозначающие простые объекты, затем они начинают пользоваться комбинациями из двух слов, а потом внезапно появляются более сложные комбинации. Язык сформировался на протяжении длительных периодов времени. В истории средних веков известны жестокие «эксперименты»: дети росли, не вступая в словесный контакт с окружающими. Такие дети вырастают немыми: у них полностью отсутствуют языковые навыки. Таким образом, не подлежит сомнению, что владение языком передается от поколения к поколению.
В мире животных передача знаний весьма ограничена. Иное дело передача знаний между людьми, обладающих устной и письменной речью. Огромное преимущество людей перед животными обусловлено именно коллективной традицией знания, накопленного предыдущими поколениями, в частности, знания, хранящегося в библиотеках. В настоящее время мы переживаем новую революцию, обусловленную компьютерами, позволяющими не только хранить, но и обрабатывать информацию различными способами. Потенциальное влияние этой новой революции на дальнейшее развитие человечества вряд ли можно переоценить.
Помимо хранения и обработки информации внутри головного мозга каждого человека теперь необходимо принимать во внимание внешнюю память и внешнюю обработку информации. Анализ этого обстоятельства привел к необходимости введения понятия интеррепрезентационных сетей (ИРС).
Взаимодействие внутреннего и внешнего приводит к появлению новых параметров порядка и в сфере индивидуального, и в сфере коллективного. В случае ИРС когнитивную систему подлежит рассматривать не как внутреннюю сеть, представляющую внешнюю окружающую среду, а внутренне-внешнюю сеть, часть элементов которой представлена или хранится внутренне в разуме, или мозге, а часть существует (хранится или внешне представлена) во внешней среде. В качестве наиболее ярких экспериментальных примеров ИРС в действии следует рассмотреть, так называемые, сценарии Ф.Бартлетта (1932), введенные им в качестве составной части работ по изучению запоминания. Общая структура сценариев Бартлетта достаточно полно передает суть понятия ИРС.
Типичный сценарий Бартлетта развивается следующим образом. Испытуемому последовательно предлагают тексты или картинки, которые он должен запомнить, а затем воспроизвести по памяти (внешняя репрезентация). Обычный исход таких экспериментов состоит в том, что после сильных флуктуации в воспроизведении текст или картинка стабилизируются и перестают изменяться от итерации к итерации. Предложенная интерпретация сводится к тому, что здесь имеется
1. когнитивная сеть, состоящая из внешних и внутренних элементов и внутренних и внешних представлений, или репрезентации;
2. секвенциальное, или последовательное, взаимодействие между внутренними и внешними элементами системы;
3. типичный синергетический процесс: секвенциальное взаимодействие сначала обнаруживает сильные флуктуации между конкурирующими конфигурациями текстов или картинок, приводящие спустя какое-то время к возникновению параметра порядка, подчиняющего себе внешние и внутренние элементы или представления (репрезентации) системы. Таким образом, вместо обычного процесса образования паттерна, в ходе которого один или несколько параметров порядка подчиняют себе те или иные внешние подсистемы, и обычного процесса распознавания паттернов, в котором один или несколько параметров порядка подчиняют себе те или иные внешние свойства системы, имеем здесь интегрированный процесс: один или несколько параметров порядка подчиняют себе и внешне репрезентированные подсистемы и внутренне репрезентированные свойства.
Общая модель ИРС в терминах синергетики
Чтобы придать изложенному выше графическую и, следовательно, математическую форму, вспомним модель распознавания паттернов синергетической сетью. По синергетическим понятиям такой компьютер может быть реализован в виде трехслойной сети (рис.1). Эти три слоя выполняют следующие функции:
1) входной слой состоит из (моделей) нейронов с индексом k, где qk(0) –заданная входная активность нейрона k;
2) средний слой представляет параметры порядка ξj;
3) выходной слой состоит из нейронов с индексом l, где ql (∞) – конечная активность нейрона l.
В дальнейшем будет удобно рассматривать сеть на рис.1 со стороны, указанной стрелкой. Так придём к сети, представленной на рис.2. и будем в состоянии придать интегративному подходу графическую форму (рис.3).
Имеем входы двух типов q(i) и q(e) (i – внутренний и e – внешний) и выходы двух типов – внутренний и внешний. Входы рассматриваются в момент времени t = 0, тогда как выходы берутся при t > 0, а в большинстве случаев при t → ∞. Средние узлы символизируют мозг, в котором устанавливаются один или несколько параметров порядка ξ. Индекс j позволяет отличать один параметр порядка от другого. Важно отметить, что одни и те же параметры порядка ξj, могут управлять совершенно различными внешними выходами. Например, параметр порядка ξj может быть с каким-нибудь конкретным выходным паттерном v(e)j. Этим выходным паттерном может быть текст или картинка, как в сценариях Ф.Бартлетта, или другое действие, например, движения или записи,
Рис. 1. Трехуровневая сеть синергетического компьютера. Первый (верхний) слой состоит из модельных нейронов, принимающих входной сигнал. Первый слой проецируется на второй слой, представляющий параметры порядка. Третий слой служит выходом из слоя параметров порядка. При всем формальном сходстве с устройством нейрокомпьютера алгоритм синергетического компьютера совершенной иной, например, модельные нейроны взаимодействуют между собой посредством мягких нелинейностей. Обратите внимание на то, что паттерны, которым обучен синергетический компьютер, закодированы в связях между первым и вторым, а также между вторым и третьим слоями. В случае статичных паттернов связи устанавливаются между параметрами порядка одной и той же универсальной формы, тогда как в случае динамических паттернов связи между параметрами порядка могут зависеть от того, какие схемы движения требуется генерировать. Эти замечания остаются в силе и для остальных иллюстраций этой главы.
Рис. 2. Сеть, представленная на предыдущем рисунке, видимая со стороны, указанной стрелкой.
Рис. 3. Простейший случай модели интеррепрезентационной сети с внешними входом и выходом и внутренними входом и выходом. Средний ряд соответствует параметрам порядка.
что может привести к возникновению внешней памяти в виде написанного от руки текста или файла в компьютере. Все множество возможных выходных паттернов можно представить выходным вектором
Со временем этот выходной вектор претерпевает изменение. В общем случае мы прослеживаем его эволюцию в течение столь продолжительного промежутка времени, что изменение параметров порядка во времени успевает завершиться. Аналогичным образом параметры порядка ξj могут управлять формированием внутренних паттернов, например, паттернов, хранимых во внутренней памяти или возникших в результате обучения. Внутренние паттерны мы обозначим v(i)j. Все множество возможных внутренних паттернов представимо вектором
Заметим, что верхний индекс может относиться к совершенно различным по своей природе паттернам, например, q(e)j может обозначать слова в устной речи, a q(i)j – соответствующие словам образы, хранящиеся во внутренней памяти.
На следующем этапе анализа необходимо установить причины, порождающие параметры порядка. Для этого, следуя рис.3, рассмотрим два различных входа на уровень параметров порядка, а именно, внешний и внутренний входы. Внешний вход обозначим q(e)(0), внутренний – q(i)(0). Нуль в скобках указывает на то, что эти входные сигналы берутся в начальный момент времени. И в этом случае входные сигналы могут иметь совершенно различные модальности. Векторы q представляют множества данных в различных модальностях и могут иметь различную размерность. Вектор q(e) задается внешним образом сенсорной системой – зрительной, слуховой или тактильной. Вектор q(i) задан внутренним образом, например, смутными идеями, фантазиями, снами, размышлениями и т.д. Важный шаг – переход с верхнего (входного) уровня на средний уровень (параметров порядка) осуществляется с помощью предварительной обработки заданных паттернов. Например, заданные паттерны могут быть неполными, искаженными или смещенными в пространстве, повернутыми, растянутыми или сжатыми, деформированными. Заданные паттерны подлежат внутренней проверке путем сравнения с хранящимися в памяти паттернами-прототипами, которые обозначим через uj. Условимся предполагать, что такая предварительная обработка заданных паттернов осуществляется всякий раз, когда в этом возникает необходимость. Совершенно ясно, что именно на этом этапе возникает понятие гештальта. Предварительной обработке могут подвергаться либо вектор q, либо векторы uj, либо те и другие векторы одновременно.
Пользуясь паттернами-прототипами uj, мы можем разложить вектор внутренне заданных данных q(e) представив его в виде
где w(e) – остаточный член. Воспользуемся и на этот раз сопряженными векторами u(е)+j, удовлетворяющими соотношению ортогональности (u(e)+j u(e)k) = δjk
Умножая предыдущее выражение на сопряженный вектор, получаем
ξ(e)j (0) = (u(e)+jq(e) (0)), где нулевой аргумент в обеих частях равенства означает, что берутся значения величин при t = 0.
Аналогично можно обработать внутренне заданный сигнал, воспользовавшись разложением
где, вообще говоря, вполне допустимо считать, что при выборе паттернов-прототипов используются различные критерии, или что паттерны прототипы имеют различные модальности. По этой причине различают паттерны-прототипы по верхнему индексу.
Возникает вопрос – как определить новые параметры порядка для всей системы, внешней и внутренней? Для ответа на него, введем взвешенные суперпозиции параметров порядка ξj (0) = αj | ξ(e)j (0)| + βj | ξ(i)j (0)| .
Подвергнем параметры порядка ξj процессу конкуренции, известному из распознавания образов синергетическим компьютером. Применительно к нашему подходу это означает, что распознаётся внутренне или внешне заданный паттерн, и в ходе распознавания конкурируют различные параметры порядка ξj, и побеждает в конкурентной борьбе один параметр порядка, а именно тот, который в начальный момент времени получает наибольшее значение. Конкуренцию описывают уравнение
где
а В и С – положительные константы, обладающие тем свойством, что конкурентную борьбу выигрывает только один параметр порядка, или, иначе говоря, используется стратегия «победитель получает все». Можно также было бы указать механизмы, при которых параметры порядка кооперируются, но мы не будем рассматривать здесь эту возможность.
Заметим, что все перечисленные выше этапы, включая предварительную обработку паттернов, могут быть выполнены компьютером, поэтому предлагаемый подход является операциональным.
Коллективные когнитивные процессы
Одно из наиболее важных свойств интеррепрезентационных сетей связано с коллективным потенциалом внешне репрезентированных элементов сети. Как только когнитивная конструкция какого-нибудь изображения становится внешним элементом его ИРС, эта конструкция становится публичным достоянием. Иначе говоря, другие конструкции могут использовать ее в различных целях, в том числе и в качестве элемента своих ИРС. Так внешний элемент вступает в коллективный социальный или культурный процесс. Чтобы разобраться в том, как действует такой процесс, обратимся к классическому случаю сценария Ф.Бартлетта.
Как уже говорилось, типичный эксперимент по сценарию Ф.Бартлетта начинается с заданного входного сигнала – текста, картинки и т.п., и продолжается как последовательность повторяющихся шагов, на каждом из которых память испытуемого о предыдущем входном сигнале становится входным сигналом для следующего испытуемого. Пример такого процесса представлен на рисунке.
Сценарий Бартлетта – это пример, иллюстрирующий динамику коллективных, интернациональных, когнитивных процессов и роль внешней репрезентации в таких процессах.
Интересный результат различных сценариев Бартлетта заключается в том, что после нескольких шагов текст или картинка стабилизируются и перестают изменяться при последующих шагах. На языке синергетики из этого следует, что некоторый параметр порядка подчиняет себе систему и переводит ее в стационарное состояние. Полученные результаты показывают, каким образом вследствие взаимодействия между внутренними и внешними представлениями отдельных личностей, достигается коллективное согласие между большим числом индивидов, в случае, когда они и не подозревают о том, что вовлечены в достижение коллективного согласия. Таким образом, параметр порядка, который в конечном счете подчиняет себе систему, становится коллективным параметром порядка.
Итерации
Рассмотренным процессам можно придать математическую форму.
1) Внутриличностные процессы. Произведенный вовне выходной сигнал одного лица может быть сначала зафиксирован, например, записан, а затем прочитан, т.е., использован в качестве входного сигнала, тем же самым лицом. Такая схема приводит к описанию экспериментов Ф.Бартлетта с одним испытуемым, в ходе которых некоторый данный паттерн используется в качестве исходного входного сигнала, воспроизводится и фиксируется на выходе, после чего предъявляется тому же испытуемому в качестве входного сигнала и т.д. (см. рисунок). Формально итерации можно описать соотношением q(e)n+1 (t=0) = q(e)n (t→∞), n = 1, 2 …
Индекс n указывает число итераций. Заметим, что этот процесс, этапы которого зафиксированы векторами q(e)n (t→∞), может быть очень сложным из-за предварительной обработки входных паттернов. Воспроизведение паттерна, например, путем рисования его по памяти, может быть не вполне точным; как
экспериментально показал Бартлетт, необходимо учитывать сходимость итераций. После появления персональных компьютеров сценарий, наглядно представленный на предыдущем рисунке, необходимо заменить сценарием, изображенным на следующем рисунке: компьютер может активно изменять передачу информации.
2) Межличностные процессы. Второй класс итерации осуществляется межперсонально. Связь между лицами можно представить по формуле
q(e)n+1 (t=0) = q(e)n (t→∞), n = 1, 2 …
Индекс n относится к лицу, участвующему на соответствующем шаге до того, как происходит передача информации. Примером снова служат эксперименты Бартлетта, которые могут быть проверены (и в настоящее время действительно проверяются) с помощью компьютерных вычислений. С формальной точки зрения мы можем констатировать, что процесс, представленный на рис. 19.4, неотличим от процесса, представленного на рис. 19.5, если предварительная обработка входных сигналов для всех лиц подчиняется одним и тем же простым законам.
"5 Проблема эволюции конфликта" - тут тоже много полезного для Вас.
3) Межличностная связь через общий резервуар. Еще один вид межперсональной связи осуществляется, как показано на рисунке, где выходной
сигнал от каждого индивида поступает в общий резервуар (библиотеку, архив данных или публичный компьютер), откуда каждый получает свой входной сигнал. С формальной точки зрения имеем соотношения
q(e)k (0) = Wkqобщее , k = 1, … n
Индекс k нумерует индивидов, Wk — оператор индивидуального окна, выбирающий для индивида k его часть информации, хранящейся в qобщее.