Р. Хайнд - Поведение животных (Синтез этологии и сравнительной психологии) (1112608), страница 158
Текст из файла (страница 158)
Однако другие исследователи считали близкое совпадение стимулов и реакций во времени необходимым, но пе достаточным условием обучения. По их мнению, за выполнением реакции также должно следовать некоторое «подкрепляющее» событие. Например, при образовании инструментальной условной реакции таким подкрепляющим агентом можно назвать событие, которое при совпадении во времени с реакцией способствует увеличению частоты выполне- 24.
некОтОРые лспенты Овучения эзэ ния этой реакции. Когда речь идет только о контроле поведения, такого операциональпого определения вполне достаточно; установить, какие именно факторы выступают для определенной реакции в роли подкрепления, можно непосредственно эмпирическим путем [2225), Однако можно выдвинуть некоторые общие положения, выходящие за рамки указанного определения, и затем подвергнуть их экспериментальной проверке. Например, одно из таких положений заключается в том, что раздражитель, служивший подкреплением в одной ситуации, будет выступать в том же качестве и в другой; при этом необходимо установить границы этого обобщения для разных реакций и животных.
Аналогичный подход, целью которого является анализ природы подкрепления, заключается в обобщенном определении условий, которые обеспечивают подкрепляющий эффект одних событий в отличие от других. Наиболее плодотворными оказались теории, основывающие аффект подкрепления на удовлетворении той пли иной биологической потребности или побуждения (ослабление побуждения), на устранении раздражителей, связанных с таким побуждением (ослабление потребности, обусловленной наличием раздрая<ителя), или на появлении раздражителей, ранее связанных с побуждениями (вторичное подкрепление) (см., например, И186, 1750)). Однако теперь становится все более очевидным, что, хотя эти теории и сохраняют некоторую эвристическую ценность (см., например, [1742]), они далеко не так всеобъемлющи, как полагали прежде.
Мы пока не можем предложить какой-либо удовлетворительной теории, однако считае»4 полезным рассмотреть некоторые данные, подчеркивающие трудности, с которыми сталкиваются имеющиеся теории. «Побуждение» мы будем здесь рассматривать как полезную промежуточную переменную (гл. 8). Согласно теории ослабления побуждения в ее первоначальном варианте, обучение реакциям происходит вследствие ослабления факторов, которые эти реакции вызвали.
Однако, по крайней мере в некоторых случаях, подкреплением могут служить раздражители, свяаанные с завершаюп4им»4 реакциями, хотя факторы, вызвавшие соответствующую реакцию, все еще присутствуют. Например, когда животное пьет раствор сахарина, это и уменьшает дальнейшее его потребление, и служит подкреплением, несмотря на то что сахарин не является питательным веществом И751, 2197).
Хотя сахарин и пе ослабляет потребности в пище, он уменьшает ее потребление. Этот факт находится в полном соответствии с той точкой зрения, что подкрепляющий аффект связан не с ослаблением потребности или с устранением вызывающих то или иное поведение факторов, а с ослаблением «побуя«дения», проявлением которого является готовность животного к осуществлению данной формы поведения. В ряде акспернментов дойствительпо была установлена корреляция между эффективностью раздражителя как фактора, приводящего какой-то тип поведения к завершению, и эффективностью этого раздрая«ягеля в качестве подкрепления.
Например, члстып. РлэВитие поведения молоко при введении непосредственно в желудок по сравнению с тем же молоком, потребляемым обычным порядком, не только значительно слабее подавляет поглощение пищи, ко и оказывается менее эффективным подкреплением при выполнении реакции нажатия на рычаг. Еще менее эффективно в атом отношении введение непосредственно в желудок физиологического раствора [233, 1377, 1751!. Остаотся открытым вопрос о том, одинаковы ли завершающий и подкрепляющий эффекты стимуляции. Имеются некоторые данные о различии их временнйх параметров; так, подкрепляющий эффект наполнения желудка развивается медленнее, чем эффект насыщения (см. также [915!). Однако подкрепление не обязательно связано с ослаблением побуледения. Шеффилд и др.
[2198) показали, что нптромиссии служили для самцов крыс подкреплением и в том случае, если эйякуляция экспериментально предотвращалась. Поскольку, вероятно, интромиссии усиливают, а не ослабляют тенденцию проявлять половое поведение, подкрепление, по-видимому, ассоциируется не с уменьшением, а с усилением побуждения.
Хотя позднее было обнаружено, что иптромиссин с последующей эйякуляцией служат более эффективным подкреплением, чем одни интромиссии [1285, 2560), это объяснение остается в силе. В любом случае эффективность в качестве подкрепления таких факторов, как контакт с самкой в анэструсе, интромиссии и эйякуляция, зависит от индивидуального опыта самца. Уэйр [2498! показал, что все этя факторы влияют на латентный период садки у самцов крыс, не имевших опыта спаривания, одинаково, но по мере приобретения опыта эйякуляция становится у них наиболее эффективным подкреплением. Однако наши знания о половом поведении не позволяют интерпретировать этот случай на основе теории ослабления побуждения, поскольку интромнссин и эйякуляция оказывают на последующую реактивность сложное влияние (сы.
равд. 15.2), В данном случае вызывает сомнение пригодность концепции унитарного побуждения. Пищевое и половое поведение прекращаются в результате действия целого ряда различных механизмов обратной связи (гл. 10 н 15); подкрепляющий эффект может определяться целым рядом раэличаых последствий реакции (см„ например, [2238, 2239)); на эффективность -подкрепления может влиягь взаимодействве этих последствий [2285!. Хотя некоторые нз рассмотренных примеров как будто бы свидетельствуют о том, что осуществление завершающей реакции (например, акта еды) не обязательно для получения эффекта подкрепления (см. также [465), цит.
на стр, 252), другие данные покааывают, что поведение при завершающих реакциях (или раздражители, возникающие в результате его осуществления) может служить подкреплением. В самом деле, описаны многочисленные случаи, когда один лишь факт выполнения реакции без какого-либо явного ослабления побуясдения мог действовать как подкрепление.
Так, Бинг н Вейсман [1346! обнаружили, что хомячки (Реготуееиз) будут на1кимать на 24. НЕКОТОРЫЕ АСПЕКТЫ ОБУЧЕНИЯ рычаг, позволяющий им получать песок, который они роют. Стимуляцией гипоталамуса можно заставить крыс что-нибудь грызть, и возможность грызть прн этом служит для них подкреплением [20231. У при»«атов подкреплением служит даже игра [16691. Теория Прсмака [[9521 «о преобладающей реакции» является крайним выражением рассматриваемой точки зрения; он считает, что любая доминирующая реакция способна играть роль подкрепления для предшествующей более слабой реакции. Например, крысы, испытывающие жажду, будут пробегать в колесе больше, если им во время движения колеса давать возможность пить; с другой стороны, они будут чаще лить, если возмоншость попасть в колесо будет им предоставляться только после того, как они попьют.
Аналогично у детей, которые берут конфеты из автомата, скорость поедания конфет увеличивается, когда скорость, с которой они получают конфеты (первоначально она выше, чем скорость поедания конфет) начипаег зависеть от нее. Следовательно, можно прийти к выводу, что поведенческие акты не обязательно должны иметь завершающий »арактер (т. е.
приходиться на конец цепи поведенческих актов), для того чтобы служить подкреплением. Однако возникает вполне уместный вопрос: какой из двух совершенно различных ответов организма считать доминирующим, если опи несоизмеримы? Кроме того, здесь все еще мол«но говорить о наличии побуждения, ослабляющегося в результате выполнения известной реакции; в данном случае, например, это побуждение «поиграть» с конфетным автоматом [[0381. Как правило, невозможно отделить подкрепляющий эффект выполнения реакции от подкрепляющего эффекта раздражителей, которые ее вызвали. Так, Томпсон [23581 установил, что для сиамских бойцовых рыбок (В«Па зр!епйпз) подкреплением может служить их отражение в зеркале; и движущаяся„и неподвижная модели оказались меяое эффективным подкреплением, чем зеркало, и к тому же еще и менее эффективными как факторы, вызывающие демонстрационное поведение (см.
также [»1031). Поатому Томпсон полагает, что раздражители, наиболее эффективно выаывающие демонстрацию, будут и наилучшим подкреплением, хотя он и отмечает, что решающим здесь, возможно, является сам факт выполнения реакции. Однако некоторые раздражители оказываются эффективными, хотя вызывают всего лишь ориентировочную реакцию.
Стивенсон [2292, 22931 показала, что для самцов зябликов, которым вводили тестостерон, подкреплением служила их видовая песня, хогя при ее звучании отмечалась лишь ориентировочная реакция (см. равд. »9.4). В подобных случаях, по-видимому, эффективность раздражителя в качества подкрепления определяется его адаптивной значимостью в жизни вида. И»1енно поэтому, как установила Стивенсон, видовая песня для самцов зяблика не имела подкрепляющего значения зимой, а белый шум той же интенсивности, что и песня, не мог служить подкреплением для птиц даже после введения тестостерона.