Д. Мак-Фарленд - Поведение животных (Психобиология, этология и эволюция) (1112575), страница 77
Текст из файла (страница 77)
Совершенно независимо от гого, цо эти результа гы нельзя >ловлетворнгсльно обьяснигь теорией сгичул-реакция ясно. что лля образования связи чежл> двумя нейтральными с~илг>лами нет необходимости в полкреплении. Помолу павловское подкрепление не является обязательныч условием образования связей. но оно облегчает их образование н делает их устойчивы аи к привыканию. Как чы увидим дальше животные вполне способны на>чнться тому.
по некоторые стимулы несутнествснны лля нх текущих мотивапнонных потребностей. и поэтому неудивительно. что связи. образованные межлу двумя нейтральными стим>лами, должны быть временными. Обра гпмся ~еперь к вопросу об иигзпдгтпяшльно«лойлуааннщл Закон эффекта Торндайка лег в основ> бихевиористского полхола л на>нению животных. Крайнюю позицию запал Гарвардский бихсвнорист Скиннер (8(г1ппег].
который определил подкрепление. исхо >я нз закона эффекта. По Скиннер>. подкреплением является любое событие, ко~орое. сочетаясь с каким-нибудь видом повеления. будет делать с~о более частым. Скиннер (1938) считал также. что любое подкрепление может усилить любую реакцию в присутствии любого стимула при условии.
что этот стимул ощущается животным, а реакция лежит в пределах е~ о возможностей. Таким образом. прелполщ алось. что реакция и подкрепление по существу произвольны. Это стало широко распространенной точкой зрения среди теоретиков научения то конца 50-х годов. Подкрепление. побуж.шюшее животное приближаться к стимулам. которые оно свяэываег с этим подкреплением.
обычно называется «положительным». Если же подкрепление засгавляег кивотное в дальнейшем избегать данной ситуации. оно считается «отрицательным». Животные чогуг научиться боя пса некоторых ситуаций, испытав в них боль или стресс. В дальнейшем они могут избегать таких ситуаций при столкновении с ними. Сходным образом сигуапии, в которых на животное действуют естественные вызывающие страх стимулы, моно ассоциации вызывать страх, даже когда животное не испытывает боли.
Но мнг«окразное применение таких стимулов может привести к привыканию. и животное перестанет их избегать. Как мы видели, неприятные стимулы применимы в опытах по классическим >словным рефлексам. Одно из первых таких исследований принадлежиз В.М Бехтереву (1913), который раздражал переднюю лап> собаки слабым электрическим током (БС) вслед за звуковым стимулом-тоном (УС). Сначала собака сгибала:шпу в ответ на ток (БР), а после ряда сочетаний УС и БС вЂ” в ответ на тон (УР) в отсу гствие тока. Классическая оборонительная условная реакция многие гоЛы оставалась парадигмой научения избеганию.
По Торндайку (Т)гоги<Иге, 1913) наказание вызывает такую же силу реакции, что и вознаграждение. Согласно положительному закону эффекта. если за реакциячи следует состояние удовлетворения, вероятнос гь их возникновения возрастает. Отрицательный закон предполагает, что вероятность возникновения реакций, приводящих к неприятным последствиям, снижается. Однако в конечном счете Торндайк (1932) на основании некоторых опытов пришел к заключению, что закон эффекта неприменим к наказанию. В этом отношении с ним соглашались Скиннер (Бс(ппег, 1938, 1953) и Эстес (Езгез, 1944).
Общее мнение, по-видимому, сводилось к тому, что наказание не ослабляет связи стимул-реакция, хотя иногда оно временно подавляет наказуемое поведение. Более поздние данные говорят о том, что наказание может быть эффективным с точки зрения модификации поведения, когда е~о сочетают с определенной реакцией (СЬнгс)г, 1963, 1969). 17.7. Оперантное поведение Скиннер (Вс(ппег, 1937) ввел различие между оперантным и реактивным пове- 291 Рие. 17.8. 1 олубь, клюющий ключ в скииие- ровеком ящике. дением. Оперантным он назвал спонтанное действие без какого-либо очевидного стимула.
Реакти«иым является всякое поведение, совершаемое в ответ на определенный стимул. Скиннер полагал, что любое операцтное поведение модифицируется и эффективно контролируется сочетаюШимся с ним подкреплением. Мысль о том, что поведением животного можно полностью управлять, создав соответствующий порядок подкреплений, явилась крайней бнхевиористской точкой зрения (8Ыппег, 1938). Бихевиористская философия Скиннера произвела революцию в экспериментальных методиках, влияние которой оШушается до сегодняшнего дня. Вместо неоднократного применения сочетаний, характерного для классической выработки условных рефлексов, и опытов с использованием проблемных ящиков и лабиринтов Скиннер разработал методику свободного оперантного поведения, при которой животному позволяют совершать различные действия, а экспериментатор старается управлять последствиями.
Чаше всего для опытов такого рода выбирались крысы и голуби, хотя использовались также и многие другие животные, а также человек. Оперангная выработка условного рефлекса состоит главным образом в том, что живо. гное «тренируют» на выполнение задачи, за которой последуе~ вознаграждение. Крысу можно заставлять нажимать на рычаг, голубя — клевать освещенный круг, называемый «ключевым стимулом». Такая ме~одика тренировки обозначается термином "зЬар1п8" (формирование поведения). Рассмотрим, как обучают голубя клевать ключевой стимул для получения корма. Голодного голубя помешаюг в маленький ящик с механизмом для подачи зерна и с «ключом» на уровне головы (рис.
17.8). Такого рода устройство называют «скиннеровским ашиком». О подаче корма обычно сиг нализирует маленькая лампочка, освешаюшая зерно. Голуби быстро научаюзся связывать включение сне~а с появлением корма; они подходят к подаюшему механизму и съедают зерно всякий раз, как включается свет. Следующая стадия обучения состоит в согласовании подачи пищи с каким-нибудь з.ином поведения голубя. Обычно от голубя требуется, чтобы он клевал ключ, но Скиннер считал, что можно формировать любую реакцию и что голубей за вознаграждение можно научиг» чистить перья или описывать круги по ящику.
Клевания ключа можно добиться, выдавая вознаграждение только в ответ на движения, которые постепенно становятся все более похожими на удар клювом по ключу. Так, сначала голубь научается за вознаг раждением подходить к ключу; затем он получает вознаграждение, только если стоит прямо, держа около ключа голову.
На этой стадии голубь обычно клюет ключ самостоятельно, но его можно и побудить к этому, на время приклеив к ключу пшеничное зерно. Своим клеванием голубь замыкает чувствительный контакч в электрической цепи, коз орая производит автоматическую подачу корма. Начиная с этого момента, голубь награждаегся, только когда клюет ключ, и ручное управление вознаграждением больше не требуется. Теперь животное р озово для использования в опыте.
Такая оперантная методика применяется во многих типах экспериментов, Например, выработку дифференцировки можно изучатчь вознаграждая животных только за реакции на определенный цвет или рисунок или давая им выбирать между двумя сигнальными раздражителями, различающимися визуально. Эта методи- 292 ка оказалась особенно полезной для изучения действия разного типа вознаграждений. Так. можно вознаграждать голубя не просзо за каждый, а за каждый )~-й удар клювом, устанавливая в итоге определенное отношение между числом уларов и числом возни| раждений. Такой метод назьшасгся «гтасраждстпсп па пастояннаьнг с«атно~«само. Другие обычно применяемые схемы опыта включают переменное саатцашенпе, постоянный питер«аз и пер«пенный анте!жал. При интервальной схеме вознаграждение дается через интервалы времени, выбранные зксцериментатором. Животное вознаграждается за первую реакцию после некоторого интервала. Оказалось, что разные схемы вознаграждения по-разному влияют на действия животного.
Так, например,применение переменных интервалов создает очень равномерную частоту реакций и служит хорошей опорной величиной„ относительно которой можно испьпывать влияние на поведение различных факторов, например величины вознаграждения. Считается, что Скиннер рассматривал бихевиоризм как философию науки о поведении, а не как собственно науку. Его подход был операционалистским, а психология. антитеоретической. Хотя Скиннер полагал, что всякое поведение создаезся подкреплением, он признавал (1975), что «естественным отбором объясняется тот факт, что люди реагируют на стимулы, воздействуют на среду и изменяют свое поведение под влиянием связи с подкреплением».
Точно так же «гог факт, что оперантные условные рефлексы, подобно всем физиологическим процессам, являются результатом есгественного отбора, проливает свет на вопрос о том, какого рода последствия служат подкреплением и почему». Подход Скиннера основан на зом, что подкрепление способно изменять поведение.
Его утверждение о возможности модификации любой деятельности иллюстрируется разными играми, которым можно обучать голубей. Так, он описывает (1958)„ как «голубя тренировали пускать деревянный шар по миниатюрному желобу в направлении расставленных игрушечных кеглей. толкая е~о резким боковым движением клюва.