14471-1 (Обучение с подкреплением), страница 3

2016-07-30СтудИзба

Описание файла

Документ из архива "Обучение с подкреплением", который расположен в категории "". Всё это находится в предмете "психология" из , которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "курсовые/домашние работы", в предмете "психология" в общих файлах.

Онлайн просмотр документа "14471-1"

Текст 3 страницы из документа "14471-1"

Способы и приемы или закономерности

Есть два аспекта выработки: первый способ и приемы, то есть последовательность шагов, необходимых для выработки типа поведения, и второй — закономерности или правила, предписывающие, как, когда и почему эти типы поведения должны подкрепляться

Большинство тренеров, большинство книг о тренировке и большинство тех, кто обучает тренеров, имеет дело почти исключительно со способом или приемом. “Возьмите в руки клюшку для гольфа как показано на рисунке”, “Подведите прицел винтовки под нужное место мишени”, “Никогда не наклоняйтесь в горах”, “Взбивайте яйца металлическим венчиком по часовой стрелке” Это прекрасно. Эти приемы обычно складываются годами при участии многих людей, путем проб и ошибок, и поэтому они оптимальны. В самом деле вы будете более уверенно сидеть на лошади, если пятки у вас опущены, а мяч для гольфа будет послан вами дальше, если вы хорошенько отклонитесь в сторону замаха. Если вы заинтересованы в том, чтобы овладеть каким-либо навыком, я могу вас уверить, что вы извлечете максимум возможного от устоявшихся приемов выполнения действий, которые включаются в данный навык, почерпнув это из книг, от преподавателей, инструкторов и наблюдая или изучая действия других людей

Другую сторону выработки составляют закономерности, которые регулируют сам процесс обучения: когда надо поднажать, когда подослабить обучение; как наиболее эффективно повышать критерии, что делать, если возникли затруднения, и, вероятно, самое главное — когда остановиться. В этих вопросах обычно полагаются на интуицию и опыт тренеров или инструкторов, на случай иди удачу. Между тем именно успешность применения этих закономерностей определяет разницу между просто хорошим и великим преподавателями, между радостным, быстрым и успешным обучением и обучением, приводящим к срывам, медленным, скучным и неприятным. Хороший процесс выработки, а не только хорошие приемы, делают обучение эффективным.

Десять правил выработки

1. Повышайте критерий небольшими градациями, чтобы у субъекта, всегда была реальная возможность выполнить требуемое и получить подкрепление.

2. В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать поведение по двум критериям одновременно.

3. Прежде чем увеличивать или повышать критерий, пользуйтесь подкреплением текущего уровня ответа, т.е. подкрепляйте любое исполнение данного действия, имеющегося в данный момент.

4. Вводя новый критерий, временно ослабьте старые.

5. Будьте впереди того, кого вы обучаете: полностью планируйте свою программу выработки так, чтобы в случае внезапного успеха обучаемого, вы знали, что следует подкреплять далее.

6. Не меняйте тренеров на “середине реки”; у вас может быть несколько инструкторов на одного обучающегося, но придерживайтесь одной программы выработки на каждый из типов поведения.

7. Если одна процедура выработки не приносит успеха, найдите другую, существует столько же способов добиться нужного поведения, сколько инструкторов, способных их придумать.

8. Не кончайте тренировку, не дав положительного подкрепления, это соответствует наказанию.

9. Если навык ухудшается, “возвратитесь к детскому саду”, быстро повторите весь процесс выработки с серией легких подкреплений.

10. Оканчивайте, по возможности, каждую тренировку на высокой ноте и в любом случае останавливайтесь, оставаясь впереди обучаемого.

Особые ученики

Можно формировать поведение почти любого существа. Психологи обучали крошечных детей движением руки гасить и зажигать свет в комнате. Можно обучать птиц. Можно формировать поведение рыб. Однажды я обучала большого краба-отшельника звонить в колокольчик, собирающий к обеду, дергая клешней за шнурок. (Фокус заключался в том, чтобы дать крабу пищу в тот момент, когда клешня, двигающаяся бесцельно, коснется шнурка. Я пользовалась длинным анатомическим пинцетом, чтобы подносить кусочки креветки прямо к его челюстям.) Профессор Гарвардского университета Рихард Хернетейн рассказывал, что однажды он обучал морского гребешка хлопать раковиной за пищевое вознаграждение. Дрессировщики морских млекопитающих любят хвастаться что они могут обучить любое животное выполнить любое действие, для которого у него имеются физические и умственные возможности, и насколько мне известно, это так и есть.

А как насчет того, чтобы формировать свое поведение? Существуют всевозможные программы изменения собственного поведения: бросаем курить, следим за своим весом и т.д. Большинство этих программ опирается в основном на метод формирования поведения, обычно называемый модификациями поведения, они могут быть или не быть успешными. Трудность, как мне кажется, состоит в том, что вы должны сами себе давать подкрепление. Но когда вы подкрепляете сами себя, исчезает элемент неожиданности — ученик всегда знает, чего стоит тренер. При этом очень просто сказать: “Черт с ней, с еще одной звездочкой в моей карточке, я лучше выкурю сигарету”.

Я обнаружила, что единственным наиболее успешным приемом самоподкрепления является постоянная регистрация результатов, которая может быть использована во всех четырех программах. Нужно было вести регистрацию так, чтобы улучшение было видно сразу. Я использовала графики. С их помощью моя виновность за упущения могла уменьшаться при взгляде на график, на котором было видно, что несмотря ни на что я сейчас нахожусь на более высоком уровне, чем шесть месяцев тому назад. Еще, может быть, далеко до совершенства, но “кривая”, или наклонная линия, графика шла в нужном направлении, и это является зримым доказательством улучшения; и хотя это само по себе является слабым, медленно действующим подкреплением, оно создает достаточную мотивацию, чтобы продолжать мои занятия.

Выработка поведения без помощи слов

В обычных ситуациях обучения, таких, как уроки тенниса, субъект знает, что ее или его обучают, и обычно охотно включается в этот процесс. Поэтому вам не обязательно дожидаться нужной реакции и подкреплять ее. Вы можете без особого вреда словами направлять поведение: “Делай так. Хорошо. Теперь повтори дважды. Хорошо”. Однако в нестандартных ситуациях лучше обойтись без инструкций и (словесных) обсуждений. Вы должны наметить план выработки, начальный и промежуточные ходы, при помощи которых вы достигнете желаемой цели.

В использовании процесса формирования существуют две ловушки. Первая состоит в том, что легче заметить ошибки, чем улучшение, и поэтому для таких вербальных существ, каковыми являемся мы, гораздо проще негодовать, когда критерий не достигнут, чем давать подкрепление, когда он достигнут. И это может свести на нет прогресс. Вторая опасность состоит в том, что если вы предполагаете сформировать чье-либо поведение, то очень заманчиво поболтать об этом. А такие разговоры могут все разрушить. Если вы говорите: “Ты получишь награду” — за то, что положил белье в корзину, не куришь марихуану, тратишь меньше денег или за что-либо другое, — вы лишь совершаете подкуп или даете обещание, а не истинное подкрепление; при обучении, идущем по вашему плану, человек может иногда ему противиться и нарочно поступать не так как нужно. Чтобы добиться результатов, надо осуществлять формирование поведения, а не говорить о нем.

А если вам удалось сформировать чье-либо поведение, то в дальнейшем также лучше этим не хвастаться. Некоторые этого совершенно не понимают и постоянно подчеркивают свою роль — в лучшем случае это проявляется в опеке, а это лучший способ нажить себе в лице субъекта врага на всю жизнь. Кроме того, если вы помогли кому-то улучшить какой-либо навык или избавиться от плохой привычки, меняя в качестве подкрепления собственное поведение, на кого падает основная тяжесть работы? На субъекта. Умные родители никогда не раззванивают повсюду о том благе, которое они совершили, воспитывая своих детей. Во-первых, мы все знаем, что эта работа никогда не кончается, а во-вторых, дети заслуживают похвалы — хотя бы за то, что выдерживают все педагогические ошибки, которые мы совершаем.

Так как формирование поведения людей может или даже должно происходить в несловесной форме, то некоторые воспринимают это как своего рода злонамеренные манипуляции. Мне кажется, что это не от недопонимания. Причина того, что формирование должно быть невербальным, состоит в том, что мы имеем дело с поведением, а не с идеями, И не только с чьим-нибудь поведением, но и со своим собственным.

Однако поскольку вы можете формировать поведение людей без того, чтобы то, что вы делаете, доходило до их сознания, и поскольку, не имея формального согласия на то, чтобы быть обученным, как это бывает при уроках игры в теннис, вы едва ли не обязаны формировать людское поведение на невербальном уровне, то не возникает ли возможность заставлять людей совершать ужасные вещи?

Конечно, да, особенно если вы в качестве отрицательного подкрепления используете такие резко неприятные стимулы, которые вызывают истинный страх и даже ужас. В лабораторных условиях психологи обнаружили феномен названный “выученная беспомощность”. Если животное обучено избегать неприятного стимула, такого как удар электрического тока, при помощи нажима на рычаг или перемещения в другую часть клетки, где нет абсолютно никаких способов избежать удара тока, оно постепенно прекращает все попытки отделаться от неприятности. Оно становится полностью податливым и пассивным, и может даже лежать и получать наказания даже тогда, когда снова появляется путь к свободе. Аналогом этого феномена у людей возможно является “промывание мозгов” Если человек подвергается строгой изоляции и неизбывному страху или боли, и если неприятные стимулы в последующем используются в качестве отрицательного подкрепления, то в тех случаях, когда человек может избегнуть или прекратить их действие, изменив поведение, — ну, тогда... животные обычно погибают, а люди оказываются более стойкими, и некоторые начинают делать все что угодно, чтоб избежать отрицательного подкрепления.

Стимулы

Все, что вызывает какую-либо поведенческую реакцию, называется стимулом. Некоторые стимулы способны вызывать реакции без какого-либо обучения или тренировки: мы вздрагиваем от громкого звука, моргаем от яркого света, нас тянет в кухню, когда до нас доносится аппетитный запах; животные поступают точно так же. Такие звуки, свет и запахи называются безусловными, или первичными, стимулами.

Другие стимулы заучиваются благодаря ассоциации. Сами по себе они могут ничего не значить, но становятся выделяемыми сигналами для поведения: сигналы светофора заставляют нас стоять или идти, мы вскакиваем, чтобы снять трубку зазвонившего телефона, на шумной улице оборачиваемся, услышав свое имя и т.д., и т.д. Ежедневно мы отвечаем на множество выученных сигналов. Они называются условными, или вторичными, стимулами.

При формальном тренинге львиная доля усилий приходится на образование условных сигналов. Сержант, занимающийся строевой подготовкой со взводом новобранцев, и хозяин собаки на дрессировочной площадке в равной мере стремятся сделать в основном так, чтобы обучающиеся повиновались командам, которые в действительности являются условными сигналами. Фокус не в том, что собака может сидеть, а человек останавливаться, фокус в том, что это делается четко и по команде. Вот что мы называем повиновением — не просто выполнение действия, но гарантия того, что оно будет выполнено по сигналу. Психологи называют это “поставить поведение под контроль стимулов”. Это вырабатывается с трудом, выработка основывается на правилах, а правила нуждаются в проверке.

Если вы руководите людьми и вам иногда приходится два или три раза повторять приказ или инструкцию, прежде чем они будут выполнены, то значит у вас проблемы со стимульным контролем. Разве не случается, что вы говорите: “Я тебе уже однажды сказала, я говорила тебе тысячу раз, не...” (Не хлопай дверью, или не клади мокрый купальник на кровать, или что-либо в этом роде.) Когда сказать один или тысячу раз недостаточно, поведение не управляется стимулами.

Иногда может казаться, что мы обладаем стимульным контролем, когда в действительности этого нет. Мы предполагаем, что сигналу или команде должны подчиниться, а этого не происходит. Самой распространенной реакцией на это является усиление сигнала. Так, официант не понимает вашего французского? Говорите громче. Чаще всего это не помогает. Субъект должен распознавать сигнал, иначе безразлично, кричите ли вы что есть мочи или даже ревете с помощью усилительной аппаратуры рок-ансамбля, на вас будут смотреть невидящим взором.

Другой реакцией человека на игнорирование условного сигнала является бешенство, которое действует только в том случае, если субъект проявляет преднамеренное непослушание, не давая твердо заученного ответа на хорошо выученный сигнал. При этом иногда, показав характер, можно получить хорошее поведение.

Бывает, что субъект отвечает правильно, но с очень большой задержкой или через пень-колоду. Часто неуклюжие ответы на команды определяются тем, что субъект не обучен отвечать быстро. Без положительного подкрепления не только за правильный, но и за проворный ответ на сигнал у субъекта нет шансов усвоить, что успех приносит быстрое повиновение стимулам. При этом поведение в действительности не контролируется стимулами.

Реальная жизнь” изобилует плохой организацией управления с помощью стимулов. Как только один человек пытается проявить власть, другой оказывается в опасности проявить “непослушание” В действительности проблема состоит в непонимании команд или сигналов, которым он поэтому не может повиноваться. Это примеры плохой коммуникации или нечеткого управления с. Помощью стимулов.

Правила управления с помощью стимулов

Для того, чтобы управлять с помощью сигналов, надо сформировать нужное поведение, а затем, когда оно осуществляется, делать так, чтобы оно происходило во время или сразу после какого-либо определенного сигнала. Этот стимул затем становится ключом, или сигналом, поведения.

Полный контроль с помощью стимулов определяется четырьмя условиями, к каждому из которых следует относиться как к самостоятельному разделу тренировочной задачи, самостоятельному пункту программы выработки:

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5209
Авторов
на СтудИзбе
430
Средний доход
с одного платного файла
Обучение Подробнее