Обучение с помощью последствий (оперантное обусловливание)

Мы уже говорили ранее о респондентном обусловливании, то есть выученной немедленной реакции на стимул, основанной на ассоциациях. В этой статье в центре нашего внимания будет оперантное обусловливание, то есть выученное поведение на основе последствий.

 

Что такое оперантное обусловливание

Оперантное обусловливание может быть определено как обучение направленному на какую-то цель поведению, то есть поведению, управляемому последствиями. Когда люди пытаются убежать от чего-то (например, от визжащей сигнализации), подразумевается, что они действуют так, чтобы изменить обстоятельства, в данном случае — прекратить вызывающий отвращение стимул в форме громкой визжащей пожарной сигнализации.

 

В таких случаях крайне важно понимать, что в аналогичных ситуациях, которые имели место ранее при определенных обстоятельствах, определенное поведение сопровождалось определенными последствиями. Эти последствия делают вероятным то, что человек будет проявлять подобное поведение в аналогичных ситуациях при аналогичных обстоятельствах. В нашем историческом опыте установлена определенная связь между нашим действием и переживанием определенных последствий.

 

Один из способов понять разницу между респондентным и оперантным обучением состоит в том, что оно подобно различию, которое мы проводим в обычном языке между “реагированием” и “действием”. Респондентное поведение классифицируется по его отношению к вызывающим стимулам, которые ему предшествуют, то есть оно “реагирует” или является “реакцией” на вызывающие стимулы. Оперантное поведение, или “действие”, подразумевает целенаправленное или предназначенное для чего-то поведение. Конечно, оперантное поведение также находится под контролем предшествующих ему стимулов, которые мы ранее описывали как возникающие при определенных обстоятельствах. Но оперантное поведение, прежде всего, понимается как имеющее особое отношение к обстоятельствам, которые происходят после того, как поведение было реализовано, то есть особое отношение к последствиям, которые следуют за поведением. Например, тот факт, что слюноотделение маленькой Лизы усиливается, когда мать показывает ей только что купленную конфету, можно понять с чисто респондентной точки зрения. Реакция слюноотделения возникает (реагирует) на стимул. Но то, что Лиза вскоре после этого (когда мама ушла с кухни) открывает шкаф, где обычно хранятся конфеты, надо понимать иначе — как оперантное обучение. Это реакция актерской игры, и это такая игра, на которую влияют те последствия, которые Лиза испытала раньше, когда открыла шкаф (она играла) и нашла конфету (следствие), которую, как думала ее мать, она так ловко спрятала. Короче говоря, она узнала, как можно искать и, возможно, находить конфеты, чтобы их съесть.

 

В оперантном обучении заложены возможности приспосабливаться к постоянно меняющимся обстоятельствам так, как никогда не позволили бы унаследованные способы реагировать. Если мать Лизы спрячет конфету в новом месте, Лиза может, например, продолжать искать ее, пока не найдет, чтобы снова съесть. Она учится на последствиях своих действий. Такое обучение открывает новые возможности для адаптации. Мы не могли быть биологически подготовлены к кредитным картам, электрическим инвалидным коляскам или сотовым телефонам, но мы вполне способны научиться осмысленно взаимодействовать с этими вещами. Оперантное обусловливание дает нам возможность выйти за пределы медленного процесса адаптации, когда она происходит на основе изменений в наших основных биологических возможностях. Это позволяет нам реагировать на постоянно меняющиеся ситуации и изобретения, о которых мы даже не думали, когда родились.

 

Как последствия влияют на поведение

Давайте подробнее рассмотрим, что значит учиться на последствиях, то есть как последствия влияют на поведение. Мы начнем с простой схемы, основанной на этих возможностях: последствия могут увеличивать или уменьшать вероятность определенного поведения, а последствия для определенного поведения могут быть добавлены или удалены.

 

Это оставляет нам 4 основных способа повлиять на поведение:

 

  • Положительное подкрепление. Добавление (или увеличение) определенного последствия увеличивает вероятность определенного поведения.
  • Отрицательное подкрепление. Устранение (или уменьшение) определенного последствия увеличивает вероятность определенного поведения.
  • Положительное наказание. Добавление (или увеличение) определенного последствия уменьшает вероятность определенного поведения.
  • Отрицательное наказание. Устранение (или уменьшение) определенного последствия уменьшает вероятность определенного поведения.

Как мы упоминали, это чисто функциональные определения. Они определяют способ, которым поведение управляется его последствиями. Однако они не указывают, какие функции могут иметь конкретные последствия. Разумно спросить, какие последствия, когда их испытываешь, увеличивают вероятность определенного поведения. Например, какие последствия увеличат вероятность того, что Лиза будет искать конфеты? Однако мы не можем определить исключительно по объективным признакам события, например сладкие вкусовые свойства конфет, какую функцию будет накладывать последствие на поведение индивида. Конечно, вы могли бы с самого начала предположить, что одни последствия вызывают у людей отвращение и, следовательно, будут иметь функции наказания, в то время как другие последствия являются привлекательными и, следовательно, вероятно, будут иметь функции вознаграждения. Но функция не может быть сведена к качеству самого последствия. Функция возникает во взаимодействии человека с последствиями.

 

Важно помнить, что последствия сами по себе не являются самым важным аспектом функционального анализа. Наиболее важным аспектом является влияние последствий на поведение. Выражение “подкрепление” всегда относится к повышению вероятности определенного поведения при определенных обстоятельствах, а “наказание” относится к понижению вероятности определенного поведения при определенных обстоятельствах. Это лежит в основе понимания поведения. С этим также связано одно из наиболее распространенных злоупотреблений этими концепциями. Например, утверждение “Мы подкрепляем всем, чем можем, но ничего не происходит с поведением!” дает нам все основания полагать, что речь идет не об обусловливающем подкреплении, по крайней мере того поведения, которое они хотели подкрепить. Словесная похвала — типичный пример, когда качество события часто предполагается априори, как имеющее подкрепляющие свойства. Следовательно, этим легко злоупотребить, рассчитывая на подкрепление, если при этом не наблюдать за фактическими эффектами такого подкрепления на поведение, которое хотят изменить.