Оперантное обусловливание
Оперантное обусловливание — это влияние последствий поведения на само поведение, под последствиями понимают изменения в окружающей среде (изменение стимула), которые происходят сразу после поведения и влияют на частоту возникновения этого поведения в будущем[1]. Этот процесс имеет схожие черты с дарвиновским естественным отбором в том смысле, что поведение отбирается по его последствиям в течение жизни особи подобно тому, как виды отбраковываются по последствиям выживания в процессе эволюции. Понятие оперантного обусловливания введено Б. Ф. Скиннером.
Оперантное научение основывается на оперантном поведении — поведении, воздействующем на окружение, которым управляют непосредственные последствия этого поведения, в противоположность ответному (респондентному) поведению, которым управляет предшествующий стимул[2]. Б. Ф. Скиннер сформулировал концепцию оперантного обусловливания после многолетних экспериментов на животных, проведённых им в университете Гарварда.
Оперантное обусловливание | Угасание | ||||||||||||||||||||||||||||||
Подкрепление Усиливает поведение | Наказание Ослабляет поведение | ||||||||||||||||||||||||||||||
Положительное подкрепление Приятный стимул в ответ на правильное поведение | Отрицательное подкрепление | Положительное наказание Неприятный стимул в ответ на неправильное поведение | Отрицательное наказание Удаление приятного стимула в ответ на неправильное поведение | ||||||||||||||||||||||||||||
Устранение Удаление неприятного стимула в ответ на правильное поведение | Активное уклонение от неприятного стимула | ||||||||||||||||||||||||||||||
Множество действий, определяющихся по последствиям (постцедентными воздействиями), называется оперантом. Операнты определяются функционально, то есть по тем изменениям, которые вызывает поведение человека в его непосредственном окружении. Связи между оперантным поведением и событиями, происходящими вокруг него, называются контингенциями[3]. Наиболее распространённой схемой для оперантного анализа является трёхчастная контингенция, состоящая из связи между предшествующим событием, или обстановкой, в которой произошло поведение, поведением и последствиями[2].
Термин условие указывает на сочетания, возникновение которых вероятно, но не неизбежно. В исследованиях поведения влияние некоторого условия на поведение необходимо доказывать.
Теоретические постулаты оперантного бихевиоризма применяются на практике в некоторых вариантах программированного обучения, поведенческой терапии[4], прикладного анализа поведения[2].
История
Оперантное обусловливание иногда называют инструментальным научением, которое было впервые тщательно изучено Эдвардом Торндайком (1874—1949): он исследовал поведение кошек, которые должны были выбираться из «проблемного ящика»[5]. Кошка могла выбраться из ящика, совершив простое действие — например, потянув за шнур или надавив на шест, — но в первый раз кошке требовалось много времени, чтобы выбраться оттуда. При повторных экспериментах неэффективные реакции возникали реже, а успешные возникали чаще, поэтому кошки выбирались из ящика все быстрее и быстрее[5]. Торндайк обобщил эти данные в своем законе эффекта (англ. Law of effect), который гласит, что поведение, которое приносит удовольствие, имеет тенденцию повторяться, а поведение, приводящее к неприятным последствиям, повторяется с меньшей вероятностью. Короче говоря, некоторые последствия усиливают поведение, а некоторые — ослабляют поведение. Составив график времени, которое требовалось кошке, чтобы выбраться из ящика, относительно числа испытаний, Торндайк создал первые известные кривые обучения животных с помощью такой процедуры.[6] Теперь этот процесс называется оперантным обусловливанием.
Отцом термина оперантное обусловливание является Б. Ф. Скиннер (1904—1990). Его книга 1938 года «The Behavior of Organisms: An Experimental Analysis» положила начало изучению оперантного обусловливания и его применения к поведению человека и животных[7]. Следуя идеям Эрнста Маха, Скиннер отверг опору на ненаблюдаемые психические состояния, такие как удовлетворение (как это было у Торндайка), построив свой анализ на наблюдаемом поведении и его последствиях, которые так же можно наблюдать[8].
Концепции и процедуры
Изменение оперантного поведения: подкрепление и наказание.
Подкрепление и наказание — это два инструмента, с помощью которых происходит модификация оперантного обусловливания. Всего существует 5 видов его последствий:
- Положительное подкрепление — сразу после поведенческой реакции предъявляется стимул, который приводит к увеличению частоты возникновения этого класса реакций в будущем[1].
- Отрицательное подкрепление (избегание) — сразу после поведенческой реакции некий аверсивный стимул убирается из окружающей среды, что приводит к увеличению частоты возникновения этого класса реакций в будущем[1]. В экспериментах Скиннера, таким стимулом был громкий звук внутри коробки. Когда крыса нажимала на рычаг, звук прекращался, таким образом, поведение крысы получало отрицательное подкрепление.
- Положительное наказание — сразу после поведенческой реакции предъявляется аверсивный стимул, и это приводит к тому, что частота возникновения поведения в будущем уменьшается[1].
- Отрицательное наказание — после поведенческой реакции из среды убирается желаемый стимул, и это приводит к уменьшению возникновения этого поведения в будущем[1].
- Угасание — ослабление поведенческой реакции до уровня, наблюдаемого до начала подкрепления, либо полное её исчезновение в результате прекращения ее подкрепления. В прикладном анализе поведения также применяется процедура гашения, то есть процедура формирования угасания путём отмены подкрепления. В процессе применения данной процедуры обычно возникает угасательное обострение, то есть увеличение частоты реакций сразу после отмены подкрепления[1]. Пример: сначала крыса много раз получает пищу после нажатия на рычаг, затем пища перестает поступать после нажатия рычага; со временем крыса начинает нажимать на рычаг всё реже и реже.
Примечания
- Джон О. Купер, Тимоти Э. Херон, Уильям Л. Хьюард. Прикладной анализ поведения. Пер. с англ.. — Москва: Практика, 2016. — С. 767. — 864 с. — 1200 экз. — ISBN (англ.) 978-0-13-142113-4. — ISBN (русск.) 978-5-89816-157-6.
- Варгас Дж. Анализ деятельности учащихся. Методология повышения школьной успеваемости. — М.: Оперант, 2015.
- Варгас Э. А. «Вербальное поведение» Б. Ф. Скиннера: Введение // Вестник Новосибирского государственного университета. Серия: Психология. — 2010. — Т. 4, № 2. — С. 56–78.
- Скиннер Беррес Фредерик / Зинченко В. П., Мещеряков Б. Г. Большой психологический словарь. — М.: ОЛМА-ПРЕСС, 2003.
- Thorndike, E.L. "Animal intelligence: An experimental study of the associative processes in animals" // Psychological Review Monograph Supplement. — 1901. — № 2. — С. 1—109.
- Miltenberger, R. G. Behavioral Modification: Principles and Procedures. — Thomson/Wadsworth, 2008. — С. 9.
- Skinner, B. F. The Behavior of Organisms: An Experimental Analysis". — New York: Appleton-Century-Crofts, 1938.
- Skinner, B. F. "Are theories of learning necessary?" // Psychological Review. — 1950. — Т. 4, № 57. — С. 193–216. — doi:10.1037/h0054367. — PMID 15440996.