Оперантное обусловливание
Оперантное обусловливание , также называемое инструментальным обусловливанием , представляет собой процесс обучения, при котором произвольное поведение модифицируется путем добавления (или удаления) вознаграждения или аверсивных стимулов. Частота или продолжительность поведения может увеличиваться за счет подкрепления или уменьшаться за счет наказания или подавления .
Оперантное обусловливание возникло в работе Эдварда Торндайка , чей закон эффекта предположил, что поведение возникает в результате того, являются ли его последствия удовлетворительными или дискомфортными. В 20 веке оперантное обусловливание изучалось психологами-бихевиористами , которые считали, что большая часть, если не все, разума и поведения может быть объяснена результатом обусловливания окружающей среды. Подкрепления — это стимулы окружающей среды, которые усиливают поведение, тогда как наказания — это стимулы, которые уменьшают поведение. Оба вида стимулов можно разделить на положительные и отрицательные, которые соответственно включают добавление или удаление стимулов окружающей среды.
Оперантное обусловливание отличается от классического обусловливания , которое представляет собой процесс, в котором стимулы сочетаются с биологически значимыми событиями, вызывая непроизвольное и рефлексивное поведение. Напротив, оперантное обусловливание является добровольным и зависит от последствий поведения.
В изучении обучения животных в 20 веке преобладал анализ этих двух видов обучения: [1] и они по-прежнему лежат в основе поведенческого анализа. Они также были применены к изучению социальной психологии , помогая прояснить некоторые явления, такие как эффект ложного консенсуса . [2]
Оперантное обусловливание | Вымирание | ||||||||||||||||||||||||||||||
Армирование Повышение поведения | Наказание Уменьшить поведение | ||||||||||||||||||||||||||||||
Положительное подкрепление Добавьте аппетитный стимул следующее правильное поведение | Отрицательное подкрепление | Положительное наказание Добавьте вредный раздражитель следующее поведение | Негативное наказание Уберите аппетитный стимул следующее поведение | ||||||||||||||||||||||||||||
Побег Устранить вредный раздражитель следующее правильное поведение | Активное избегание Поведение избегает вредных раздражителей | ||||||||||||||||||||||||||||||
История
[ редактировать ]Закон эффекта Торндайка
[ редактировать ]Оперантное обусловливание, иногда называемое инструментальным обучением , впервые было тщательно изучено Эдвардом Л. Торндайком (1874–1949), который наблюдал за поведением кошек, пытающихся сбежать из самодельных коробок с головоломками. [3] Кошка могла вырваться из коробки, просто потянув за шнур или толкнув шест, но, когда ее впервые сдерживали, кошкам требовалось много времени, чтобы выбраться. При повторных испытаниях неэффективные реакции возникали реже, а успешные — чаще, поэтому кошки убегали все быстрее и быстрее. [3] Торндайк обобщил этот вывод в своем законе эффекта , который гласит, что поведение, сопровождающееся удовлетворительными последствиями, имеет тенденцию повторяться, а поведение, приводящее к неприятным последствиям, повторяется с меньшей вероятностью. Короче говоря, некоторые последствия усиливают поведение, а некоторые последствия ослабляют поведение. Сопоставив время побега с номером испытания, Торндайк построил первые известные кривые обучения животных. с помощью этой процедуры [4]
Люди, по-видимому, учатся многим простым формам поведения посредством процесса, изученного Торндайком, который теперь называется оперантным обусловливанием. То есть реакции сохраняются, когда они приводят к успешному результату, и отбрасываются, когда они не приводят к успеху или когда они вызывают неприятные последствия. Обычно это происходит без планирования со стороны какого-либо «учителя», но оперантное обусловливание использовалось родителями при обучении своих детей на протяжении тысячелетий. [5]
Б. Ф. Скиннер
[ редактировать ]Б. Ф. Скиннера (1904–1990) называют отцом оперантного обусловливания, и его работы часто цитируются в связи с этой темой. Его книга 1938 года «Поведение организмов: экспериментальный анализ». [6] начал свое непрерывное исследование оперантного обусловливания и его применения к поведению человека и животных. Следуя идеям Эрнста Маха , Скиннер отверг ссылку Торндайка на ненаблюдаемые психические состояния, такие как удовлетворение, построив свой анализ на наблюдаемом поведении и его столь же наблюдаемых последствиях. [7]
Скиннер считал, что классическая обусловленность слишком упрощена, чтобы ее можно было использовать для описания чего-то столь сложного, как человеческое поведение. По его мнению, оперантное обусловливание лучше описывает человеческое поведение, поскольку исследует причины и последствия намеренного поведения.
Чтобы реализовать свой эмпирический подход, Скиннер изобрел камеру оперантного кондиционирования , или « ящик Скиннера », в котором такие субъекты, как голуби и крысы, были изолированы и могли подвергаться тщательно контролируемым стимулам. В отличие от коробки-головоломки Торндайка, такое расположение позволяло испытуемому дать одну или две простые, повторяемые реакции, и частота таких ответов стала основным поведенческим показателем Скиннера. [8] Другое изобретение — накопительный регистратор — позволяло производить графическую запись, по которой можно было оценить частоту ответов. Эти записи были основными данными, которые Скиннер и его коллеги использовали для изучения влияния на скорость реакции различных схем подкрепления. [9] График подкрепления можно определить как «любую процедуру, которая доставляет подкрепление организму в соответствии с некоторым четко определенным правилом». [10] Эффекты расписания, в свою очередь, стали основными открытиями, на основе которых Скиннер разработал свою теорию оперантного обусловливания. Он также опирался на множество менее формальных наблюдений за поведением людей и животных. [11]
Многие работы Скиннера посвящены применению оперантного обусловливания к поведению человека. [12] В 1948 году он опубликовал «Уолден-два» , вымышленный рассказ о мирном, счастливом и продуктивном сообществе, организованном на основе его принципов обусловленности. [13] В 1957 году Скиннер опубликовал книгу «Вербальное поведение» . [14] который распространил принципы оперантного обусловливания на язык, форму человеческого поведения, которая ранее анализировалась лингвистами и другими людьми совершенно по-разному. Скиннер определил новые функциональные отношения, такие как «приказы» и «такты», чтобы охватить некоторые основы языка, но он не ввел никаких новых принципов, рассматривая вербальное поведение как любое другое поведение, контролируемое его последствиями, включая реакции аудитории говорящего.
Концепции и процедуры
[ редактировать ]Истоки оперантного поведения: оперантная вариативность
[ редактировать ]Говорят, что оперантное поведение «испускается»; то есть первоначально оно не вызывается каким-либо конкретным стимулом. Таким образом, можно спросить, почему это вообще происходит. Ответ на этот вопрос подобен ответу Дарвина на вопрос о происхождении «новой» телесной структуры, а именно: изменчивости и отбора. Точно так же поведение человека меняется от момента к моменту в таких аспектах, как конкретные движения, количество приложенной силы или время реакции. Вариации, которые приводят к подкреплению, усиливаются, и если подкрепление последовательное, поведение имеет тенденцию оставаться стабильным. Однако изменчивость поведения сама по себе может быть изменена путем манипулирования определенными переменными. [15]
Модификация оперантного поведения: подкрепление и наказание
[ редактировать ]Подкрепление и наказание являются основными инструментами, с помощью которых модифицируется оперантное поведение. Эти термины определяются по их влиянию на поведение. И то, и другое может быть положительным или отрицательным.
- Положительное и отрицательное подкрепление увеличивают вероятность поведения, которому они следуют, в то время как положительное и отрицательное наказание уменьшают вероятность поведения, которому они следуют.
Другая процедура называется «гашение».
- Угашение происходит, когда ранее подкрепленное поведение больше не подкрепляется ни положительным, ни отрицательным подкреплением. Во время угасания поведение становится менее вероятным. Периодическое подкрепление может привести к еще более длительной задержке перед исчезновением поведения из-за фактора обучения, когда для получения подкрепления становится необходимым фактор обучения, заключающийся в том, что для получения подкрепления становится необходимым фактор обучения, по сравнению с подкреплением, которое предоставляется при каждой возможности перед исчезновением. [16]
Всего существует пять последствий.
- Позитивное подкрепление возникает, когда поведение (реакция) приносит пользу или за поведением следует другой стимул, который приносит вознаграждение, что увеличивает частоту такого поведения. [17] Например, если крыса в ящике Скиннера получает еду, когда нажимает на рычаг, скорость ее нажатия увеличится. Эту процедуру обычно называют просто армированием .
- Негативное подкрепление (так называемое бегство) возникает, когда за поведением (реакцией) следует устранение аверсивного стимула, тем самым увеличивая частоту исходного поведения. В эксперименте с ящиком Скиннера аверсивным стимулом мог быть постоянный громкий шум внутри ящика; отрицательное подкрепление произойдет, когда крыса нажмет на рычаг, чтобы выключить шум.
- Позитивное наказание (также называемое «наказание условной стимуляцией») происходит, когда за поведением (реакцией) следует аверсивный стимул. Пример: боль от шлепания , которая часто приводит к снижению такого поведения. Позитивное наказание — термин, сбивающий с толку, поэтому процедуру обычно называют «наказанием».
- Негативное наказание (наказание) (также называемое «наказание условным отказом») происходит, когда за поведением (реакцией) следует устранение стимула. Пример: отобрать у ребенка игрушку после его нежелательного поведения, что приведет к уменьшению нежелательного поведения.
- Угасание происходит, когда поведение (реакция), которое ранее подкреплялось, перестает быть эффективным. Пример: крысе сначала много раз дают еду за нажатие на рычаг, пока экспериментатор не перестанет выдавать еду в качестве награды. Крыса обычно реже нажимает на рычаг, а затем останавливается. Тогда можно было бы сказать, что нажатие рычага «погашено».
Об актерах (например, о крысе) не говорят, что их подкрепляют, наказывают или уничтожают; именно действия подкрепляются, наказываются или подавляются. Подкрепление, наказание и угашение — это не термины, использование которых ограничено лабораторными условиями. Естественно возникающие последствия также могут подкреплять, наказывать или подавлять поведение и не всегда планируются или реализуются намеренно.
Графики армирования
[ редактировать ]Графики подкрепления — это правила, которые контролируют доставку подкрепления. Правила определяют либо время, в течение которого должно быть доступно подкрепление, либо количество ответных действий, либо и то, и другое. Возможны многие правила, но следующие являются наиболее основными и часто используемыми. [18] [9]
- График с фиксированными интервалами: подкрепление происходит после первой реакции по истечении фиксированного времени после предыдущего подкрепления. Этот график дает модель реагирования «перерыв-бег»; то есть после тренировки по этому графику организм обычно делает паузу после подкрепления, а затем начинает быстро реагировать по мере приближения времени следующего подкрепления.
- График переменных интервалов: подкрепление происходит после первой реакции после того, как прошло переменное время с момента предыдущего подкрепления. Этот график обычно обеспечивает относительно стабильную скорость реакции, которая варьируется в зависимости от среднего времени между подкреплениями.
- График с фиксированным соотношением: подкрепление происходит после того, как с момента предыдущего подкрепления было получено фиксированное количество ответов. Организм, обученный по этому графику, обычно делает паузу на некоторое время после подкрепления, а затем реагирует с высокой скоростью. Если требования к реагированию низкие, паузы может не быть; если потребность в реакции высока, организм может вообще перестать реагировать.
- График с переменным соотношением: подкрепление происходит после того, как с момента предыдущего подкрепления было получено переменное количество ответов. Этот график обычно обеспечивает очень высокую и постоянную скорость ответа.
- Постоянное подкрепление: подкрепление происходит после каждого ответа. Организмы обычно реагируют так быстро, как только могут, учитывая время, необходимое для получения и потребления подкрепления, пока они не насытятся.
Факторы, влияющие на эффективность подкрепления и наказания
[ редактировать ]Эффективность подкрепления и наказания можно изменить.
- Насыщение/депривация : эффективность положительного или «аппетитного» стимула будет снижена, если человек получил достаточно этого стимула для удовлетворения своего аппетита. Противоположный эффект произойдет, если человек будет лишен этого стимула: тогда эффективность последствий возрастет. Субъект с полным желудком не будет чувствовать такой мотивации, как голодный. [19]
- Немедленность : немедленные последствия более эффективны, чем отсроченные. Если дать собаке лакомство за то, что она сидит, в течение пяти секунд, она научится быстрее, чем если бы лакомство было дано через тридцать секунд. [20]
- Непредвиденные обстоятельства : чтобы быть наиболее эффективным, подкрепление должно происходить последовательно после ответов, а не в другое время. Обучение может идти медленнее, если подкрепление носит прерывистый характер, то есть следует только за некоторыми случаями одной и той же реакции. Реакции, подкрепляемые периодически, обычно затухают медленнее, чем реакции, которые подкреплялись всегда. [19]
- Размер : Размер или количество стимула часто влияет на его эффективность как подкрепления. Люди и животные занимаются анализом затрат и выгод. Если рычажный пресс приносит десять пищевых гранул, нажатие рычага можно освоить быстрее, чем если бы пресс приносил только одну гранулу. Куча четвертаков из игрового автомата может заставить игрока тянуть за рычаг дольше, чем один четвертак.
Большинство из этих факторов выполняют биологические функции. Например, процесс насыщения помогает организму поддерживать стабильную внутреннюю среду ( гомеостаз ). Например, когда организм лишен сахара, вкус сахара является эффективным подкреплением. организма Когда уровень сахара в крови достигает оптимального уровня или превышает его, вкус сахара становится менее эффективным или даже неприятным.
Формирование
[ редактировать ]Формирование — это метод кондиционирования, часто используемый при дрессировке животных и обучении невербальных людей. Это зависит от оперантной вариативности и подкрепления, как описано выше. Тренер начинает с определения желаемого конечного (или «целевого») поведения. Далее дрессировщик выбирает поведение, которое с некоторой вероятностью уже демонстрирует животное или человек. Форма этого поведения затем постепенно меняется в ходе последовательных испытаний за счет закрепления поведения, которое все более и более приближается к целевому поведению. Когда целевое поведение наконец проявляется, его можно усилить и поддерживать с помощью графика подкрепления.
Неусловное подкрепление
[ редактировать ]Необусловленное подкрепление — это доставка подкрепляющих стимулов независимо от поведения организма. Необусловленное подкрепление может использоваться в попытке уменьшить нежелательное целевое поведение путем усиления нескольких альтернативных реакций при одновременном подавлении целевой реакции. [21] Поскольку ни одно измеряемое поведение не считается усиленным, существуют разногласия по поводу использования термина «безусловное подкрепление». [22]
Стимульный контроль оперантного поведения
[ редактировать ]Хотя первоначально оперантное поведение проявляется без идентифицированной ссылки на конкретный стимул, во время оперантного кондиционирования операнты попадают под контроль стимулов, которые присутствуют, когда поведение подкрепляется. Такие стимулы называются «дискриминативными стимулами». так называемое « трехчленное непредвиденное обстоятельство Результатом является ». То есть дискриминационные стимулы создают повод для реакций, вызывающих вознаграждение или наказание. Пример: крысу можно научить нажимать на рычаг только тогда, когда загорается свет; собака бросается на кухню, когда слышит грохот своей сумки с едой; ребенок тянется к конфете, когда видит ее на столе.
Дискриминация, обобщение и контекст
[ редактировать ]Большая часть поведения находится под контролем стимулов. Здесь можно выделить несколько аспектов:
- Дискриминация обычно происходит, когда реакция усиливается только в присутствии определенного стимула. Например, голубя можно накормить за то, что он клевал на красный свет, а не на зеленый; в результате он клюет красный цвет и перестает клевать зеленый. Изучено множество сложных комбинаций раздражителей и других условий; например, организм может быть подкреплен по интервальному графику при наличии одного стимула и по пропорциональному графику при наличии другого.
- Генерализация — это тенденция реагировать на стимулы, аналогичные ранее обученному различительному стимулу. Например, наученный клевать «красный», голубь может также клевать «розовый», хотя обычно с меньшей силой.
- Контекст относится к стимулам, которые постоянно присутствуют в ситуации, например, стены, столы, стулья и т. д. в комнате или интерьер камеры оперантного кондиционирования. Контекстные стимулы могут контролировать поведение так же, как и дискриминационные стимулы, хотя обычно в меньшей степени. Поведение, усвоенное в одном контексте, может отсутствовать или изменяться в другом. Это может вызвать трудности при поведенческой терапии, поскольку поведение, усвоенное в терапевтической обстановке, может не проявиться в других ситуациях.
Поведенческие последовательности: условное подкрепление и цепочка
[ редактировать ]Большую часть поведения нелегко описать с помощью индивидуальных реакций, подкрепляемых одна за другой. Объем оперантного анализа расширяется за счет идеи поведенческих цепочек, которые представляют собой последовательности реакций, связанных между собой трехчленными непредвиденными обстоятельствами, определенными выше. Цепочка основана на экспериментально продемонстрированном факте, что дискриминационный стимул не только создает повод для последующего поведения, но также может подкрепить поведение, которое ему предшествует. То есть дискриминативный стимул также является «условным подкреплением». Например, свет, который создает повод для нажатия рычага, может использоваться для усиления «поворота» при наличии шума. В результате получается последовательность «шум – поворот – свет – нажатие рычага – питание». Гораздо более длинные цепочки можно построить, добавив больше стимулов и реакций.
Побег и избегание
[ редактировать ]При обучении бегству поведение прекращает действие (аверсивного) стимула. Например, защита глаз от солнечного света прекращает (неприятную) стимуляцию ярким светом в глазах. (Это пример отрицательного подкрепления, определенного выше.) Поведение, которое поддерживается за счет предотвращения раздражителя, называется «избеганием», как, например, надевание солнцезащитных очков перед выходом на улицу. Поведение избегания порождает так называемый «парадокс избегания», поскольку, можно спросить, как может невозникновение стимула служить подкреплением? Этот вопрос рассматривается несколькими теориями избегания (см. ниже).
Обычно используются два типа экспериментальных условий: дискриминируемое и свободное обучение избеганию.
Дискриминированное обучение избеганию
[ редактировать ]Эксперимент по избирательному избеганию включает в себя серию испытаний, в которых за нейтральным стимулом, например светом, следует аверсивный стимул, например электрошок. После появления нейтрального стимула оперантная реакция, такая как нажатие рычага, предотвращает или прекращает действие аверсивного стимула. В ранних испытаниях испытуемый не реагирует до тех пор, пока не появится аверсивный стимул, поэтому эти ранние испытания называются испытаниями «побега». По мере обучения субъект начинает реагировать на нейтральный стимул и, таким образом, предотвращает возникновение аверсивного стимула. Такие судебные процессы называются «судами по уклонению». Говорят, что этот эксперимент включает классическое обусловливание, потому что нейтральный CS (условный стимул) сочетается с аверсивным US (безусловный стимул); эта идея лежит в основе двухфакторной теории обучения избеганию, описанной ниже.
Свободно-операторное обучение избеганию
[ редактировать ]При свободно-оперантном избегании субъект периодически получает аверсивный стимул (часто электрический шок), пока не будет получен оперантный ответ; реакция задерживает наступление шока. В этой ситуации, в отличие от избирательного избегания, никакой предшествующий стимул не сигнализирует о шоке. Два важнейших временных интервала определяют скорость обучения избеганию. Это первый интервал СС (шок-шок). Это время между последовательными потрясениями при отсутствии реакции. Второй интервал – это интервал RS (реакция-шок). Это определяет время, на которое оперантная реакция задерживает наступление следующего шока. Каждый раз, когда испытуемый выполняет оперантную реакцию, интервал RS без шока начинается заново.
Двухпроцессная теория избегания
[ редактировать ]Первоначально эта теория была предложена для объяснения обучения избирательному избеганию, при котором организм учится избегать аверсивного стимула, ускользая от сигнала этого стимула. Здесь задействованы два процесса: классическое обусловливание сигнала, за которым следует оперантное обусловливание реакции ускользания:
а) Классическая обусловленность страха. Первоначально в организме происходит сопряжение КС с аверсивным УЗ. Теория предполагает, что это сочетание создает ассоциацию между КС и США посредством классической обусловленности, и из-за аверсивной природы США КС вызывает условную эмоциональную реакцию (УЭР) – «страх». б) Подкрепление оперантного ответа за счет снижения страха. В результате первого процесса CS теперь сигнализирует о страхе; эта неприятная эмоциональная реакция служит мотивацией оперантных реакций, а реакции, прекращающие КС, подкрепляются прекращением страха. Теория не говорит, что организм «избегает» УЗ в том смысле, что предвидит его, а скорее, что организм «избегает» аверсивного внутреннего состояния, вызванного КС. Некоторые экспериментальные результаты, похоже, противоречат двухфакторной теории. Например, поведение избегания часто угасает очень медленно, даже если первоначальное соединение CS-US больше никогда не возникает, поэтому можно ожидать, что реакция страха угаснет (см. Классическое кондиционирование ). Кроме того, животные, которые научились избегать, часто проявляют мало признаков страха, что позволяет предположить, что бегство от страха не является необходимым для поддержания поведения избегания. [23]
Оперантная или «однофакторная» теория
[ редактировать ]Некоторые теоретики предполагают, что поведение избегания может быть просто особым случаем оперантного поведения, поддерживаемого его последствиями. С этой точки зрения идея «последствий» расширяется и включает в себя чувствительность к последовательности событий. Таким образом, при избегании последствием реакции является снижение частоты аверсивной стимуляции. Действительно, экспериментальные данные показывают, что «пропущенный шок» воспринимается как стимул и может действовать как подкрепление. Когнитивные теории избегания развивают эту идею еще дальше. Например, крыса начинает «ожидать» шока, если ей не удается нажать на рычаг, и «не ожидать шока», если она нажимает на него, и поведение избегания усиливается, если эти ожидания подтверждаются. [23]
Оперантное накопительство
[ редактировать ]Оперантное накопительство относится к наблюдению, что крысы, усиленные определенным образом, могут позволять пищевым гранулам накапливаться в лотке с едой вместо того, чтобы извлекать эти гранулы. В этой процедуре извлечение гранул всегда включало одноминутный период угашения , в течение которого дополнительных пищевых гранул не было, но те, которые были накоплены ранее, могли быть употреблены. Это открытие, по-видимому, противоречит обычному выводу о том, что крысы ведут себя импульсивно в ситуациях, когда есть выбор между меньшим пищевым объектом сразу и более крупным пищевым объектом после некоторой задержки. См. графики армирования . [24]
Нейробиологические корреляты
[ редактировать ]Первые научные исследования, идентифицирующие нейроны , которые реагировали таким образом, что предполагалось, что они кодируют условные стимулы, были проведены в работе Махлона ДеЛонга. [25] [26] и Р. Т. Ричардсон. [26] Они показали, что базального ядра нейроны , которые выделяют ацетилхолин по всей коре головного мозга , активируются вскоре после условного стимула или после первичного вознаграждения, если условного стимула нет. Эти нейроны одинаково активны в отношении положительных и отрицательных подкреплений, и было показано, что они связаны с нейропластичностью во многих областях коры . [27] Также существуют доказательства того, что дофамин активируется в одно и то же время. Имеются убедительные доказательства того, что дофамин участвует как в подкрепляющем, так и в аверсивном обучении. [28] Дофаминовые пути гораздо плотнее проецируются в области лобной коры . Холинергические проекции, напротив, плотны даже в задних областях коры, таких как первичная зрительная кора . Исследование пациентов с болезнью Паркинсона , состоянием, которое объясняется недостаточным действием дофамина, еще раз иллюстрирует роль дофамина в положительном подкреплении. [29] Оно показало, что пациенты, не принимавшие лекарства, легче обучались при негативных последствиях, чем при положительном подкреплении. Пациенты, принимавшие лекарства, показали обратное: положительное подкрепление оказалось более эффективной формой обучения при высокой активности дофамина.
Предполагается, что в основе подкрепления лежит нейрохимический процесс с участием дофамина. Когда организм испытывает усиливающий стимул, дофаминовые активируются пути в мозге. Эта сеть путей «выпускает короткий импульс дофамина во многие дендриты , передавая таким образом глобальный сигнал подкрепления постсинаптическим нейронам ». [30] Это позволяет недавно активированным синапсам повысить свою чувствительность к эфферентным (проводящим наружу) сигналам, тем самым увеличивая вероятность возникновения недавних ответов, которые предшествовали подкреплению. По статистике, эти реакции с наибольшей вероятностью были поведением, ответственным за успешное достижение подкрепления. Но когда применение подкрепления менее немедленное или менее случайное (менее последовательное), способность дофамина воздействовать на соответствующие синапсы снижается.
Вопросы о законе эффекта
[ редактировать ]Ряд наблюдений, кажется, показывает, что оперантное поведение может быть установлено без подкрепления в смысле, определенном выше. Чаще всего упоминается феномен автоформирования (иногда называемый «отслеживанием знаков»), при котором за стимулом неоднократно следует подкрепление, и, как следствие, животное начинает реагировать на стимул. Например, загорается клавиша ответа, а затем подается еда. Когда это повторяется несколько раз, голубь начинает клевать ключ, хотя еда приходит независимо от того, клюет птица или нет. Аналогичным образом крысы начинают брать в руки небольшие предметы, например, рычаг, когда рядом находится еда. [31] [32] Поразительно, но голуби и крысы упорствуют в таком поведении даже тогда, когда клевание ключа или нажатие на рычаг приводит к уменьшению количества еды (тренировка бездействия). [33] [34] Еще одно очевидное оперантное поведение, проявляющееся без подкрепления, — это контрнахлебка .
Эти и другие наблюдения, по-видимому, противоречат закону эффекта и побудили некоторых исследователей предложить новые концепции оперантного подкрепления (например, [35] [36] [37] ) Более общая точка зрения состоит в том, что автоформирование является примером классической обусловленности ; процедура автоформирования фактически стала одним из наиболее распространенных способов измерения классической обусловленности. С этой точки зрения, на многие виды поведения могут влиять как классические непредвиденные обстоятельства (стимул-реакция), так и оперантные непредвиденные обстоятельства (реакция-подкрепление), и задача экспериментатора состоит в том, чтобы выяснить, как они взаимодействуют. [38]
Приложения
[ редактировать ]Подкрепление и наказание повсеместно используются в социальных взаимодействиях людей, и было предложено и реализовано очень много применений оперантных принципов. Ниже приведены некоторые примеры.
Пристрастие и зависимость
[ редактировать ]Позитивное и негативное подкрепление играют центральную роль в развитии и поддержании наркомании и наркозависимости . Наркотик, вызывающий привыкание , по своей сути приносит пользу ; то есть он действует как первичное положительное подкрепление употребления наркотиков. Система вознаграждения мозга придает ему значимость стимула (т. е. он «желателен» или «желателен»), [39] [40] [41] поэтому по мере развития зависимости лишение наркотика приводит к тяге к нему. Кроме того, стимулы, связанные с употреблением наркотиков – например, вид шприца и место употребления – становятся ассоциированными с интенсивным подкреплением, вызываемым наркотиком. [39] [40] [41] Эти ранее нейтральные стимулы приобретают несколько свойств: их появление может вызвать тягу к потреблению, и они могут стать условным положительным подкреплением дальнейшего употребления. [39] [40] [41] Таким образом, если зависимый человек сталкивается с одним из этих сигналов о наркотике, тяга к соответствующему наркотику может появиться снова. Например, агентства по борьбе с наркотиками ранее использовали плакаты с изображениями принадлежностей для употребления наркотиков , пытаясь показать опасность употребления наркотиков. Однако такие плакаты больше не используются из-за эффекта заметности стимулов, вызывающего рецидив при виде стимулов, изображенных на плакатах.
У лиц с наркотической зависимостью негативное подкрепление происходит, когда препарат принимается самостоятельно с целью облегчить или «избежать» симптомов физической зависимости (например, тремора и потливости) и/или психологической зависимости (например, ангедонии , беспокойства, раздражительности и тревожность), возникающие в состоянии отмены препарата . [39]
Дрессировка животных
[ редактировать ]Дрессировщики и владельцы домашних животных применяли принципы и методы оперантного обусловливания задолго до того, как эти идеи были названы и изучены, и дрессировка животных до сих пор представляет собой один из самых ярких и убедительных примеров оперантного контроля. Среди концепций и процедур, описанных в этой статье, наиболее важными являются следующие: (а) наличие первичного подкрепления (например, пакета вкусняшек для собак); (б) использование вторичного подкрепления (например, воспроизведение кликера сразу после желаемой реакции, а затем предоставление вкусняшки); (в) непредвиденные обстоятельства, гарантирующие, что подкрепление (например, кликер) следует желаемому поведению, а не чему-то другому; (г) формирование, например, постепенное принуждение собаки прыгать все выше и выше; (д) прерывистое подкрепление, например, постепенное уменьшение частоты подкрепления, чтобы вызвать устойчивое поведение без насыщения; (е) цепочка, когда сложное поведение постепенно строится из более мелких частей. [42]
Прикладной анализ поведения
[ редактировать ]Прикладной анализ поведения — это дисциплина, основанная Б. Ф. Скиннером , которая применяет принципы обусловленности к модификации социально значимого человеческого поведения. Он использует основные понятия теории обусловленности, включая условный раздражитель (S С ), дискриминативный стимул (S д ), реакцию (R) и подкрепляющий стимул (S повод или С р для подкрепления, иногда S авеню для аверсивных раздражителей). [23]
Практики прикладного поведенческого анализа (ABA) применяют эти процедуры, а также множество их вариаций и разработок для решения различных социально значимых моделей поведения и проблем. Во многих случаях практикующие врачи используют оперантные техники для развития конструктивного, социально приемлемого поведения взамен аномального поведения. Методы ABA эффективно применяются в таких областях, как раннее интенсивное поведенческое вмешательство для детей с расстройствами аутистического спектра (РАС). [43] исследование принципов, влияющих на преступное поведение , профилактика ВИЧ, [44] сохранение природных ресурсов, [45] образование, [46] геронтология , [47] здоровье и физические упражнения , [48] промышленная безопасность , [49] овладение языком , [50] мусор, [51] медицинские процедуры , [52] воспитание детей, [53] психотерапия , [ нужна ссылка ] использование ремней безопасности, [54] тяжелые психические расстройства , [55] спорт, [56] злоупотребление психоактивными веществами , фобии , расстройства кормления у детей, а также управление зоопарками и уход за животными . [57] Некоторые из этих приложений входят в число описанных ниже.
Поведение ребенка – тренинг по управлению родителями
[ редактировать ]Обеспечение положительного подкрепления за соответствующее поведение ребенка является основным направлением обучения родителей управлению. Как правило, родители учатся вознаграждать соответствующее поведение с помощью социальных вознаграждений (таких как похвала, улыбки и объятия), а также конкретных наград (например, наклеек или указаний на более крупную награду в рамках системы стимулирования, созданной совместно с ребенком). [58] Кроме того, родители учатся выбирать простое поведение в качестве первоначального фокуса и вознаграждать каждый маленький шаг, который их ребенок делает на пути к достижению более крупной цели (эта концепция называется «последовательными приближениями»). [58] [59]
Экономика
[ редактировать ]И психологи, и экономисты заинтересовались применением оперантных концепций и результатов к поведению людей на рынке. Пример представляет собой анализ потребительского спроса, индексируемого количеством приобретаемого товара. В экономике степень влияния цены на потребление называется «ценовой эластичностью спроса». Некоторые товары более эластичны, чем другие; например, изменение цен на определенные продукты питания может сильно повлиять на объем покупок, в то время как бензин и другие повседневные расходные материалы могут меньше зависеть от изменений цен. С точки зрения оперантного анализа такие эффекты можно интерпретировать с точки зрения мотивации потребителей и относительной ценности товаров в качестве подкрепления. [60]
Азартные игры – планирование с переменным коэффициентом
[ редактировать ]Как говорилось ранее в этой статье, график с переменным соотношением дает подкрепление после подачи непредсказуемого количества ответов. Такой график обычно обеспечивает быстрое и настойчивое реагирование. Игровые автоматы окупаются по графику с переменным соотношением, и они вызывают у игроков именно такое постоянное поведение, связанное с использованием рычагов. Переменное соотношение выигрышей от игровых автоматов и других форм азартных игр часто называют фактором, лежащим в основе игровой зависимости. [61]
Военная психология
[ редактировать ]Люди обладают врожденной устойчивостью к убийству и неохотно действуют напрямую и агрессивно по отношению к представителям своего вида, даже ради спасения жизни. Это сопротивление убийствам привело к тому, что пехота стала крайне неэффективной на протяжении всей истории военных войн. [62]
Это явление не было понято до тех пор, пока Маршалл SLA (бригадный генерал и военный историк) не провел исследование интервью с пехотой Второй мировой войны сразу после боевого боя. В известной и неоднозначной книге Маршалла «Люди против огня» показано, что только 15% солдат стреляли из винтовок с целью убийства в бою. [63] После принятия исследований Маршалла армией США в 1946 году Управление исследований человеческих ресурсов армии США начало внедрять новые протоколы обучения, напоминающие методы оперантного кондиционирования. Последующее применение таких методов увеличило процент солдат, способных убивать, примерно до 50% в Корее и более 90% во Вьетнаме. [62] Революция в обучении включала замену традиционных выдвижных стрельбищ трехмерными всплывающими мишенями в форме человека, которые разрушались при попадании в них. Это обеспечивало немедленную обратную связь и действовало как положительное подкрепление поведения солдата. [64] Другие усовершенствования методов военной подготовки включали курс стрельбы на время; более реалистичное обучение; большое количество повторений; похвала от начальства; награды за меткую стрельбу; и групповое признание. Негативное подкрепление включает подотчетность коллег или требование перепройти курсы. Современная военная подготовка обусловливает реакцию среднего мозга на боевое давление путем точной имитации реального боя, используя в основном классическое обусловливание Павлова и оперантное обусловливание Скиннера (обе формы бихевиоризма ). [62]
Современная тренировка по стрельбе является настолько прекрасным примером бихевиоризма, что она уже много лет используется во вводном курсе психологии, который преподают всем курсантам Военной академии США в Вест-Пойнте, как классический пример оперантного обусловливания. В 1980-х годах во время визита в Вест-Пойнт Б. Ф. Скиннер определил, что современные военные тренировки по стрельбе являются почти идеальным применением оперантного обусловливания. [64]
Подполковник Дэйв Гроссман утверждает об оперантном обусловливании и военной подготовке США следующее:
Вполне возможно, что никто намеренно не сел за использование методов оперантного обусловливания или модификации поведения для обучения солдат в этой области… Но с точки зрения психолога, который также является историком и кадровым военным, для меня становится все более очевидным, что именно это и было достигнуто. [62]
Теория подталкивания
[ редактировать ]Теория подталкивания (или подталкивания) — это концепция в поведенческой науке , политической теории и экономике , которая утверждает, что косвенные предложения, направленные на достижение ненасильственного подчинения, могут влиять на мотивы, стимулы и принятие решений группами и отдельными людьми, по крайней мере, так же эффективно — если не более эффективно, чем прямое указание, законодательство или правоприменение. [ нужна ссылка ]
Хвалить
[ редактировать ]Концепция похвалы как средства поведенческого подкрепления коренится в модели оперантного обусловливания Б. Ф. Скиннера. С этой точки зрения похвала рассматривается как средство положительного подкрепления, при котором наблюдаемое поведение становится более вероятным за счет условной похвалы такого поведения. [65] Сотни исследований продемонстрировали эффективность похвалы в поощрении позитивного поведения, в частности, в изучении использования похвалы учителями и родителями в отношении детей для улучшения поведения и успеваемости. [66] [67] но и при изучении производительности труда. [68] Также было продемонстрировано, что похвала усиливает позитивное поведение у соседних людей, которых не хвалят (например, одноклассника получателя похвалы), посредством косвенного подкрепления. [69] Похвала может быть более или менее эффективной для изменения поведения в зависимости от ее формы, содержания и подачи. Для того чтобы похвала привела к позитивному изменению поведения, она должна быть обусловлена позитивным поведением (т. е. применяться только после того, как было реализовано целевое поведение), должна указывать детали поведения, которое необходимо подкрепить, и должна произноситься искренне и искренне. достоверно. [70]
Признавая эффект похвалы как стратегии положительного подкрепления, многочисленные поведенческие и когнитивно-поведенческие вмешательства включили использование похвалы в свои протоколы. [71] [72] Стратегическое использование похвалы признано научно обоснованной практикой как в управлении классом, так и в управлении классом. [71] и мероприятия по обучению родителей, [67] хотя в исследованиях вмешательства похвала часто относится к более широкой категории положительного подкрепления, которая включает в себя такие стратегии, как стратегическое внимание и поведенческое вознаграждение.
Было проведено несколько исследований влияния когнитивно-поведенческой терапии и оперантно-поведенческой терапии на различные заболевания. Когда пациенты разработали когнитивные и поведенческие методы, которые изменили их поведение, отношение и эмоции; выраженность боли уменьшилась. Результаты этих исследований показали влияние когнитивных функций на восприятие боли, а представленное воздействие объяснило общую эффективность когнитивно-поведенческой терапии (КПТ) и оперантно-поведенческой терапии (ОБТ). [ нужна ссылка ]
Видеоигры
[ редактировать ]Большинство [ нужна ссылка ] Многие видеоигры построены на основе цикла принуждения , добавляя своего рода положительное подкрепление посредством графика переменной скорости, чтобы игрок продолжал играть. Это может привести к патологии зависимости от видеоигр . [73]
В рамках тенденции монетизации видеоигр в 2010-х годах некоторые игры предлагали лутбоксы в качестве награды или предметов, которые можно было купить за реальные деньги. Коробки содержат случайный набор игровых предметов. Эта практика связана с теми же методами, которыми выдают вознаграждения игровые автоматы и другие игровые устройства, поскольку она следует графику переменных ставок. Несмотря на общее мнение, что лутбоксы являются формой азартной игры, эта практика классифицируется как таковая лишь в нескольких странах. Однако методы использования этих предметов в качестве виртуальной валюты для онлайн-азартных игр или торговли на реальные деньги создали рынок скин-гемблинга , который находится на стадии юридической оценки. [74]
Оперантное кондиционирования и защитная медицина
[ редактировать ]Одной из многих причин, объясняющих огромные затраты, связанные со здравоохранением, является практика защитной медицины. Прабху просматривает статью Коула и обсуждает, почему реакции двух групп нейрохирургов представляют собой классическое оперантное поведение. Одна группа практикует в штате с ограничениями на медицинские иски, а другая — без ограничений. Группу нейрохирургов анонимно опросили об их практике. Врачи изменили свою практику в ответ на негативные отзывы (страх перед судебным иском) в группе, которая практиковала в штате, где нет ограничений на медицинские иски. [75]
См. также
[ редактировать ]- Злоупотребление властью и контролем
- Тестирование на животных
- Поведенческий контраст
- Бихевиоризм (раздел психологии, относящийся к методологическому и радикальному бихевиоризму)
- Модификация поведения (старое выражение ABA; изменяет поведение либо посредством последствий без учета контроля стимулов, либо включает использование наводнения , также называемого терапией длительного воздействия )
- Морковь и палка
- Уход за ребенком
- Классическое кондиционирование
- Когнитивизм (психология) (теория внутренних механизмов без привязки к поведению)
- Тесты потребительского спроса (на животных)
- Педагогическая психология
- Образовательные технологии
- Экспериментальный анализ поведения ( принципы экспериментального исследования оперантного и респондентного обусловливания)
- Экспозиционная терапия (также называемая десенсибилизацией)
- Поэтапная экспозиционная терапия (также называемая систематической десенсибилизацией )
- Привыкание
- Ежи Конорски
- Наученное трудолюбие
- Соответствующий закон
- Отрицательный (положительный) контрастный эффект
- Радикальный бихевиоризм (концептуальная теория поведенческого анализа, которая расширяет бихевиоризм, включив в него также частные события (мысли и чувства) как формы поведения)
- Армирование
- Павловско-инструментальный перевод
- Тесты предпочтений (животные)
- Принцип Премака
- Сенсибилизация
- Социальная обусловленность
- Общество количественного анализа поведения
- Спонтанное выздоровление
Ссылки
[ редактировать ]- ^ Дженкинс, HM «Обучение животных и теория поведения», гл. 5 в Херсте, Э. «Первый век экспериментальной психологии», Хиллсдейл, штат Нью-Джерси, Эрлбаум, 1979.
- ^ Тарантола, Тор; Кумаран, Дхаршан; Даян, Питерс; Де Мартино, Бенедетто (10 октября 2017 г.). «Предыдущие предпочтения благотворно влияют на социальное и несоциальное обучение» . Природные коммуникации . 8 (1): 817. Бибкод : 2017NatCo...8..817T . дои : 10.1038/s41467-017-00826-8 . ISSN 2041-1723 . ПМЦ 5635122 . ПМИД 29018195 .
- ^ Jump up to: а б Торндайк, EL (1901). «Интеллект животных: экспериментальное исследование ассоциативных процессов у животных». Приложение к монографии «Психологический обзор» . 2 :1–109.
- ^ Мильтенбергер, Р.Г. «Модификация поведения: принципы и процедуры». Томсон/Уодсворт , 2008. с. 9.
- ^ Милтенбергер, Р.Г., и Кросланд, штат Калифорния (2014). Воспитание. Справочник Уайли Блэквелла по оперантному и классическому обусловливанию. (стр. 509–531) Уайли-Блэквелл. два : 10.1002/9781118468135.ch20
- ^ Скиннер, Б.Ф. «Поведение организмов: экспериментальный анализ», 1938, Нью-Йорк: Appleton-Century-Crofts
- ^ Скиннер, Б.Ф. (1950). «Нужны ли теории обучения?». Психологический обзор . 57 (4): 193–216. дои : 10.1037/h0054367 . ПМИД 15440996 . S2CID 17811847 .
- ^ Шактер, Дэниел Л., Дэниел Т. Гилберт и Дэниел М. Вегнер. «Б. Ф. Скиннер: роль подкрепления и наказания», подраздел: Психология; Второе издание. Нью-Йорк: Worth, Incorporated, 2011, 278–288.
- ^ Jump up to: а б Ферстер, CB и Скиннер, BF «График армирования», 1957 г., Нью-Йорк: Appleton-Century-Crofts.
- ^ Стаддон, JE R; Д. Т. Черутти (февраль 2003 г.). «Оперантное кондиционирование» . Ежегодный обзор психологии . 54 (1): 115–144. дои : 10.1146/annurev.psych.54.101601.145124 . ПМК 1473025 . ПМИД 12415075 .
- ^ Мекка Кьеза (2004) Радикальный бихевиоризм: философия и наука
- ^ Скиннер, Б.Ф. «Наука и человеческое поведение», 1953. Нью-Йорк: Макмиллан.
- ^ Скиннер, Б.Ф. (1948). Уолден Два. Индианаполис: Хакетт
- ^ Скиннер, Б.Ф. «Вербальное поведение», 1957. Нью-Йорк: Appleton-Century-Crofts.
- ^ Нойрингер, А (2002). «Оперантная изменчивость: доказательства, функции и теория» . Психономический бюллетень и обзор . 9 (4): 672–705. дои : 10.3758/bf03196324 . ПМИД 12613672 .
- ^ Скиннер, Б.Ф. (2014). Наука и поведение человека (PDF) . Кембридж, Массачусетс: Фонд Б.Ф. Скиннера. п. 70 . Проверено 13 марта 2019 г.
- ^ Шульц В. (2015). «Нейронное вознаграждение и сигналы решения: от теорий к данным» . Физиологические обзоры . 95 (3): 853–951. doi : 10.1152/physrev.00023.2014 . ПМЦ 4491543 . ПМИД 26109341 .
Награды в оперантном обусловливании являются положительным подкреплением. ... Оперантное поведение дает хорошее определение вознаграждения. Все, что заставляет человека возвращаться снова и снова, является положительным подкреплением и, следовательно, наградой. Хотя положительное подкрепление дает хорошее определение, оно является лишь одной из нескольких функций вознаграждения. ... Награды привлекательны. Они мотивируют и заставляют нас прилагать усилия. ... Награды стимулируют подходящее поведение, также называемое аппетитным или подготовительным поведением, и завершающее поведение. ... Таким образом, любой стимул, объект, событие, деятельность или ситуация, которая потенциально может заставить нас приблизиться и поглотить его, по определению является наградой.
- ^ Schacter et al.2011 Психология, 2-е изд. стр. 280–284 Ссылка на весь раздел «Принципы», версия 130317
- ^ Jump up to: а б Мильтенбергер, Р.Г. «Модификация поведения: принципы и процедуры». Томсон/Уодсворт , 2008. с. 84.
- ^ Мильтенбергер, Р.Г. «Модификация поведения: принципы и процедуры». Томсон/Уодсворт , 2008. с. 86.
- ^ Такер, М.; Сигафус, Дж.; Бушелл, Х. (1998). «Использование неусловного подкрепления при лечении проблемного поведения». Модификация поведения . 22 (4): 529–547. дои : 10.1177/01454455980224005 . ПМИД 9755650 . S2CID 21542125 .
- ^ Полинг, А.; Норманд, М. (1999). «Необусловленное подкрепление: неподходящее описание временных графиков, которые снижают поведение» . Журнал прикладного анализа поведения . 32 (2): 237–238. дои : 10.1901/jaba.1999.32-237 . ПМК 1284187 .
- ^ Jump up to: а б с Пирс и Чейни (2004) Анализ поведения и обучение
- ^ Коул, MR (1990). «Оперантное накопительство: новая парадигма изучения самоконтроля» . Журнал экспериментального анализа поведения . 53 (2): 247–262. дои : 10.1901/jeab.1990.53-247 . ПМК 1323010 . ПМИД 2324665 .
- ^ «Активность паллидных нейронов во время движения» , М. Р. Делонг, Дж. Нейрофизиол. , 34:414–27, 1971 г.
- ^ Jump up to: а б Ричардсон Р.Т., Делонг М.Р. (1991): Электрофизиологические исследования функции базального ядра у приматов. В Napier TC, Каливас П., Хамин I (редакторы), Базальный передний мозг: от анатомии к функциям ( Достижения в области экспериментальной медицины и биологии ), vol. 295. Нью-Йорк, Пленум, стр. 232–252.
- ^ PNAS 93:11219-24 1996, Science 279:1714–8 1998
- ^ Neuron 63: 244–253, 2009, Границы поведенческой нейронауки, 3: Статья 13, 2009 г.
- ^ Майкл Дж. Франк, Лорен К. Сибергер и Рэндалл К. О'Рейли (2004) «Кнутом или пряником: обучение с когнитивным подкреплением при паркинсонизме», Science 4, ноябрь 2004 г.
- ^ Шульц, Вольфрам (1998). «Прогнозирующий сигнал вознаграждения дофаминовых нейронов» . Журнал нейрофизиологии . 80 (1): 1–27. дои : 10.1152/jn.1998.80.1.1 . ПМИД 9658025 . S2CID 52857162 .
- ^ Тимберлейк, W (1983). «Реакция крыс на движущийся объект, связанный с едой или водой: анализ поведенческих систем» . Обучение и поведение животных . 11 (3): 309–320. дои : 10.3758/bf03199781 .
- ^ Нойрингер, AJ (1969). «Животные отвечают на еду при наличии бесплатной еды». Наука . 166 (3903): 399–401. Бибкод : 1969Sci...166..399N . дои : 10.1126/science.166.3903.399 . ПМИД 5812041 . S2CID 35969740 .
- ^ Уильямс, доктор медицинских наук; Уильямс, Х. (1969). «Автоматическое обслуживание голубя: продолжительное клевание, несмотря на отсутствие подкрепления» . Журнал экспериментального анализа поведения . 12 (4): 511–520. дои : 10.1901/jeab.1969.12-511 . ПМЦ 1338642 . ПМИД 16811370 .
- ^ Педен, БФ; Браун, член парламента; Херст, Э. (1977). «Настойчивые подходы к сигналу о еде, несмотря на пропуск еды при приближении». Журнал экспериментальной психологии: процессы поведения животных . 3 (4): 377–399. дои : 10.1037/0097-7403.3.4.377 .
- ^ Гарднер, РА; Гарднер, БТ (1988). «Прямая связь против обратной связи: этологическая альтернатива закону эффекта». Поведенческие и мозговые науки . 11 (3): 429–447. дои : 10.1017/s0140525x00058258 . S2CID 143876403 .
- ^ Гарднер, Р.А. и Гарднер Б.Т. (1998) Структура обучения от жестовых стимулов к языку жестов. Махва, Нью-Джерси: Lawrence Erlbaum Associates.
- ^ Баум, WM (2012). «Переосмысление подкрепления: распределение, индукция и непредвиденные обстоятельства» . Журнал экспериментального анализа поведения . 97 (1): 101–124. дои : 10.1901/jeab.2012.97-101 . ПМЦ 3266735 . ПМИД 22287807 .
- ^ Локурто, CM, Террас, HS, и Гиббон, Дж. (1981) Теория автоформирования и кондиционирования. Нью-Йорк: Академическая пресса.
- ^ Jump up to: а б с д Эдвардс С. (2016). «Принципы усиления медицины наркозависимости; от употребления рекреационных наркотиков до психических расстройств». Нейронаука в наркозависимости: от профилактики к реабилитации — конструкции и лекарства . Прогресс в исследованиях мозга. Том. 223. стр. 63–76. дои : 10.1016/bs.pbr.2015.07.005 . ISBN 9780444635457 . ПМИД 26806771 .
Вещества, которыми злоупотребляют (от алкоголя до психостимуляторов), изначально употребляются регулярно в соответствии с их положительными подкрепляющими свойствами. Важно отметить, что неоднократное воздействие полезных веществ запускает цепочку вторичных подкрепляющих событий, в результате чего сигналы и контексты, связанные с употреблением наркотиков, сами по себе могут стать подкрепляющими и тем самым способствовать продолжению употребления и возможному злоупотреблению выбранными веществами. ...
Важным аспектом подкрепления, имеющим большое значение для процесса зависимости (и особенно рецидива), является вторичное подкрепление (Stewart, 1992). Вторичные подкрепления (во многих случаях также рассматриваемые как условные подкрепления), вероятно, управляют большинством процессов подкрепления у людей. В конкретном случае наркотической [наркомании] сигналы и контексты, которые тесно и неоднократно связаны с употреблением наркотиков, часто сами по себе становятся подкрепляющими... Фундаментальная часть теории зависимости Робинсона и Берриджа, основанной на стимулировании и сенсибилизации, утверждает, что стимулирующая ценность или привлекательность Природа таких процессов вторичного подкрепления, помимо самих первичных подкреплений, может сохраняться и даже становиться сенсибилизированной с течением времени в связи с развитием наркозависимости (Robinson and Berridge, 1993). ...
Негативное подкрепление — это особое состояние, связанное с усилением поведенческих реакций, которые прекращают действие некоторого продолжающегося (предположительно аверсивного) стимула. В этом случае мы можем определить негативное подкрепление как мотивационный стимул, который усиливает такую реакцию «побега». Исторически, что касается наркозависимости, это явление постоянно наблюдалось у людей, когда наркотики употреблялись самостоятельно для удовлетворения мотивационной потребности в состоянии абстиненции (Wikler, 1952).{{cite book}}
:|journal=
игнорируется ( помогите ) - ^ Jump up to: а б с Берридж К.К. (апрель 2012 г.). «От ошибки прогнозирования к значимости стимулов: мезолимбические вычисления мотивации вознаграждения» . Евро. Дж. Нейроски . 35 (7): 1124–1143. дои : 10.1111/j.1460-9568.2012.07990.x . ПМК 3325516 . ПМИД 22487042 .
Когда Павловскому CS+ приписывается стимулирующая значимость, это не только вызывает «желание» его UCS, но часто сам сигнал становится очень привлекательным – даже до иррациональной степени. Эта привлекательность сигнала — еще одна характерная черта значимости стимула. На CS становится трудно не смотреть (Wiers & Stacy, 2006; Hickey et al., 2010a; Piech et al., 2010; Anderson et al., 2011). CS даже приобретает некоторые стимулирующие свойства, аналогичные UCS. Привлекательный КС часто вызывает поведенчески мотивированный подход, а иногда человек может даже попытаться «потребить» КС в некотором роде как его UCS (например, есть, пить, курить, заниматься сексом, принимать как наркотик). «Желание» CS может также превратить ранее нейтральный стимул в инструментальное условное подкрепление, так что человек будет работать над получением сигнала (однако существуют и альтернативные психологические механизмы для условного подкрепления).
- ^ Jump up to: а б с Берридж К.К., Крингельбах М.Л. (май 2015 г.). «Системы удовольствия в мозге» . Нейрон . 86 (3): 646–664. дои : 10.1016/j.neuron.2015.02.018 . ПМЦ 4425246 . ПМИД 25950633 .
Важная цель нейробиологии зависимостей в будущем — понять, как интенсивная мотивация становится узконаправленной на конкретную цель. Предполагается, что зависимость отчасти возникает из-за чрезмерной значимости стимулов, создаваемых сенсибилизированными или гиперреактивными дофаминовыми системами, которые вызывают сильное «желание» (Robinson and Berridge, 1993). Но почему одна цель становится более «желанной», чем все остальные, до конца не объяснено. У наркоманов или пациентов, стимулированных агонистами, повторение выраженности стимулов дофаминовой стимуляции объясняется определенными индивидуализированными занятиями, такими как прием препарата, вызывающего привыкание, или определенные навязчивые действия. В ситуациях с вознаграждением по Павлову некоторые сигналы вознаграждения становятся более «желанными» больше, чем другие, как мощные мотивационные магниты, причем у разных людей эти сигналы различаются (Robinson et al., 2014b; Saunders and Robinson, 2013). ... Однако гедонистический эффект вполне может со временем измениться. Поскольку препарат принимался неоднократно, у восприимчивых людей могла возникнуть мезолимбическая дофаминергическая сенсибилизация, усиливающая «желание» (Leyton and Vezina, 2013; Lodge and Grace, 2011; Wolf and Ferrario, 2010), даже если опиоидные гедонические механизмы подверглись негативной регуляции. из-за постоянной лекарственной стимуляции, вызывающей «любящую» толерантность. Стимулирующая сенсибилизация может вызвать зависимость, избирательно усиливая вызванное сигналом «желание» снова принять наркотик, и таким образом мощно вызвать мотивацию, даже если наркотик станет менее приятным (Robinson and Berridge, 1993).
- ^ МакГриви, П. и Боукс, Р. «Морковь и палка: принципы дрессировки животных». (Сидней: «Sydney University Press», 2011).
- ^ Дилленбургер, К.; Кинан, М. (2009). «Ни одна из букв ABA не означает аутизм: развенчание мифов». J Intellect Dev Disabil . 34 (2): 193–95. дои : 10.1080/13668250902845244 . ПМИД 19404840 . S2CID 1818966 .
- ^ ДеВрис, Дж. Э.; Бернетт, ММ; Редмон, ВК (1991). «Профилактика СПИДа: улучшение соблюдения медсестрами режима ношения перчаток посредством обратной связи» . Журнал прикладного анализа поведения . 24 (4): 705–11. дои : 10.1901/jaba.1991.24-705 . ПМЦ 1279627 . ПМИД 1797773 .
- ^ Братья, К.Дж.; Кранц, П.Дж.; МакКланнахан, Ю.Л. (1994). «Переработка офисной бумаги: функция близости контейнеров» . Журнал прикладного анализа поведения . 27 (1): 153–60. дои : 10.1901/jaba.1994.27-153 . ПМЦ 1297784 . ПМИД 16795821 .
- ^ Дардиг, Джилл С.; Хьюард, Уильям Л.; Херон, Тимоти Э.; Нэнси А. Ниф; Петерсон, Стефани; Дайан М. Сайнато; Картледж, Гвендолин; Гарднер, Ральф; Петерсон, Ллойд Р.; Сьюзан Б. Херш (2005). Сосредоточьтесь на анализе поведения в образовании: достижения, проблемы и возможности . Река Аппер-Сэддл, Нью-Джерси: Пирсон/Меррилл/Прентис-Холл. ISBN 978-0-13-111339-8 .
- ^ Галлахер, С.М.; Кинан М. (2000). «Самостоятельное использование материалов деятельности пожилыми людьми в жилых условиях» . Журнал прикладного анализа поведения . 33 (3): 325–28. дои : 10.1901/jaba.2000.33-325 . ПМЦ 1284256 . ПМИД 11051575 .
- ^ Де Лука, Р.В.; Холборн, Юго-Запад (1992). «Влияние режима подкрепления с переменным соотношением и изменением критериев на физические упражнения у мальчиков с ожирением и без него» . Журнал прикладного анализа поведения . 25 (3): 671–79. дои : 10.1901/jaba.1992.25-671 . ПМЦ 1279749 . ПМИД 1429319 .
- ^ Фокс, ДК; Хопкинс, БЛ; Гнев, WK (1987). «Долгосрочное влияние экономики токенов на показатели безопасности при добыче полезных ископаемых открытым способом» . Журнал прикладного анализа поведения . 20 (3): 215–24. дои : 10.1901/jaba.1987.20-215 . ПМК 1286011 . ПМИД 3667473 .
- ^ Драсгоу, Э.; Галле, JW; Остроский, М.М. (1998). «Влияние дифференциального подкрепления на генерализацию замещающего манда у трех детей с тяжелыми задержками речи» . Журнал прикладного анализа поведения . 31 (3): 357–74. дои : 10.1901/jaba.1998.31-357 . ПМЦ 1284128 . ПМИД 9757580 .
- ^ Пауэрс, РБ; Осборн, Дж. Г.; Андерсон, Э.Г. (1973). «Положительное подкрепление вывоза мусора в естественной среде» . Журнал прикладного анализа поведения . 6 (4): 579–86. дои : 10.1901/jaba.1973.6-579 . ПМК 1310876 . ПМИД 16795442 .
- ^ Агопян, LP; Томпсон, Р.Х. (1999). «Укрепление приверженности респираторному лечению у ребенка, больного муковисцидозом» . Журнал прикладного анализа поведения . 32 (2): 233–36. дои : 10.1901/jaba.1999.32-233 . ПМЦ 1284184 . ПМИД 10396778 .
- ^ Кун, САК; Лерман, округ Колумбия; Ворндран, CM (2003). «Пирамидный тренинг для семей детей с проблемным поведением» . Журнал прикладного анализа поведения . 36 (1): 77–88. дои : 10.1901/jaba.2003.36-77 . ПМЦ 1284418 . ПМИД 12723868 .
- ^ Ван Хаутен, Р.; Маленфант, JEL; Остин, Дж.; Леббон, А. (2005). Воллмер, Тимоти (ред.). «Влияние задержки переключения передач и ремней безопасности влияет на использование ремней безопасности автомобилистами, которые не пристегивают ремни безопасности регулярно» . Журнал прикладного анализа поведения . 38 (2): 195–203. дои : 10.1901/jaba.2005.48-04 . ПМК 1226155 . ПМИД 16033166 .
- ^ Вонг, SE; Мартинес-Диас, JA; Массель, Гонконг; Эдельштейн, бакалавр; Виганд, В.; Боуэн, Л.; Либерман, Р.П. (1993). «Тренировка разговорных навыков с пациентами, страдающими шизофренией: исследование обобщения условий и собеседников». Поведенческая терапия . 24 (2): 285–304. дои : 10.1016/S0005-7894(05)80270-9 .
- ^ Бробст, Б.; Уорд, П. (2002). «Влияние публичных публикаций, постановки целей и устных отзывов на навыки футболисток-женщин» . Журнал прикладного анализа поведения . 35 (3): 247–57. дои : 10.1901/jaba.2002.35-247 . ПМЦ 1284383 . ПМИД 12365738 .
- ^ Фортман, Д.Л.; Огден, Джей-Джей (1992). «Роль прикладного поведенческого анализа в управлении зоопарками: сегодня и завтра» . Журнал прикладного анализа поведения . 25 (3): 647–52. дои : 10.1901/jaba.1992.25-647 . ПМЦ 1279745 . ПМИД 16795790 .
- ^ Jump up to: а б Каздин А.Е. (2010). Обучение навыкам решения проблем и обучение родителям управлению поведением при оппозиционно-вызывающем расстройстве и расстройстве поведения. Доказательная психотерапия для детей и подростков (2-е изд.), 211–226. Нью-Йорк: Гилфорд Пресс.
- ^ Форгач М.С., Паттерсон Г.Р. (2010). Обучение родительскому менеджменту — модель штата Орегон: меры вмешательства при антисоциальном поведении детей и подростков. Доказательная психотерапия для детей и подростков (2-е изд.), 159–78. Нью-Йорк: Гилфорд Пресс.
- ^ Домьян, М. (2009). Принципы обучения и поведения. Издательская компания Уодсворт. 6-е издание. страницы 244–249.
- ^ Бледа, Мигель Анхель Перес; Ньето, Хосе Эктор Лозано (2012). «Импульсивность, интеллект и различение непредвиденных обстоятельств подкрепления в графике с фиксированным соотношением 3». Испанский журнал психологии . 3 (15): 922–929. дои : 10.5209/rev_SJOP.2012.v15.n3.39384 . ПМИД 23156902 . S2CID 144193503 . ПроКвест 1439791203 .
- ^ Jump up to: а б с д Гроссман, Дэйв (1995). Об убийстве: психологическая цена обучения убийству на войне и в обществе . Бостон: Литтл Браун. ISBN 978-0316040938 .
- ^ Маршалл, ОАС (1947). Люди против огня: проблема боевого командования в войне будущего . Вашингтон: Пехотный журнал. ISBN 978-0-8061-3280-8 .
- ^ Jump up to: а б Мюррей К.А., Гроссман Д., Кентридж Р.В. (21 октября 2018 г.). «Поведенческая психология» . killology.com/behavioral-psychology .
- ^ Каздин, Алан (1978). История модификации поведения: Экспериментальные основы современных исследований . Балтимор: University Park Press. ISBN 9780839112051 .
- ^ Стрейн, Филипп С.; Ламберт, Дебора Л.; Керр, Мэри Маргарет; Стэгг, Воган; Ленкнер, Донна А. (1983). «Натуралистическая оценка соответствия детей требованиям педагога и последствия выполнения» . Журнал прикладного анализа поведения . 16 (2): 243–249. дои : 10.1901/jaba.1983.16-243 . ПМЦ 1307879 . ПМИД 16795665 .
- ^ Jump up to: а б Гарланд, Энн Ф.; Хоули, Кристин М.; Брукман-Фрейзи, Лорен; Херлберт, Майкл С. (май 2008 г.). «Определение общих элементов научно обоснованных психосоциальных методов лечения проблем деструктивного поведения детей». Журнал Американской академии детской и подростковой психиатрии . 47 (5): 505–514. дои : 10.1097/CHI.0b013e31816765c2 . ПМИД 18356768 .
- ^ Кроуэлл, Чарльз Р.; Андерсон, Д. Крис; Абель, Дон М.; Серджио, Джозеф П. (1988). «Уточнение задач, обратная связь по результатам и социальная похвала: процедуры улучшения обслуживания клиентов банковскими кассирами» . Журнал прикладного анализа поведения . 21 (1): 65–71. дои : 10.1901/jaba.1988.21-65 . ПМК 1286094 . ПМИД 16795713 .
- ^ Каздин, Алан Э. (1973). «Влияние косвенного подкрепления на внимательное поведение в классе» . Журнал прикладного анализа поведения . 6 (1): 71–78. дои : 10.1901/jaba.1973.6-71 . ПМК 1310808 . ПМИД 16795397 .
- ^ Брофи, Джер (1981). «Об эффективном восхвалении». Журнал начальной школы . 81 (5): 269–278. дои : 10.1086/461229 . JSTOR 1001606 . S2CID 144444174 .
- ^ Jump up to: а б Симонсен, Брэнди; Фэрбенкс, Сара; Бриш, Эми; Майерс, Дайан; Сугай, Джордж (2008). «Научно обоснованные практики управления классом: соображения по поводу исследований на практике». Образование и лечение детей . 31 (1): 351–380. дои : 10.1353/etc.0.0007 . S2CID 145087451 .
- ^ Вайс, Джон Р.; Каздин, Алан Э. (2010). Доказательная психотерапия для детей и подростков . Гилфорд Пресс.
- ↑ Джон Хопсон: Поведенческий игровой дизайн , Гамасутра , 27 апреля 2001 г.
- ^ Худ, Вик (12 октября 2017 г.). «Являются ли лутбоксы азартной игрой?» . Еврогеймер . Проверено 12 октября 2017 г.
- ^ Оперантное обучение и практика защитной медицины. Викрам К. Прабху World Neurosurgery, 01 июля 2016 г., том 91, страницы 603–605