Jump to content

Армирование

(Перенаправлено из «Подкрепление (психология)

Камера оперирования для тренировки с подкреплением

В поведенческой психологии подкрепление относится к последствиям , которые увеличивают вероятность будущего поведения организма, обычно при наличии определенного предшествующего стимула . [1] Например, крысу можно научить нажимать на рычаг, чтобы получить еду, всякий раз, когда включается свет. В этом примере свет является предшествующим стимулом, нажатие на рычаг — оперантным поведением, а еда — подкреплением. Аналогичным образом, ученик, который получает внимание и похвалу при ответе на вопрос учителя, с большей вероятностью ответит на будущие вопросы в классе. Вопрос учителя является антецедентом, ответ ученика — поведением, а похвала и внимание — подкреплением.

Последствия, которые приводят к аппетитному поведению, такие как субъективное «желание» и «пристрастие» (желание и удовольствие), действуют как вознаграждение или положительное подкрепление . [2] Существует также негативное подкрепление , которое предполагает устранение нежелательного стимула. Примером негативного подкрепления может быть прием аспирина для облегчения головной боли.

Подкрепление является важным компонентом оперантного обусловливания и модификации поведения . Эта концепция применялась в различных практических областях, включая воспитание детей, коучинг, терапию, самопомощь, образование и управление.

Терминология

[ редактировать ]
Словарь наркомании и зависимости [3] [4] [5]

В науках о поведении термины «позитивный» и «негативный» при использовании в их строгом техническом смысле относятся к природе действия, выполняемого обусловливающим, а не к оценке реагирующего операнта этого действия и его последствий. «Позитивные» действия — это те, которые добавляют в окружающую среду какой-либо фактор, будь то приятный или неприятный, тогда как «негативные» действия — это те, которые удаляют или удерживают из окружающей среды фактор любого типа. В свою очередь, строгий смысл «подкрепления» относится только к обусловлению, основанному на вознаграждении; введение неприятных факторов и удаление или удержание приятных факторов вместо этого называются «наказанием», которое в строгом смысле, таким образом, противопоставляется «подкреплению». Таким образом, «положительное подкрепление» относится к добавлению приятного фактора, «положительное наказание» относится к добавлению неприятного фактора, «отрицательное подкрепление» относится к удалению или удержанию неприятного фактора, а «негативное наказание» относится к удаление или удержание приятного фактора.

Такое использование противоречит некоторым нетехническим значениям четырех комбинаций терминов, особенно в случае термина «негативное подкрепление», которое часто используется для обозначения того, что на техническом языке можно было бы назвать «положительным наказанием», поскольку не Техническое использование интерпретирует «подкрепление» как включающее в себя как вознаграждение, так и наказание, а «негативное» - как относящееся к оценке реагирующим оперантом вводимого фактора. Напротив, в техническом языке будет использоваться термин «негативное подкрепление» для описания поощрения определенного поведения путем создания сценария, в котором неприятный фактор присутствует или будет присутствовать, но участие в таком поведении приводит либо к бегству от этого фактора, либо к предотвращению его возникновения. , как в эксперименте Мартина Селигмана , в котором собаки учились избегать поражения электрическим током .

Введение

[ редактировать ]

Б. Ф. Скиннер был известным и влиятельным исследователем, сформулировавшим многие теоретические конструкции подкрепления и бихевиоризма . Скиннер определил подкрепления в соответствии с изменением силы реакции (скоростью ответа), а не более субъективными критериями, такими как то, что кому-то приятно или ценно. Соответственно, действия, продукты питания или предметы, считающиеся приятными или доставляющими удовольствие, не обязательно могут быть подкрепляющими (поскольку они не вызывают усиления предшествующей им реакции). Стимулы, условия и действия подходят под определение подкреплений только в том случае, если поведение, которое непосредственно предшествует потенциальному подкреплению, усиливается в аналогичных ситуациях в будущем; например, ребенок, который получает печенье, когда просит его. Если частота «запроса файлов cookie» увеличивается, файл cookie можно рассматривать как усиливающий «поведение запроса файлов cookie». Однако, если «поведение при запросе файлов cookie» не усиливается, файлы cookie не могут считаться усиливающими.

Единственным критерием, определяющим, является ли стимул подкрепляющим, является изменение вероятности поведения после введения этого потенциального подкрепления. Другие теории могут фокусироваться на дополнительных факторах, например, ожидал ли человек, что поведение приведет к определенному результату, но в поведенческой теории подкрепление определяется повышенной вероятностью реакции.

Изучение подкрепления дало огромное количество воспроизводимых экспериментальных результатов. Подкрепление является центральной концепцией и процедурой в специальном образовании , прикладном анализе поведения и экспериментальном анализе поведения , а также основной концепцией в некоторых медицинских и психофармакологических моделях, особенно в моделях зависимости , зависимости и принуждения .

Лабораторные исследования по подкреплению обычно датируются работами Эдварда Торндайка , известного своими экспериментами с кошками, убегающими из коробок-головоломк. [6] Ряд других продолжили эти исследования, в частности Б. Ф. Скиннер, который опубликовал свою плодотворную работу по этой теме в книге «Поведение организмов » в 1938 году и развил эти исследования во многих последующих публикациях. [7] В частности, Скиннер утверждал, что положительное подкрепление превосходит наказание в формировании поведения. [8] Хотя наказание может показаться полной противоположностью подкрепления, Скиннер утверждал, что они сильно различаются, утверждая, что положительное подкрепление приводит к устойчивому изменению поведения (долгосрочному), тогда как наказание меняет поведение лишь временно (краткосрочно) и имеет множество вредных побочных эффектов.

Многие исследователи впоследствии расширили наше понимание подкрепления и поставили под сомнение некоторые выводы Скиннера. Например, Азрин и Хольц определили наказание как «последствие поведения, которое снижает вероятность такого поведения в будущем». [9] а некоторые исследования показали, что положительное подкрепление и наказание одинаково эффективны для изменения поведения. [ нужна ссылка ] Исследования эффектов положительного, отрицательного подкрепления и наказания продолжаются и сегодня, поскольку эти концепции имеют основополагающее значение для теории обучения и применимы ко многим практическим применениям этой теории.

Оперантное обусловливание

[ редактировать ]
Оперантное обусловливание Вымирание
Армирование
Повышение поведения
Наказание
Уменьшить поведение
Положительное подкрепление
Добавьте аппетитный стимул
следующее правильное поведение
Отрицательное подкрепление Положительное наказание
Добавьте вредный раздражитель
следующее поведение
Негативное наказание
Уберите аппетитный стимул
следующее поведение
Побег
Устранить вредный раздражитель
следующее правильное поведение
Активное избегание
Поведение избегает вредных раздражителей

Термин оперантное обусловливание был введен Скиннером, чтобы указать, что в его экспериментальной парадигме организм может свободно воздействовать на окружающую среду. В этой парадигме экспериментатор не может вызвать желаемую реакцию; экспериментатор ждет, пока произойдет ответ (который будет излучаться организмом), а затем будет доставлено потенциальное подкрепление. В классической парадигме обусловливания экспериментатор запускает (вызывает) желаемую реакцию, предъявляя рефлекторный стимул, безусловный стимул (UCS), который он сочетает (предшествует) с нейтральным стимулом, условным стимулом (CS).

Подкрепление — это основной термин в оперантном обусловливании. Информацию о наказании в оперантном обусловливании см. в разделе « Наказание (психология)» .

Положительное подкрепление

[ редактировать ]

Позитивное подкрепление возникает, когда желаемое событие или стимул представляется как следствие поведения, и вероятность того, что это поведение проявится в аналогичной среде, увеличивается. [10] : 253 


Методика обучения с высокой вероятностью (HPI) — это бихевиористский подход, основанный на идее положительного подкрепления.

Отрицательное подкрепление

[ редактировать ]

Негативное подкрепление увеличивает вероятность поведения, направленного на избегание или избегание неприятных ситуаций или стимулов . [10] : 253  Делать что-то неприятное для людей с целью предотвратить или предотвратить повторение такого поведения — это наказание , а не негативное подкрепление. Разница в том, что подкрепление всегда увеличивает вероятность определенного поведения, тогда как наказание всегда снижает ее.


Вымирание

[ редактировать ]

Угашение происходит, когда данное поведение игнорируется (т. е. его отслеживание не приводит к каким-либо последствиям), и со временем оно исчезает, если поведение постоянно не получает подкрепления. Поведение после вымирания сначала резко возрастает, а затем со временем снижается. Вымирание не обязательно должно быть преднамеренным, чтобы повлиять на поведение субъекта.


Подкрепление против наказания

[ редактировать ]

Подкрепления служат для усиления поведения, тогда как наказания служат для его уменьшения; таким образом, положительные подкрепления — это стимулы, над достижением которых субъект будет работать, а отрицательные подкрепления — это стимулы, от которых субъект будет стараться избавиться или положить конец. [11] В таблице ниже показано добавление и удаление стимулов (приятных или неприятных) в зависимости от подкрепления и наказания.

Поощрительный (приятный) стимул Аверсивный (неприятный) стимул
Добавление/представление Положительное подкрепление Положительное наказание
Удаление/удаление Негативное наказание Отрицательное подкрепление


Дальнейшие идеи и концепции

[ редактировать ]
  • Различить положительное и отрицательное подкрепление может быть сложно и не всегда необходимо. Сосредоточение внимания на том, что удаляется или добавляется и как это влияет на поведение, может быть более полезным.
  • Событие, которое наказывает за поведение одних, может подкреплять поведение других.
  • Некоторое подкрепление может включать как положительные, так и отрицательные черты, например, наркоман принимает наркотики для дополнительной эйфории (положительное подкрепление), а также для устранения симптомов абстиненции (отрицательное подкрепление).
  • Подкрепление в деловом мире имеет важное значение для повышения производительности. Сотрудники постоянно мотивированы возможностью получить положительный стимул, например повышение по службе или бонус. Сотрудниками также движет негативное подкрепление, например, устранение неприятных задач.
  • Хотя негативное подкрепление имеет положительный эффект на рабочем месте в краткосрочной перспективе (т.е. поощряет финансово выгодные действия), чрезмерная зависимость от отрицательного подкрепления препятствует способности работников действовать творчески и заинтересованно, обеспечивая рост в долгосрочной перспективе. [12]

Первичные и вторичные подкрепления

[ редактировать ]

Первичное подкрепление , иногда называемое безусловным подкреплением , представляет собой стимул, который не требует соединения с другим стимулом , чтобы функционировать в качестве подкрепления, и, скорее всего, получил эту функцию в результате эволюции и своей роли в выживании вида. [13] Примеры первичных подкреплений включают еду, воду и секс. Некоторые первичные подкрепления, например определенные лекарства, могут имитировать эффекты других первичных подкреплений. Хотя эти первичные подкрепления довольно стабильны на протяжении всей жизни и у разных людей, подкрепляющая ценность различных первичных подкреплений варьируется в зависимости от множества факторов (например, генетики, опыта). Таким образом, один человек может предпочитать один тип пищи, а другой избегает его. Или один человек может есть много еды, а другой - очень мало. Таким образом, хотя еда является основным подкреплением для обоих людей, ценность еды как подкрепления у них разная.

Вторичное подкрепление , иногда называемое условным подкреплением , представляет собой стимул или ситуацию, которая приобрела свою функцию подкрепления после соединения со стимулом , который действует как подкрепление. Этот стимул может быть первичным подкреплением или другим условным подкреплением (например, деньгами).

Пытаясь отличить первичные и вторичные подкрепления на примере людей, используйте «тест пещерного человека». Если стимулом является что-то, что пещерный человек, естественно, счел бы желательным (например, конфеты), то это первичное подкрепление. Если, с другой стороны, пещерный человек не отреагировал на это (например, на долларовую купюру), это вторичное подкрепление. Как и в случае с первичными подкреплениями, организм может испытывать удовлетворение и лишения при использовании вторичных подкреплений.

Другие условия армирования

[ редактировать ]
  • Генерализованное подкрепление — это условное подкрепление, которое получило подкрепляющую функцию в сочетании со многими другими подкреплениями и действует как подкрепление при самых разнообразных мотивирующих операциях . (Одним из примеров являются деньги, поскольку они сочетаются со многими другими подкреплениями). [14] : 83 
  • При выборке подкрепления организму предъявляется потенциально подкрепляющий, но незнакомый стимул, независимо от какого-либо предшествующего поведения.
  • Социально-опосредованное подкрепление предполагает доставку подкрепления, требующего поведения другого организма. Например, подкрепление обеспечивает другой человек.
  • Принцип Премака — это особый случай подкрепления, разработанный Дэвидом Премаком , который утверждает, что наиболее предпочтительная деятельность может эффективно использоваться в качестве подкрепления для менее предпочтительной деятельности. [14] : 123 
  • Иерархия подкрепления — это список действий, ранжирующий последствия от наиболее желательных до наименее желательных, которые могут служить подкреплением. Иерархия подкрепления может использоваться для определения относительной частоты и желательности различных действий и часто используется при применении принципа Премака. [ нужна ссылка ]
  • Условные результаты с большей вероятностью подкрепят поведение, чем неусловные реакции. Условные результаты — это те, которые напрямую связаны с причинным поведением, например, включение света зависит от щелчка выключателя. Обратите внимание, что непредвиденные результаты не являются обязательными для демонстрации подкрепления, но предполагаемые непредвиденные обстоятельства могут улучшить обучение.
  • Непрерывные стимулы — это стимулы, тесно связанные во времени и пространстве с конкретным поведением. Они сокращают количество времени, необходимое для изучения поведения, одновременно повышая его устойчивость к исчезновению . [ нужна ссылка ] Предоставление собаке кусочка еды сразу после того, как она села, более соответствует поведению (и, следовательно, с большей вероятностью подкрепляет его), чем задержка в подаче еды на несколько минут после такого поведения.
  • Неусловное подкрепление относится к независимой от реакции доставке стимулов, определенных как подкрепление для некоторых видов поведения этого организма. Однако это обычно влечет за собой доставку стимулов, определяемых как поддерживающие аберрантное поведение, в зависимости от времени, что снижает скорость целевого поведения. [15] Поскольку ни одно измеряемое поведение не считается усиленным, существуют разногласия по поводу использования термина «безусловное подкрепление». [16]

Естественное и искусственное армирование

[ редактировать ]

В своей статье 1967 года «Произвольное и естественное подкрепление » Чарльз Ферстер предложил классифицировать подкрепление на события, которые увеличивают частоту оперантного поведения как естественное следствие самого поведения, и события, которые влияют на частоту в силу необходимости человеческого посредничества, например, в символическая экономика , при которой субъекты вознаграждаются за определенное поведение терапевта.

В 1970 году Баер и Вольф разработали концепцию «поведенческих ловушек». [17] Поведенческая ловушка требует лишь простой реакции, чтобы попасть в ловушку, но, попав в ловушку, ей невозможно сопротивляться, вызывая общее изменение поведения. Это использование поведенческих ловушек, которые расширяют репертуар человека, подвергая его естественному подкреплению такого поведения. Поведенческие ловушки имеют четыре характеристики:

  • Их «наживляют» желанными подкреплениями, которые «заманивают» ученика в ловушку.
  • Чтобы попасть в ловушку, необходима только не требующая усилий реакция, которая уже имеется в арсенале.
  • Взаимосвязанные условия подкрепления внутри ловушки мотивируют человека приобретать, расширять и поддерживать целевые навыки. [18]
  • Они могут оставаться эффективными в течение длительного периода времени, поскольку у человека практически не наблюдается эффекта насыщения.

Таким образом, искусственное подкрепление можно использовать для формирования или развития обобщаемых навыков, в конечном итоге переходя к естественному подкреплению для поддержания или усиления поведения. Другим примером является социальная ситуация, которая обычно возникает в результате определенного поведения, если оно соответствует определенному критерию.

Графики периодического армирования

[ редактировать ]

Поведение не всегда подкрепляется каждый раз, когда оно реализуется, и характер подкрепления сильно влияет на то, насколько быстро усваивается оперантная реакция, какова ее скорость в любой момент времени и как долго она продолжается после прекращения подкрепления. Простейшие правила, управляющие подкреплением, — это непрерывное подкрепление, при котором подкрепляется каждая реакция, и угасание, при котором ни одна реакция не подкрепляется. Между этими крайностями более сложные схемы подкрепления определяют правила, определяющие, как и когда подкрепитель будет следовать реакции.

Определенные схемы подкрепления надежно вызывают определенные модели реакции, и эти правила применимы ко многим различным видам. Различная последовательность и предсказуемость подкрепления оказывают важное влияние на то, как работают различные графики. Многие простые и сложные графики были подробно исследованы Б. Ф. Скиннером с использованием голубей .

Простые расписания

[ редактировать ]
Диаграмма, демонстрирующая различную скорость реакции четырех простых схем подкрепления, каждая штриховка обозначает даваемое подкрепление.
  • График соотношений – подкрепление зависит только от количества реакций, выполненных организмом.
  • Непрерывное подкрепление (CRF) – график подкрепления, при котором за каждым проявлением инструментальной реакции (желаемой реакции) следует подкрепление. [14] : 86 

Простые графики имеют одно правило, определяющее, когда для конкретной реакции применяется один тип подкрепления.

  • Фиксированное соотношение (FR) – графики доставляют подкрепление после каждого n- го ответа. [14] : 88  График FR 1 является синонимом графика CRF.
  • График с переменным соотношением (VR) – усиливается в среднем при каждом n -м ответе, но не всегда при n -м ответе. [14] : 88 
  • Фиксированный интервал (FI) – усиливается через n интервалов времени.
  • Переменный интервал (VI) – усиливается в среднем за n раз, но не всегда ровно за n раз. [14] : 89 
  • Фиксированное время (FT) — обеспечивает подкрепляющий стимул в фиксированное время с момента последней подачи подкрепления, независимо от того, отреагировал субъект или нет. Другими словами, это неусловный график.
  • Переменное время (VT). Обеспечивает подкрепление в среднее переменное время с момента последнего подкрепления, независимо от того, отреагировал субъект или нет.

Простые графики используются во многих дифференциальных подкреплениях. [19] процедуры:

  • Дифференциальное подкрепление альтернативного поведения (DRA). Процедура кондиционирования, при которой нежелательная реакция уменьшается путем ее подавления или , реже, путем условного наказания с одновременным обеспечением подкрепления, зависящего от желательной реакции. Примером может служить учитель, который обращается к ученику только тогда, когда он поднимает руку, и игнорирует ученика, когда он или она зовет его.
  • Дифференциальное подкрепление другого поведения (DRO). Также известное как процедуры обучения пропуску, инструментальная процедура кондиционирования, при которой положительное подкрепление периодически предоставляется только в том случае, если участник делает что-то, кроме целевой реакции. Примером может служить подкрепление любого действия руки, кроме ковыряния в носу. [14] : 338 
  • Дифференциальное подкрепление несовместимого поведения (DRI). Используется для уменьшения частого поведения без наказания за него путем подкрепления несовместимой реакции. Примером может служить усиление аплодисментов, чтобы уменьшить ковыряние в носу.
  • Дифференциальное подкрепление низкой скорости ответа (DRL) – используется для поощрения низкой скорости ответа. Это похоже на интервальный график, за исключением того, что преждевременные реакции сбрасывают время, необходимое между действиями.
  • Дифференциальное подкрепление высокой скорости (DRH) – используется для увеличения скорости реагирования. Это похоже на интервальный график, за исключением того, что для получения подкрепления в интервале требуется минимальное количество ответов.

Эффекты различных типов простых графиков

[ редактировать ]
  • Фиксированное соотношение: активность замедляется после введения подкрепления, затем скорость ответа увеличивается до следующего введения подкрепления (пауза после подкрепления).
  • Переменное соотношение: быстрая, устойчивая скорость реагирования; наиболее устойчив к вымиранию .
  • Фиксированный интервал: реакция увеличивается к концу интервала; слабая устойчивость к вымиранию.
  • Переменный интервал: устойчивые результаты активности, хорошая устойчивость к вымиранию.
  • Графики соотношений обеспечивают более высокую скорость реагирования, чем интервальные графики, когда в остальном темпы подкрепления аналогичны.
  • Переменные графики обеспечивают более высокие темпы роста и большую устойчивость к исчезновению , чем большинство фиксированных графиков. Это также известно как эффект частичного угасания подкрепления (PREE).
  • График с переменным соотношением обеспечивает как наивысшую скорость реагирования, так и наибольшую устойчивость к исчезновению (например, поведение игроков в игровых автоматах ).
  • Фиксированные графики создают «паузы после подкрепления» (PRP), когда ответы на короткое время прекращаются сразу после подкрепления, хотя пауза является функцией предстоящего требования к ответу, а не предыдущего подкрепления. [20]
    • За PRP графика с фиксированными интервалами часто следует «гребешковая» ускоряющаяся скорость реакции, в то время как графики с фиксированным соотношением дают более «угловой» ответ.
      • Гребешок с фиксированным интервалом: модель реагирования, которая развивается при использовании графика подкрепления с фиксированным интервалом, результативность на фиксированном интервале отражает точность субъекта в определении времени.
  • Организмы, чьи графики подкрепления «утончены» (т. е. требуют большего количества ответов или большего ожидания перед подкреплением), могут испытывать «соотношение перенапряжения», если истончаются слишком быстро. Это приводит к поведению, аналогичному тому, которое наблюдается во время вымирания.
    • Коэффициентное напряжение: нарушение реагирования, которое происходит, когда требование реагирования с фиксированным соотношением увеличивается слишком быстро.
    • Ratio run: высокая и стабильная скорость реагирования, которая соответствует каждому требованию соотношения. Обычно более высокие требования к соотношению приводят к более длительным паузам после подкрепления.
  • Графики частичного подкрепления более устойчивы к исчезновению, чем графики непрерывного подкрепления.
    • Графики соотношений более устойчивы, чем интервальные графики, а переменные графики более устойчивы, чем фиксированные.
    • Мгновенные изменения в ценности подкрепления приводят к динамическим изменениям в поведении. [21]

Составные графики

[ редактировать ]

Сложные графики каким-то образом объединяют два или более разных простых графика, используя одно и то же подкрепление для одного и того же поведения. Есть много возможностей; среди наиболее часто используемых:

  • Альтернативные расписания - тип составного расписания, в котором действуют два или более простых расписания, и в зависимости от того, какое расписание будет выполнено первым, приводит к усилению. [22]
  • Объединенные графики – сложный график подкрепления, в котором два или более простых графиков действуют независимо друг от друга, и для подкрепления должны соблюдаться требования ко всем простым графикам.
  • Множественные графики . Два или более графиков чередуются с течением времени, при этом стимул указывает, какой из них действует. Подкрепление предоставляется, если требование реагирования выполняется во время действия графика.
  • Смешанные графики . Любой из двух или более графиков может иметь место без стимула, указывающего, какой из них действует. Подкрепление предоставляется, если требование реагирования выполняется во время действия графика.
  • Одновременное администрирование двух графиков подкрепления
    Параллельные графики — сложная процедура подкрепления, в которой участник может выбрать любой из двух или более простых графиков подкрепления, доступных одновременно. Организмы могут свободно переключаться между вариантами ответа в любое время.
  • График подкрепления в параллельной цепочке - сложная процедура подкрепления, в которой участнику разрешается выбирать во время первого звена, какой из нескольких простых графиков подкрепления будет действовать во втором звене. После того как выбор сделан, отвергнутые альтернативы становятся недоступными до начала следующего испытания.
  • Взаимосвязанные графики – единый график с двумя компонентами, в котором прогресс в одном компоненте влияет на прогресс в другом компоненте. Например, в взаимосвязанном 120-секундном расписании FR 60 FI каждый ответ вычитает время из интервального компонента, так что каждый ответ «равен» удалению двух секунд из расписания FI.
  • Связанные расписания . Подкрепление происходит после завершения двух или более последовательных расписаний, при этом стимул указывает, когда одно расписание было завершено и началось следующее.
  • Тандемные графики . Подкрепление происходит, когда два или более последовательных требования графика выполнены, при этом нет стимула, указывающего на завершение графика и начало следующего.
  • Графики высшего порядка – завершение одного графика подкрепляется вторым графиком; например, в FR2 (FI10 секунд) два последовательных графика с фиксированными интервалами требуют завершения, прежде чем ответ будет подкреплен.

Наложенные расписания

[ редактировать ]

Термин психологии « наложенные схемы подкрепления» относится к структуре вознаграждений, при которой два или более простых графика подкрепления действуют одновременно. Подкрепления могут быть положительными, отрицательными или и теми, и другими. Примером может служить человек, который приходит домой после долгого рабочего дня. Открытие входной двери вознаграждается крепким поцелуем в губы со стороны супруга человека и разрывом штанов от восторженно прыгающей семейной собаки. Другой пример наложенных графиков подкрепления — голубь в экспериментальной клетке, клюющий кнопку. Клевки доставляют бункер с зерном каждый 20-й клев, а доступ к воде – после каждых 200 клевков.

Наложенные графики подкрепления — это тип составного графика, который развился из первоначальных работ Б. Ф. Скиннера и его коллег над простыми ( графиками подкрепления Skinner and Ferster, 1957). Они продемонстрировали, что подкрепления можно вводить по расписанию и, кроме того, что организмы ведут себя по-разному в зависимости от графика. Вместо того, чтобы подкрепление, такое как еда или вода, доставлялось каждый раз в результате определенного поведения, подкрепление могло быть доставлено после более чем одного экземпляра поведения. Например, голубю может потребоваться десять раз клюнуть кнопку выключателя, прежде чем появится еда. Это «график отношений». Кроме того, подкрепление может быть предоставлено через определенный промежуток времени после целевого поведения. Примером может служить крыса , которой дают пищевые гранулы сразу после первой реакции, которая возникает по истечении двух минут с момента последнего нажатия рычага. Это называется «интервальный график».

Кроме того, графики соотношений могут обеспечивать подкрепление после фиксированного или переменного количества поведенческих реакций отдельного организма. Аналогично, интервальные графики могут обеспечивать подкрепление через фиксированные или переменные интервалы времени после единичной реакции организма. Индивидуальное поведение имеет тенденцию генерировать скорость реакции, которая различается в зависимости от того, как создается график подкрепления. Многие последующие исследования во многих лабораториях изучали влияние планирования подкреплений на поведение.

Если организму предоставляется возможность выбирать между двумя или более простыми графиками подкрепления одновременно, структура подкрепления называется «параллельным графиком подкрепления». Брехнер (1974, 1977) ввел концепцию наложенных графиков подкрепления в попытке создать лабораторную аналогию социальных ловушек , например, когда люди чрезмерно вылавливают рыбные запасы или вырубают тропические леса. Брехнер создал ситуацию, когда простые графики подкрепления накладывались друг на друга. Другими словами, одна реакция или группа реакций организма приводила к множеству последствий. Параллельные графики подкрепления можно рассматривать как графики «или», а наложенные графики подкрепления можно рассматривать как графики «и». Брехнер и Линдер (1981) и Брехнер (1987) расширили эту концепцию, чтобы описать, как наложенные графики и аналогия с социальной ловушкой могут быть использованы для анализа того, как энергия течет через системы .

Помимо создания социальных ловушек , наложенные графики подкрепления имеют множество реальных применений . Путем наложения простых схем подкрепления можно создать множество различных индивидуальных и социальных ситуаций между людьми. Например, у человека может быть одновременно табачная и алкогольная зависимость. Еще более сложные ситуации можно создать или смоделировать путем наложения двух или более параллельных графиков. Например, у старшеклассника может быть выбор между поступлением в Стэнфордский университет или Калифорнийский университет в Лос-Анджелесе, и в то же время у него может быть выбор пойти в армию или в ВВС, и одновременно устроиться на работу в интернет-компанию или работа в компании-разработчике программного обеспечения. Это структура подкрепления, состоящая из трех наложенных друг на друга параллельных графиков подкрепления.

Наложенные графики подкрепления могут создать три классические конфликтные ситуации (конфликт подхода-подхода, конфликт подхода-избегания и конфликт избегания-избегания), описанные Куртом Левином (1935), и могут операционализировать другие левиновские ситуации, проанализированные с помощью его анализа силового поля . Другими примерами использования наложенных графиков армирования в качестве аналитического инструмента являются его применение к непредвиденным обстоятельствам, связанным с контролем арендной платы (Brechner, 2003) и проблемой сброса токсичных отходов в систему ливневой канализации округа Лос-Анджелес (Brechner, 2010).

Параллельные расписания

[ редактировать ]

В оперантном обусловливании параллельные графики подкрепления — это графики подкрепления, которые одновременно доступны как животному, так и участнику-человеку, так что субъект или участник могут реагировать по любому графику. Например, в принудительного выбора с двумя альтернативами задаче голубь в коробке Скиннера сталкивается с двумя клюющими ключами; В ответ на клевание можно ответить на любой из них, а за клеванием на любой из них может последовать подкрепление пищей. Графики армирования, устраиваемые для клевок на два ключа, могут быть разными. Они могут быть независимыми или могут быть связаны так, что поведение по одному ключу влияет на вероятность подкрепления по другому.

Нет необходимости, чтобы ответы на двух графиках были физически различны. В альтернативном способе организации параллельных расписаний, предложенном Финдли в 1958 году, оба расписания размещаются на одной клавише или другом реагирующем устройстве, и субъект может реагировать на вторую клавишу для переключения между расписаниями. В такой «параллельной» процедуре Финдли стимул (например, цвет главной клавиши) сигнализирует о том, какое расписание действует.

Параллельные расписания часто вызывают быстрое чередование клавиш. Чтобы предотвратить это, обычно вводят «задержку переключения»: каждый график деактивируется на короткое время после того, как субъект переключится на него.

Когда оба параллельных графика представляют собой переменные интервалы количественная связь, известная как закон соответствия , между относительными скоростями реагирования в двух графиках и относительными темпами подкрепления, которые они обеспечивают, обнаруживается ; Впервые это было замечено Р. Дж. Хернштейном в 1961 году. Закон соответствия — это правило инструментального поведения, которое гласит, что относительная скорость реагирования на конкретную альтернативу ответа равна относительной скорости подкрепления для этой реакции (скорость поведения = скорость подкрепления). Животные и люди имеют тенденцию отдавать предпочтение выбору в расписании. [23]

Формирование

[ редактировать ]

Формирование — это усиление последовательных приближений к желаемому инструментальному отклику. Например, при обучении крысы нажимать на рычаг простой поворот к рычагу сначала усиливается. Тогда только поворот и шаг к нему получают подкрепление. Со временем крыса получит подкрепление для нажатия на рычаг. Успешное достижение одного поведения запускает процесс формирования следующего. По мере обучения реакция становится все более похожей на желаемое поведение, при этом каждое последующее поведение становится более близким к конечному поведению. [24]

Вмешательство шейпинга используется во многих учебных ситуациях, а также для людей с аутизмом и другими нарушениями развития. Когда формирование сочетается с другими научно обоснованными практиками, такими как тренинг функционального общения (FCT), [25] это может дать положительные результаты для человеческого поведения. Для формирования обычно используется непрерывное подкрепление, но позже реакцию можно перевести на прерывистый график подкрепления.

Формирование также применяют при отказе от еды. [26] Отказ от еды – это когда у человека возникает частичное или полное отвращение к еде. Это может быть как минимальное проявление придирчивости в еде, так и настолько серьезное, что может повлиять на здоровье человека. Формирование использовалось для достижения высокого уровня успеха при приеме пищи. [27]

Цепочка предполагает объединение отдельных видов поведения в серию, так что последствием каждого поведения является как подкрепление предыдущего поведения, так и предшествующий стимул для следующего поведения. Существует много способов обучения цепочке, например, прямая цепочка (начиная с первого поведения в цепочке), обратная цепочка (начиная с последнего поведения) и полная цепочка задач (обучение каждому поведению в цепочке одновременно). Утренний распорядок дня человека представляет собой типичную цепочку действий (например, принятие душа, вытирание, одевание), происходящих последовательно и являющихся хорошо усвоенной привычкой.

Проблемное поведение, наблюдаемое у людей с аутизмом и другими связанными с ним нарушениями, успешно контролировалось и поддерживалось в исследованиях с использованием схемы цепного подкрепления. [28] Тренировка функциональной коммуникации — это вмешательство, в котором часто используются цепочки графиков подкрепления для эффективного содействия соответствующей и желаемой функциональной коммуникативной реакции. [29]

Математические модели

[ редактировать ]

Были проведены исследования по построению математической модели армирования. Эта модель известна как MPR, что является сокращением от математических принципов армирования . Питер Киллин сделал ключевые открытия в этой области, исследуя голубей. [30]

Приложения

[ редактировать ]

Подкрепление и наказание повсеместно используются в социальных взаимодействиях людей, и было предложено и реализовано очень много применений оперантных принципов. Ниже приведены несколько примеров.

Пристрастие и зависимость

[ редактировать ]

Позитивное и негативное подкрепление играют центральную роль в развитии и поддержании наркомании и наркозависимости . Наркотик, вызывающий привыкание , по своей сути приносит пользу ; то есть он действует как первичное положительное подкрепление употребления наркотиков. Система вознаграждения мозга придает ему значимость стимула (т. е. он «желателен» или «желателен»), [31] [32] [33] поэтому по мере развития зависимости лишение наркотика приводит к тяге к нему. Кроме того, стимулы, связанные с употреблением наркотиков – например, вид шприца и место употребления – становятся ассоциированными с интенсивным подкреплением, вызываемым наркотиком. [31] [32] [33] Эти ранее нейтральные стимулы приобретают несколько свойств: их появление может вызвать тягу к потреблению, и они могут стать условным положительным подкреплением дальнейшего употребления. [31] [32] [33] Таким образом, если зависимый человек сталкивается с одним из этих сигналов о наркотике, тяга к соответствующему наркотику может появиться снова. Например, агентства по борьбе с наркотиками ранее использовали плакаты с изображениями принадлежностей для употребления наркотиков , пытаясь показать опасность употребления наркотиков. Однако такие плакаты больше не используются из-за эффекта заметности стимулов, вызывающего рецидив при виде стимулов, изображенных на плакатах.

У лиц с наркотической зависимостью негативное подкрепление происходит, когда препарат принимается самостоятельно с целью облегчить или «избежать» симптомов физической зависимости (например, тремора и потливости) и/или психологической зависимости (например, ангедонии , беспокойства, раздражительности и тревога), возникающие в состоянии отмены препарата . [31]

Дрессировка животных

[ редактировать ]
Курица катается на скейтборде

Дрессировщики и владельцы домашних животных применяли принципы и практики оперантного обусловливания задолго до того, как эти идеи были названы и изучены, и дрессировка животных до сих пор представляет собой один из самых ярких и убедительных примеров оперантного контроля. Среди концепций и процедур, описанных в этой статье, наиболее важными являются: наличие немедленного подкрепления (например, вездесущий пакетик с собачьими вкусняшками); непредвиденные обстоятельства, гарантирующие, что подкрепление следует за желаемым поведением, а не за чем-то другим; использование вторичного подкрепления, например, прослушивание кликера сразу после желаемой реакции; формирование, например, постепенное принуждение собаки прыгать все выше и выше; прерывистое подкрепление, уменьшающее частоту употребления вкусняшек, чтобы вызвать устойчивое поведение без насыщения; цепочка, где сложное поведение постепенно объединяется. [34]

Поведение ребенка – тренинг по управлению родителями

[ редактировать ]

Обеспечение положительного подкрепления за соответствующее поведение ребенка является основным направлением обучения родителей управлению. Обычно родители учатся вознаграждать соответствующее поведение с помощью социальных вознаграждений (таких как похвала, улыбки и объятия), а также конкретных наград (например, наклеек или указаний на более крупную награду в рамках системы стимулирования, созданной совместно с ребенком). [35] Кроме того, родители учатся выбирать простое поведение в качестве первоначального фокуса и вознаграждать каждый маленький шаг, который делает их ребенок на пути к достижению более крупной цели (эта концепция называется «последовательными приближениями»). [35] [36] Они также могут использовать косвенное вознаграждение, например, посредством диаграмм прогресса . Обеспечение положительного подкрепления в классе может способствовать успеху учащихся. Применяя положительное подкрепление к учащимся, очень важно сделать его индивидуализированным в соответствии с потребностями этого учащегося. Таким образом, ученик понимает, почему он получает похвалу, может принять ее и в конечном итоге научиться продолжать действие, заработанное положительным подкреплением. Например, использование поощрений или дополнительных перерывов может больше относиться к некоторым учащимся, тогда как другие могут согласиться с принуждением, получив наклейки или галочки с указанием похвалы.

Экономика

[ редактировать ]

И психологи, и экономисты заинтересовались применением оперантных концепций и результатов к поведению людей на рынке. Примерпредставляет собой анализ потребительского спроса, индексируемого количеством приобретаемого товара. В экономике степень влияния цены на потребление называется «ценовой эластичностью спроса». Некоторые товары более эластичны, чем другие; например, изменение цен на определенные продукты питания может сильно повлиять на объем покупок, в то время как бензин и другие предметы первой необходимости могут меньше зависеть от изменений цен. С точки зрения оперантного анализа такие эффекты можно интерпретировать с точки зрения мотивации потребителей и относительной ценности товаров как подкрепления. [37]

Азартные игры – планирование с переменным коэффициентом

[ редактировать ]

Как говорилось ранее в этой статье, график с переменным соотношением дает подкрепление после подачи непредсказуемого количества ответов. Такой график обычно обеспечивает быстрое и настойчивое реагирование. Игровые автоматы окупаются по графику с переменным соотношением, и они вызывают у игроков именно такое постоянное поведение, связанное с использованием рычагов. Поскольку автоматы запрограммированы на выплату меньше денег, чем они получают, настойчивый пользователь игровых автоматов в долгосрочной перспективе неизменно проигрывает. Игровые автоматы и, следовательно, подкрепление с переменным соотношением часто называют фактором, лежащим в основе игровой зависимости. [38]

Концепция похвалы как средства поведенческого подкрепления у людей уходит корнями в модель оперантного обусловливания Б. Ф. Скиннера. С этой точки зрения похвала рассматривается как средство положительного подкрепления, при котором наблюдаемое поведение становится более вероятным за счет условной похвалы такого поведения. [39] Сотни исследований продемонстрировали эффективность похвалы в поощрении позитивного поведения, в частности, в изучении использования похвалы учителями и родителями в отношении детей для улучшения поведения и успеваемости. [40] [41] но и при изучении производительности труда. [42] Также было продемонстрировано, что похвала усиливает позитивное поведение у соседних людей, которых не хвалят (например, одноклассника получателя похвалы), посредством косвенного подкрепления. [43] Похвала может быть более или менее эффективной для изменения поведения в зависимости от ее формы, содержания и подачи. Для того чтобы похвала привела к позитивному изменению поведения, она должна быть обусловлена ​​позитивным поведением (т. е. применяться только после того, как было реализовано целевое поведение), должна указывать детали поведения, которое необходимо подкрепить, и должна произноситься искренне и искренне. достоверно. [44]

Признавая эффект похвалы как стратегии положительного подкрепления, многочисленные поведенческие и когнитивно-поведенческие вмешательства включили использование похвалы в свои протоколы. [45] [46] Стратегическое использование похвалы признано научно обоснованной практикой как в управлении классом, так и в управлении классом. [45] и мероприятия по обучению родителей, [41] хотя в исследованиях вмешательства похвалу часто относят к более широкой категории положительного подкрепления, которая включает в себя такие стратегии, как стратегическое внимание и поведенческое вознаграждение.

Травматическая связь

[ редактировать ]

Травматическая связь возникает в результате продолжающихся циклов насилия , в которых периодическое усиление вознаграждений и наказаний создает мощные эмоциональные связи, устойчивые к изменениям. [47] [48]

Другой источник указал, что [49] «Необходимыми условиями возникновения травматической связи является то, что один человек должен доминировать над другим и что уровень жестокого обращения хронически возрастает, а затем спадает. Отношения характеризуются периодами снисходительного, сострадательного и даже нежного поведения со стороны доминирующего человека, перемежающимися периодическими эпизодами интенсивного насилия. Чтобы сохранить преимущество, обидчик манипулирует поведением жертвы и ограничивает ее возможности, чтобы увековечить дисбаланс сил. Любая угроза балансу доминирования и подчинения может быть встречена ужесточающимся циклом наказаний, начиная от яростного запугивания и заканчивая вспышками чрезвычайного насилия. Преступник также изолирует жертву от других источников поддержки, что снижает вероятность обнаружения и вмешательства, ухудшает способность жертвы получать уравновешивающую самореферентную обратную связь и усиливает чувство односторонней зависимости... Травматические последствия этих оскорбительных отношений может включать нарушение способности жертвы точной самооценки, что приводит к ощущению личной неадекватности и подчиненному чувству зависимости от доминирующего человека. Жертвы также могут столкнуться с различными неприятными социальными и правовыми последствиями своей эмоциональной и поведенческой связи с кем-то, совершившим агрессивные действия, даже если они сами были объектами агрессии.

Видеоигры

[ редактировать ]

Большинство видеоигр построены на основе определенного типа цикла принуждения, добавляющего своего рода положительное подкрепление посредством графика переменной скорости, чтобы игрок продолжал играть в игру, хотя это также может привести к зависимости от видеоигр . [50]

В рамках тенденции монетизации видеоигр 2010-х годов в некоторых играх в качестве награды предлагались «лутбоксы» или их можно было приобрести за реальные фонды, которые предлагали случайный выбор внутриигровых предметов, распределенных по редкости. Эта практика связана с теми же методами, которыми выдают вознаграждения игровые автоматы и другие игровые устройства, поскольку она следует графику переменных ставок. Несмотря на общее мнение, что лутбоксы являются формой азартных игр, эта практика классифицируется как азартная игра и в других отношениях законная только в нескольких странах. Однако методы использования этих предметов в качестве виртуальной валюты для онлайн-азартных игр или торговли на реальные деньги создали рынок скин-гемблинга , который находится на стадии юридической оценки. [51]

Стандартное определение поведенческого подкрепления подверглось критике как циклическое , поскольку оно, по-видимому, утверждает, что сила реакции увеличивается за счет подкрепления, и определяет подкрепление как нечто, что увеличивает силу реакции (т. е. сила реакции увеличивается за счет вещей, которые увеличивают силу реакции). Однако правильное использование [52] Подкрепление заключается в том, что что-то является подкреплением из-за его влияния на поведение, а не наоборот. Это становится круговым, если кто-то говорит, что конкретный стимул усиливает поведение, потому что он является подкреплением, и не объясняет, почему стимул оказывает такое влияние на поведение. Были предложены и другие определения, такие как «непревзойденное поведение, зависящее от реакции» Ф.Д. Шеффилда, но они широко не используются в психологии. [53]

Понимание роли, которую играют подкрепления, все чаще переходит от «усиливающего» эффекта к «сигнальному». [54] То есть точка зрения, согласно которой подкрепления усиливают реакцию, потому что они сигнализируют о поведении, которое может привести к подкреплению. Хотя в большинстве практических применений эффект любого данного подкрепления будет одинаковым независимо от того, подает ли подкрепление сигнал или усиливается, этот подход помогает объяснить ряд поведенческих феноменов, включая модели реагирования на прерывистые графики подкрепления (гребешки с фиксированными интервалами) и эффект дифференцированных результатов . [55]

См. также

[ редактировать ]
  1. Определение подкрепления от Американской психологической ассоциации, получено 30 января 2024 г.
  2. ^ Шульц В. (июль 2015 г.). «Нейронное вознаграждение и сигналы решения: от теорий к данным» . Физиологические обзоры . 95 (3): 853–951. doi : 10.1152/physrev.00023.2014 . ПМЦ   4491543 . ПМИД   26109341 . Награды в оперантном обусловливании являются положительным подкреплением. ... Оперантное поведение дает хорошее определение вознаграждения. Все, что заставляет человека возвращаться и требовать большего, является положительным подкреплением и, следовательно, наградой. Хотя положительное подкрепление дает хорошее определение, оно является лишь одной из нескольких функций вознаграждения. ... Награды привлекательны. Они мотивируют и заставляют нас прилагать усилия. ... Награды стимулируют поведение приближения, также называемое аппетитным или подготовительным поведением, и завершающее поведение. ... Таким образом, любой стимул, объект, событие, деятельность или ситуация, которая потенциально может заставить нас приблизиться и поглотить его, по определению является наградой. ... Внутренние вознаграждения — это действия, которые доставляют удовольствие сами по себе и предпринимаются ради самих себя, не являясь средством получения внешних вознаграждений. ... Внутренние награды сами по себе являются настоящими наградами, поскольку они побуждают к обучению, подходу и удовольствию, например, к совершенствованию, игре на фортепиано и получению удовольствия. Хотя они могут служить для обусловления вознаграждений более высокого порядка, они не являются обусловленными вознаграждениями более высокого порядка, поскольку для достижения их свойств вознаграждения не требуется соединение с безусловным вознаграждением.
  3. ^ Маленка Р.К., Нестлер Э.Дж., Хайман С.Е. (2009). «Глава 15: Подкрепление и аддиктивные расстройства». В Сидоре А., Брауне Р.Ю. (ред.). Молекулярная нейрофармакология: фонд клинической неврологии (2-е изд.). Нью-Йорк: McGraw-Hill Medical. стр. 364–375. ISBN  9780071481274 .
  4. ^ Нестлер Э.Дж. (декабрь 2013 г.). «Клеточная основа памяти при наркомании» . Диалоги в клинической неврологии . 15 (4): 431–443. ПМЦ   3898681 . ПМИД   24459410 . Несмотря на важность многочисленных психосоциальных факторов, по своей сути наркозависимость включает в себя биологический процесс: способность многократного воздействия злоупотребляемого наркотика вызывать изменения в уязвимом мозге, которые приводят к компульсивному поиску и приему наркотиков и потере контроля. над употреблением наркотиков, которые определяют состояние наркомании. ... Большой объем литературы продемонстрировал, что такая индукция ΔFosB в нейронах D1-типа [прилежащее ядро] увеличивает чувствительность животного к лекарственному средству, а также к естественным вознаграждениям и способствует самостоятельному приему лекарственного средства, предположительно посредством процесса положительного подкрепления.. Другой мишенью ΔFosB является cFos: поскольку ΔFosB накапливается при повторном воздействии препарата, он подавляет c-Fos и способствует молекулярному переключению, посредством которого ΔFosB избирательно индуцируется в состоянии хронического лечения лекарственными средствами. 41 . ... Более того, появляется все больше свидетельств того, что, несмотря на целый ряд генетических рисков развития зависимости среди населения, воздействие достаточно высоких доз наркотика в течение длительного периода времени может превратить человека с относительно низкой генетической нагрузкой в ​​наркомана.
  5. ^ Волков Н.Д., Кооб Г.Ф., Маклеллан А.Т. (январь 2016 г.). «Нейробиологические достижения модели зависимости от заболеваний головного мозга» . Медицинский журнал Новой Англии . 374 (4): 363–371. дои : 10.1056/NEJMra1511480 . ПМК   6135257 . ПМИД   26816013 . Расстройство, связанное с употреблением психоактивных веществ: диагностический термин в пятом издании «Руководства по диагностике и статистике психических расстройств» (DSM-5), относящийся к повторяющемуся употреблению алкоголя или других наркотиков, которое вызывает клинически и функционально значимые нарушения, такие как проблемы со здоровьем, инвалидность, и неспособность выполнять основные обязанности на работе, в школе или дома. В зависимости от степени тяжести это расстройство классифицируется как легкое, среднее или тяжелое.
    Наркомания: термин, используемый для обозначения наиболее тяжелой, хронической стадии расстройства, связанного с употреблением психоактивных веществ, при которой происходит значительная потеря самоконтроля, о чем свидетельствует компульсивный прием наркотиков, несмотря на желание прекратить их прием. В DSM-5 термин «зависимость» является синонимом классификации тяжелого расстройства, связанного с употреблением психоактивных веществ.
  6. ^ Торндайк Э. (июнь 1898 г.). «Некоторые эксперименты по интеллекту животных» . Наука . 7 (181): 818–24. Бибкод : 1898Sci.....7..818T . дои : 10.1126/science.7.181.818 . ПМИД   17769765 .
  7. ^ Скиннер, Б.Ф. « Поведение организмов: экспериментальный анализ », 1938, Нью-Йорк: Appleton-Century-Crofts.
  8. ^ Скиннер Б.Ф. (1948). Уолден Два . Торонто: Компания Macmillan.
  9. ^ Хониг В. (1966). Оперантное поведение: области исследования и применения . Нью-Йорк: Издательская компания Мередит. п. 381.
  10. ^ Jump up to: а б Флора С (2004). Сила подкрепления . Олбани: Издательство Государственного университета Нью-Йорка.
  11. ^ Д'Амато MR (1969). Маркс М.Х. (ред.). Процессы обучения: инструментальное обучение . Торонто: Компания Macmillan.
  12. ^ Хартер Дж. К. (2002). Киз CL (ред.). Благополучие на рабочем месте и его связь с результатами бизнеса: обзор исследований Gallup (PDF) . Вашингтон, округ Колумбия: Американская психологическая ассоциация.
  13. ^ Скиннер, Б.Ф. (1974). О бихевиоризме
  14. ^ Jump up to: а б с д и ж г Мильтенбергер, Р.Г. «Модификация поведения: принципы и процедуры». Томсон/Уодсворт , 2008.
  15. ^ Такер М., Сигафус Дж., Бушелл Х. (октябрь 1998 г.). «Использование безусловного подкрепления в лечении проблемного поведения. Обзор и клиническое руководство». Модификация поведения . 22 (4): 529–47. дои : 10.1177/01454455980224005 . ПМИД   9755650 . S2CID   21542125 .
  16. ^ Дролески Р.Э., Эндрюс К., Кьярантини Л., ДеЛоач-младший (1992). «Использование флуоресцентных зондов для описания процесса инкапсуляции при гипотоническом диализе». Использование повторно запечатанных эритроцитов в качестве носителей и биореакторов . Достижения экспериментальной медицины и биологии. Том. 326. стр. 73–80. дои : 10.1007/978-1-4615-3030-5_9 . ISBN  978-1-4613-6321-7 . ПМИД   1284187 .
  17. ^ Баер ДМ, Вольф ММ. «Вхождение в естественные сообщества подкрепления». У Ульриха Р., Стачника Т., Мабри Дж. (ред.). Управление поведением человека . Том. 2. Гленвью, Иллинойс: Скотт Форесман. стр. 319–24.
  18. ^ Колер Ф.В., Гринвуд CR (1986). «На пути к технологии обобщения: выявление естественных возможностей подкрепления» . Поведенческий аналитик . 9 (1): 19–26. дои : 10.1007/bf03391926 . ПМК   2741872 . ПМИД   22478644 .
  19. ^ Фоллмер Т.Р., Ивата Б.А. (1992). «Дифференциальное подкрепление как лечение расстройств поведения: процедурные и функциональные вариации». Исследования нарушений развития . 13 (4): 393–417. дои : 10.1016/0891-4222(92)90013-в . ПМИД   1509180 .
  20. ^ Деренн А., Фланнери К.А. (2007). «Внутри сеанса FR приостановка». Поведенческий аналитик сегодня . 8 (2): 175–86. дои : 10.1037/h0100611 .
  21. ^ МакСвини Ф.К., Мерфи Э.С., Коваль Б.П. (2001). «Динамические изменения ценности подкрепления: некоторые заблуждения и почему вас это должно волновать». Поведенческий аналитик сегодня . 2 (4): 341–349. дои : 10.1037/h0099952 .
  22. ^ Иверсен И.Х., Латтал К.А. (1991). Экспериментальный анализ поведения . Амстердам: Эльзевир. ISBN  9781483291260 .
  23. ^ Мартин Т.Л., Ю.К.Т., Мартин Г.Л., Фаццио Д. (2006). «О выборе, предпочтении и предпочтении выбора» . Поведенческий аналитик сегодня . 7 (2): 234–48. дои : 10.1037/h0100083 . ПМЦ   3558524 . ПМИД   23372459 .
  24. ^ Шактер Д.Л., Гилберт Д.Т., Вегнер Д.М. (2011). «Глава 7: Обучение» . Психология (2-е изд.). Нью-Йорк: Издательство Worth. стр. 284–85 . ISBN  978-1-4292-3719-2 .
  25. ^ Геммагами, Махшид; Хэнли, Грегори П.; Джессел, Джошуа; Ланда, Робин (14 мая 2018 г.). «Формирование сложных функциональных коммуникативных реакций» . Журнал прикладного анализа поведения . 51 (3): 502–520. дои : 10.1002/jaba.468 . ISSN   0021-8855 . ПМИД   29761485 .
  26. ^ Тарбокс и Ланаган Бермудес, Джонатан и Тайра (2017). Решение проблем с питанием при аутизме . Сан-Диего: Академическая пресса. стр. 1–6. ISBN  978-0-12-813563-1 .
  27. ^ Тернер, Вирджиния Р; и др. (2020). «Формирование реакции для улучшения принятия пищи детьми с аутизмом: влияние маленьких и больших наборов еды». Исследования нарушений развития . 98 : 103574. doi : 10.1016/j.ridd.2020.103574 . ПМИД   31982827 . S2CID   210922007 .
  28. ^ «ИСПРАВЛЕНИЕ к «Дальнейшей оценке обучения функциональному общению и цепным графикам подкрепления для лечения нескольких функций сложного поведения» » . Модификация поведения . 46 (1): 254. 24 июля 2020 г. doi : 10.1177/0145445520945810 . ISSN   0145-4455 . ПМИД   32706269 . S2CID   241136859 .
  29. ^ Фалькомата, Терри С.; Роан, Генри С.; Мьютинг, Колин С.; Стивенсон, Кейси М.; Инж, Анна Д. (9 февраля 2012 г.). «Тренинг функционального общения и цепочные графики подкрепления для лечения проблемного поведения, поддерживаемого прекращением перерывов в деятельности» . Модификация поведения . 36 (5): 630–649. дои : 10.1177/0145445511433821 . ISSN   0145-4455 . ПМИД   22327267 . S2CID   29108702 .
  30. ^ Киллин PR (4 февраля 2010 г.). «Математические основы армирования» . Поведенческие и мозговые науки . 17 (1): 105–135. дои : 10.1017/S0140525X00033628 .
  31. ^ Jump up to: а б с д Эдвардс С. (2016). «Принципы усиления медицины наркозависимости; от употребления рекреационных наркотиков до психических расстройств». Нейронаука в наркозависимости: от профилактики к реабилитации — конструкции и лекарства . Прогресс в исследованиях мозга. Том. 223. стр. 63–76. дои : 10.1016/bs.pbr.2015.07.005 . ISBN  9780444635457 . ПМИД   26806771 . Вещества, которыми злоупотребляют (от алкоголя до психостимуляторов), изначально употребляются регулярно в соответствии с их положительными подкрепляющими свойствами. Важно отметить, что неоднократное воздействие полезных веществ запускает цепочку вторичных подкрепляющих событий, в результате чего сигналы и контексты, связанные с употреблением наркотиков, сами по себе могут стать подкрепляющими и тем самым способствовать продолжению употребления и возможному злоупотреблению выбранными веществами. ...
    Важным аспектом подкрепления, имеющим большое значение для процесса зависимости (и особенно рецидива), является вторичное подкрепление (Stewart, 1992). Вторичные подкрепления (во многих случаях также рассматриваемые как условные подкрепления), вероятно, управляют большинством процессов подкрепления у людей. В конкретном случае наркотической [наркомании] сигналы и контексты, которые тесно и неоднократно связаны с употреблением наркотиков, часто сами по себе становятся подкрепляющими... Фундаментальная часть теории наркозависимости Робинсона и Берриджа, основанной на стимулирующей сенсибилизации, утверждает, что стимулирующая ценность или привлекательная Природа таких процессов вторичного подкрепления, помимо самих первичных подкреплений, может сохраняться и даже становиться сенсибилизированной с течением времени в связи с развитием наркотической зависимости (Robinson and Berridge, 1993). ...
    Негативное подкрепление — это особое состояние, связанное с усилением поведенческих реакций, которые прекращают действие некоторого продолжающегося (предположительно аверсивного) стимула. В этом случае мы можем определить негативное подкрепление как мотивационный стимул, который усиливает такую ​​реакцию «побега». Исторически, что касается наркозависимости, это явление постоянно наблюдалось у людей, когда наркотики употреблялись самостоятельно для удовлетворения мотивационной потребности в состоянии абстиненции (Wikler, 1952).
  32. ^ Jump up to: а б с Берридж К.К. (апрель 2012 г.). «От ошибки прогнозирования к значимости стимулов: мезолимбические вычисления мотивации вознаграждения» . Европейский журнал неврологии . 35 (7): 1124–43. дои : 10.1111/j.1460-9568.2012.07990.x . ПМЦ   3325516 . ПМИД   22487042 . Когда Павловскому CS+ приписывается стимулирующая значимость, это не только вызывает «желание» его UCS, но часто сам сигнал становится очень привлекательным – даже до иррациональной степени. Эта привлекательность сигнала — еще одна отличительная черта значимости стимула. На CS становится трудно не смотреть (Wiers & Stacy, 2006; Hickey et al., 2010a; Piech et al., 2010; Anderson et al., 2011). CS даже приобретает некоторые стимулирующие свойства, аналогичные UCS. Привлекательный КС часто вызывает поведенчески мотивированный подход, а иногда человек может даже попытаться «потребить» КС в некотором роде как его UCS (например, есть, пить, курить, заниматься сексом, принимать как наркотик). «Желание» CS может также превратить ранее нейтральный стимул в инструментальное условное подкрепление, так что человек будет работать над получением сигнала (однако существуют и альтернативные психологические механизмы для условного подкрепления).
  33. ^ Jump up to: а б с Берридж К.К., Крингельбах М.Л. (май 2015 г.). «Системы удовольствия в мозге» . Нейрон . 86 (3): 646–64. дои : 10.1016/j.neuron.2015.02.018 . ПМЦ   4425246 . ПМИД   25950633 . Важная цель нейробиологии зависимостей в будущем — понять, насколько интенсивная мотивация становится узконаправленной на конкретную цель. Предполагается, что зависимость отчасти возникает из-за чрезмерной значимости стимулов, создаваемых сенсибилизированными или гиперреактивными дофаминовыми системами, которые вызывают сильное «желание» (Robinson and Berridge, 1993). Но почему одна цель становится более «желанной», чем все остальные, до конца не объяснено. У наркоманов или пациентов, стимулированных агонистами, повторение выраженности стимулов дофаминовой стимуляции объясняется определенными индивидуализированными занятиями, такими как прием препарата, вызывающего привыкание, или определенные навязчивые действия. В ситуациях с вознаграждением по Павлову некоторые сигналы вознаграждения становятся более «желанными» больше, чем другие, как мощные мотивационные магниты, причем у разных людей эти сигналы различаются (Robinson et al., 2014b; Saunders and Robinson, 2013). ... Однако гедонистический эффект вполне может со временем измениться. Поскольку препарат принимался неоднократно, у восприимчивых людей могла возникнуть мезолимбическая дофаминергическая сенсибилизация, усиливающая «желание» (Leyton and Vezina, 2013; Lodge and Grace, 2011; Wolf and Ferrario, 2010), даже если опиоидные гедонические механизмы подверглись негативной регуляции. из-за постоянной лекарственной стимуляции, вызывающей «любящую» толерантность. Стимулирующая сенсибилизация может вызвать зависимость, избирательно усиливая вызванное сигналом «желание» снова принять наркотик, и таким образом мощно вызвать мотивацию, даже если наркотик станет менее приятным (Robinson and Berridge, 1993).
  34. ^ МакГриви П.Д., Боукс Р.А. (2007). Кнут и пряник: принципы дрессировки животных . Кембридж: Издательство Кембриджского университета. ISBN  978-0-521-68691-4 .
  35. ^ Jump up to: а б Каздин А.Е. (2010). Обучение навыкам решения проблем и обучение родителям управлению поведением при оппозиционно-вызывающем расстройстве и расстройстве поведения. Доказательная психотерапия для детей и подростков (2-е изд.) , 211–226. Нью-Йорк: Гилфорд Пресс.
  36. ^ Форгач М.С., Паттерсон Г.Р. (2010). Обучение родительскому менеджменту — модель штата Орегон: Меры по борьбе с антисоциальным поведением детей и подростков. Доказательная психотерапия для детей и подростков (2-е изд.) , 159–78. Нью-Йорк: Гилфорд Пресс.
  37. ^ Домьян, М. (2009). Принципы обучения и поведения. Издательская компания Уодсворт. 6-е издание. страницы 244–249.
  38. ^ Лосано Бледа Дж. Х., Перес Ньето М. А. (ноябрь 2012 г.). «Импульсивность, интеллект и распознавание непредвиденных обстоятельств подкрепления в графике с фиксированным соотношением 3». Испанский журнал психологии . 15 (3): 922–9. дои : 10.5209/rev_sjop.2012.v15.n3.39384 . ПМИД   23156902 . S2CID   144193503 .
  39. ^ Каздин, Алан (1978). История модификации поведения: Экспериментальные основы современных исследований . Балтимор: Университет Парк Пресс. ISBN  9780839112051 .
  40. ^ Бейкер Г.Л., Барнс Х.Дж. (1992). «Синдром верхней полой вены: этиология, диагностика и лечение». Американский журнал критической помощи . 1 (1): 54–64. дои : 10.4037/ajcc1992.1.1.54 . ПМИД   1307879 .
  41. ^ Jump up to: а б Гарланд А.Ф., Хоули К.М., Брукман-Фрейзи Л., Херлберт М.С. (май 2008 г.). «Определение общих элементов научно обоснованных психосоциальных методов лечения проблем с деструктивным поведением детей». Журнал Американской академии детской и подростковой психиатрии . 47 (5): 505–14. дои : 10.1097/CHI.0b013e31816765c2 . ПМИД   18356768 .
  42. ^ Кроуэлл CR, Андерсон, округ Колумбия, Абель DM, Серджио Дж. П. (1988). «Уточнение задач, обратная связь по результатам и социальная похвала: процедуры улучшения обслуживания клиентов банковскими кассирами» . Журнал прикладного анализа поведения . 21 (1): 65–71. дои : 10.1901/jaba.1988.21-65 . ПМК   1286094 . ПМИД   16795713 .
  43. ^ Голдман, Северная Каролина (1992). «Аденоидно-кистозный рак наружного слухового прохода». Отоларингология – хирургия головы и шеи . 106 (2): 214–5. дои : 10.1177/019459989210600211 . ПМИД   1310808 . S2CID   23782303 .
  44. ^ Брофи Дж. (1981). «Об эффективном восхвалении». Журнал начальной школы . 81 (5): 269–278. дои : 10.1086/461229 . JSTOR   1001606 . S2CID   144444174 .
  45. ^ Jump up to: а б Симонсен Б., Фэрбенкс С., Бриш А., Майерс Д., Сугай Г. (2008). «Научно обоснованные практики управления классом: соображения по поводу исследований на практике». Образование и лечение детей . 31 (1): 351–380. дои : 10.1353/etc.0.0007 . S2CID   145087451 .
  46. ^ Вайс-младший, Каздин А.Е. (2010). Доказательная психотерапия для детей и подростков . Гилфорд Пресс. ISBN  9781606235256 .
  47. ^ Даттон; Художник (1981). «Травматическая связь: развитие эмоциональных привязанностей у женщин, подвергшихся избиению, и других отношений, подвергающихся периодическому насилию». Виктимология (7).
  48. ^ Крисси Сандерсон. Консультирование жертв домашнего насилия . Издательство Джессики Кингсли; 15 июня 2008 г. ISBN   978-1-84642-811-1 . п. 84.
  49. ^ «Травматическая связь | Энциклопедия.com» .
  50. ^ Хопсон Дж. (27 апреля 2001 г.). «Поведенческий игровой дизайн» . Гамасутра .
  51. ^ Худ V (12 октября 2017 г.). «Являются ли лутбоксы азартной игрой?» . Еврогеймер . Проверено 12 октября 2017 г.
  52. ^ Скиннер Б.Ф. (1982). Эпштейн Р. (ред.). Скиннер для занятий: избранные статьи . Шампейн, Иллинойс: Research Press. ISBN  978-0-87822-261-2 .
  53. ^ Ваккарино Ф.Дж., Шифф Б.Б., Гликман С.Е. (1989). Моурер Р.Р., Кляйн С.Б. (ред.). Современные теории обучения . Хиллсдейл, Нью-Джерси: Lawrence Erlbaum Associates. ISBN  978-0-89859-915-2 .
  54. ^ Коуи С., Дэвисон М., Эллифф Д. (июль 2011 г.). «Подкрепление: еда сигнализирует о времени и месте будущей еды» . Журнал экспериментального анализа поведения . 96 (1): 63–86. дои : 10.1901/jeab.2011.96-63 . ПМК   3136894 . ПМИД   21765546 .
  55. ^ МакКормак Дж., Арнольд-Саритепе А., Эллифф Д. (июнь 2017 г.). «Эффект дифференциальных результатов у детей с аутизмом». Поведенческие вмешательства . 32 (4): 357–369. дои : 10.1002/bin.1489 .

[1]

Дальнейшее чтение

[ редактировать ]
[ редактировать ]
  1. ^ Бердон, Уильям М.; Сент-Де Лор, Джеф; Прендергаст, Майкл Л. (7 сентября 2011 г.). «Разработка и реализация мер по подкреплению позитивного поведения при лечении наркозависимости в тюрьмах: проект BRITE» . Журнал психоактивных препаратов . 43 (суп1): 40–50. дои : 10.1080/02791072.2011.601990 . ISSN   0279-1072 . ПМЦ   3429341 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 1d57cf2affd7e7d640cd2a4c84a95b89__1720952880
URL1:https://arc.ask3.ru/arc/aa/1d/89/1d57cf2affd7e7d640cd2a4c84a95b89.html
Заголовок, (Title) документа по адресу, URL1:
Reinforcement - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)