Как правило, режим ВИ порождает более высокую скорость реагирования и большую сопротивляемость угасанию, чем режим ПИ.
Условное подкрепление
Теоретики, занимающиеся научением, признавали два типа подкрепления — первичное и вторичное. Первичное подкрепление — это любое событие или объект, сами по себе обладающие подкрепляющими свойствами. Таким образом, они не требуют предварительной ассоциации с другими подкреплениями, чтобы удовлетворить биологическую потребность. Первичные подкрепляющие стимулы для людей — это пища, вода, физический комфорт и секс. Их ценностное значение для организма не зависит от научения. Вторичное, или условное подкрепление, с другой стороны, — это любое событие или объект, которые приобретают свойство осуществлять подкрепление посредством тесной ассоциации с первичным подкреплением, обусловленным прошлым опытом организма. Примерами общих вторичных подкрепляющих стимулов у людей являются деньги, внимание, привязанности и хорошие оценки.
Небольшое изменение в стандартной процедуре оперантного научения демонстрирует, как нейтральный стимул может приобрести подкрепляющую силу для поведения. Когда крыса научилась нажимать на рычаг в «ящике Скиннера», сразу же ввели звуковой сигнал (сразу после осуществления реакции), за которым следовал шарик еды. В этом случае звук действует как различительный стимул (то есть животное учится реагировать только при наличии звукового сигнала, так как он сообщает о пищевом вознаграждении). После того, как эта специфическая оперантная реакция устанавливается, начинается угасание: когда крыса нажимает на рычаг, не появляются ни пища, ни звуковой сигнал. Через какое — то время крыса перестает нажимать на рычаг. Затем звуковой сигнал повторяется каждый раз, когда животное нажимает на рычаг, но шарик пищи не появляется. Несмотря на отсутствие первоначального подкрепляющего стимула, животное понимает, что нажатие на рычаг вызывает звуковой сигнал, поэтому оно продолжает настойчиво реагировать, тем самым ослабляя угасание. Другими словами, установленная скорость нажатия на рычаг отражает тот факт, что звуковой сигнал теперь действует как условный подкрепляющий фактор. Точная скорость реагирования зависит от силы звукового сигнала как условного подкрепляющего стимула (то есть от числа случаев, когда звуковой сигнал ассоциировался с первичным подкрепляющим стимулом, пищей, в процессе научения). Скиннер доказывал, что фактически любой нейтральный стимул может стать подкрепляющим, если он ассоциируется с другими стимулами, ранее имевшими подкрепляющие свойства. Таким образом, феномен условного подкрепления в значительной степени увеличивает сферу возможного оперантного научения, особенно если это касается социального поведения человека. Иначе говоря, если бы все, чему мы научились, было пропорционально первичному подкреплению, то возможности для научения были бы очень ограничены, и деятельность человека не была бы столь разнообразна.
Характерным для условного подкрепления является то, что оно генерализуется, если объединяется с более чем одним первичным подкреплением. Деньги — особенно показательный пример. Очевидно, что деньги не могут удовлетворить какое — либо из наших первичных влечений. Все же благодаря системе культурного обмена деньги являются мощным и сильным фактором для получения множества удовольствий. Например, деньги позволяют нам иметь модную одежду, яркие машины, медицинскую помощь и образование. Иные виды генерализованных условных подкрепляющих стимулов — это лесть, похвала, привязанности и подчинение себе других. Эти так называемые социальные подкрепляющие стимулы (включающие в себя поведение других людей) часто действуют очень сложно и едва уловимо, но они существенны для нашего поведения в разнообразных ситуациях. Внимание — простой случай. Все знают, что ребенок может получить внимание, когда притворяется больным или плохо себя ведет. Часто дети назойливы, задают нелепые вопросы, вмешиваются в разговор взрослых, рисуются, поддразнивают младших сестер или братьев и мочатся в постель — и все это для привлечения внимания. Внимание значимого другого — родителей, учителя, возлюбленного — особенно эффективный генерализованный условный стимул, который может содействовать ярко выраженному поведению привлечения внимания.
Еще более сильный генерализованный условный стимул — это социальное одобрение. Например, многие люди проводят массу времени, прихорашиваясь перед зеркалом, в надежде получить одобряющий взгляд супруга или любовника. И женская, и мужская мода — это предмет одобрения, и она существует до тех пор, пока есть социальное одобрение. Студенты высшей школы соревнуются за место в университетской легкоатлетической команде или участвуют в мероприятиях вне учебного плана (драма, диспут, школьный ежегодник) для того, чтобы получить одобрение родителей, сверстников и соседей. Хорошие отметки в колледже — тоже позитивный подкрепляющий стимул, потому что ранее за это получали похвалу и одобрение родителей. Будучи мощным условным подкрепляющим стимулом, удовлетворительные оценки также способствуют поощрению учения и достижению более высокой академической успеваемости.
Скиннер полагал, что условные подкрепляющие стимулы очень важны в контроле поведения человека (Skinner, 1971). Он также отмечал, что каждый человек проходит уникальную науку научения, и вряд ли всеми людьми управляют одни и те же подкрепляющие стимулы. Например, для кого — то очень сильным подкрепляющим стимулом является успех в качестве антрепренера; для других важно выражение нежности; а иные находят подкрепляющий стимул в спорте, академических или музыкальных занятиях. Возможные вариации в поведении, поддержанные условными подкрепляющими стимулами, бесконечны. Следовательно, понять условные подкрепляющие стимулы у человека намного сложнее, чем понять, почему крыса, лишенная пищи, нажимает рычаг, получая в качестве подкрепления только звуковой сигнал.
Контроль поведения посредством аверсивных стимулов
С точки зрения Скиннера, в основном поведение человека контролируется аверсивными (неприятными или болевыми) стимулами. Два наиболее типичных метода аверсивного контроля — это наказание и негативное подкрепление. Эти термины часто используются как синонимы для описания концептуальных свойств и поведенческих эффектов аверсивного контроля. Скиннер предложил следующее определение: «Вы можете различать наказание, при котором происходит аверсивное событие, пропорциональное реакции, и негативное подкрепление, в котором подкреплением является устранение аверсивного стимула, условного или безусловного» (Evans, 1968, р. 33).
Наказание. Термин наказание относится к любому аверсивному стимулу или явлению, которое следует или которое зависит от появления какой — то оперантной реакции. Вместо того, чтобы усиливать реакцию, которую оно сопровождает, наказание уменьшает, по крайней мере временно, вероятность того, что реакция повторится. Предполагаемая цель наказания — побудить людей не вести себя данным образом. Скиннер (Skinner, 1983) заметил, что это наиболее общий метод контроля поведения в современной жизни.
По Скиннеру, наказание может быть осуществлено двумя различными способами, которые он называет позитивное наказание и негативное наказание (табл. 7–1). Позитивное наказание встречается всякий раз, когда поведение ведет к аверсивному исходу. Вот несколько примеров: если дети плохо себя ведут, их шлепают или бранят; если студенты пользуются шпаргалками на экзамене, их исключают из вуза или школы; если взрослых ловят на краже, их штрафуют или сажают в тюрьму. Негативное же наказание встречается всякий раз, когда за поведением следует устранение (возможного) позитивного подкрепляющего стимула. Например, детям запрещают смотреть телевизор из — за плохого поведения. Широко используемый подход к негативному наказанию — методика приостановки. В соответствии с этой методикой человека моментально удаляют из ситуации, в которой доступны определенные подкрепляющие стимулы. Например, непослушного ученика четвертого класса, мешающего занятиям, могут выгнать из кабинета.