Размер подкрепления зависит также от сложности задачи. В океанариуме «Жизнь моря» мы сочли необходимым давать каждому дельфину по большой макрели за их олимпийские 6-7-метровые вертикальные прыжки. Они просто отказывались делать это за обычное вознаграждение в виде двух маленьких корюшек. У людей почти всегда более трудная работа вознаграждается лучше. А если этого нет, то как мы ненавидим тяжелую работу, если нам приходится ее делать.
Большой куш
Одним из наиболее полезных приемов пищевого или какого-либо другого подкрепления для человека и животных является получение куша. Это награда, которая во много, иногда в 10 раз больше обыкновенного подкрепления и являющаяся сюрпризом для субъекта. В рекламном агентстве, где я когда-то работала, бывали официальные вечера на Рождество, а также неофициальные праздники по поводу окончания большой работы или заполучения нового клиента. Но у председателя правления была еще привычка устраивать в год один-два абсолютно неожиданных вечера. Внезапно в середине дня он проносился по всем комнатам конторы, крича, чтоб все кончали работу. Коммутаторы выключались, появлялась процессия поставщиков провизии, музыканты, буфетчики, шампанское, копченая семга, и все это только для нас и безо всякой особенной причины.
Это было неожиданным кушем для пятидесяти человек. Я думаю, что это очень способствовало поднятию духа коллектива. Куш можно использовать и для того, чтоб отметить внезапное озарение. Один мой знакомый наездник, когда лошадь впервые проделывает какой-нибудь сложный маневр, соскакивает с нее, освобождает от седла и уздечки и свободно выпускает на манеж — куш полной свободы, который часто, по-видимому, может привести к образованию новой линии поведения. Как ни странно, получение всего одного куша может так же улучшить ответы непокорного, испуганного или сопротивляющегося субъекта, который вообще не проявлял нужного поведения. В океанариуме «Жизнь моря» мы проводили исследования по заданию ВМС США, в которых дельфин получал подкрепление за новые реакции, осуществляемые вместо старого, ранее выработанного поведения. Испытуемой была понятливая самочка по имени Хоу, которая редко давала новые ответы. Когда ей не стало удаваться получать подкрепления за свои действия, она стала неактивной, и в конце концов в течение одного занятия за двадцать минут не дала ни одного ответа. Наконец, тренер кинул ей пару рыбок «ни за что». Явно ошарашенная такой щедростью, Хоу снова стала активной и вскоре выполнила движение, которое можно было подкрепить, что привело к несомненному прогрессу на последующих занятиях. Я сама бывала в таком же положении, как этот дельфин. Когда мне было пятнадцать лет, самым большим удовольствием для меня были уроки верховой езды. Конюшни, где я занималась, продавали билеты, каждый на десять уроков; по своим деньгам я могла позволить себе один билет в месяц. В то время я жила с отцом, Филиппом Уили, и мачехой, Рики; и хотя они относились ко мне очень хорошо, я вступила в один из тех периодов юности, когда беспрерывно целыми днями бываешь невыносимо грубым и противным. Однажды вечером супруги Уйди, которые были любящими и изобретательными родителями, сказали, что они ужасно устали от моего поведения и поэтому решили меня наградить. И они презентовали мне ослепительно новый, дополнительный бесплатный билет на верховую езду. Один из них не поленился съездить на конюшни, чтобы купить его. Поразительно! Незаслуженный куш. Как мне помнится, я с ходу переменилась, и Рики Уйди подтвердила это много лет спустя, когда я писала эту книгу. Почему назаработанный куш может оказать такое внезапное и далеко идущее влияние, я не совсем понимаю. Может быть, со временем кто-нибудь напишет диссертацию по этому поводу и объяснит нам это. Я только знаю, что дополнительный билет на верховую езду мгновенно снял у меня сильные чувства угнетенности и обиды, и я подозреваю, что и дельфин чувствовал то же самое.
Условное подкрепление
Очень часто, особенно при работе с пищевым подкреплением, его невозможно дать в тот момент, когда субъект делает то, что хотели бы поощрить. Если я учу дельфина прыгать, то я никак не могу дать ему рыбку в тот момент, когда он находится в воздухе. Если за каждым прыжком следует брошенная рыбка (отставленное подкрепление), то у животного в конце концов образуется связь между прыжком и едой, и оно будет прыгать чаще. Однако это не несет информации о том, какой из аспектов прыжка мне нравится. На какую высоту? С каким прогибом? Может, надо войти обратно в воду со всплеском? Таким образом, потребуется очень много повторений, чтобы животное установило, какой именно прыжок я имела в виду. Чтобы обойти эту трудность, мы используем условное подкрепление. Условное подкрепление представляет собой какой-либо изначально ничего незначащий сигнал — звук, свет, движение, — который умышленно связывают с подачей подкрепления. Тренеры дельфинов остановили свой выбор на полицейском свистке: его хорошо слышно даже под водой и он не связывает руки, чтобы можно было давать сигналы и бросать рыбу. С другими животными я обычно использую «сверчка», десятицентовую игрушку, которая щелкает, когда на нее нажимаешь, или особые поощряющие слова, выбранные и приберегаемые для использования в качестве условного подкрепления: «хорошая собака», «хорошая лошадка». Школьные учителя часто прибегают к некоторым таким ритуальным и тщательно нормированным словам похвалы — «замечательно» или «очень хорошо», — за которые дети страстно работают и ждут их. Наша жизнь изобилует условными подкреплениями. Нам нравится слышать, как звонит телефон или видеть набитый почтовый ящик, даже если половина звонков неинтересна и большая часть корреспонденции — утиль, потому что множество случаев научили нас связывать звонок или конверт с хорошим. Нам нравится рождественская музыка, и мы ненавидим запах зубного кабинета. Мы храним окружающие нас вещи — картины, посуду, трофеи — не потому, что они красивы или полезны, а потому, что они напоминают нам о временах, когда мы были счастливы, или о людях, которых мы любили. Они представляют собой условные подкрепления. Практически дрессировка животных с использованием положительного подкрепления почти всегда должна начинаться с выработки условного подкрепления. Прежде чем начать выработку поведения как такового, пока субъект еще ничего особенного и не делает, вы учите его понимать значимость условного подкрепления, сочетая его с пищей, поглаживанием или другим истинным подкреплением.
Иногда, по крайней мере при работе с животными, вы можете уловить, когда субъект начинает узнавать ваш сигнал, означающий «Хорошо!». Видно, как животное вздрагивает при действии условного подкрепления и начинает искать истинное подкрепление. После выработки условного подкрепления в ваших руках оказывается реальный способ сообщения животному, что в его поведении вас интересует. Чтобы разговаривать с животными, вам не обязательно быть доктором Дулиттлом, можно очень многое сказать таким выработанным подкреплением. Условные подкрепления приобретают чрезвычайную силу. Так как информация «Ты прав» сама по себе представляет ценность, она не обязательно должна сопровождаться первичным подкреплением. Фактически использование пищи, ласки или чего-нибудь в этом роде можно практически свести к нулю, а условное подкрепление будет приносить прекрасные результаты. Я видела, как морские млекопитающие долго работали после насыщения за условные подкрепления, а лошади и собаки работают по часу и более с маленьким или безо всякого безусловного подкрепления. Люди конечно же тоже могут бесконечно работать за деньги, являющиеся ничем иным как условным подкреплением, обозначением вещей, которые на них можно купить, особенно люди, которые уже заработали гораздо больше денег, чем они когда-либо смогут действительно потратить, и, следовательно, пристрастившиеся к условному подкреплению. Действие условного подкрепления можно усилить, сочетая его с несколькими безусловными подкреплениями. В данный момент субъект может не хотеть, скажем, есть, но если тот же подкрепляющий звук или слово были умышленно связаны еще и с водой или другими потребностями или приятными моментами, он сохраняет свое действие и в этом случае. Мои кошки слышат слова «хорошая киса!», когда получают ужин, когда их гладят, когда их впускают в дом и выпускают из дома, когда они проделывают маленькие трюки и получают за них вознаграждение. В результате я могу использовать эти слова для поощрения кошки, спрыгивающей с кухонного стола, и нет нужды сопровождать его каким-либо безусловным подкреплением. Быть может, причина того, что деньги оказывают на нас такое подкрепляющее действие, кроется в том, что они могут связываться практически с чем угодно. Это чрезвычайно обобщенное условное подкрепление. Как только вы выработали условное подкрепление, вы должны пользоваться им осторожно, не разбрасывать без толку, иначе его сила уменьшится. Дети, которые ездили на моих уэльских пони, очень скоро научились говорить: «Хорошая лошадка!» только когда хотели подкрепить поведение. Если им просто хотелось выразить свою привязанность, они могли болтать с пони, как угодно, не употребляя этих слов. Однажды девочка, которая только что присоединилась к их компании, начала гладить пони, приговаривая: «Ты хорошая лошадка!». Трое остальных тотчас же ополчились на нее: «Ты за что ему это говоришь? Он же ничего не сделал!». Подобным же образом можно и должно окружить заботой и вниманием детей, супруга, родителей, любимых и друзей безотносительно к какому-нибудь определенному поведению, но необходимо приберечь что-то специально в качестве условного подкрепления чего-либо определенного.