Теория оперантного научения Ф.Скиннера. Скиннер: оперантное обусловливание Кто создал концепцию оперантного научения

Отдельную линию в развитии бихевиоризма представляет система взглядов Б. Скиннера. Беррес Фредерик Скиннер (1904-1990) выдвинул теорию оперантного бихевиоризма .

Основываясь на экспериментальных исследованиях и теоретическом анализе поведения животных, он сформулировал положение о трех видах поведения: безусловно-рефлекторном , условно-рефлекторном и оперантном . Последнее и составляет специфику учения Б. Скиннера.

Первые два вида вызываются стимулами (S) и называются респондентным , отвечающим поведением. Это реакции обусловливания типа S. Они составляют определенную часть репертуара поведения, но ими одними не обеспечивается адаптация к реальной среде обитания. Реально процесс приспособления строится на основе активных проб - воздействий организма на окружающий мир. Некоторые из них случайно могут приводить к полезному результату, который в силу этого закрепляется. Часть из таких реакций (R), не вызываемых стимулом, а выделяемых («испускаемых») организмом, оказывается правильными и подкрепляются. Их Скиннер и назвал оперантными. Это реакции типа R.

Оперантное поведение предполагает, что организм активно воздействует на окружение и в зависимости от результатов этих активных действий они закрепляются или отвергаются. По Скиннеру, именно эти реакции - преобладающие в адаптации животного: они являются формой произвольного поведения. Катание на роликовой доске, игра на фортепиано, обучение письму - это все примеры оперантных действий человека, контролируемых их последствиями. Если последние благоприятны для организма, тогда вероятность повторения оперантной реакции усиливается.

Проанализировав поведение, Скиннер сформулировал свою теорию научения. Главным средством формирования нового поведения выступает подкрепление. Вся процедура научения у животных получила название «последовательного наведения на нужную реакцию».

Скиннер выделяет четыре режима подкрепления:

  1. Режим подкрепления с постоянным соотношением, когда уровень положительного подкрепления зависит от количества правильно выполненных действий. (Например, работнику платят пропорционально количеству произведенной продукции, т. е. чем чаще возникает правильная реакция организма, тем больше подкреплений он получает.)
  2. Режим подкрепления с постоянным интервалом, когда организм получает подкрепление после того, как пройдет строго фиксированное время с момента предыдущего подкрепления. (Например, работнику платят зарплату через каждый месяц или у студента сессия через каждые четыре месяца, при этом скорость реагирования ухудшается сразу после получения подкрепления - ведь следующая зарплата или сессия будет еще не скоро.)
  3. Режим подкрепления с вариативным соотношением. (Например, выигрыш-подкрепление в азартной игре бывает непредсказуем, непостоянен, человек не знает, когда и каким будет следующее подкрепление, но всякий раз надеется на выигрыш - такой режим значимо воздействует на поведение человека.)
  4. Режим подкрепления с вариативным интервалом. (Через неопределенные интервалы времени человек получает подкрепления или знания студента контролируют с помощью «неожиданных контрольных» через случайные промежутки времени, что побуждает соблюдать более высокий уровень прилежания и реагирования в отличие от подкрепления с «постоянным интервалом».)

Скиннер выделял «первичные подкрепления» (пища, вода, физический комфорт, секс) и вторичные, или условные (деньги, внимание, хорошие оценки, привязанность и т. п.). Вторичные подкрепления генерализуются, объединяются со многими первичными: например, деньги являются средством для получения множества удовольствий. Еще более сильным генерализованным условным подкреплением является социальное одобрение: ради его получения со стороны родителей, окружающих человек стремится хорошо себя вести, соблюдать социальные нормы, прилежно учиться, делать карьеру, красиво выглядеть и т. п.

Ученый полагал, что условные подкрепляющие стимулы очень важны в контроле поведения человека, а аверсивные (болевые или неприятные) стимулы, наказание - это наиболее общий метод контроля над поведением. Скиннер выделял позитивные и негативные подкрепления, а также позитивные и негативные наказания (табл. 5.2).

Таблица 5.2.

Скиннер боролся против того, чтобы использовать наказание для контроля над поведением, потому что это вызывает отрицательные эмоциональные и социальные побочные эффекты (страх, тревогу, антисоциальные действия, ложь, потерю самоуважения и уверенности). Кроме того, оно всего лишь на время подавляет нежелательное поведение, которое вновь проявится, если уменьшится вероятность наказания.

Вместо аверсивного контроля Скиннер рекомендует позитивное подкрепление как наиболее эффективный метод для устранения нежелательных и поощрения желательных реакций. «Метод успешного приближения или формирования поведения» заключается в положительном подкреплении тех действий, которые наиболее близки к ожидаемому оперантному поведению. К этому приближаются шаг за шагом: одна реакция закрепляется, а затем заменяется другой, более близкой к предпочтительной (так формируют речь, трудовые навыки и т. п.).

Данные, полученные при изучении поведения животных, Скиннер перенес на поведение людей, что привело к биологизаторской трактовке. Так, возник скиннеровский вариант программированного обучения. Его принципиальная ограниченность состоит в сведении обучения к набору внешних актов поведения и подкреплению правильных из них. При этом игнорируется внутренняя познавательная деятельность человека, следовательно, нет обучения как сознательного процесса. Вслед за установкой уотсоновского бихевиоризма Скиннер исключает внутренний мир человека, его сознание из поведения и производит бихевиоризацию психики. Мышление, память, мотивы и тому подобные психические процессы он описывает в терминах реакции и подкрепления, а человека - как реактивное существо, подвергающееся воздействиям внешних обстоятельств.

Биологизация мира людей, характерная для бихевиоризма в целом, принципиально не проводящего различий между человеком и животным, достигает у Скиннера своих пределов. Культурные явления оказываются в его трактовке «хитроумно придуманными подкреплениями».

Для разрешения социальных проблем современного общества Б. Скиннер выдвинул задачу создания технологии поведения , которая призвана осуществлять контроль одних людей над другими. Поскольку намерения, желания, самосознание человека не принимаются во внимание, управление поведением не связано с сознанием. Таким средством выступает контроль за режимом подкреплений, позволяющий манипулировать людьми. Для наибольшей эффективности необходимо учитывать, какое подкрепление наиболее важно, значимо, ценно в данный момент (закон субъективной ценности подкрепления ), а затем предоставлять такое субъективно ценное подкрепление в случае правильного поведения человека или угрожать его лишением в случае неправильного поведения. Подобный механизм и позволит управлять поведением.

Скиннер сформулировал закон оперантного обусловливания:

«поведение живых существ полностью определяется последствиями, к которым оно приводит. В зависимости от того, будут ли эти последствия приятными, безразличными или неприятными, живой организм проявит тенденцию повторять данный поведенческий акт, не придавать ему никакого значения или же избегать его повторения в дальнейшем».

Человек способен предвидеть возможные последствия своего поведения и избегать тех действий и ситуаций, которые приведут к негативным для него последствиям. Он субъективно оценивает вероятность их наступления: чем больше возможность негативных последствий, тем сильнее это влияет на поведение человека (закон субъективной оценки вероятности последствий ). Эта субъективная оценка может не совпадать с объективной вероятностью последствий, но на поведение влияет именно она. Поэтому один из способов воздействовать на поведение человека - «нагнетание обстановки», «запугивание», «преувеличение вероятности негативных последствий». Если человеку кажется, что последняя, вытекающая из какой-либо его реакции, незначительна, он готов «рискнуть» и прибегнуть к данному действию.

Продолжает и развивает идеи Уотсона Беррес Ф. Скиннер (1904-1990), который разработал теорию оперантного научения. Он является лидером современной формы бихевиоризма (или необихевиоризма).

Скиннер считал теории психоаналитические умозрительными, т.е. основанными на предположении. Они предполагают существование интрапсихических факторов (влечения, бессознательное), которые нельзя эмпирически проверить. Скиннер считал, что поведение человека надо изучать с позиции того, что его формируют обстоятельства окружения (окружающая среда и люди). Все действия человека и его поведение объясняются влиянием окружения.

Скиннер утверждал, что человеческий организм - это «черный ящик». Его содержимое (эмоции, мотивы, интрапсихические конфликты, влечения) нельзя объективно измерить, поэтому их следует исключить из сферы эмпирического наблюдения.

Поведение человека можно и нужно надежно и объективно измерить. И таким образом теория Скиннера из разряда умозрительных переходит в разряд эмпирических (научно-обоснованных). Он ставил науку о поведении в разряд естественных наук, т.е. наук: основанных на фактах (1) и цель которых предсказать и проконтролировать изучаемое явление (2).

Скиннер предложил в качестве метода исследования поведения - функциональный анализ поведения. Он указывал, что поведение лучше всего изучать, обращаясь к тому, как оно соотносится с предшествующими событиями. Он полагает, что поведение можно изучить и контролировать посредством манипулирования средой, в которую включен организм. При этом нет необходимости рассматривать механизмы, действующие внутри организма.

Так, функциональный анализ дает возможность установить точные и обусловленные взаимоотношения между открытым поведением (реакцией) и условиями окружающей среды (стимулами), которые контролируют поведение. Функциональный анализ дает возможность установить причинно-следственные отношения между поведением и окружающей средой. Манипулируя переменными окружающей среды (независимыми переменными - теми, которыми манипулирует экспериментатор), можно предсказывать и измерять поведение человека (зависимую переменную - ту, которая изменяется в результате манипуляции).

Скиннер не принял идею о личности или самости, которая направляет или стимулирует поведение. Он считает, что необходимо отказаться от мысли, что поведение порождается силами, находящимися внутри индивида (чертами, потребностями, мыслями, чувствами), в пользу более научных представлений о силах, лежащих вне человека. Он полагает, что поведение человека регулируется не изнутри, а снаружи - окружающей средой. Изучение личности по Скиннеру -это нахождение своеобразного характера взаимоотношений между поведением организма и результатами этого поведения, которые и подкрепляют его в последствии. Этот подход фокусируется на прогнозировании и контроле наблюдаемого поведения.

Как и Уотсон Скиннер огромное внимание уделял научению, но в отличие от Уотсона главным его интересом было не классическое, а так называемое оперантное научение. При классическом научении организм ассоциирует разные стимулы, при оперантном научении организм ассоциирует свое поведение с последующим результатом. Оперантное научение подчиняется закону эффекта, который был открыт американским психологом Эдвардом Торндаком в конце 19 века. В своих опытах Торндайк использовал так называемые проблемные клетки, в которые он помещал голодных кошек. Что бы выйти из такой проблемной клетки кошке нужно было потянуть за веревку или приподнять крючок. Наблюдая за животными, Торндайк заметил, что, помещенная в проблемную клетку кошка беспорядочно металась по клетке и, в конце концов, случайно задевала веревку или крючок. Однако с каждой следующей попыткой активность животных все больше сосредоточивались вокруг веревки или крючка и после многократных проб кошка научалась выходить из клетки. Такое научение также называется научением методом проб и ошибок. Это научение подчиняется закону эффекта, согласно которому если поведение приводит к желаемому результату (вознаграждается), вероятность его повторения увеличивается.

Для своего подхода к пониманию личности в свою теорию Скиннер добавляет положения о двух видах поведения: респондентное и оперантное поведение.

Респондентное поведение - подразумевает реакцию, вызываемую стимулом. Стимул всегда предшествует реакции.

Выделяют два вида респондентного поведения:

  1. условно рефлекторное
  2. безусловно рефлекторное.

Введение

Актуальность темы исследования. В начале 21 века психология бихевиоризма получает все более и более широкое распространение в России. Ситуация перехода от советской системы к западному пути развития вызвала у большинства людей огромные социальные и идеологические потрясения, связанные с лишением чувства принадлежности к могучему государству, потерей консолидирующей и возвышающей общественной идеи, девальвацией нравственных ценностей и т. д.

Круг внимания бихевиоризма как раз и составляет проблематика человека, поставленного перед необходимостью самостоятельно, в смятении и сомнениях, определять свою идентичность и ценности, ради которых он живет. Развитие собственной индивидуальности становится одновременно и задачей, и способом справиться с новой социальной реальностью.

Общая ситуация в психологии, характеризующаяся движением от естественнонаучной парадигмы к гуманитарной, от объясняющего подхода к понимающему, от изучения человека, как изолированного объекта к рассмотрению неразрывной связи человека и мира также способствует развитию и распространению бихевиоризма и стремлению к активному обмену идеями с ней со стороны других психологических направлений.

Цель данной работы заключается в обосновании вопроса об особенностях бихевиористической концепции научения.

Бихевиористическая концепция научения

Теория оперантного обусловливания Б. Скиннера

В переводе с английского бихевиоризм означает «поведение». Именно оно стало центральным предметом внимания этого направления.

Бихевиоризм признавал наличие сложного поведения, которое объяснял комбинациями цепочек стимулов и реакций. Собственно их изучение также входило в главные задачи течения.

Научение (обучение,учение) - процесс приобретения субъектом новых способов осуществления поведения и деятельности, их фиксации и/или модификации. Столяренко Л.Д. Основы психологии. - Ростов-на-Дону: Феникс,2006. - С. 68-72. Изменение психологических структур, которое происходит в результате этого процесса, обеспечивает возможность дальнейшего совершенствования деятельности.

Впервые закономерности научения, установленные экспериментальными методами, были установлены в рамках бихевиоризма. Теория, разработанная Б.Ф. Скиннером(1904-1990),носит название теории оперантого обусловливания.

Скиннер ставил перед собой цель объяснить механизмы научения у человека и животных (крыс и голубей) на основе ограниченного набора базовых принципов. Основная идея состояла в том, чтобы управлять средой, контролировать ее, получая при этом упорядоченные изменения. Он говорил: « Проконтролируйте условия, среду, и вам откроется порядок» Скиннер Б. Оперантное поведение //История зарубежной психологии:Тексты.М: АсТ,2006.С.60-82 4.

Процедура обучения получила название - «оперантное обусловливание».

Она заключалась в стремлении экспериментатора установить связь между стимулом (S) и реакцией (R) посредством подкрепления - поощрения или наказания. В схеме стимул-реакции (S-R) ключевой для Скиннера была именно реакция. Реакции рассматривались с точки зрения простоты-сложности. Простая -слюноотделение, отдергивание руки; сложная - решение математической задачи, агрессивное поведение.

Оперантное обусловливание - это процесс, посредством которого характеристики реакции детерминируются последствиями этой реакции. Осуществление оперантного поведения заложено в биологической природе организма. Научение рассматривалось Скиннером как процесс.

Подкрепление является одним из принципом обусловливания. Уже с младенческого возраста, Согласно Скиннеру, поведение людей можно регулировать с помощью подкрепляющих стимулов Скиннер Б. Оперантное поведение// История зарубежной психологии:Тексты.М.АсТ,2006. С,60-82 5. Существуют два разных вида подкрепления. Некоторые,например, еда или устранение боли, называются первичными подкреплениями, т.к. они обладают естественной подкрепляющей силой. Другие подкрепляющие стимулы (улыбка, внимание взрослого,одобрение,похвала) являются обусловленными подкрелениями. Они становятся таковыми в результате частого сочетания с первичными подкреплениями.

Оперантное обусловливание опирается в основном на положительное подкрепление, т.е. на такие последствия реакций, которые их поддерживают или усиливают,например,пища, денежное вознаграждение,похвала. Тем не менее, Скиннер подчеркивает важность негативного подкрепления,которое приводит к угасанию реакции. Такими подкрепляющими стимулами могут быть физическое наказание, моральное воздействие,психологическое давление.

Кроме подкрепления, принципом обусловливания является его незамедлительность. Было обнаружено, что в начальной стадии эксперимента можно довести реакцию до наивысшего уровня только в том случае,если подкреплять ее немедленно. Иначе, реакция, начавшая было формироваться, быстро угаснет.

При оперантном, также как и при респондентном обусловливании, наблюдается генерализация стимулов. Генерализация - это возникшая в процессе обусловливания ассоциативная связь реакции со стимулами, похожая на первоначальную выработку условного рефлекса. Примерами генерализации являются - страх перед всеми собаками, который сформировался вследствие нападения какой- то одной собаки, положительная реакция ребенка (улыбка, произнесение слов « папа» при контакте с мужчинами похожих на его отца, движение на встречу и проч.)

Формирование реакции представляет собой очень сложный процесс. Реакция не возникает сразу и вдруг, она оформляется постепенно, по мере осуществления ряда подкреплений. Последовательное подкрепление - это выработка сложных действий с помощью подкрепления действий, которые постепенно все больше становятся похожими на ту окончательную форму поведения, которую предполагалось сформировать. Сплошное поведение формируется в процессе подкрепления отдельных элементов поведения, которые в совокупности складываются в сложные действия.

Были выделены такие режимы подкрепления: непрерывное подкрепление - предъявление подкрепления каждый раз, когда субъект дает желаемую реакцию; прерывистое или частичное подкрепление. Для более строгой классификации режимов подкрепления было выделено два параметра - временное подкрепление и пропорциональное подкрепление. В первом случае подкрепляют только тогда, когда истек срок, в течение которого необходимо выполнить соответствующую деятельность, во втором: подкрепляют за объем той работы (количества действий), которая должна быть произведена.

На основе двух параметров были описаны четыре режима подкрепления: Уотстон Дж. Поведение как предмет психологии (бихевиоризм и необихевиоризм)// хрестоматия по истории психологии / Под ред. П.Я.Гальперина, А. Н. Ждан.- М.:Изд-во МГУ,1980.-С.34-44. 6

Режим подкрепления с постоянным соотношением. Подкрепление осуществляется в соответствии с установленным объемом реакций. Примером такого режима может быть оплата труда за определенный, постоянный объем работ.

Режим подкрепления с постоянным интервалом. Подкрепление производится только тогда, когда твердо установленный, фиксированный временной интервал истек. Например, ежемесячная, понедельная, почасовая оплата, отдых после жестко установленного времени физической или умственной работы.

Режим подкрепления с вариативным соотношением. В этом режиме организм подкрепляется на основе какого - то в среднем предопределенного числа реакций.

Режим подкрепления с вариативным интервалом. Индивид получает подкрепление после того, как проходит неопределенный интервал.

Скиннер говорил об индивидуальности подкреплений, о вариативности развития того или иного навыка у разных людей, а также у разных животных. Более того само подкрепление носит уникальный характер, т.к. уверенно нельзя сказать, что у данного человека или животного оно может выступать в качестве подкрепления.

По мере того, как ребенок развивается, его реакции усваиваются и остаются под контролем подкрепляющих воздействий со стороны окружающей среды. В виде подкрепляющих воздействий выступают - пища, похвала, эмоциональная поддержка и др. он считает, что овладение речью происходит по общим законам оперантного обусловливания. Ребенок получает подкрепление при произнесении определенных звуков. Подкреплением служит не пища и вода, а одобрение и поддержка взрослых.

С точки зрения психологии научения нет необходимости искать объяснение симптомов болезни в скрытых глубинных причинах. Патология, согласно бихевиоризму, не недуг, а либо (1) результат неусвоенной реакции, либо (2) усвоенная неадаптивная реакция.

Изменение поведения также построено на принципах оперантного обусловливания, на системе модификации поведения и сопряженных с ним подкреплений.

Изменения поведения может происходить вследствие самоконтроля. Самоконтроль включает в себя две взаимозависимые реакции: Уфимцева О.В. Бихевиоризм. - М.:Наука,2008. С.178 7

Контролирующая реакция, которая воздействует на среду, изменяя вероятность возникновения вторичных реакций(«уход» чтобы не выразить «гнев»; удаление пищи, чтобы отвыкнуть от переедания).

Контролирующая реакция, направленная на наличие в ситуации стимулов, которые могут сделать желательное поведение более вероятным (наличие стола для осуществления учебного процесса).

Изменение поведения может происходить и вследствие осуществления поведенческого консультирования. Во многом этот тип консультирования базируется на принципах научения.

Достоинства:

Стремление к строгой проверке гипотез, эксперименту, контролю дополнительных переменных.

Признание роли ситуативных переменных, параметров среды и их систематическое изучение.

Прагматический подход к терапии, позволил создать важные процедуры для изменения поведения.

Недостатки:

Редукционизм - сведение принципов поведения, полученных на животных к анализу поведения человека.

Низкая внешняя валидность вызвана поведением экспериментов в лабораторных условиях, результаты которых трудно перенести в естественные условия.

Игнорирование когнитивных процессов при анализе S-R связей.

Большой разрыв между теорией и практикой.

Поведенческая теория не дает стабильных результатов.

Введение

Основной постулат теории научения состоит в том, что почти всякое поведение усваивается в результате научения. Например, любая психопатология понимается как усвоение неадаптивного поведения или как неудача при усвоении адаптивного поведения. Вместо того чтобы говорить о психотерапии, сторонники теорий научения говорят о модификации поведения и о поведенческой терапии. Нужно модифицировать или изменять конкретные действия, вместо того чтобы разрешать внутренние конфликты, лежащие в основе этих действий, или реорганизовывать личность. Так как большинство видов проблемного поведения было когда-то усвоено, от них можно отказаться или как-то их изменить, используя специальные процедуры, основанные на законах обучения.

Еще более существенной чертой этих подходов является ориентация на объективность и научную строгость, на проверяемость гипотез и экспериментальный контроль переменных.

Сторонники теории научения манипулируют параметрами внешней среды и наблюдают последствия этих манипуляций в поведении. Теории научения иногда называют психологией S-R (стимула - реакции ).

Научение - (обучение, учение) - процесс приобретения субъектом новых способов осуществления поведения и деятельности, их фиксации и/или модификации. Изменение психологических структур, которое происходит в результате этого процесса, обеспечивает возможность дальнейшего совершенствования деятельности.

Теории научения в психологии исходят из двух основных положений:

  • - Всякое поведение усваивается в процессе научения.
  • - В целях соблюдения научной строгости при проверке гипотез необходимо соблюдать принцип объективности данных. В качестве переменных, которыми можно манипулировать, выбираются внешние причины (пищевое вознаграждение), в отличие от "внутренних" переменных в психодинамическом направлении (инстинкты, защитные механизмы, Я-концепция), которыми манипулировать нельзя.

К закономерностям научения относятся:

  • - Закон готовности: чем сильнее потребность, тем успешнее научение.
  • - Закон эффекта: поведение, которое приводит к полезному действию, вызывает снижение потребности и поэтому будет повторяться.
  • - Закон упражнения: при прочих равных условиях повторение определенного действия облегчает совершение поведения и приводит к более быстрому выполнению и снижению вероятности ошибок.
  • - Закон недавности: лучше заучивается тот материал, который предъявляется в конце серии. Этот закон противоречит эффекту первичности - тенденции к лучшему заучиванию материала, который предъявляется в начале процесса научения. Противоречие устраняется при формулировке закона "эффект края". U-образная зависимость степени заученности материала от его места в процессе научения отражает этот эффект и называется "позиционной кривой".
  • - Закон соответствия: существует пропорциональное отношение между вероятностью ответа и вероятностью подкрепления.

Существуют три основные теории научения:

  • - теория классического обусловливания И.П. Павлова;
  • - теория оперантного обусловливания Б.Ф. Скиннера;
  • - теория социального научения А. Бандуры.

Теория классического обусловливания берет свое начало с учения И.П. Павлова (1849-1936) об образовании условных рефлексов. Иван Петрович Павлов (1849-1936) был русским физиологом, который в ходе своих исследований процесса пищеварения разработал метод изучения поведения и принципы научения, оказавшие глубокое воздействие на всю психологическую науку.

В конце XIX - начале XX в. Павлов занимался исследованием секреции желудочного сока у собак. В ходе этих экспериментов он, среди прочего, вкладывал некоторое количество корма в пасть собаки и измерял, сколько слюны выделяется в результате. Случайно он обратил внимание на то, что после нескольких таких опытов собака начинает выделять слюну на определенные стимулы еще до того, как пища попадает ей в рот. Слюноотделение "происходило в ответ на такие сигналы, как появление миски с едой или появление человека, который обычно приносил пищу. Другими словами, стимулы, которые первоначально не приводили к данной реакции (так называемые нейтральные стимулы), затем могли вызывать слюноотделение из-за того, что ассоциировались с кормом, который автоматически заставлял собаку выделять слюну. Это наблюдение натолкнуло Павлова на идею проведения выдающихся исследований, в результате которых был открыт процесс, получивший название процесса выработки классического условного рефлекса, или процесса классического обусловливания.

Принципы классического обусловливания. И.П. Павлов первым открыл, что респондентное поведение может быть классически обусловленным. Суть процесса классического обусловливания состоит в том что изначально нейтральный стимул начинает вызывать реакцию благодаря своей ассоциативной связи со стимулом, который автоматически (безусловно) порождает такую же или очень похожую реакцию.

Иначе говоря, еда, в случае с собакой, рассматривается как безусловный стимул (БС), а слюноотделение - как безусловная реакция или безусловный рефлекс (БР). Это происходит потому, что слюноотделение - автоматическая, рефлекторная реакция на пищу. Нейтральный стимул - например, звонок - не вызовет слюноотделения. Однако если в ряде опытов непосредственно перед предложением пищи звонит звонок, то его звук сам по себе, без следующего за ним появления пищи может вызвать реакцию слюноотделения. В этом случае речь идет о процессе обусловливания, так как слюноотделения происходит вслед за звонком без предъявления пищи. В этом смысле звонок можно отнести к условным стимулам (УС) а слюно отделение - к условным реакциям, или условным рефлексам (УР).

На основании вышеизложенного можно сказать, что основная схема условного рефлекса И.П. Павлова S - > R, где S - стимул R реакция Из данной схемы видно, что основной путь управления ведением - это управление предъявлением стимулов, вызывающий определенную реакцию, внешним окружением, контроль над ним Организуя определенным образом окружение, вырабатывая условные рефлексы, можно формировать определенное поведение у человека.

Элементами классического обусловливания при этом являются - безусловный стимул (БС), безусловная реакция (БР), условный стимул (УС) и условная реакция (УР).

И.П. Павлов показал, что формирование условного рефлекса подчиняется ряду требований:

  • - важнейшим из них является смежность (совпадение по времени индифферентного и безусловного раздражителей, с некоторым опережением индифферентного раздражителя);
  • - не менее важным условием является повторение (многократное сочетание индифферентного и безусловного раздражителей).

Несмотря на то, что вначале Павлов проводил экперименты на животных, другие исследователи начали изучать основные процессы классического обусловливания на людях.

Теория оперантного обусловливания связана с именами Эдварда Ли Торндайка (E. L. Thorndike) и Берреса Скиннера (B. F. Skinner). В отличие от принципа классического обусловливания (S->R), они разработали принцип оперантного обусловливания (R->S), согласно которому поведение контролируется его результатами и последствиями. Основной путь воздействия на поведение, исходя из этой формулы, - влияние на его результаты.

теория научение условный рефлекс

Как уже и говорилось ранее, респондентное поведение - это версия Б.Ф. Скиннера павловского представления о поведении, которое он называл обусловливанием типа S, чтобы подчеркнуть важность стимула, который появляется до реакции и выявляет ее. Однако Скиннер полагал, что в целом поведение животных и человека нельзя объяснять в терминах классического обусловливания. Скиннер делал акцент на поведении, не связанном с какими-либо известными стимулами. Он утверждал, что в основном на ваше поведение воздействуют стимульные события, которые наступят после него, а именно - его последствия. Так как этот тип поведения предполагает, что организм активно воздействует на окружение с целью изменить события каким-то образом, Скиннер определил его как оперантное поведение. Он также называл его обусловливание типа Я., чтобы подчеркнуть воздействие реакции на будущее поведение.

Итак, ключевая структурная единица бихевиористского подхода в целом и скиннеровского подхода в особенности - это реакция. Реакции можно ранжировать от простых рефлекторных реакций (например, слюноотделение на пищу, вздрагивание на громкий звук) до сложного паттерна поведения (например, решение математической задачи, скрытые формы агрессии).

Реакция - это внешняя, наблюдаемая часть поведения, которую можно связать с событиями окружающей среды. Сущность процесса научения - это установление связей (ассоциаций) реакций с событиями внешней среды.

В своем подходе к научению Скиннер проводил различие между реакциями, которые вызываются четко определенными стимулами (например, мигательный рефлекс в ответ на дуновение воздуха), и реакциями, которые нельзя связать ни с одним стимулом. Эти реакции второго типа порождаются самим организмом и называются операн-тами. Скиннер считал, что стимулы среды не принуждают организм вести себя определенным образом и не побуждают его действовать. Исходная причина поведения находится в самом организме.

Оперантное поведение (вызванное оперантным научением) определяется событиями, которые следуют за реакцией. То есть за поведением идет следствие, и природа этого следствия изменяет тенденцию организма повторять данное поведение в будущем. Например, катание на роликовой доске, игра на фортепиано, метание дротиков и написание собственного имени - это образцы оперантной реакции, или операнты, контролируемые результатами, следующими за соответствующим поведением. Это произвольные приобретенные реакции, для которых не существует стимула, поддающегося распознаванию. Скиннер понимал, что бессмысленно рассуждать о происхождении оперантного поведения, так как нам неизвестны стимул или внутренняя причина, ответственная за его появление. Оно происходит спонтанно.

Если последствия благоприятны для организма, тогда вероятность повторения операнта в будущем усиливается. Когда это происходит, говорят, что последствия подкрепляются, и оперантные реакции, полученные в результате подкрепления (в смысле высокой вероятности его появления), обусловились. Сила позитивного подкрепляющего стимула таким образом определяется в соответствии с его воздействием на последующую частоту реакций, которые непосредственно предшествовали ему.

И напротив, если последствия реакции не благоприятны и не подкреплены, тогда вероятность получить оперант уменьшается. Скиннер полагал, что, следовательно, оперантное поведение контролируется негативными последствиями. По определению, негативные, или аверсивные последствия, ослабляют поведение, порождающее их, и усиливают поведение, устраняющее их.

Оперантное научение можно представить как процесс обучения, основанный на связи раздражитель-реакция-подкрепление, в рамках которой поведение формируется и поддерживается в силу тех или иных его последствий.

Примером оперантного поведения служит ситуация, встречающаяся почти в каждой семье, где есть маленькие дети, а именно - оперантное научение поведению плача. Как только маленькие дети испытывают боль, они плачут, и немедленная реакция родителей - выразить внимание и дать другие позитивные подкрепления. Так как внимание является подкрепляющим фактором для ребенка, реакция плача становится естественно обусловленной. Однако плач может возникать и тогда, когда боли нет. Хотя большинство родителей утверждают, что они могут различать плач от расстройства и плач, вызванный желанием внимания, все же многие родители упорно подкрепляют последний.

В 1969 году Альберт Бандура (1925) - канадский психолог выдвинул свою теорию личности, названную теорией социального обучения.

А. Бандура критиковал радикальный бихевиоризм, который отрицал детерминанты поведения человека, возникающие из внутренних когнитивных процессов. Для Бандуры индивиды не являются ни автономными системами, ни простыми механическими передатчиками, оживляющими влияния окружения - они обладают высшими способностями, которые позволяют им предсказывать появление событий и создавать средства для осуществления контроля над тем, что влияет на их повседневную жизнь. Учитывая, что традиционные теории поведения могли быть неверными, это давало скорее неполное, чем неточное объяснение поведению человека.

С точки зрения А. Бандуры, люди не управляются интрапсихическими силами и не реагируют на окружение. Причины функционирования человека нужно понимать в терминах непрерывного взаимодействия поведения, познавательной сферы и окружения. Данный подход к анализу причин поведения, который Бандура обозначил как взаимный детерминизм, подразумевает, что факторы предрасположенности и ситуационные факторы являются взаимозависимыми причинами поведения.

Функционирование человека рассматривается как продукт взаимодействия поведения, личностных факторов и влияния окружения.

Проще говоря, внутренние детерминанты поведения, такие как вера и ожидание, и внешние детерминанты, такие как поощрение и наказание, являются частью системы взаимодействующих влияний, которые действуют не только на поведение, но также на различные части системы.

Разработанная Бандурой модель-триада взаимного детерминизма показывает, что хотя на поведение влияет окружение, оно также частично является продуктом деятельности человека, то есть люди могут оказывать какое-то влияние на собственное поведение. Например, грубое поведение человека на званом вечере может привести к тому, что действия присутствующих рядом людей будут, скорее, наказанием, а не поощрением для него. Во всяком случае, поведение изменяет окружение. Бандура также утверждал, что благодаря своей необычайной способности использовать символы люди могут думать, творить и планировать, то есть они способны к познавательным процессам, которые постоянно проявляются через открытые действия.

Каждая из трех переменных в модели взаимного детерминизма способна влиять на другую переменную. В зависимости от силы каждой из переменных доминирует то одна, то другая, то третья. Иногда наиболее сильны влияния внешнего окружения, иногда доминируют внутренние силы, а иногда ожидание, вера, цели и намерения формируют и направляют поведение. В конечном итоге, однако, Бандура полагает, что по причине двойной направленности взаимодействия между открытым поведением и окружающими обстоятельствами люди являются и продуктом, и производителем своего окружения. Таким образом, социально-когнитивная теория описывает модель взаимной причинности, в которой познавательные, аффективные и другие личностные факторы и события окружения работают как взаимозависимые детерминанты.

Предвиденные последствия. Исследователи научения делают акцент на подкреплении как на необходимом условии для приобретения, сохранения и модификации поведения. Так, Скиннер утверждал, что внешнее подкрепление обязательно для научения.

А. Бандура, хотя и признает важность внешнего подкрепления, но не рассматривает его как единственный способ, при помощи которого приобретается, сохраняется или изменяется наше поведение. Люди могут учиться наблюдая или читая, или слыша о поведении других людей. В результате предыдущего опыта люди могут ожидать, что определенное поведение будет иметь последствия, которые они ценят, другое - произведет нежелательный результат, а третье - окажется малоэффективным. Наше поведение, следовательно, регулируется в значительной мере предвиденными последствиями. В каждом случае мы имеем возможность заранее вообразить последствия неадекватной подготовки к действию и принимаем необходимые меры предосторожности. Посредством нашей способности представлять действительный исход символически будущие последствия можно перевести в сиюминутные побудительные факторы, которые влияют на поведение во многом так же, как и потенциальные последствия. Наши высшие психические процессы дают нам способность предвидения.

В центре социально-когнитивной теории лежит положение о том, что новые формы поведения можно приобрести в отсутствие внешнего подкрепления. Бандура отмечает, что многое в поведении, которое мы демонстрируем, приобретается посредством примера: МЫ просто наблюдаем, что делают другие, а затем повторяем их действия. Этот акцент на научении через наблюдение или через пример, а не на прямом подкреплении, является наиболее характерной чертой теории Бандуры.

Саморегуляция и познание в поведении. Другой характерной чертой социально-когнитивной теории является то, что важную роль она отдает уникальной способности человека к саморегуляции. Устраивая свое непосредственное окружение, обеспечивая когнитивную поддержку и осознавая последствия своих собственных действий, люди способны оказывать некоторое влияние на свое поведение. Разумеется, функции саморегуляции создаются и не так уж редко поддерживаются влиянием окружения. Таким образом, они имеют внешнее происхождение, однако не следует преуменьшать тот факт, что однажды установившись, внутренние влияния частично регулируют то, какие действия выполняет человек. Далее, Бандура утверждает, что высшие интеллектуальные способности, например способность оперировать символами, дают нам мощное средство воздействия на наше окружение. Посредством вербальных и образных репрезентаций мы производим и сохраняем опыт таким образом, что он служит ориентиром для будущего поведения. Наша способность формировать образы желаемых будущих результатов выливается в бихевиоральные стратегии, направленные на то, чтобы вести нас к отдаленным целям. Используя способность к оперированию символами, мы можем решать проблемы, не обращаясь к методу проб и ошибок, можем, таким образом, предвидеть вероятные последствия различных действий и соответственно изменять наше поведение.

Заключение

Термином научение обозначают относительно постоянное изменение поведенческого потенциала в результате практики или приобретенного опыта. В этом определении содержатся три ключевые элемента:

  • 1) совершившееся изменение обычно отличается устойчивостью и длительностью;
  • 2) изменение претерпевает не само поведение, а потенциальные возможности для его осуществления (субъект может научиться чему-то не изменяющему его поведение в течение долгого времени или не влияющему на него вообще никогда);
  • 3) научение требует приобретения некоторого опыта (так, оно не происходит просто в результате взросления и роста).

Отталкиваясь от работ Павлова и Торндайка, ранние представители "теории научения", господствовавшей в психологической науке Соединенных Штатов Америки практически всю первую половину XX века, направляли свои изыскания на инструментальное поведение. Они исследовали те его виды, которые влекли за собой последствия. Изучению подвергалось, например, поведение крысы, перемещающейся по лабиринту для нахождения выхода и получения пищи. При этом измеряли такие величины, как количество времени, требующееся крысе для достижения цели в ходе каждой из повторяющихся попыток. Аналогично исследованию Торндайка, процедура состояла в том, что крыса помещалась в начало лабиринта, а затем производилась оценка ее продвижения к выходу. Главным анализируемым показателем было количество попыток, требующихся крысе для того, чтобы она, наконец, смогла пройти весь лабиринт, не совершая ошибок (таких, как попадание в тупиковые коридоры).

Представители теории научения несколько отошли от строгого бихевиоризма. Они использовали такие понятия, как научение, мотивация, движущие силы, побуждения, психическое торможение, которые обозначали невидимое поведение. По утверждению выдающегося теоретика научения Кларка Халла (1884-1952), эти понятия являются научными настолько, насколько их можно определить в терминах наблюдаемых операций (см. Hull, 1943). Например, операциональное определение наличия голода или "потребности в насыщении" можно выдвинуть исходя из количества часов пищевой депривации, испытываемой крысой перед экспериментом, или из снижения веса тела крысы относительно нормального. В свою очередь, операциональное определение научения можно дать в терминах прогрессирующего снижения от попытки к попытке количества времени, необходимого крысе для достижения выхода из лабиринта (или кошке для освобождения из проблемного ящика). Теперь теоретики могли задаться такими требующими исследования вопросами, как: "Происходит ли обучение быстрее, если усиливается мотив удовлетворения пищевой потребности"? Оказывается, происходит, но лишь до определенного момента. После этого момента у крысы просто не остается сил, чтобы пройти лабиринт.

Исследователи научения изобретали формулы для научения и поведения посредством усреднения поведения большого числа отдельных испытуемых и постепенно выводили общие "законы" научения. Одним из них является классическая кривая научения, распространяющаяся на многие типы поведения человека, которая показана. Так, научение некоторому навыку, например игре на музыкальном инструменте, характеризуется быстрым улучшением мастерства на начальных этапах, но затем темпы улучшения все более и более замедляются. Предположим, что ребенок учится играть на гитаре. Сначала он быстро развивает гибкость и послушность пальцев, навыки перебора струн и выставления аккордов; но если ему и суждено стать виртуозом, то это потребует немало лет практики. Кривая научения довольно хорошо подходит для иллюстрации возникновения многих сложных навыков человека, несмотря на то, что ее создали на основании наблюдений за улучшением прохождения лабиринта крысами с течением времени.

Некоторые другие закономерности, выявленные представителями классической теории научения, также распространяются на поведение человека. Однако существует и большой ряд тех из них, которые не подлежат такому переносу. От поиска универсальных для всех видов животных принципов обучения, по большей части, отказались в пользу видоспецифических принципов.

В середине XX в. в итоге пересмотра ряда основополагающих идей ортодоксального бихевиоризма сформировался необихевиоризм (Э. Толмен – когнитивный бихевиоризм, К. Халл – гипотетико-дедуктивный бихевиоризм, Э. Газри, Б. Ф. Скиннер – оперантный бихевиоризм и др.). Серьезную критику со стороны оппонентов ортодоксального бихевиоризма вызывал его явный механицизм в понимании поведения. Поэтому некоторые необихевиористы сделали попытку введения в традиционную схему "стимул – реакция" ряда новых промежуточных переменных (познавательной когнитивной карты, матрицы ценностей, цели, мотивации, антиципации, управления поведением и др.). Это существенно изменило общее содержание бихевиоризма.

В то время как большая часть сторонников необихевиоризма смягчили свои позиции за счет введения понятий, не свойственных ортодоксальному бихевиоризму, известный американский психолог Б. Ф. Скиннер и ряд других исследователей встали на точку зрения "радикального бихевиоризма". Этот подход еще жестче, чем это было принято в ортодоксальном бихевиоризме, отвергал любые интерпретации, имеющие отношения к ментализму. Б. Ф. Скиннер осуждал отступления от ортодоксального бихевиоризма, считая их возвратом к ненаучной психологии. Материалом для научного анализа, по его мнению, могут служить лишь наблюдаемые и измеряемые аспекты среды, поведения организма и последствия этого поведения.

Необихевиоризм оказал существенное влияние на теорию обучения и образовательную практику середины XX в. во всем мире. На фундаменте идей необихевиористов в педагогической психологии и теории обучения сформировалось мощное научное направление, получившее наименование "программированного обучения". С середины 1950-х гг. программированное обучение получило широкое распространение в мире (Англия, Польша, СССР, США, Франция, Чехословакия и др.). В США были созданы специальные научно-исследовательские учреждения, занимающиеся вопросами разработки новой дидактической технологии. В СССР также был организован специальный научный совет по вопросам программированного обучения.

Бэррас Фредерик Скиннер (1904– 1990) родился п Саскэханне, штат Пенсильвания, получил степень магистра в 1930 г., а степень доктора философских наук – в 1931 г. в Гарварде. Юношеское желание стать писателем реализовано не было, и после ряда неудачных попыток поиска собственного пути, он отправился изучать психологию в Гарвард.

Б. Ф. Скиннер преподавая психологию в университете Миннесоты с 1936 по 1945 г. В это время он опубликовал одну из основных своих работ – "Поведение организмов". После трехлетней работы деканом факультета психологии в университете Индианы, в 1948 г. он вернулся в Гарвард, где жил и работая до своей кончины – в 1990 г.

Основные положения теории "оперантного научения" Б. Ф. Скиннера

Важной точкой отсчета для понимания теории Б. Ф. Скиннера является его классификация видов поведения. Он выделял "респондентное поведение" и "оперантное поведение". Респондентное поведение вызывается известным стимулом. Пример респондентного поведения – все безусловные реакции, они возникают в результате безусловного стимула. Оперантное поведение не вызывается стимулом, оно просто производится организмом. Поскольку оперантное поведение не связывается с известными стимулами, кажется, что оно происходит спонтанно. Проявления оперантного поведения многообразны, большую часть наших каждодневных действий можно квалифицировать как оперантное поведение.

Б. Ф. Скиннер не утверждал, что оперантное поведение возникает независимо от стимуляции, скорее наоборот. Просто стимул, вызывающий оперантное поведение, неизвестен и знать его причину необязательно. Респондентное поведение целиком зависит от предшествовавшего ему стимула. В отличие от него оперантное повеление контролируется его последствиями.

Наряду с двумя типами поведения, по Б. Ф. Скиннеру, существует два тина обусловливания: "респондентное обусловливание" и "оперантное обусловливание". Респондентное обусловливание идентично классическому обусловливанию И. П. Павлова, Б. Ф. Скиннер называл его еще обусловливанием типа "S ". Тем самым подчеркивая важность стимула, который и вызывает необходимую реакцию. Оперантное обусловливание Б. Ф. Скиннер обозначает буквой "R", подчеркивая в данном случае, что акцент делается на реакцию.

При обусловливании типа "R" о его силе судят по скорости реакции, а при обусловливании типа "S " сила обусловливания часто определяется по величине условной реакции. Несложно заметить, что обусловливание типа "/?" Б. Ф. Скиннера очень похоже на "инструментальное обусловливание" Э. Торндайка, а его обусловливание типа "S " – на "классическое обусловливание" И. П. Павлова. Основное внимание в собственных исследованиях Б. Ф. Скиннер уделял оперантному обусловливанию, или по его терминологии обусловливанию типа "R".

Б. Ф. Скиннером выделены два главных принципа оперантного обусловливания (обусловливания типа "R"):

  • 1. Любая реакция, следующая за подкрепляющим стимулом, предрасположена к повторению.
  • 2. Подкрепляющим стимулом может быть все, что увеличивает скорость появления оперантной реакции.

В качестве подкрепляющего стимула может выступать все, что увеличивает вероятность повторения реакции. Как легко заметить, принципы оперантного обусловливания могут применяться к разнообразным ситуациям. Для того чтобы изменить поведение, необходимо найти нечто, что будет служить подкреплением для организма. Затем следует подождать, пока желаемое поведение проявится, и после этого произвести подкрепление.

В увлекательной книге последовательницы Б. Ф. Скиннера, американского зоопсихолога и дрессировщицы Карен Прайор "Не рычите на собаку" описано множество примеров использования принципов оперантного научения при дрессировке морских животных. Участвовавшие в ее исследованиях дельфины не только научились выполнять команды человека, они с успехом решали даже творческие задачи.

После этого частота желаемой реакции возрастет. Когда желаемое поведение проявится вновь, оно снова подкрепляется, и скорость проявления ответной реакции еще больше возрастает. Подобное влияние можно оказывать на любое поведение организма.

Б. Ф. Скиннер рассматривал социально-культурную среду как совокупность возможностей подкрепления.

Благодаря различиям в социально-культурной среде подкрепляются различные паттерны поведения. Согласно Б. Ф. Скиннеру то, что именуется словом "личность", нс является ничем, кроме согласующихся паттернов поведения, которые являются итогом истории нашего подкрепления.

Поделиться