Теория оперантного научения Б.Ф. Скиннера. Теория оперантного научения скиннера реферат


Теория оперантного научения

Теория оперантного научения Б.Ф. Скиннера

В основании теории оперантного обусловливания Скиннера лежит тот простой факт, что не всегда действия живого существа являются реакцией на ту или иную комбинацию внешних воздействий - стимулов. Довольно часто (по мнению Скиннера, в большинстве случаев) поведение выглядит так, как будто бы ему не предшествуют никакие видимые стимулы.

В знаменитых опытах Скиннера лабораторная крыса помещалась в пустой ящик с педалью внутри (так называемый "ящик Скиннера" см ниже .) и получала полную свободу действий. В процессе хаотичного исследования ящика крыса неизбежно задевала педаль и получала порцию пищи. После нескольких случайных нажатий на педаль у крысы формировалась новая форма поведения, которая не была связана ни с какими предшествующими стимулами. Теперь, проголодавшись, крыса целенаправлено следовала к педали и, нажав на нее - получала желаемое.

Таким образом, ключевое отличие оперантного обусловливания от классического состоит в том, что в случае оперантного обусловливания живой организм своим поведением активно воздействует на окружающую среду и сталкивается с теми или иными последствиями. В случае формирования условного рефлекса* см ниже ) такого воздействия не наблюдается. Животные в опытах Павлова были специально, в целях соблюдения чистоты эксперимента, лишены какой-либо возможности влиять на окружение. В этом смысле оперантное поведение активно и направлено на исследование окружающего мира, респондентное поведение реактивно и лишь следует тем или иным воздействиям, в процессе классического обусловливания( см ниже ), приобретшим для организма определенное сигнальное воздействие.

Но сама по себе исследовательская активность ничего не дает - она лишь увеличивает шансы встретить те или иные последствия. То, каким образом видоизменяется поведение, зависит в первую очередь от характера последствий - от того, будут эти последствия приятными или неприятными. Приятные последствия Скиннера называл "подкреплением"(см ниже ).

Экспериментируя с разными типами подкрепления, Скиннер вывел одну бесспорную и всегда воспроизводимую закономерность: образцы поведения (операнты), вслед за которыми следуют приятные последствия, в будущем встречаются чаще. Крыса чаще нажимает на педаль, если непосредственно вслед за этим действием она получает кусочек пищи.

Голубь, помещенный в клетку, на полу которой имеется красное пятно, лишь случайным образом может клюнуть в него. Но если сразу вслед за этим он получит пищу - зернышко, то этот оперант (действие в расчете на успех) будет чаще встречаться в будущем. Человек, которого вкусно накормят в одном из ресторанов города, будет чаще ходить в этот ресторан, даже если он довольно далеко расположен от дома. Эту закономерность Скиннер назвал "законом выгоды (приобретения)"(см ниже ), иногда его еще называют первым законом оперантного научения. 

Закон приобретения означал для Скиннера и его последователей следующее: если перед терапевтом или учителем встает задача сформировать новые привычки, новые образцы поведения, то единственный способ, который дает предсказуемые и надежные результаты, состоит в том, что мы специально создаем позитивные последствия для так называемого "целевого" поведения, т.е. поведения, с которым мы бы хотели чаще встречаться впредь.

Подкрепляя это поведение, мы обязательно добьемся своего: это поведение будет встречаться чаще.

Логичным кажется и другой способ модификации поведения. Многие предполагают, что поведение, которое наказывается, штрафуется, т.е. ведет к последствиям, для индивида неприятным, должно исчезнуть. Этому выводу, однако, Скиннер не нашел подтверждения. С его точки зрения, наказание(см ниже ) - довольно спорный способ отучить от нежелательного поведения, поскольку поведение, за которым следуют неприятные последствия, никуда не исчезает, оно лишь видоизменяется самым неожиданным образом. Человек в случае штрафа вынужден искать иные формы поведения, чтобы избежать штрафа. Часто оказывается так, что эти новые формы бывают еще менее желательными, чем те, которые вызвали наказание.

Конечно, человек (или любое другое живое существо) склонен избегать неприятных событий. Это - факт. Однако предсказать, к чему приведут его поиски альтернативных форм поведения - практически невозможно, если только не оказывать ему помощь - не продемонстрировать в явной форме образцы поведения, которые позволят наказания избежать.  И здесь Скиннер еще раз напоминал о том, что предотвращение негативных последствий само вызывает позитивные последствия, т.е. само является подкреплением. И эту форму подкрепления, конечно, можно использовать.

Принципиально в целях изменения поведения можно использовать пять различных типов последствий. Во-первых, это позитивное и негативное подкрепление, которое ведет к укреплению способов поведения, вслед за которыми оно следует. Далее следует позитивное и негативное наказание, ведущее к непредсказуемым последствиям, и игнорирование - то есть абсолютное отсутствие последствий, которое ведет к угасанию поведения и (как мы увидим далее) - к состоянию выученной беспомощности.

Практическое применение теории оперантного научения

Теория и выводы Скиннера получили практическое применение в педагогике, бизнесе и медицине. Наиболее известным в России практическим применением законов оперантного обусловливания можно считать программированное обучение. Суть этого способа обучения сводится к применению принципов последовательного приближения и подкрепления к процессу обучения. Именно учитель, автор программы, а не ученик, становится ответственным за успех обучения.

Материал учебника был составляется таким образом, что предусматривает возможность разным образом, переходя на разные страницы или пункты программы и затрачивая различное время, все же придти к конечному результату.

Подготовленные ученики, способные учиться быстро - быстро осваивают материал, те же, кому требуется значительное время и подробные объяснения, получают и то и другое, причем вне зависимости от скорости обучения - каждый получает немедленное подкрепление, подтверждение своего успеха (или помощь в виде новых материалов и текстов).

Не останавливаясь подробно на содержании программированного обучения (см. Талызина, 1969, 1975), отметим лишь некоторые принципы, общие для него и поведенческой психотерапии:

1. Скорость обучения и план "последовательного приближения" к целевому поведению строго индивидуальны для каждого человека.

2. Именно терапевт, который ставит задачи и планирует режим подкрепления, в конечном счете отвечает за успех терапии.

3. Терапевтические (учебные) мероприятия планируются так, что более сложные задачи ставятся после того, как выполнение предшествующего задания привело к очевидному успеху.

4. Программа постоянно пересматривается и корректируется в зависимости от успехов клиента.

В сфере менеджмента идеи Скиннера нашли выражение в планировании и последовательном осуществлении в организациях "среды моментального подкрепления" ценных для организации действий (см. Питерс и Уотермен, 1986).

В рекламной практике широко используют принцип небольших подарков и накопленных бонусов.

Правоохранительные органы все чаще штрафы заменяют либо системой подкреплений, либо предоставляют провинившемуся на выбор возможность заплатить штраф или принять участие в тренинге, который его научит альтернативным формам поведения.  Но наиболее радикальные изменения идеи Скиннера произвели в психотерапии, заложив основу совершенно новой ее ветви - терапии и модификации поведения. 

Ограничения теории оперантного научения

В теории оперантного научения Скиннера остался ряд невыясненных моментов, которые ограничивали ее всестороннее использование и не давали ответов на ряд вопросов, возникающих в психотерапевтической практике.

Некоторые сомнения вызывало (и продолжает вызывать) утверждение о том, что наказание ведет к непредсказуемым последствиям. Ведь совершенно очевидно, что сильный штраф быстро устраняет нежелательное поведение. Если ребенок лезет гвоздем в розетку, то громкий окрик на некоторое время прекратит это интересное занятие.

Большинство людей совершенно очевидно перестают делать то, что вызывает неприятные последствия. Идея Скиннера о том, что в данном случае мы имеем дело с негативным подкреплением - т.е., человеку приятным становится отсутствие наказания, и он начинает чаще делать (или не делать) то, что позволяет избежать наказания, лишь частично объясняет реальность.

Еще одно "темное пятно" в теории Скиннера, которое довольно скоро стало очевидным для психологов и психотерапевтов, состоит в том, что из нее не понятно, как появляются абсолютно новые формы поведения.

Из теории следовало, что позитивное, новое, здоровое поведение должно подкрепляться, и лучше, если это подкрепление не систематично и не отсрочено. Этот достаточно надежный принцип применим к простым навыкам, вероятность спонтанного появления которых достаточно высока.

Если же речь идет о сложных навыках (например, решение математических задач), то достаточно долго вероятно, придется держать наготове подкрепление, прежде чем в результате спонтанной поисковой активности будет найден способ их решения. Иными словами, не очень понятно, как подтолкнуть человека к тем образцам поведения, которые следует подкреплять и относительно которых он не имеет никакого представления.

Ответы на эти вопросы были найдены другими психологами поведенческого направления. 

studfiles.net

Теория оперантного научения Б.Ф. Скиннера

Одним из представителей теории оперантного бихевиоризма был Б.Ф. Скиннер. Стремясь переработать классический бихевиоризм, Скиннер исходил прежде всего их необходимости систематического подхода к пониманию поведения человека. С его точки зрения, нельзя говорить о реальной свободе человека, так как он никогда реально сам не управляет своим поведением, которое зависит от внешней среды. На основе представления о том, что не только умения, но и знания представляют собой вариации поведения, Скиннер разработал его особый вид – оперантное поведение

Теория оперантного научения Б.Ф. Скиннера

В основании теории оперантного обусловливания Скиннера лежит тот простой факт, что не всегда действия живого существа являются реакцией на ту или иную комбинацию внешних воздействий - стимулов. Довольно часто (по мнению Скиннера, в большинстве случаев) поведение выглядит так, как будто бы ему не предшествуют никакие видимые стимулы.

В знаменитых опытах Скиннера лабораторная крыса помещалась в пустой ящик с педалью внутри  и получала полную свободу действий. В процессе хаотичного исследования ящика крыса неизбежно задевала педаль и получала порцию пищи. После нескольких случайных нажатий на педаль у крысы формировалась новая форма поведения, которая не была связана ни с какими предшествующими стимулами. Теперь, проголодавшись, крыса целенаправлено следовала к педали и, нажав на нее - получала желаемое.

Таким образом, ключевое отличие оперантного обусловливания от классического состоит в том, что в случае оперантного обусловливания живой организм своим поведением активно воздействует на окружающую среду и сталкивается с теми или иными последствиями. В случае формирования условного рефлекса  такого воздействия не наблюдается. Животные в опытах Павлова были специально, в целях соблюдения чистоты эксперимента, лишены какой-либо возможности влиять на окружение. В этом смысле оперантное поведение активно и направлено на исследование окружающего мира, респондентное поведение реактивно и лишь следует тем или иным воздействиям, в процессе классического обусловливания, приобретшим для организма определенное сигнальное воздействие.

Но сама по себе исследовательская активность ничего не дает - она лишь увеличивает шансы встретить те или иные последствия. То, каким образом видоизменяется поведение, зависит в первую очередь от характера последствий - от того, будут эти последствия приятными или неприятными. Приятные последствия Скиннера называл "подкреплением".

Экспериментируя с разными типами подкрепления, Скиннер вывел одну бесспорную и всегда воспроизводимую закономерность: образцы поведения (операнты), вслед за которыми следуют приятные последствия, в будущем встречаются чаще. Крыса чаще нажимает на педаль, если непосредственно вслед за этим действием она получает кусочек пищи.

Голубь, помещенный в клетку, на полу которой имеется красное пятно, лишь случайным образом может клюнуть в него. Но если сразу вслед за этим он получит пищу - зернышко, то этот оперант (действие в расчете на успех) будет чаще встречаться в будущем. Человек, которого вкусно накормят в одном из ресторанов города, будет чаще ходить в этот ресторан, даже если он довольно далеко расположен от дома. Эту закономерность Скиннер назвал "законом выгоды (приобретения)", иногда его еще называют первым законом оперантного научения.

Другие похожие работы, которые могут вас заинтересовать.вшм>

20876. Курсовая Теория денег или денежная теория 57.85 KB   При помощи денег выражают стоимость различных товаров (и услуг), поскольку деньги легко обмениваются на любой из них. Такая денежная оценка делает разнородные товары легко сопоставимыми при обмене. По мнению сторонников трудовой теории стоимости (в частности Карла Маркса) не деньги делают товары соизмеримыми, а наоборот: именно потому, что все товары представляют собой овеществлённый человеческий труд и, следовательно, сами по себе соизмеримы по количеству затраченного труда 14833. Лекция ТЕОРИЯ ОБУЧЕНИЯ 29.48 KB   Дидактика на теоретическом уровне исследует обучение. Обучение - целенаправленный процесс организации деятельности обучающихся по овладению знаниями, умениями, навыками и компетенцией, приобретению опыта деятельности, развитию способностей, приобретению опыта применения знаний в повседневной жизни и формированию у обучающихся мотивации получения образования в течение всей жизни1. Дидактика - это педагогическая теория обучения, дающая научное обоснование его содержания 21273. Контрольная Теория вероятностей 201.56 KB   В этом смысле говорят что результат измерения есть величина случайная. Ещё в древности было замечено что имеются явления которые обладают особенностью: при малом числе наблюдений над ними не наблюдается никакой правильности но по мере увеличения числа наблюдений всё яснее проявляется определенная закономерность. Найти вероятность того что одна взятая наугад болванка имеет дефект. Какова вероятность что второй шар белый Решение. 1805. Курсовая Теория мотивации 27.87 KB   Для человека, стремящегося к успеху, интерес к решению задачи возрастает после неудачного ее решения, а для человека, ориентированного на неудачу интерес падает и возникает тенденция избегания этой задачи, желание больше к ней никогда не возвращаться. Ориентированные на успех люди 7450. Лекция Теория потребления 48.16 KB   Теория потребления Потребительское поведение и полезность блага. рациональный потребитель стремится максимизировать полезность. Полезность это субъективное понятие которое характеризует степень удовольствия от покупки данного товара. Предельная полезность это добавочная полезность или удовлетворение извлекаемое потребителем из одной дополнительной единицы конкретной продукции. 12979. Реферат Теория антенных решёток 450.74 KB   Для увеличения направленности действия уже на первых этапах развития антенной техники стали применять систему вибраторов антенные решетки. В антенных решётках элементами могут быть как слабонаправленные излучатели металлические и щелевые вибраторы волноводы диэлектрические стержни спирали и др. Это достигается применением антенных решеток АР состоящих из нескольких коллинеарно расположенных излучателей объединенных общей схемой питания. 14204. Книга Теория бухгалтерского учета 92.42 KB   Развитие рыночных отношений в РФ обозначает новые направления к подготовке специалистов управления крупным и малым бизнесом: руководителям, менеджерам, экономистам, финансистам, бухгалтерам, аналитикам, ревизорам, маркетологам. Данные специалисты, зная основы бухгалтерского учета и умея их применить в практической деятельности 6001. Лекция Теория механизмов и машин 1.52 MB   Зависимость линейных координат в какой-либо точке механизма от обобщенной координаты – линейная функция положения данной точки в проекциях на соответствующие оси координат. Первая производная линейной функции положения точки по обобщенной координате – линейная передаточная функция данной точки в проекциях на соответствующие оси координат иногда называют аналог линейной скорости полная скорость т. Вторая производная линейной функции положения по обобщенной... 12740. Контрольная Релятивистская кинетическая теория 1.39 MB   Вектор потока частиц. Климантовича которые вывели нерелятивистские кинетические уравнения из уравнений механики частиц. Вектор потока частиц. Эта величина определяется таким образом что произведение дает среднее число частиц находящихся в элементе в точке в момент времени t. 10900. Лекция Теория экономических организаций 26.99 KB   Под отношением власти понимают передачу полномочий принятия решения явным или неявным образом от одного агента или группы агентов другим агентам. Действия подобного управляющего определяют две группы интересов: 1 обслуживание интересов управляемого предприятия улучшение производственных показателей и получение прибыли или в крайнем случае минимизация убытков если работа предприятия не рассчитана на прибыль; 2 государственный менеджер не может не помнить о своих личных экономических материальных интересах. Организация и группы. Большие...

refleader.ru

Теория Скиннера

Продолжает и развивает идеи Уотсона Беррес Ф. Скиннер (1904-1990), который разработал теорию оперантного научения. Он является лидером современной формы бихевиоризма (или необихевиоризма).

Скиннер считал теории психоаналитические умозрительными, т.е. основанными на предположении. Они предполагают существование интрапсихических факторов (влечения, бессознательное), которые нельзя эмпирически проверить. Скиннер считал, что поведение человека надо изучать с позиции того, что его формируют обстоятельства окружения (окружающая среда и люди). Все действия человека и его поведение объясняются влиянием окружения.

Скиннер утверждал, что человеческий организм - это «черный ящик». Его содержимое (эмоции, мотивы, интрапсихические конфликты, влечения) нельзя объективно измерить, поэтому их следует исключить из сферы эмпирического наблюдения.

Поведение человека можно и нужно надежно и объективно измерить. И таким образом теория Скиннера из разряда умозрительных переходит в разряд эмпирических (научно-обоснованных). Он ставил науку о поведении в разряд естественных наук, т.е. наук: основанных на фактах (1) и цель которых предсказать и проконтролировать изучаемое явление (2).

Скиннер предложил в качестве метода исследования поведения - функциональный анализ поведения. Он указывал, что поведение лучше всего изучать, обращаясь к тому, как оно соотносится с предшествующими событиями. Он полагает, что поведение можно изучить и контролировать посредством манипулирования средой, в которую включен организм. При этом нет необходимости рассматривать механизмы, действующие внутри организма.

Так, функциональный анализ дает возможность установить точные и обусловленные взаимоотношения между открытым поведением (реакцией) и условиями окружающей среды (стимулами), которые контролируют поведение. Функциональный анализ дает возможность установить причинно-следственные отношения между поведением и окружающей средой. Манипулируя переменными окружающей среды (независимыми переменными - теми, которыми манипулирует экспериментатор), можно предсказывать и измерять поведение человека (зависимую переменную - ту, которая изменяется в результате манипуляции).

Скиннер не принял идею о личности или самости, которая направляет или стимулирует поведение. Он считает, что необходимо отказаться от мысли, что поведение порождается силами, находящимися внутри индивида (чертами, потребностями, мыслями, чувствами), в пользу более научных представлений о силах, лежащих вне человека. Он полагает, что поведение человека регулируется не изнутри, а снаружи - окружающей средой. Изучение личности по Скиннеру -это нахождение своеобразного характера взаимоотношений между поведением организма и результатами этого поведения, которые и подкрепляют его в последствии. Этот подход фокусируется на прогнозировании и контроле наблюдаемого поведения.

Как и Уотсон Скиннер огромное внимание уделял научению, но в отличие от Уотсона главным его интересом было не классическое, а так называемое оперантное научение. При классическом научении организм ассоциирует разные стимулы, при оперантном научении организм ассоциирует свое поведение с последующим результатом. Оперантное научение подчиняется закону эффекта, который был открыт американским психологом Эдвардом Торндаком в конце 19 века. В своих опытах Торндайк использовал так называемые проблемные клетки, в которые он помещал голодных кошек. Что бы выйти из такой проблемной клетки кошке нужно было потянуть за веревку или приподнять крючок. Наблюдая за животными, Торндайк заметил, что, помещенная в проблемную клетку кошка беспорядочно металась по клетке и, в конце концов, случайно задевала веревку или крючок. Однако с каждой следующей попыткой активность животных все больше сосредоточивались вокруг веревки или крючка и после многократных проб кошка научалась выходить из клетки. Такое научение также называется научением методом проб и ошибок. Это научение подчиняется закону эффекта, согласно которому если поведение приводит к желаемому результату (вознаграждается), вероятность его повторения увеличивается.

Для своего подхода к пониманию личности в свою теорию Скиннер добавляет положения о двух видах поведения: респондентное и оперантное поведение.

Респондентное поведение - подразумевает реакцию, вызываемую стимулом. Стимул всегда предшествует реакции.

Выделяют два вида респондентного поведения:1. условно рефлекторное2. безусловно рефлекторное.

psyera.ru

Теория оперантного обусловливания Берреса Скиннера

Психологические понятия - научение, обучение, учение описывают широкий круг явлений, связанных с приобретением опыта, знаний, навыков, умений в процессе активного взаимоотношения субъекта с предметным и социальным миром - в поведении, деятельности, общении.

Когда речь идет о научении, то исследователь имеет в виду такие аспекты этого процесса как:

 - постепенность изменения;

 - роль упражнения;

 - специфику научения по сравнению с врожденными особенностями индивида.

Обычно термины обучение и учение обозначают процесс приобретения индивидуального опыта, а термин "научение" описывает и сам процесс, и его результат. Итак, научение (обучение, учение) - процесс приобретения субъектом новых способов осуществления поведения и деятельности, их фиксации и/или модификации. Изменение психологических структур, которое происходит в результате этого процесса, обеспечивает возможность дальнейшего совершенствования деятельности. Известны классические концепции научения. Это, например, учение И.П. Павлова (1849-1936) об образовании условных рефлексов. В результате одного или нескольких предъявлений индифферентного разграничителя (условного стимула) и следующего за ним безусловного стимула (пищи), который вызывает безусловную, врожденную реакцию (слюноотделение), индифферентный раздражитель сам начинает вызывать реакцию. В процессе установления временной связи безусловный стимул выполняет функцию подкрепления, условный - сигнальное значение, а рефлекс способствует адаптации организма к меняющимся условиям среды. Впервые закономерности научения, установленные экспериментальными методами, были установлены в рамках бихевиоризма. Эти закономерности, или "законы обучения", сформулированы Э. Торндайком и дополнены, а также модифицированы К. Халлом, Э. Толменом и Э. Газри.

Ими являются:

 - Закон готовности: чем сильнее потребность, тем успешнее научение. Закон выводится на основе установления связи между потребностью и научением.

 - Закон эффекта: поведение, которое приводит к полезному действию, вызывает снижение потребности и поэтому будет повторяться.

 - Закон упражнения: при прочих равных условиях повторение определенного действия облегчает совершение поведения и приводит к более быстрому выполнению и снижению вероятности ошибок. Позже Торндайк показал, что не всегда упражнение, повторение способствует упрощению навыка, хотя при моторном научении это фактор является очень важным, способствуя модификации поведения.

 - Закон недавности: лучше заучивается тот материал, который предъявляется в конце серии. Этот закон противоречит эффекту первичности - тенденции к лучшему заучиванию материала, который предъявляется в начале процесса научения. Противоречие устраняется при формулировке закона "эффект края". U-образная зависимость степени заученности материала от его места в процессе научения отражает этот эффект и называется "позиционной кривой".

 - Закон соответствия: существует пропорциональное отношение между вероятностью ответа и вероятностью подкрепления.

Теперь обратимся к теориям научения в психологии личности. Теории исходят из двух положений:

1.   Всякое поведение усваивается в процессе научения.

2.   В целях соблюдения научной строгости при проверке гипотез необходимо соблюдать принцип объективности данных. В качестве переменных, которыми можно манипулировать, выбираются внешние причины (пищевое вознаграждение), в отличие от "внутренних" переменных в психодинамическом направлении (инстинкты, защитные механизмы, Я-концепция), которыми манипулировать нельзя.

В теориях научения (И.П. Павлов) приспособление рассматривается как аналог развития человека. Оно может осуществляется разными путями, например посредством классического обусловливания по Павлову.

При этом были исследованы важные феномены:

 - Генерализация - условная реакция на первоначально нейтральный стимул распространяется и на другие стимулы, похожие на условный раздражитель (страх, возникший на конкретную собаку, затем распространяется на всех собак).

 - Дифференцировка - специфичная реакция на похожие стимулы, которые различаются по степени подкрепления (например, дифференцировка реакций на круг и эллипс).

 - Угашение - разрушение связи между условным стимулом и реакцией, если он не сопровождается подкреплением.

Типичный эксперимент заключался в том, что собаку закрепляли ремнями, ограничивая ее движение, затем включали свет. Через 30 секунд, после того как зажигался свет, в рот собаки клали немного пищи, что вызывало слюноотделение. Сочетание включения света и пищи повторяли несколько раз. Через какое-то время свет, изначально выступавший индифферентным раздражителем, сам по себе начинал вызывать реакцию слюноотделения. Аналогичным образом можно выработать условные оборонительные реакции на первоначально нейтральные стимулы. В первых исследованиях по оборонительному обусловливанию на собаку надевали специальную упряжь, чтобы удерживать ее в станке, а к лапе прикрепляли электроды. Подача электрического тока (безусловный раздражитель) на лапу вызывала отдергивание лапы (безусловный рефлекс), которое было рефлекторной реакцией животного. Если непосредственно перед ударом током несколько раз звонил звонок, то постепенно звук сам по себе был способен вызывать оборонительный рефлекс отдергивания лапы. По терминологии И.П. Павлова, пища (или удар током) были безусловными раздражителями, а свет (или звук) - условным. Слюноотделение (или отдергивание лапы) при появлении пищи (или ударе током) были названо безусловным рефлексом, а слюноотделение на включение света (или отдергивание лапы на звук) - условным. Реакции, которые изучал Павлов, стали называть ответными, или респондентными, поскольку они автоматически возникали вслед за известными стимулами (пищей, ударом тока). Ведущим в модели И.П. Павлова является стимул, манипуляция которым приводит к возникновению новых форм поведения. Итак, классическое обусловливание - это процесс, открытый И.П. Павловым, благодаря которому первоначально нейтральный стимул начинает вызывать реакцию из-за своей ассоциативной связи со стимулом, автоматически порождающим ту же самую или похожую реакцию. Теория, разработанная Б.Ф. Скиннером (1904-1990), носит название теории оперантного обусловливания. Он говорил, что ученый, как и всякий другой организм, является продуктом уникальной истории. Поприще, которое он выберет для себя в качестве предпочтительного, частично будет зависеть от его личной биографии. Интерес к формированию и модификации поведения возник у Скиннера после знакомства с работой И.П. Павлова "Условные рефлексы" и статьей (критической по своей направленности) Бертрана Рассела. Статьи последнего не только не оттолкнули от павловских идей, но, наоборот, усилили их влияние. Скиннер ставил перед собой цель объяснить механизмы научения у человека и животных (крыс и голубей) на основе ограниченного набора базовых принципов. Основная идея состояла в том, чтобы управлять средой, контролировать ее, получая при этом упорядоченные изменения. Он говорил: "Проконтролируйте условия (среду), и вам откроется порядок".

Определение оперантного обусловливания

Процедура обучения получила название - "оперантное обусловливание". Она заключалась в стремлении экспериментатора установить связь между стимулом (S) и реакцией (R) посредством подкрепления - поощрения или наказания. В схеме стимул-реакция (S-R) ключевой для Скиннера была именно реакция. Реакции рассматривались с точки зрения простоты-сложности. Простая - слюноотделение, отдергивание руки; сложная - решение математической задачи, агрессивное поведение. Оперантное обусловливание - это процесс, посредством которого характеристики реакции детерминируются последствиями этой реакции. Далее, Скиннер различал (1) реакции, которые вызываются определенными стимулами (отдергивание руки от горячего предмета) - в этом случае связь стимула и реакции безусловна; и (2) реакции, которые непосредственно не связаны со стимулом. Последние реакции продуцируются самим организмом и называются оперантами. Скиннер считал, что сами по себе стимулы не принуждают индивида реагировать на них. Исходная причина лежит в самом организме. В любом случае поведение происходит без воздействия какого-то специального побуждающего стимула. Осуществление оперантного поведения заложено в биологической природе организма. Научение рассматривалось Скиннером как процесс. Ни один (особенно сложный) оперант не возникает сразу. Процесс представляет собой поощрение оперантного поведения животного. Поощрение или наказание - это подкрепление, или стимул, который следует за реакцией и увеличивает вероятность ее появления. Когда голубь тычет клювом в диск (или крыса нажимает лапой на рычаг) - это оперантное поведение, при котором, если оно сопровождается подкреплением, увеличивается вероятность его повторения. "Оперантное обусловливание формирует поведение так же, как скульптор лепит фигуру из глины. Хотя в какой-то момент скульптор, казалось бы, создает совершенно новый объект, мы всегда можем вернуться назад, в начало процесса, к первоначальной недифференцированной болванке и выделить сколь угодно маленькие шаги, или последовательные этапы, следуя которым можно дойти до нужной кондиции. Ни в какой отдельно взятый момент не может появиться ничего такого, что очень сильно отличалось бы от того, что ему предшествовало… Оперант - это не то, что появляется в поведении уже полностью в готовом виде. Это результат непрерывного процесса формирования" (цит. по: Первин Л., Джон О. Психология личности. Теория и исследования. М., 2000. С.350).

Принципы оперантного обусловливания

Подкрепление является одним из принципов обусловливания. Уже с младенческого возраста, согласно Скиннеру, поведение людей можно регулировать с помощью подкрепляющих стимулов. Существуют два разных вида подкрепления. Некоторые, например еда или устранение боли, называются первичными подкреплениями, т.к. они обладают естественной подкрепляющей силой. Другие подкрепляющие стимулы (улыбка, внимание взрослого, одобрение, похвала) являются обусловленными подкреплениями. Они становятся таковыми в результате частого сочетания с первичными подкреплениями. Оперантное обусловливание опирается в основном на положительное подкрепление, т.е. на такие последствия реакций, которые их поддерживают или усиливают, например, пища, денежное вознаграждение, похвала. Тем не менее Скиннер подчеркивает важность негативного подкрепления, которое приводит к угасанию реакции. Такими подкрепляющими стимулами могут быть физическое наказание, моральное воздействие, психологическое давление. При наказании неприятный стимул следует за реакцией, уменьшая вероятность того, что реакция появится вновь. Скиннер с сожалением замечал, что наказание - "это самая распространенная техника контроля над поведением, применяемая в современном мире. Схема всем известна: если мужчина ведет себя не так, как вам нравится, ударьте его кулаком, если ребенок плохо себя ведет, отшлепайте его, если люди в другой стране плохо себя ведут, сбросьте на них бомбу" (цит. по: Крэйн У. Секреты формирования личности. СПб.: Прайм-Еврознак, 2002. С. 241). Кроме подкрепления, принципом обусловливания является его незамедлительность. Было обнаружено, что в начальной стадии эксперимента можно довести реакцию до наивысшего уровня только в том случае, если подкреплять ее немедленно. Иначе реакция, начавшая было формироваться, быстро угаснет. При оперантном, так же как и при респондентном, обусловливании наблюдается генерализация стимулов. Генерализация - это возникшая в процессе обусловливания ассоциативная связь реакции со стимулами, похожими на те, на которые первоначально был выработан условный рефлекс. Примерами генерализации являются - страх перед всеми собаками, который сформировался вследствие нападения какой-то одной собаки, положительная реакция ребенка (улыбка, произнесение слова "папа", движение на встречу и проч.) на всех мужчин, похожих на его отца. Формирование реакции представляет собой процесс. Реакция не возникает сразу и вдруг, она оформляется постепенно, по мере осуществления ряда подкреплений. Последовательное подкрепление - это выработка сложных действий с помощью подкрепления действий, которые постепенно все больше становятся похожими на ту окончательную форму поведения, которую предполагалось сформировать. Сплошное поведение формируется в процессе подкрепления отдельных элементов поведения, которые в совокупности складываются в сложные действия. Т.е. серия первоначально усвоенных действий в конечной форме воспринимается как целостное поведение. Сам процесс поддерживается так называемым режимом подкрепления. Режим подкрепления - процент и интервал подкрепления реакций. Для исследования режимов подкреплений Скиннер изобрел ящик Скиннера (Skinner box), благодаря которому он наблюдал за поведением животных. Схематически это выглядит так: S1 - R - S2, где S1 - рычаг; R - нажатие на рычаг; S2 - пища (подкрепление). Поведение контролируется при помощи изменения условий среды (или подкрепления). Их, например, можно давать (1) через определенный промежуток времени, независимо от числа реакций; (2) через определенное число реакций (нажатие на рычаг) и др.

Режимы подкрепления

Были выделены такие режимы подкрепления: непрерывное подкрепление - предъявление подкрепления каждый раз, когда субъект дает желаемую реакцию; прерывистое, или частичное, подкрепление. Для более строгой классификации режимов подкрепления было выделено два параметра - временное подкрепление и пропорциональное подкрепление. В первом случае подкрепляют только тогда, когда истек срок, в течение которого необходимо было выполнить соответствующую деятельность, во втором подкрепляют за объем той работы (количество действий), которая должна была быть произведена.

На основе двух параметров были описаны четыре режима подкрепления:

1.   Режим подкрепления с постоянным соотношением. Подкрепление осуществляется в соответствии с установленным количеством (объемом) реакций. Примером такого режима может быть оплата труда за определенный, постоянный объем работ. Например, оплата труда переводчику за количество переведенных знаков, или машинистке за количество напечатанного материала.

2.   Режим подкрепления с постоянным интервалом. Подкрепление производится только тогда, когда твердо установленный, фиксированный временной интервал истек. Например, ежемесячная, понедельная, почасовая оплата, отдых после жестко установленного времени физической или умственной работы.

3.   Режим подкрепления с вариативным соотношением. В этом режиме организм подкрепляется на основе какого-то в среднем предопределенного числа реакций. Так, покупка лотерейных билетов может быть примером работы такого режима подкрепления. В данном случае покупка билета означает, что с какой-то вероятностью может выпасть выигрыш. Вероятность возрастает, если покупается не один, а несколько билетов. Однако результат в принципе мало предсказуем и непостоянен, и человеку редко удается вернуть вложенные в покупку билетов деньги. Тем не менее неопределенность результата и ожидание большого выигрыша приводят к очень медленному затуханию реакции и угасанию поведения.

4.   Режим подкрепления с вариативным интервалом. Индивид получает подкрепление после того, как проходит неопределенный интервал. Подобно режиму подкрепления с постоянным интервалом, в этом случае подкрепление зависит от времени. Интервал времени произволен. Короткие интервалы, как правило, порождают высокую скорость реагирования, а длинные - низкую. Такой режим применяется в учебном процессе, когда оценка уровня достижений производится нерегулярно.

Скиннер говорил об индивидуальности подкреплений, о вариативности развития того или иного навыка у разных людей, а также у разных животных. Более того, само подкрепление носит уникальный характер, т.к. уверенно нельзя сказать, что у данного человека или животного может выступать в качестве подкрепления.

Рост и развитие личности

По мере того, как ребенок развивается, его реакции усваиваются и остаются под контролем подкрепляющих воздействий со стороны окружающей среды. В виде подкрепляющих воздействий выступают - пища, похвала, эмоциональная поддержка и др. Эта же идея излагается Скиннером в книге "Вербальное поведение" (1957). Он считает, что овладение речью происходит по общим законам оперантного обусловливания. Ребенок получает подкрепление при произнесении определенных звуков. Подкреплением служит не пища или вода, а одобрение и поддержка взрослых. С критическими замечаниями в адрес концепции Скиннера выступил в 1959 г. известный американский лингвист Н. Хомский. Он отрицал особую роль подкрепления в ходе овладения речью и критиковал Скиннера за пренебрежение синтаксическими правилами, которые играют роль в осознании человеком языковых конструкций. Он считал, что обучение правилам не требует особого учебного процесса, а совершается благодаря врожденному, специфическому речевому механизму, который называется "механизмом овладения речью". Таким образом, овладение речью происходит не в результате научения, а посредством естественного развития.

Психопатология

С точки зрения психологии научения нет необходимости искать объяснение симптомов болезни в скрытых глубинных причинах. Патология, согласно бихевиоризму, не недуг, а либо (1) результат неусвоенной реакции, либо (2) усвоенная неадаптивная реакция.

(1) Неусвоенная реакция или поведенческий дефицит возникает в результате отсутствия подкрепления при формировании необходимых навыков и умений. Депрессия также рассматривается как результат отсутствия подкрепления для формирования или даже поддержания необходимых реакций.

(2) Неадаптивная реакция - результат усвоения действия, неприемлемого для общества, не соответствующего нормам поведения. Такое поведение возникает как следствие подкрепления нежелательной реакции, либо в результате случайного совпадения реакции и подкрепления.

Изменение поведения также построено на принципах оперантного обусловливания, на системе модификации поведения и сопряженных с ним подкреплений. А. Изменение поведения может происходить вследствие самоконтроля.

Самоконтроль включает в себя две взаимозависимые реакции:

1.   Контролирующая реакция, которая воздействует на среду, изменяя вероятность возникновения вторичных реакций ("уход" чтобы не выразить "гнев"; удаление пищи, чтобы отвыкнуть от переедания).

2.   Контролирующая реакция, направленная на наличие в ситуации стимулов, которые могут сделать желательное поведение более вероятным (наличие стола для осуществления учебного процесса).

Б. Изменение поведения может происходить и вследствие осуществления поведенческого консультирования. Во многом этот тип консультирования базируется на принципах научения. Вольпе (Wolpe) определяет терапию поведения как терапию обусловливания, подразумевающую использование сформулированных в процессе экспериментирования принципов научения с целью изменения неадекватного поведения. Неадекватные привычки ослабляются и устраняются; адаптивные привычки, напротив, вводятся и усиливаются.

Цели консультирования:

 - 1) Изменение неадекватного поведения.

 - 2) Научение принятию решения.

 - 3) Предотвращение проблем путем антиципации результатов поведения.

 - 4) Устранение дефицита в поведенческом репертуаре.

Этапы консультирования:

 - 1) Поведенческая оценка, сбор информации о приобретенных действиях.

 - 2) Процедуры релаксации (мышечная, вербальная и т.д.).

 - 3) Систематическая десенсибилизация - связь расслабления с образом, вызывающим тревогу.

 - 4) Тренинг ассертивности

 - 5) Процедуры подкрепления.

Достоинства и недостатки теорий научения

Достоинства:

1.   Стремление к строгой проверке гипотез, эксперименту, контролю дополнительных переменных.

2.   Признание роли ситуативных переменных, параметров среды и их систематическое изучение.

3.   Прагматический подход к терапии позволил создать важные процедуры для изменения поведения.

Недостатки:

1.   Редукционизм - сведение принципов поведения, полученных на животных, к анализу поведения человека.

2.   Низкая внешняя валидность вызвана проведением экспериментов в лабораторных условиях, результаты которых трудно перенести в естественные условия.

3.   Игнорирование когнитивных процессов при анализе S-R связей.

4.   Большой разрыв между теорией и практикой.

5.   Поведенческая теория не дает стабильных результатов.



biofile.ru

Оперантный бихевиоризм Б. Скиннера | Учеба-Легко.РФ

Отдельную линию в развитии бихевиоризма представляет система взглядов Б. Скиннера. Беррес Фредерик Скиннер (1904-1990) выдвинултеорию оперантного бихевиоризма,

Основываясь на экспериментальных исследованиях и теоретическом анализе поведения животных, он сформулировал положение о трех видах поведения: безусловно-рефлекторном, условно-рефлекторном иоперантном. Последнее и составляет специфику учения Б. Скиннера.

Первые два вида вызываются стимулами (5) и называютсяреспондентным, отвечающим поведением. Это реакции обусловливания типа S. Они составляют определенную часть репертуара поведения, но ими одними не обеспечивается адаптация к реальной среде обитания. Реально процесс приспособления строится на основе активных проб — воздействий организма на окружающий мир. Некоторые из них случайно могут приводить к полезному результату, который в силу этого закрепляется. Часть из таких реакций (R), не вызываемых стимулом, а выделяемых («испускаемых») организмом, оказывается правильными и подкрепляются. Их Скиннер и назвал оперантными. Это реакции типа R.

Оперантное поведение предполагает, что организм активно воздействует на окружение и в зависимости от результатов этих активных действий они закрепляются или отвергаются. По Скиннеру, именно эти реакции — преобладающие в адаптации животного: они являются формой произвольного поведения. Катание на роликовой доске, игра на фортепиано, обучение письму — это все примеры оперантных действий человека, контролируемых их последствиями. Если последние благоприятны для организма, тогда вероятность повторения оперантной реакции усиливается.

Проанализировав поведение, Скиннер сформулировал свою теорию научения. Главным средством формирования нового поведения выступает подкрепление. Вся процедура научения у животных получила название «последовательного наведения на нужную реакцию».

Скиннер выделяет четыре режима подкрепления:

1. Режим подкрепления с постоянным соотношением, когда уровень положительного подкрепления зависит от количества правильно выполненных действий. (Например, работнику платят пропорционально количеству произведенной продукции, т. е. чем чаще возникает правильная реакция организма, тем больше подкреплений он получает.)

2. Режим подкрепления с постоянным интервалом, когда организм получает подкрепление после того, как пройдет строго фиксированное время с момента предыдущего подкрепления. (Например, работнику платят зарплату через каждый месяц или у студента сессия через каждые четыре месяца, при этом скорость реагирования ухудшается сразу после получения подкрепления — ведь следующая зарплата или сессия будет еще не скоро.)

3. Режим подкрепления с вариативным соотношением. (Например, выигрыш-подкрепление в азартной игре бывает непредсказуем, непостоянен, человек не знает, когда и каким будет следующее подкрепление, но всякий раз надеется на выигрыш — такой режим значимо воздействует на поведение человека.)

4. Режим подкрепления с вариативным интервалом. (Через неопределенные интервалы времени человек получает подкрепления или знания студента контролируют с помощью «неожиданных контрольных» через случайные промежутки времени, что побуждает соблюдать более высокий уровень прилежания и реагирования в отличие от подкрепления с «постоянным интервалом».)

Скиннер выделял «первичные подкрепления» (пища, вода, физический комфорт, секс) и вторичные, или условные (деньги, внимание, хорошие оценки, привязанность и т. п.). Вторичные подкрепления генерализуются, объединяются со многими первичными: например, деньги являются средством для получения множества удовольствий. Еще более сильным генерализованным условным подкреплением является социальное одобрение: ради его получения со стороны родителей, окружающих человек стремится хорошо себя вести, соблюдать социальные нормы, прилежно учиться, делать карьеру, красиво выглядеть и т. п.

Ученый полагал, что условные подкрепляющие стимулы очень важны в контроле поведения человека, а аверсивные (болевые или неприятные) стимулы, наказание — это наиболее общий метод контроля над поведением. Скиннер выделял позитивные и негативные подкрепления, а также позитивные и негативные наказания (табл. 5.2).

Таблица 5.2

Теория Б. Скиннера

 

Позитивное

Негативное

Подкрепление

Предъявление положительного подкрепления (удовольствие)

Удаление аверсивного (болевого) стимула

Наказание

Предъявление аверсивного стимула (ругают, бьют, исключают из школы, сажают в тюрьму и т. п.)

Удаление положительного стимула (запрещают смотреть телевизор, гулять и т. п.)

Скиннер боролся против того, чтобы использовать наказание для контроля над поведением, потому что это вызывает отрицательные эмоциональные и социальные побочные эффекты (страх, тревогу, антисоциальные действия, ложь, потерю самоуважения и уверенности). Кроме того, оно всего лишь на время подавляет нежелательное поведение, которое вновь проявится, если уменьшится вероятность наказания.

Вместо аверсивного контроля Скиннер рекомендует позитивное подкрепление как наиболее эффективный метод для устранения нежелательных и поощрения желательных реакций. «Метод успешного приближения или формирования поведения» заключается в положительном подкреплении тех действий, которые наиболее близки к ожидаемому оперантному поведению. К этому приближаются шаг за шагом: одна реакция закрепляется, а затем заменяется другой, более близкой к предпочтительной (так формируют речь, трудовые навыки и т. п.).

Данные, полученные при изучении поведения животных, Скиннер перенес на поведение людей, что привело к биологизаторской трактовке. Так, возник скиннеровский вариант программированного обучения. Его принципиальная ограниченность состоит в сведении обучения к набору внешних актов поведения и подкреплению правильных из них. При этом игнорируется внутренняя познавательная деятельность человека, следовательно, нет обучения как сознательного процесса. Вслед за установкой уотсоновского бихевиоризма Скиннер исключает внутренний мир человека, его сознание из поведения и производит бихевиоризацию психики. Мышление, память, мотивы и тому подобные психические процессы он описывает в терминах реакции и подкрепления, а человека — как реактивное существо, подвергающееся воздействиям внешних обстоятельств.

Биологизация мира людей, характерная для бихевиоризма в целом, принципиально не проводящего различий между человеком и животным, достигает у Скиннера своих пределов. Культурные явления оказываются в его трактовке «хитроумно придуманными подкреплениями».

Для разрешения социальных проблем современного общества Б. Скиннер выдвинул задачу создания технологии поведения, которая призвана осуществлять контроль одних людей над другими. Поскольку намерения, желания, самосознание человека не принимаются во внимание, управление поведением не связано с сознанием. Таким средством выступает контроль за режимом подкреплений, позволяющий манипулировать людьми. Для наибольшей эффективности необходимо учитывать, какое подкрепление наиболее важно, значимо, ценно в данный момент (закон субъективной ценности подкрепления), а затем предоставлять такое субъективно ценное подкрепление в случае правильного поведения человека или угрожать его лишением в случае неправильного поведения. Подобный механизм и позволит управлять поведением.

Скиннер сформулировал закон оперантного обусловливания:«поведение живых существ полностью определяется последствиями, к которым оно приводит. В зависимости от того, будут ли эти последствия приятными, безразличными или неприятными, живой организм проявит тенденцию повторять данный поведенческий акт, не придавать ему никакого значения или же избегать его повторения в дальнейшем». Человек способен предвидеть возможные последствия своего поведения и избегать тех действий и ситуаций, которые приведут к негативным для него последствиям. Он субъективно оценивает вероятность их наступления: чем больше возможность негативных последствий, тем сильнее это влияет на поведение человека (закон субъективной оценки вероятности последствий). Эта субъективная оценка может не совпадать с объективной вероятностью последствий, но на поведение влияет именно она. Поэтому один из способов воздействовать на поведение человека — «нагнетание обстановки», «запугивание», «преувеличение вероятности негативных последствий». Если человеку кажется, что последняя, вытекающая из какой-либо его реакции, незначительна, он готов «рискнуть» и прибегнуть к данному действию.

uclg.ru


Смотрите также