No condicionamento operante, um animal aprende a realizar um determinado comportamento com mais frequência sendo recompensado por isso. Quando punido, ele se comporta com menos frequência. 

Condicionamento operante simplesmente explicado  

O condicionamento operante é uma teoria de aprendizagem bem conhecida do behaviorismo 

Trata-se de fazer uma pessoa ou animal realizar um determinado comportamento mais ou menos recompensando ou punindo . 

Por exemplo, você vai fazer compras para uma senhora idosa (comportamento) e ela lhe agradece depois com uma barra de chocolate (consequência/recompensa agradável). Isso fará com que você faça compras para ela novamente na próxima semana. Mas se você levar as compras para a mulher e ela reclamar que você esqueceu alguma coisa (consequência/punição desagradável), então você provavelmente não fará mais nada por ela. 

Portanto, se um comportamento tiver uma consequência agradável , ele será mostrado com mais frequência. Se tiver uma consequência desagradável , será exibido com menos frequência. Isso também funciona quando um comportamento interrompe uma consequência desagradável (recompensa) ou uma consequência agradável desaparece (punição). Isso é condicionamento operante. 

A definição de condicionamento operante é a seguinte: 

Definição de condicionamento operante  

No condicionamento operante , a frequência de ocorrência de um comportamento é influenciada. Os comportamentos desejados são recompensados ​​por consequências agradáveis ​​(reforço positivo) ou pela ausência de consequências desagradáveis ​​(reforço negativo). Comportamentos indesejáveis ​​são suprimidos por consequências desagradáveis ​​(punição positiva) ou pela ausência de consequências agradáveis ​​(punição negativa). 

amplificador 

No condicionamento operante, existem quatro maneiras de reforçar ou punir um comportamento. Como resultado, um indivíduo é condicionado a exibir um comportamento com mais ou menos frequência. perceber

Os seguintes termos têm esse significado no contexto do condicionamento operante:

  • Positivo = Presente ≠ Agradável       
  • Negativo = Ausente ≠ Desconfortável
  • Consequência agradável = Apetite ≠ Positivo
  • Consequência desagradável = aversiva ≠ negativa

Abaixo, examinamos mais de perto as quatro possíveis consequências de um comportamento: 

reforço

No caso de reforço  ,  um comportamento desejado deve ser mostrado com mais frequência. Para conseguir isso, você tem duas opções no condicionamento operante.

Reforço positivo: você recompensa o comportamento desejado com uma consequência agradável , por exemplo, dando dinheiro ou comida ao indivíduo. Mas o respeito e o reconhecimento também podem atuar como reforçadores positivos. 

Reforço negativo : você recompensa um comportamento desejado evitando as consequências aversivas quando o comportamento é realizado. Por exemplo, você remove ruído extremo ou luz brilhante do indivíduo. 

punição

Com uma punição  você  quer suprimir o comportamento indesejado . Novamente, você tem duas opções aqui.

Punição Positiva : Você pode punir o comportamento indesejado seguindo esse comportamento com uma consequência desagradável. Por exemplo, o indivíduo é exposto a ruído extremo ou uma criança é aterrada. 

Punição negativa : Você também pode suprimir o comportamento indesejado por não ter uma consequência agradável do comportamento. Por exemplo, você pode tirar comida do indivíduo ou parar de recebê-lo.

esquema de contingência

Você pode representar as quatro possíveis consequências do condicionamento operante usando o chamado esquema de contingência. 

Origem do Condicionamento Clássico: Lei do efeito 

A ideia de condicionamento operante remonta à Lei do Efeito de Edward Lee Thorndike. Descreve que quando as ações ocorrem aleatoriamente, as ações que têm consequências positivas são mostradas com mais frequência. 

Exemplo: Skinner Box (Burrhus Frederic Skinner) 

Brrrhus Frederic Skinner adotou a lei do efeito e desenvolveu o condicionamento operante a partir dela. Para isso ele projetou o chamado Skinnerbox.

A caixa do esfolador é uma gaiola que mais tarde contém um rato. Há uma alavanca na gaiola que o rato pode pressionar. Há também um dispositivo de alimentação, uma lâmpada e um piso que pode ser eletrificado. 

Agora Skinner fez vários experimentos. Vamos dar uma olhada mais de perto nestes. 

  1. Reforço positivo : o rato recebe comida (consequência agradável) sempre que puxa a alavanca (comportamento). Como resultado, ela exibe o comportamento com mais frequência.
  2. Reforço negativo : o chão da gaiola do rato é constantemente eletrificado. Se o rato agora pressiona a alavanca (comportamento), a eletricidade acaba (resultados desagradáveis ​​permanecem). Ela se comporta assim com mais frequência. 
  3. Punição Positiva : O rato é eletrocutado (Consequência Desagradável) sempre que pressiona a alavanca (Comportamento). Como resultado, ela exibe o comportamento com menos frequência. 
  4. Punição Negativa : Skinner não implementou a quarta possibilidade, caso em que a comida sempre seria tirada do rato (sem consequência agradável) se ele pressionasse a alavanca (comportamento). Ela então evita o comportamento. 

Na etapa seguinte, ele ensinou a um rato que ele só recebe comida (consequência agradável) se pressionar a alavanca (comportamento) enquanto a lâmpada da gaiola estiver acesa (estímulo). Você também pode vincular um comportamento a uma operação ou situação específica. 

A caixa de Skinner é um exemplo importante de condicionamento operante, agora vamos ver o que você deve saber sobre reforçadores no condicionamento operante em geral.

Ocorrência temporal dos reforçadores 

Em princípio, os amplificadores podem ocorrer com frequência variável. Uma programação de repetidor é frequentemente usada. Você pode distinguir entre os seguintes métodos. 

Amplificadores Contínuos / Amplificadores Sempre:

Cada vez que o comportamento desejado ocorre, você o recompensa. Com esse tipo de reforço, o indivíduo aprende rapidamente e exibe o comportamento com frequência. No entanto, ele também desaprende novamente com a mesma rapidez.

Exemplo : Você é elogiado por tudo que faz em casa. 

Reforço Intermitente / Às vezes Reforço / Reforço Parcial: 

Aqui o comportamento é apenas ocasionalmente reforçado. Como resultado, a aprendizagem operante leva mais tempo, mas também é mais sustentável. O comportamento desejado é mostrado com mais frequência a longo prazo. 

Exemplo : Você diz a um cozinheiro que a comida estava particularmente saborosa hoje. 

human body sculpture

Você pode dividir o reforço intermitente em:

  • Cota Boost : Por exemplo, a obsolescência desejada é aumentada a cada 10 vezes.
  • Reforço de intervalo : é reforçado três vezes por hora, por exemplo, então se você elogiar o indivíduo três vezes nos primeiros dez minutos, deve parar de elogiá-lo pelos 50 minutos restantes.

tipos de amplificadores

Vários objetos e ações podem servir como amplificadores. Você pode distinguir entre o seguinte no condicionamento operante:

  • Reforçadores primários : Satisfazem necessidades fisiológicas, como comida ou bebida.
  • Reforçadores Secundários : Não são essenciais à vida. Você já aprendeu que são desejáveis ​​como elogios, boas notas, permissão ou autoridade para fazer algo.
  • Reforçadores materiais : Isso inclui todos os objetos que estão associados a despesas materiais, como flores e chocolate, mas também dinheiro e salário. 
  • Action Enhancer: Você recompensa com uma atividade prazerosa, como ir ao cinema ou fazer outras atividades de lazer.
  • Reforçadores Sociais : Recompensados ​​pelo contato interpessoal agradável, como elogios, aplausos, sorrisos ou aprovação. 

Como você acabou de ver, um amplificador pode pertencer a várias categorias. 

eficácia dos amplificadores

Os amplificadores individuais possíveis têm efeitos diferentes. Ou seja, com um reforçador, um indivíduo aprende o comportamento mais rapidamente do que com outro reforçador. A eficácia do potenciador de condicionamento operante depende de: 

  • Pessoa (por exemplo, um amante de chocolate fica mais feliz com uma barra de chocolate do que alguém que não gosta de doces)
  • Situação (por exemplo, se você acabou de receber uma barra de chocolate como recompensa, você está muito menos feliz com uma segunda)
  • Cultura e socialização (por exemplo, prestígio e riqueza são vistos de forma diferente em diferentes culturas e em diferentes classes sociais)
  • Elogie a pessoa  (por exemplo, você fica mais feliz quando é elogiado pelo seu treinador do que quando alguém com menos experiência elogia você)
  • Tempo (por exemplo, se você receber uma barra de chocolate por um determinado comportamento, vale mais se você a receber imediatamente após o comportamento do que se for entregue a você um ano depois)

aprendendo através da punição 

Quando você quer que um comportamento indesejado ocorra com menos frequência ou não ocorra, você usa o condicionamento operante para puni-lo. Isso não reforça o comportamento que você deseja, apenas reduz o comportamento que você não deseja . Esse comportamento, portanto, não é mais mostrado no curto prazo e é suprimido . A longo prazo, no entanto, é provável que se repita. 

extinção e recuperação espontânea

Uma vez que um comportamento é aprendido, muitas vezes falta a recompensa. Mas isso leva à extinção (= deleção ) do comportamento. Isso significa que você ” desaprende ” o comportamento que aprendeu. Como resultado, o comportamento desejado é mostrado com menos frequência se não for mais recompensado.

No entanto, também é possível que o comportamento ocorra excessivamente no início sem reforço porque as consequências agradáveis ​​são exigidas com tanta impaciência. Depois de um tempo, no entanto, isso também diminui e o comportamento não é mais mostrado intencionalmente. 

Outra maneira pela qual um indivíduo pode perceber a falta de um reforçador é interpretando-o como punição. Como resultado, o comportamento é “desaprendido” ainda mais rapidamente.

Independentemente de como a extinção ocorra, esse fenômeno ocorre frequentemente: depois de um tempo, o comportamento é simplesmente repetido espontaneamente e sem motivo, sem ser reforçado novamente. Mas depois diminui novamente. Isso é o que você chama de recuperação espontânea . 

Modelagem

O condicionamento operante é usado na chamada modelagem . Com isso, você quer dizer a abordagem gradual de um comportamento desejado e mais complexo. O método é frequentemente usado no treinamento de animais.

Por exemplo, você pode usar a modelagem para ensinar ao seu cavalo que, quando você o chamar, ele virá até você de uma distância maior. Para fazer isso, você primeiro fica a apenas um metro de distância do cavalo e o chama. Quando vem, você elogia. Faça isso algumas vezes até que sempre vá para você. Em seguida, recue um pouco mais e faça o mesmo. Aumente gradualmente a distância ao longo do tempo. Agora você só elogia o cavalo quando se trata de você a grande distância. 

Delimitação do condicionamento instrumental 

O condicionamento instrumental é muitas vezes equiparado ao condicionamento operante e os termos são usados ​​de forma intercambiável. No entanto, eles podem ser distinguidos um do outro. 

Ambos os condicionamentos resultam em um comportamento exibido com mais frequência quando é reforçado por consequências agradáveis. 

No condicionamento instrumental , um determinado comportamento é visto como um meio (=instrumento) para atingir um objetivo. Um indivíduo, portanto, apresenta um determinado comportamento porque deseja alcançar algo com ele (objetivo/intenção). Com o comportamento pode ser bem sucedido e atingir o objetivo, ou não. Se tiver sucesso em um comportamento, ele repetirá o comportamento, se não, tentará outro comportamento para atingir o objetivo. Assim, o sucesso do comportamento em si atua como um reforçador. 

Por exemplo, uma pessoa quer ser admirada (objetivo). Para conseguir isso, ela se gaba (comportamento). Se ela agora recebe a admiração que deseja (consequência agradável), então seu comportamento foi bem-sucedido e ela está repetindo o comportamento. 

Assim, o comportamento no condicionamento instrumental é direcionado a um objetivo . No condicionamento operante, um comportamento é exibido  aleatoriamente que é então recompensado externamente.

Diferença entre condicionamento clássico e operante

Além do condicionamento operante, o condicionamento clássico também é uma das mais importantes teorias de aprendizagem do behaviorismo. 

No condicionamento operante , o foco está em recompensar ou punir o comportamento desejado ou indesejado.

O condicionamento clássico ensina um indivíduo a mostrar um determinado comportamento (=reação) em resposta a um determinado sinal (=estímulo).  

No condicionamento operante você age após um determinado comportamento, no condicionamento clássico você dá um sinal para um determinado comportamento de antemão.