No condicionamento operante, um animal aprende a realizar um determinado comportamento com mais frequência sendo recompensado por isso. Quando punido, ele se comporta com menos frequência.
Condicionamento operante simplesmente explicado
O condicionamento operante é uma teoria de aprendizagem bem conhecida do behaviorismo .
Trata-se de fazer uma pessoa ou animal realizar um determinado comportamento mais ou menos recompensando ou punindo .
Por exemplo, você vai fazer compras para uma senhora idosa (comportamento) e ela lhe agradece depois com uma barra de chocolate (consequência/recompensa agradável). Isso fará com que você faça compras para ela novamente na próxima semana. Mas se você levar as compras para a mulher e ela reclamar que você esqueceu alguma coisa (consequência/punição desagradável), então você provavelmente não fará mais nada por ela.
Portanto, se um comportamento tiver uma consequência agradável , ele será mostrado com mais frequência. Se tiver uma consequência desagradável , será exibido com menos frequência. Isso também funciona quando um comportamento interrompe uma consequência desagradável (recompensa) ou uma consequência agradável desaparece (punição). Isso é condicionamento operante.
A definição de condicionamento operante é a seguinte:
Definição de condicionamento operante
No condicionamento operante , a frequência de ocorrência de um comportamento é influenciada. Os comportamentos desejados são recompensados por consequências agradáveis (reforço positivo) ou pela ausência de consequências desagradáveis (reforço negativo). Comportamentos indesejáveis são suprimidos por consequências desagradáveis (punição positiva) ou pela ausência de consequências agradáveis (punição negativa).
amplificador
No condicionamento operante, existem quatro maneiras de reforçar ou punir um comportamento. Como resultado, um indivíduo é condicionado a exibir um comportamento com mais ou menos frequência. perceber
Os seguintes termos têm esse significado no contexto do condicionamento operante:
- Positivo = Presente ≠ Agradável
- Negativo = Ausente ≠ Desconfortável
- Consequência agradável = Apetite ≠ Positivo
- Consequência desagradável = aversiva ≠ negativa
Abaixo, examinamos mais de perto as quatro possíveis consequências de um comportamento:
reforço
No caso de reforço , um comportamento desejado deve ser mostrado com mais frequência. Para conseguir isso, você tem duas opções no condicionamento operante.
Reforço positivo: você recompensa o comportamento desejado com uma consequência agradável , por exemplo, dando dinheiro ou comida ao indivíduo. Mas o respeito e o reconhecimento também podem atuar como reforçadores positivos.
Reforço negativo : você recompensa um comportamento desejado evitando as consequências aversivas quando o comportamento é realizado. Por exemplo, você remove ruído extremo ou luz brilhante do indivíduo.
punição
Com uma punição você quer suprimir o comportamento indesejado . Novamente, você tem duas opções aqui.
Punição Positiva : Você pode punir o comportamento indesejado seguindo esse comportamento com uma consequência desagradável. Por exemplo, o indivíduo é exposto a ruído extremo ou uma criança é aterrada.
Punição negativa : Você também pode suprimir o comportamento indesejado por não ter uma consequência agradável do comportamento. Por exemplo, você pode tirar comida do indivíduo ou parar de recebê-lo.
esquema de contingência
Você pode representar as quatro possíveis consequências do condicionamento operante usando o chamado esquema de contingência.
Origem do Condicionamento Clássico: Lei do efeito
A ideia de condicionamento operante remonta à Lei do Efeito de Edward Lee Thorndike. Descreve que quando as ações ocorrem aleatoriamente, as ações que têm consequências positivas são mostradas com mais frequência.
Exemplo: Skinner Box (Burrhus Frederic Skinner)
Brrrhus Frederic Skinner adotou a lei do efeito e desenvolveu o condicionamento operante a partir dela. Para isso ele projetou o chamado Skinnerbox.
A caixa do esfolador é uma gaiola que mais tarde contém um rato. Há uma alavanca na gaiola que o rato pode pressionar. Há também um dispositivo de alimentação, uma lâmpada e um piso que pode ser eletrificado.
Agora Skinner fez vários experimentos. Vamos dar uma olhada mais de perto nestes.
- Reforço positivo : o rato recebe comida (consequência agradável) sempre que puxa a alavanca (comportamento). Como resultado, ela exibe o comportamento com mais frequência.
- Reforço negativo : o chão da gaiola do rato é constantemente eletrificado. Se o rato agora pressiona a alavanca (comportamento), a eletricidade acaba (resultados desagradáveis permanecem). Ela se comporta assim com mais frequência.
- Punição Positiva : O rato é eletrocutado (Consequência Desagradável) sempre que pressiona a alavanca (Comportamento). Como resultado, ela exibe o comportamento com menos frequência.
- Punição Negativa : Skinner não implementou a quarta possibilidade, caso em que a comida sempre seria tirada do rato (sem consequência agradável) se ele pressionasse a alavanca (comportamento). Ela então evita o comportamento.
Na etapa seguinte, ele ensinou a um rato que ele só recebe comida (consequência agradável) se pressionar a alavanca (comportamento) enquanto a lâmpada da gaiola estiver acesa (estímulo). Você também pode vincular um comportamento a uma operação ou situação específica.
A caixa de Skinner é um exemplo importante de condicionamento operante, agora vamos ver o que você deve saber sobre reforçadores no condicionamento operante em geral.
Ocorrência temporal dos reforçadores
Em princípio, os amplificadores podem ocorrer com frequência variável. Uma programação de repetidor é frequentemente usada. Você pode distinguir entre os seguintes métodos.
Amplificadores Contínuos / Amplificadores Sempre:
Cada vez que o comportamento desejado ocorre, você o recompensa. Com esse tipo de reforço, o indivíduo aprende rapidamente e exibe o comportamento com frequência. No entanto, ele também desaprende novamente com a mesma rapidez.
Exemplo : Você é elogiado por tudo que faz em casa.
Reforço Intermitente / Às vezes Reforço / Reforço Parcial:
Aqui o comportamento é apenas ocasionalmente reforçado. Como resultado, a aprendizagem operante leva mais tempo, mas também é mais sustentável. O comportamento desejado é mostrado com mais frequência a longo prazo.
Exemplo : Você diz a um cozinheiro que a comida estava particularmente saborosa hoje.
Você pode dividir o reforço intermitente em:
- Cota Boost : Por exemplo, a obsolescência desejada é aumentada a cada 10 vezes.
- Reforço de intervalo : é reforçado três vezes por hora, por exemplo, então se você elogiar o indivíduo três vezes nos primeiros dez minutos, deve parar de elogiá-lo pelos 50 minutos restantes.
tipos de amplificadores
Vários objetos e ações podem servir como amplificadores. Você pode distinguir entre o seguinte no condicionamento operante:
- Reforçadores primários : Satisfazem necessidades fisiológicas, como comida ou bebida.
- Reforçadores Secundários : Não são essenciais à vida. Você já aprendeu que são desejáveis como elogios, boas notas, permissão ou autoridade para fazer algo.
- Reforçadores materiais : Isso inclui todos os objetos que estão associados a despesas materiais, como flores e chocolate, mas também dinheiro e salário.
- Action Enhancer: Você recompensa com uma atividade prazerosa, como ir ao cinema ou fazer outras atividades de lazer.
- Reforçadores Sociais : Recompensados pelo contato interpessoal agradável, como elogios, aplausos, sorrisos ou aprovação.
Como você acabou de ver, um amplificador pode pertencer a várias categorias.
eficácia dos amplificadores
Os amplificadores individuais possíveis têm efeitos diferentes. Ou seja, com um reforçador, um indivíduo aprende o comportamento mais rapidamente do que com outro reforçador. A eficácia do potenciador de condicionamento operante depende de:
- Pessoa (por exemplo, um amante de chocolate fica mais feliz com uma barra de chocolate do que alguém que não gosta de doces)
- Situação (por exemplo, se você acabou de receber uma barra de chocolate como recompensa, você está muito menos feliz com uma segunda)
- Cultura e socialização (por exemplo, prestígio e riqueza são vistos de forma diferente em diferentes culturas e em diferentes classes sociais)
- Elogie a pessoa (por exemplo, você fica mais feliz quando é elogiado pelo seu treinador do que quando alguém com menos experiência elogia você)
- Tempo (por exemplo, se você receber uma barra de chocolate por um determinado comportamento, vale mais se você a receber imediatamente após o comportamento do que se for entregue a você um ano depois)
aprendendo através da punição
Quando você quer que um comportamento indesejado ocorra com menos frequência ou não ocorra, você usa o condicionamento operante para puni-lo. Isso não reforça o comportamento que você deseja, apenas reduz o comportamento que você não deseja . Esse comportamento, portanto, não é mais mostrado no curto prazo e é suprimido . A longo prazo, no entanto, é provável que se repita.
extinção e recuperação espontânea
Uma vez que um comportamento é aprendido, muitas vezes falta a recompensa. Mas isso leva à extinção (= deleção ) do comportamento. Isso significa que você ” desaprende ” o comportamento que aprendeu. Como resultado, o comportamento desejado é mostrado com menos frequência se não for mais recompensado.
No entanto, também é possível que o comportamento ocorra excessivamente no início sem reforço porque as consequências agradáveis são exigidas com tanta impaciência. Depois de um tempo, no entanto, isso também diminui e o comportamento não é mais mostrado intencionalmente.
Outra maneira pela qual um indivíduo pode perceber a falta de um reforçador é interpretando-o como punição. Como resultado, o comportamento é “desaprendido” ainda mais rapidamente.
Independentemente de como a extinção ocorra, esse fenômeno ocorre frequentemente: depois de um tempo, o comportamento é simplesmente repetido espontaneamente e sem motivo, sem ser reforçado novamente. Mas depois diminui novamente. Isso é o que você chama de recuperação espontânea .
Modelagem
O condicionamento operante é usado na chamada modelagem . Com isso, você quer dizer a abordagem gradual de um comportamento desejado e mais complexo. O método é frequentemente usado no treinamento de animais.
Por exemplo, você pode usar a modelagem para ensinar ao seu cavalo que, quando você o chamar, ele virá até você de uma distância maior. Para fazer isso, você primeiro fica a apenas um metro de distância do cavalo e o chama. Quando vem, você elogia. Faça isso algumas vezes até que sempre vá para você. Em seguida, recue um pouco mais e faça o mesmo. Aumente gradualmente a distância ao longo do tempo. Agora você só elogia o cavalo quando se trata de você a grande distância.
Delimitação do condicionamento instrumental
O condicionamento instrumental é muitas vezes equiparado ao condicionamento operante e os termos são usados de forma intercambiável. No entanto, eles podem ser distinguidos um do outro.
Ambos os condicionamentos resultam em um comportamento exibido com mais frequência quando é reforçado por consequências agradáveis.
No condicionamento instrumental , um determinado comportamento é visto como um meio (=instrumento) para atingir um objetivo. Um indivíduo, portanto, apresenta um determinado comportamento porque deseja alcançar algo com ele (objetivo/intenção). Com o comportamento pode ser bem sucedido e atingir o objetivo, ou não. Se tiver sucesso em um comportamento, ele repetirá o comportamento, se não, tentará outro comportamento para atingir o objetivo. Assim, o sucesso do comportamento em si atua como um reforçador.
Por exemplo, uma pessoa quer ser admirada (objetivo). Para conseguir isso, ela se gaba (comportamento). Se ela agora recebe a admiração que deseja (consequência agradável), então seu comportamento foi bem-sucedido e ela está repetindo o comportamento.
Assim, o comportamento no condicionamento instrumental é direcionado a um objetivo . No condicionamento operante, um comportamento é exibido aleatoriamente que é então recompensado externamente.
Diferença entre condicionamento clássico e operante
Além do condicionamento operante, o condicionamento clássico também é uma das mais importantes teorias de aprendizagem do behaviorismo.
No condicionamento operante , o foco está em recompensar ou punir o comportamento desejado ou indesejado.
O condicionamento clássico ensina um indivíduo a mostrar um determinado comportamento (=reação) em resposta a um determinado sinal (=estímulo).
No condicionamento operante você age após um determinado comportamento, no condicionamento clássico você dá um sinal para um determinado comportamento de antemão.