Renforcement et Punition

Publié le par Johanne Parent

Il y a quelques mois déjà, une collègue en France m’a demandé un éclaircissement dans les définitions de R+ R- P+ et P-

 

En clair… qu’est-ce que le renforcement positif versus négatif et comment une punition peut-elle être positive?

 

Je n’invente rien. Pamela J. Reid, dans son livre « EXCEL-Erated Learning » explique ces concepts très bien et avec de nombreux exemples faciles à comprendre. Faut lire le livre en entier pour réellement voir cette facilité mais voici les définitions traduites de ces concepts. En premier lieu, il faut comprendre que chaque stimulus entraîne une réponse et par la suite, une conséquence.

 

Définitions tirées de Pamela J.Reid dans son livre EXCEL-Erated Learning.

 

 

Stimulus = Réponse = Conséquence

 

 

Renforcement Positif : Le R+ implique la présentation d’une bonne conséquence quand la réponse est donnée. Ce qui veut dire, vous dites ‘assis’ (stimulus), le chien s’assoie (réponse) et vous lui donner un biscuit (conséquence). Ceci sert à augmenter la possibilité d’une bonne réponse dans le futur. Majoritairement, l’entraînement d’un chien est basé sur des méthodes qui incorporent le R+. Le comportement humain est aussi régit par le R+ : l’enfant fait ses devoirs, l’enfant obtient une bonne note ; une personne travaille fort pour plusieurs mois, la personne profite ensuite d’une période de vacances.

 

Renforcement Négatif : Le R- implique le retrait d’une mauvaise conséquence quand la réponse est donnée. Ce qui veut dire, vous dites ‘assis’ en tirant sur le collier étrangleur, le chien s’assoie et vous arrêtez la pression sur le collier (vous relâchez la laisse). Ceci sert aussi à augmenter la possibilité d’une bonne réponse dans le futur. R- est aussi une méthode commune pour contrôler le comportement : l’enfant fait ses devoirs pour éviter de se faire punir par maman; une personne frappe sur le mur pour se plaindre du bruit du voisin.

 

Punition Positive : La P+ implique la présentation d’une mauvaise conséquence quand la réponse est donnée. Ce qui veut dire, vous dites ‘assis, le chien se couche, vous le replacer assis en tirant sur la laisse, vous relâchez dès que le chien est en position assise. Ceci sert à diminuer la possibilité de cette réponse (position couchée) dans le futur. On voit beaucoup de P+ : l’enfant frappe son frère, le père puni l’enfant; le chiot urine sur le plancher, le chiot reçoit un coup de journal roulé.

 

Punition négative : La P- implique le retrait d’une bonne conséquence quand la réponse est donnée. Ce qui veut dire, vous dites ‘assis’, le chien se couche, vous mangez le biscuit que vous vouliez lui donner. Ceci sert aussi à diminuer la possibilité de la réponse (position couchée) dans le futur. L’enfant dérange à la table pendant le repas, la télé se ferme; la personne conduit en état d’ébriété, la personne perd son permis de conduire.

 

 

Action (Réponse)

 

 

 

Stimulus

 

Donner

Retirer

Bon

R+

Présenter quelque chose de bien

Renforci le comportement

P-

Retirer quelque chose de bien

Diminue le comportement

Mauvais

P+

Présenter quelque chose de ‘mal’

Diminue le comportement

R-

Retirer quelque chose de ‘mal’

Renforci le comportement

 

 

RENFORCEMENT positif ou négatif augmente la possibilité du comportement (réponse)

 

PUNITION positive ou négative diminue la possibilité du comportement (réponse)

 

Toujours selon Pamela, les 4 stages de l’apprentissage sont :

 

  1. acquisition (j’apprends)
  2. compréhension (j’exécute)
  3. généralisation (j’exécute peut importe l’environnement ou les distractions)
  4. maintenance (je pratique pour ne pas oublier)

 

 

Revenons à moi-même, Johanne

 

Pour faciliter la compréhension, voici mes définitions :

 

 

 

R + : quand le chien exécute le comportement, je récompense.

Le chien qui court après les voitures est lui aussi en R+ puisque les voitures fuient à son signal (aboiements, course). Le contenu appétant ou divertissant de la poubelle est aussi un R+ intéressant pour le chien puisque il y trouve de bonnes odeurs et des « gâteries » gratuites!!!

 

R- : quand le chien fait une erreur, ne donne pas le bon comportement, je corrige physiquement (sans blesser ni créer de douleur) ou verbalement (non ou autre commandement).

La poubelle qui punie le chien quand il la renverse est un R-. Des ballons qui flottent au dessus d’un canapé agissent comme R- chez un chien ayant peur des ballons…

 

P + : quand le chien fait une erreur, ne donne pas le bon comportement, je replace le chien physiquement pour exécuter le bon comportement.

Le chien qui reçoit un choc « au moment même ou il aboie » est aussi un P+….. mais le gros problème c’est le timing imprévisible de ces appareils…. donc rarement efficace.

 

P- : quand le chien n’exécute pas le comportement, on le mets dans sa cage… donc retrait du jeu, retrait de l’attention.

 

 

Alors comme vous le voyez, l’apprentissage se fait toujours par association de R+ R- P+ et P-.   L’éducation exclusive au R+ est un leurre…. et la preuve de l’incompétence de ceux qui en font la promotion.

 

Le clicker training, considéré comme un R+ exclusif, est une combinaison.

 

Quand le chien exécute le comportement, il entend un click puis obtient une récompense gustative. Quand il n’exécute pas le comportement recherché… l’ignorance, le non (ou autre son) sont des R-.

 

Johanne Parent

Publié dans éducation canine