fc2ブログ

ごほうび

リウォードベースドモチベーショナルトレーニング、つまり報酬を基とした動機付けトレーニングでは、2つの本能に起因した報酬をいかに的確に与えるかが、成否のカギとなります。
2つの本能とは捕食と危機回避。
どちらも極めるにはとても奥が深く、簡単には定義づけられません。

捕食本能ベースの報酬、これはおもちゃだったり遊びだったり、モーターパターンになっている内的報酬が出る行動だったり・・・。

そしてもちろん食べ物。
私たちには一番便利で分かりやすい報酬が食べ物なので、ついついこれに頼りすぎてしまうことが多いと思います。

ところが食べ物の出る状況はまさに捕食本能全開。狩りのモードですからアドレナリンの増加をはじめ様々な化学物質が行動や感情に変化を生じさせてしまいます。

「犬が喜んでいる」とか「真剣だ」とか表することが多い反応ですが、そんな簡単なものではありませんね。危険な場合すらあります。

人が犬と暮らすようになった理由。その大きなものの一つに危機回避本能があると思います。
そしてそれが人との暮らしの中で満たされている状態が信頼感であり、絆になっていくのだと思います。

信頼感は絆を作りますが、食べ物自体は絆を作れない。私はそう思います。食うに困らない生活を約束することには信頼感が生まれますが、一時強化子である食べ物そのものは絆とは無関係だからです。

オペラント条件づけに基づくトレーニングをしているなら、報酬として出される食べものは行動の結果として得られるものであり、人に服従した結果得ているものではないのです。
だから機械で自動的に食べ物が出ても学習効率は変わりません。

やはり確信をもってこう言いたいです。

新たに何かを教えることと、教えたことを守ってもらうプログラムは全く異なる
と。

食べ物を与えるプログラムはオペラント条件づけによって新しい行動を教える場合と、古典的条件づけによって新たな刺激を関連付ける場合にのみ用いられるべきものなのだと考えます。

70%以上の学習をしているもの(こと)に対しては信頼関係のルールによってそれを実行してもらうべきであり、食べ物を出さない方が良いのではないでしょうか。

それでやってくれない場合、最悪なのは(とても多くの人がそうしていますが)もう一度キューを出して成功したら褒めて食べ物を与えるというパターンです。
おそらくこういうパターンでは犬が万年初心者にとどまるでしょう。

望ましいのは、徹底した「じゃまいか禁止」の負の弱化だと思います。

騒ぐ犬を食べ物で黙らせる。
気が散っている犬を食べ物で集中させる。
過剰な誘導。

これらはすべて危機回避本能を捕食本能でごまかそうとする「口止め料」的な発想になりかねません。

そしてそういった状況では望んでいる学習はほとんどしてくれないと思った方がいいかもしれません。

食べ物を用いるときは明確にその理由を理解している必要があります。

たとえばシッターさんや保護活動の方が犬を預かる時には、むしろ他人が絆を作るべきではなく、一貫した人とのルールを守りながら管理を徹底するべきであり、その管理にこそ食べ物を用いた誘導や口止め料が有効であることも大事な使い分けだと思います。

捕食か危機回避か、
内的報酬か外的報酬か、
どのタイミングで、
どんな出し方をするか・・・。

たかが「ごほうび」されど「ごほうび」
本当に奥が深いと思います。

コメントの投稿

非公開コメント

プロフィール

のいぱぱ

Author:のいぱぱ
やっぱりサモエドが大好きです。
抜け毛がものすごくても、頑固でマイペースでも・・・。
運命の出会いで一緒に暮らすことになったルフトと、最新の科学的な理論をバックボーンに信頼関係を楽しく築いて行きたいと思います。

カテゴリー
全記事表示リンク

全ての記事を表示する

ブログ内検索
RSSフィード
リンク