ランダムリウォード

間欠的強化の原則はギャンブルの例が紹介されることもあって、とてもポピュラーな考え方になっていますが、最近あまりそれを意識する必要はないのではないかなと思い始めています。

やはり「新しいことを教える」プログラムと、「教えたことを適切なキューで(いつでもどこでも)実行してもらう」プログラムをはっきり分けて考えることがとっても重要で、それがすっきりわかってくると、これまでの常識がどんどん覆ってくるような気がします。

ランダムリウォードもその一つ。深い理由は割愛しますが、新しい行動を強化する(つまり学習させる)のであれば、単純に出せるときは出すべきで、その段階でランダムな報酬の引き上げなど考えるべきではないのではないでしょうか。
ちなみに人間におけるギャンブルでは間欠的に得られるお金だけが報酬ではなく、むしろ内的報酬が毎回必ず出ることが、「はまる」理由ではないでしょうか。

常識ついでにジャックポットについても考えてみました。
ジャックポットは以前はとても有効な手法と言われていましたが、学習理論的には無意味であるという考え方が近頃の主流です。
これはこれで一理あるのですが、私が一番気にしているのは「記憶のメカニズム」に関してで、これは犬の科学でもあまり取り上げられない領域なのですが、実は非常に大切な部分だと思っています。で、短期記憶から長期記憶に移行させることが、犬に何かを「教えること」に他ならないのですから、この記憶のメカニズムを有効に機能させるために「エピソード」はとても重要な役割を持っていて(電話番号や年号を覚えるのに語呂合わせするのもその例ですね)、ジャックポットは上手に出すことでそういった意味でのエピソードとなり得ると思うのです。
もちろん他にもエピソードを追加できるアイデアがあればどんどん採用し、記憶のメカニズムに刺激を与えることで、学習効率は飛躍的に向上するはずです。

今、犬のトレーニングは、古い習慣と近代的な科学の狭間で揺れ動いていますが、その科学自体がまだアンバランスな掘り下げ方をされている傾向も否めず、行動分析学だけではなく、認知学も重要であるといわれ始めたり、まだまだ発展途上にあるような気がします。
結果において科学がまだ伝統に明確に勝てていないのがその証です。

今一つだけはっきり言えるのは、「行動を教える理論自体はきわめてシンプルで単純なものである」ということでしょう。
IMG_9937.jpg

コメントの投稿

非公開コメント

管理人のみ閲覧できます

このコメントは管理人のみ閲覧できます
プロフィール

のいぱぱ

Author:のいぱぱ
やっぱりサモエドが大好きです。
抜け毛がものすごくても、頑固でマイペースでも・・・。
運命の出会いで一緒に暮らすことになったルフトと、最新の科学的な理論をバックボーンに信頼関係を楽しく築いて行きたいと思います。

カテゴリー
全記事表示リンク

全ての記事を表示する

ブログ内検索
RSSフィード
リンク