夜中に目が覚めたので書いてみました…
When errors are rewarding.
de Bruijn ER, de Lange FP, von Cramon DY, Ullsperger M.
J Neurosci. 2009 Sep 30;29(39):12183-6.
Journal of Neuroscience誌より。
Brief Communicationのためか、かなりCasualなタイトルです。
内容を簡単に言うと、
- 状況によらず、とにかく報酬を得たときに反応する領野
がそれぞれ別に存在する、ということです。
ヒトのfMRIで脳のBOLD信号を測定しつつ、簡単なコンピューターゲーム課題をさせます。
(BOLDは脳の血流の酸素化の程度の指標で、その変化はその領域の神経活動の増減に関連すると考えられています。)
ゲームの内容は、画面の上側に出現するターゲットの左右の位置と、画面の下側にある自分のカーソルの左右の位置を合わせるという単純なもので、うまくピッタリの位置に合わせられればお金がもらえるというものです。
そして、この実験では、2人のヒトが同時に実験室にやってきて、自分がトライする試行と相手のトライするのを観察する試行を交互に行うこと、そしてブロックごとに「協力条件」と「競争条件」が入れ替わることを説明されます。
別室に誘導され、お互いの姿は見えないですが、
協力条件では、もう1人の被験者が成功してくれれば自分がお金をもらえて、
競争条件では、相手が失敗してくれればお金がもらえます。
(実際にはこの説明はウソで、2人ともがコンピューター相手に同じ実験をしています。)
つまり、お金がもらえる場合は、
自分のトライで成功したとき
「競争条件」のときに相手のトライが失敗したとき
お金を損する場合は、
自分のトライで失敗したとき
「競争条件」で相手が成功したとき
「協力条件」で相手が失敗したとき
ということになります。
ここで注目すべきなのが、「競争条件」で相手が失敗したときです。
このときは、相手の「エラー」が自分の報酬に結びつくからです。
このような設定で、実際に実験中のMRIの結果を見てみると、
大脳基底核の線条体(striatum)では、とにかく自分がお金がもらえるときに強いBOLD信号の変化が見られました。
特に、「競争条件」で相手のトライを見るときには、相手が失敗するときのほうが、相手が成功するときより強いという結果が得られました。
しかし前頭皮質内側の後部(pMFC)では、どの条件でも、自分あるいは相手が「失敗」するときに強い活動が見られました。
なので、「競争条件」で相手が失敗すれば、やはり強いBOLDが見られました。
と、このように、2人の被験者を使って、相手の行動価値が競争or協力というコンテクストによって異なるという課題を行うことで、エラーそのものをコードする部位と報酬をコードする部位をそれぞれ示したというものです。
********
さて、自分はMRIのことは詳しくないですが、
結果の棒グラフを見ると、先の「競争条件で相手のエラーを見るとき」の結果以外は、全て逆転する結果(correct > error or correct < error)となっています。
ということは、もし「競争条件で相手のエラーを見るとき」の結果が信頼性が低ければ、これら2つの領野はただ単に逆の活動パターンであるというだけになるのですが、ここではp < 0.0001と強い有意差があるようです。
ただ、協力条件で相手が失敗or成功では有意差無し(p = 0.06)ということで、結果を鵜呑みにして結論付けして良いものかというのは少し気になりました。
あと、協力条件のときと競争条件のときで、失敗か成功かに限らず、BOLD信号の変化率にかなり差があるように見えます。これは何故なんだろう。縦軸の目盛りがマイナスまでとってあるので、活動が増強したといってもほとんどゼロとマイナスの変化の比較だったり。
まあそして、当然ながらこのタスクに特異的な活動を見ているだけの可能性もあり(つまり、ただ単にターゲットと自分のカーソルが「離れている」ときだけの活動を見てるかも)、別の実験でも確認される必要はあると思います。
また1試行の報酬は10セント(9〜10円)ということで、お金に余裕があるヒトはそれほど気にならない金額かもとか思ったり。被験者の収入で差が出たりするだろうか。
今までは1人でタスクを行って、エラーのときと成功のときを比較する実験しかなかったのを、2人にして2つのコンテクスト、そしてownとobservedの2条件で行ったというのがおもしろい。
きっともうどこかでやられているだろうけど、実際に電気生理でやっても同じような結果が出るだろうか。
そういうニューロンがあれば、「エラー」という情報に関して自己と他者の区別無くグローバルに表現しているという意味ではミラーニューロン的でもあるんだけど、実際にこういう状況で報酬を予測するにはやはりエラーの情報と報酬の情報という2つの要素が絶対必要なわけで、きっとある気がする。
しかしそれらの統合された認知に近い情報がやはり前頭のニューロンで表現されるとして、その表現は線条体なんかの報酬の表現とどう区別されうるのだろう。もちろんスパイクの立ち上がりのタイムラグとかはあるかもしれないけど、報酬予測は中脳レベルで表現されてるわけだし…
なんかこうやって2者あるいは2匹でやると、おもしろいことができそうですね
最近のコメント