[報道資料]

20091216日 大阪大学

衝動性が生みだす社会問題を脳科学から解明へ

〜痛い目にあっても学習できないのはなぜ?〜

 

概要

大阪大学・社会経済研究所の田中沙織特任准教授らのグループは、脳内物質のセロトニンが不足すると、行動とその結果生じる損失の間に時間遅れがある場合に、より大きな損失を避ける行動の学習を遅らせることを明らかにした。この結果は、何度痛い目にあってもなかなか学習できないといった問題行動に関する脳機構の解明につながる可能性がある。さらには、脳科学の視点から、多重債務などの社会問題の予防法や解決策を見出すことが期待される。

 

セロトニンの前駆物質であるトリプトファンの経口摂取量を変化させることで、被験者の脳内のセロトニン活性を、不足、通常、過剰の3状態に調節し、コンピューターゲームを解いているときの行動を調べた。このゲームでは、画面上に2つの図形が提示され、そのどちらかをボタンを押して選ぶと、図形によって異なる金額の賞金か罰金が、異なる時間遅れで与えられる。ゲーム開始時点では被験者はどの図形が何を意味するかは知らず、試行錯誤のうちにより多くの報酬を得て、より少ない罰金を払う行動を学習する。21人の被験者の660回の選択の経過を解析した結果、少ない罰金を支払う図形と大きな罰金を支払う図形の選択問題において、セロトニン不足状態では、罰金を約10秒後(他の3つの図形のペアの選択の後)に差し引かれた場合に、より少ない罰金を選ぶ学習が、他のセロトニン状態に比べて遅いことが明らかになった。一方、罰金の代わりに賞金がもらえる図形の選択問題では、セロトニンの状態は学習に影響しなかった。

 

本成果は米国科学雑誌「ジャーナル オブ ニューロサイエンス」(20091216日発行、米国東部時間;日本では1217) に掲載される。本研究は、国際電気通信基礎技術研究所 (ATR) 脳情報研究所、広島大学大学院精神神経医科学、沖縄科学技術大学院大学先行研究、南カリフォルニア大学との共同で行われた。また本研究の一部は、文部科学省脳科学研究戦略推進プログラムにより実施された「社会的行動を支える脳基盤の計測・支援技術の開発」および特定領域研究統合脳の成果である。

論文著者名とタイトル

Saori C.TanakaKazuhiro Shishida NicolasSchweighoferYasumasa OkamotoShigeto YamawakiKenji Doya

Serotonin affects association of aversive outcomes to past actions.

研究実施機関

大阪大学社会経済研究所

田中沙織

()国際電気通信基礎技術研究所(ATR)脳情報研究所

銅谷賢治、田中沙織、Nicolas Schweighofer

広島大学医学部精神神経医科学研究室

              山脇成人、岡本泰昌、志々田一宏

沖縄科学技術大学院大学先行研究神経計算ユニット

              銅谷賢治

南カリフォルニア大学

              Nicolas Schweighofer

問い合わせ先

大阪大学社会経済研究所 田中沙織

567-0047 大阪府茨木市美穂ケ丘6ー1

TEL: 06-6879-8561

FAX: 06-6878-2766

E-mail: xsaori@iser.osaka-u.ac.jp

研究の背景と詳細

<背景>

我々は日頃、遅れてやってくる結果からより良い行動を学ばなければならないことがしばしばある。たとえば囲碁や将棋は、多数の「手」を積み重ねて、最終的に勝ち負けという結果が得られる。より強くなるためには、「ここで負けたのはどの手が原因だったのか」という結果と過去の行動との関連付けが重要になる。そうすることで、次に同じような状況になったときに、同じ失敗を繰り返すことがなくなる。しかし日頃の経験からわかるように、結果と過去の行動の間に時間が経過するほど、その関連付けは困難になる。

 

このような、結果と過去の行動を正しく関連付けできるかは、将来の出来事を予測して正しい行動をとる能力と深く関連している。たとえば、すぐに小さい利益をとるか、しばらく待ってからより大きい利益をとるかという問題においては、利益の大きさと待ち時間の両方を考慮して、最終的により利益をとることのできる選択をする必要がある.このような問題では、どれぐらい先の利益まで視野に入れて予測するかが重要になる。近視眼的な見方では、目先の小さい利益に飛びついて痛い目にあうかもしれない。また、現在の利益をどれぐらい過去の行動までさかのぼって関連付けするかも重要になる。長い時間待って大きい利益が手に入ったときに、それをもたらした過去の行動との関連付けができないと、関連付けが容易であるすぐにもらえる小さい利益ばかりを取ってしまう可能性がある。

 

うつ病や薬物依存、衝動性を伴う精神障害の臨床事例から、将来の出来事を予測して正しい行動をとる能力は、脳内物質のセロトニンが深くかかわることが指摘されている。我々は先行研究において、セロトニンの機能が低下すると、遠い将来の利益まで視野に入れて予測できなくなることを明らかにした (Schweighofer et. al., 2008)。また、機能的磁気共鳴画像法 (fMRI) を用いた実験で、セロトニンレベルによって大脳基底核の入力部にあたる線条体の異なる場所が活動することで、衝動的な行動が起こることを示唆する結果を得ている (Tanaka et. al., 2007)。本研究では、セロトニンがどれぐらい過去の行動までさかのぼって関連付けするかにどう関わっているかを調べるために、被験者の脳内セロトニンレベルを調節して、過去の行動と関連付けをしないと解けない問題を解いているときの学習の違いを調べた。

 

<脳内セロトニンの調整>

21人の被験者(男性、右利き)は、1週間の間隔をあけて合計3日間実験に参加した。各被験者は、各実験日にセロトニンの前駆物質である必須アミノ酸のトリプトファンの濃度が異なる3種類のアミノ酸混合飲料(不足、通常、過剰)のうち1種類を口径接種し、脳内のセロトニン活性が十分変化したとされる6時間後に実験課題を行った。3日間にどのトリプトファン濃度の飲料を接種するかは、実験者とは別のコントローラーが決定するという二重盲検法を用いた。

 

<実験課題>

この学習課題(図1)において、被験者は画面上に提示される2つの図形のどちらかを選ぶと、選んだ図形に応じて金額が得られる。図形は全部で8種類あり、それぞれに異なる金額 (10円、40円、-10円、-40) と、その金額が表示される時間遅れ (すぐ、3問後) が設定されている。 被験者はこの図形と金額の関係を知らされていないため、最終的により多くの金額を得るためには、各図形と金額の関係を試行錯誤により学習し、より多い賞金(40円)もしくはより少ない罰金(-10円)の図形を選ぶ必要がある。すぐ結果が表示される図形に関しては学習が容易であるが、3問後に表示される図形に関しては、結果が表示された時に直前の行動ではなく3問前の行動と関連付けをしないと、その図形の金額を正しく学習することができない。したがって、すぐ結果が表示される図形の選択問題に比べて、より遠い過去の行動までさかのぼって関連付けすることが必要とされる。この2つの時間遅れ問題を、賞金(10円と40円の選択)と罰(-10円と-40円の選択)の条件でそれぞれのセロトニン状態で比較した。

 

<実験結果>

すぐに結果が表示される問題では、すべてのセロトニン状態において、時間がたつほど正解の図形(利益条件では40円、損失条件では-10円)を選ぶ同じような学習傾向が見られた(図2B左上下)。またこれは賞金でも罰でも差は見られなかった。一方、3問後に結果が表示される問題では、賞金ではすべてのセロトニン状態において同じような学習傾向が見られたものの(図2B右上)、罰ではセロトニン不足において他の状態に比べて学習が遅いという結果が得られた(図2B右下)。

 

<理論モデルによる解析>

セロトニン不足において、3問後に結果が表示される問題で学習が遅いという結果は、セロトニン不足で結果と過去の行動との関連付けが低下していることを反映しているのだろうか?この点を明らかにするために、結果と過去の行動との関連付けの理論モデルを用いて、被験者の行動データを解析した。具体的には、各被験者が実際に選択した図形と金額の時系列を、強化学習のプログラムに疑似体験させ、 被験者の行動をもっともよく説明できる学習パラメータを推定した。その結果、被験者が罰金が表示された際に過去の行動をどれぐらい振り返るかというパラメータが、各被験者の血中セロトニン濃度と正の相関があることを発見した。このパラメータを3つのセロトニン状態で比較すると、セロトニン不足のときはセロトニン過剰のときよりも有意に小さいことがわかった。この結果は、セロトニン不足の状態では、罰金の際に近い過去の行動しか振り返ることができないことを示しており、実験課題においてセロトニン不足の状態では、3問前の行動を振り返って関連付けができなかったという結果をうまく説明することができる.

 

<本研究の意義と今後の課題>

本研究は、セロトニンの機能が低下した状態では、損失とその原因となる行動との間に時間が経つと学習が遅れることを明らかにした。毎年夏休みの最後の日に苦労してたまった宿題を片付けるといった行動や、返済で苦しんでも懲りずに借金をしてしまうといった行動のような、「痛い目にあってもなかなか学習できない」という問題の一つの要因として、セロトニンの機能低下が考えられることを示唆している。このような衝動的行動は、近年経済学の研究において、多重債務といった経済面での問題だけでなく、肥満といった健康面での問題とも関連性が指摘されている。本研究は、セロトニンの機能低下が将来をみる能力の欠如だけでなく、結果と過去との関連付けの能力の欠如も引き起こすという新たなメカニズムを解明したことによって、衝動性を生む脳機構の理解と診断、多重債務や肥満の増加といった社会的問題の予防や対策への重要な手がかりを与えるものである。


 

 

 

1: 実験課題

Tanaka_fig1_J.gif

 

 

 

2: 行動結果

Tanaka_fig2_J.gif

 

 


 

3: 理論モデルによるパラメータ推定と、データの再現

Tanaka_fig3_J

 


<図の説明>

1

A) 各試行の流れ。画面に2つのフラクタル図形が表示される。ビープ音でどちらかの図形をボタンで選択すると、選択した図形に赤枠が表示され、金額が表示される。

B) 8種類の図形の金額と、金額が表示される時間遅れの関係。被験者によって、また実験日によって異なる図形のセットを用いた。

C) 金額が表示される時間遅れを説明。すぐに表示される図形を選ぶと (t+1回目、t+2回目)、金額はその試行内に表示される。3回後に表示される図形を選ぶと (t回目)3回後の試行 (t+3回目) で表示される。その際にすぐに表示される図形を選ぶと、その合計が表示される (t+3回目)

 

2

賞金同士の選択でより多い賞金を選ぶ割合と、罰金同士の選択でより少ない賞金を選ぶ割合。学習が進むほど、割合は1に近づく。3回後に表示される罰金同士の選択で、セロトニン不足状態では、中盤の割合が他のセロトニン状態よりも有意に低い。これは、学習が遅れていることを示している。

 

3

A) 理論モデルを用いて被験者のパラメータを推定した結果。罰金を支払う際にどれぐらい過去の行動まで振り返って関連付けするかを決めるパラメータ (l-) が、セロトニン不足状態で有意に小さい。これは、近い過去しか振り返って関連付けできないことを示している。

B) 推定したパラメータを用いて被験者の結果を再現した結果。セロトニン不足状態では、中盤の割合が他のセロトニン状態よりも有意に低いことをよく再現できている。