ありのままに生きる

社会不適合なぼっちおやじが、自転車、ジョギング等々に現実逃避する日々を綴っています。

ディープラーニング革命

テレンス・J・セイノフスキー/監訳 銅谷賢治 「ディープラーニング革命」メモ  

ディープラーニング革命

ディープラーニング革命

 

テレンス・J・セイノフスキー  監訳 銅谷賢治
ディープラーニング革命」メモ

第1部 新たな着想による知能

第5章 視覚系からの知見
----------------------------------------------------------------------------------
【まとめ】
・科学の究極のパズルは、脳がどうやって問題を解くのかということ。
・視覚は人間の感覚のなかで最も鋭く、視覚野の構造がディープラーニングネットワークの着想を与えた。
・機能的磁気共鳴画像法(fMRI)は、組織を傷つけずに脳の活動を視覚化可能で、認知神経科学の発展に貢献している。
----------------------------------------------------------------------------------


・科学には、ピース不足で、そこに潜む図を知るための手がかりがあいまいなパズルのような問題がある。
・脳がどうやって問題を解くのかということが、究極のパズル。


・視覚は人間の感覚のなかで最も鋭く、最も研究されてきた。
・目による奥行き知覚の仕組みをもち、大脳皮質の半分は視覚に関連する。
・視覚野の構造がディープラーニングネットワークの着想を与えた。


・視覚野の100億個のニューロンが同時に共同して働くことで、散らかった場所にあるコップも10分の1秒で見分けられる。


ボトムアップでの視覚
・ある画像により生記された信号を脳内で追跡すると、処理の段階を移るたび、その信号が繰り返し変換される。
・視覚は網膜から始まる。
・網膜で光受容細胞により光が電気信号に変換される。
・網膜のニューロンは2層で、時間的・空間的に視覚信号が処理され、神経節細胞に入る。
・神経節細胞は長く伸びて視神経となる。


・一点の光を当ててニューロンに刺激を与え、発火の様子を記録する。
・出力ニューロンには、ある領域の中心に光を当てたときに反応するものと、消したときに反応するものがある。
・ON中心OFF周辺型と、OFF中心ON周辺型がある。
・受容野特性:光のパターンに対する神経節細胞の反応。


●大脳皮質の中の視覚
・皮質ニューロンは、一点の光よりも、ある方向の棒状の光や明暗の境界線によく反応する。
・入力信号は皮質内の回路により変形する。
・細胞の二つの分類
 ①単純型細胞:ONとOFFの領域をもつ
 ②複雑型細胞:向きをもつ刺激を受容野のどこに与えても同じ反応を示す。


・視覚皮質のそれぞれのニューロンは、視覚的特徴検出器。
・活動状態になるのは、視野の特定部分でそれぞれの特徴についてある閾値以上の入力を受けたとき。
・各ニューロンが反応する特徴は、他のニューロンとの連結状態で決まる。
・哺乳動物の新皮質は、機能が特化した六つの層に分かれる。
・皮質の中央の層(第4層)には「右目からの入力コラム」と「左目からの入力コラム」の2種類の列が交互に並ぶ。
・両眼からの入力は視床で中継されて第4層へ入る。
・第4層の単眼に対応するニューロンから、上層(第2、3層)のニューロンへ投射され、それらは両眼の入力を受ける。
・そこから上層の他の皮質野に投射され、下層(第5、6層)にも投射されてさらに皮質下へと投射される。
・一つのコラムのなかの全細胞は、どの向きに応答するかと(方位選択性)、左右どちらの目が優位か(眼優位性)が同じで、皮質の上でなめらなかに変化する。


シナプス可塑性
・猫の片方の目を生後数ヶ月間、閉じたままにすると、開いていたほうの目の入力にしか応答しなくなる。
シナプスの強度の変化が引き起こされる。
・片目の遮断は、発達初期段階で生じる高度の可塑性の一例。
・脳にあるニューロンのほとんどは、出生時と同じだが、ニューロンとそれをつなげるシナプスのほぼすべての構成要素は、日々入れ替わる。
→ダイナミックな入れか替わりがあるのに、記憶はどのようにして一生維持されるのか?
・記憶は私たちの体の傷跡のようなもので、人生における過去の出来事マーカーとして生き残る。
・マーカーを探すべき場所は、ニューロンの中ではなく、ニューロンの間の空間。
・そこにある細胞間質は、傷口に生じるコラーゲンに似たプロテオグリカンとい物質でできている。
・何年も持ちこたえる強靱な性質を備える。


シナプスに含まれる何百種類のタンパク質が、神経伝達物質の放出、それを受け取る側のニューロンにある受容体の活動を制御する。
シナプスの強さは選択的に増加したり減少させることができる。
・振れ幅は、皮質の場合は100倍ほどの違いがでる。
・皮質では常に新たなシナプスが形成され、古いシナプスが除去され、体内で最も変化の激しい細胞小器官。
・脳の中にはおよそ100種類のシナプスが存在する。
グルタミン酸は皮質で最も一般的な興奮性の神経伝達物質
・別のアミノ酸、γ-アミノ酸(GABA)が最も一般的な抑制性の神経伝達物質
神経伝達物質が他のニューロンに電気化学的な影響を及ぼし時間スケールも広い幅がある。


●陰影からの形状の認識
・一次視覚野は極めて規則的な構造をもつ。
・コンピューター・ビジョンの研究者の多くは、物体を背景から切り出し、その物体を特定する特徴を探すことで物体認識を行う。
・表面の陰影や折り目やしわなどの特徴から物体の形を抽出する方法は?
・3次元の等高線と、画像内の明るさが等しい点をつなげた等光線との密接な関係に基づく。


・正(凸)であるか、負(凹)であるかの判定に隠れ層のユニットが使われる。
・ある種の単純型細胞と同様、これらのユニットは特徴検出器だった。
・それらの活動は、非常に低いか高いかという、二峰性の分布を示す。
・隠れ層の他のユニットは、連続的応答を示し、凹凸の方向と大きさを出力ユニットに伝えるフィルターとして機能。
ニューロンの機能は、入力にどうのように反応するかだけでなく、それが活性化させる下流ニューロン、「投射野」によっても決まる。


●皮質の視覚マップの階層構造
・一次視覚からの入力を受ける皮質領域は、領域ごとに異なる性質をもつ。
・「中則頭皮質」または「MT」と呼ばれる領域にある視覚野のニューロンは、特定の方向へと
動く視覚刺激に反応する。
・サルの視覚野で、20から30の視覚領域が発見されている。


<階層的ダイアグラム>
・皮質の視覚野ごとに出力を洗い出して配置。
・ダイアグラムの一番下で、網膜神経細胞(RGC)からの視覚入力が、一次視覚野(VI)に投射される。
・そこから信号が階層上部へ伝わる。
・各領域は、視覚のさまざまな側面に対応するよう特化している。
・階層最上部付近右側の、下側頭皮質前部と中部と後部(AIT、CIT、PIT)のニューロン受容野は、視野全体をカバーし、物体の複雑な視覚刺激に対して選択的に反応する。
ニューロンがどうやってそれを表現しているかはわからない。
・経験により結合強度が変わることで、ニューロンが新しい物体のどう反応するか学習することはわかっている。


認知神経科学の誕生
<機能的磁気共鳴画像法(fMRI)>
・組織を傷つけずに脳の活動を視覚化可能。
・数ミリメートルの空間分解能をもつ。


・脳は酸素なしで機能せず、血流はミリメートル以下のレベルで精密に調節される。
fMRIでは脳活動の代わりに血中酸素濃度依存(BOLD)信号を測定する。
・血液中の鉄分の酸化度合いにより磁気的特性が変化し、fMRIを用いて組織を傷めずに観察可能。
・数秒という時間分解能で脳の活動を動画として得られ、実験中に脳のどの部分が活動しているか記録できる。
fMRIは視覚的階層のさまざまな部位が情報を統合している時間スケールを調べるのにも使われる。


fMRIで、さまざな長さの動画を処理するのに視覚的階層のどの部分が関係するのか実験された。
・階層の一番下にある一次視覚野には、時間スケールによらず、強い確実な反応があった。
・より上の層では、明確な反応が引き起こされたのは長い時間スケールの場面のみで、最上層の前頭前野皮質の反応には最長の継続時間が必要。
→作業記憶、電話番号や行っている作業要素のような情報を保持する能力も階層化され、前頭前野皮質が作業記憶の最長のタイムスケールをもつことを示す他の実験結果とも一致する。