視る・考える・覚えるを1チップで

研究チームが開発したのは、モノレイヤー(一原子層)厚のMoS₂を使った小さな光センサー内蔵トランジスタです。
このデバイスに光が当たると、材料中の欠陥サイトが電子を捕獲・放出し、まるでニューロンが電気信号を溜め込み発射するような振る舞いを示します。
具体的には、光刺激によって電流が徐々に増大し(積分に相当)、閾値に達すると急激にスパイク信号を出力し、ゲート電圧を加えることで電流をリセットして次の刺激に備えるという、一連のLIFニューロン的な動作が確認されました。
筆頭著者のティハ・アウン博士課程研究者は「私たちは原子レベルで薄い二硫化モリブデンが、スパイキングニューラルネットワークの基本要素であるリーキー積分発火(LIF)ニューロンの挙動を正確に再現できることを実証しました」と説明しています。
つまり、原子レベルのチップにおいても脳の神経細胞のように電気を少しずつためては一定量でパッと放電する動きを、そっくりそのまま再現できることを確かめたのです。
このデバイスは光刺激による「膜電位」の蓄積とスパイク出力を一体化して行えるため、従来は別々の素子で担っていた「センシング(検出)」「情報処理」「メモリ保持」を融合できた点が画期的です。
さらに研究チームは、このMoS₂チップを実際のスパイキングニューラルネットワークに組み込み、CIFAR10(静的画像)とDVS128(動的ビジョン)のデータセットで最大約75~80%の分類精度を達成可能であることも示しました。
実験ではまず、目の前で手を振るというシンプルな動作を対象にデバイスの反応をテストしたところ、通常のカメラが行うようにフレームごとの撮影を行わずとも、手の動きによる視界の変化を即座に捉えることができました。
これはエッジ検出と呼ばれる手法で、シーン全体ではなく変化の部分だけを検知できるため、処理すべきデータ量と消費エネルギーを大幅に削減できます。
実際、手の振れによるわずかな明暗の変化を検知すると、その瞬間にスパイク信号を発して「手が動いた」というイベントを自動的に記録しました。
人間が目で動きを捉えて脳に伝え記憶するのと同様に、このチップ自体が見る・処理する・覚えるを完結させているのです。
ワリア教授は「この試作デバイスは、人間の目が光を捉える能力と脳が視覚情報を処理する能力を部分的に再現しており、大量のデータや大きなエネルギーを必要とせずに環境の変化を瞬時に察知できます」と強調しています。
さらにゲート電圧を用いたリセット機能により、一度記録した後はすぐに次の変化を捉えられる高速応答が可能です。
このように、本研究のMoS₂チップはセンサー・プロセッサ・メモリを統合した人工視覚ニューロンとして機能し、SNNの基礎技術としても応用できる可能性を示しました。