科学と人間「AI(人工知能)の現状と展望」                 KDDI総合研究所  小林 雅一

180420③「ディ-プラ-ニングとは何か」

現在のAIの限界を打破してレベルアップする為に、人間の脳に近い本物の知性に基づくニュ-ラル・ネットというものが注目されている。現在AIの関係者の間でディ-プ・ラ-ニングという流行語もあるが、そういった呼び方もされている。それがどういう物であるか見て行こう。

「ニューラル・ネットとは」

神経細胞のネットワ-クということで、人間の脳の仕組みの事である。

・パーセルトロン 人工知能の最初

この研究は1940年代に遡る。1957年にフランク・ロ-ゼンブラット()が考案したパ-セブトロンに始まる。視覚と脳の機能をモデル化したもので、爆発的なニュ-ラル・ネットのブームを巻き起こした。生物の脳神経細胞とシナップス(神経細胞同士の接合部分)とのネットワ-クを人工的に再現したものである。しかし今のレベルで見たら、普通の人がプログラミングを少し勉強したら、実現できるレベルである。人間の脳は何千億本の繋がりで出来ているが、このバ-セルトロンは5~6本の単純なものであった。そして線形分離可能な物しか学習出来ないと限界が明らかになり、ブ-ムは下火。

・多層バ-セルトロン

初期バ-セルトロンの限界を克服する方法。従来単層であったバ-セルトロンを多層とすることで対応した。

ここでブームが再燃。当初単層であった物が多層となり、複雑な概念が処理できるようになった。この状況が「ディ-プ・ラ-ニング」の由来である。然し問題点があった。

多層化により複雑な概念は理解・処理できるようになったが、処理時間の長さ、高価なハ-ドウェア、人手・・・・。

この為実用化は困難として、1990年代には悲観的な予測がなされていた。 

「21世紀のブレ-クスル-」

一つはハ-ドウェアの進化によって、大きく前進した。グラフィック プロセス ユニットといってビデオゲームに使われる画像処理専用のチップを高価ではあるが、これをニュ-ラルネットに応用すると処理時間の大幅短縮が出来ることが判明した。

「脳科学の進歩」

もう一つは本当の意味で脳科学の研究成果が、ニュ-ラルネットつまりAIに応用され始めた。それまでのニュ-ラルネットは名ばかりで、その99%は幼稚な数値計算の手法に過ぎなかった。

・脳に視覚野という領域があるが、生物が物を見るための領域である。21世紀になってこの分野の研究が大いに進んだ。動物実験の結果、視覚野の仕組みが分かってきた。そしてそれを数式で表現できるようになった。そしてこの脳科学の進歩をAIに応用することになった。

「脳科学の進歩をAIに応用するやり方」

・デジカメで外界を認識するには何百万画素が必要となるが、人間の脳は絶え間なくこの情報を処理することはしない。ほぼ自動的に特徴点を何百ポイントか見出して縮小する。微小な特徴、形状とかを人間の脳は瞬時に見抜いてしまう。例えば、人間の顔・耳・鼻・目・・・・。このバ-ツを組み合わせることによって相手を瞬時に認識できるようになっている。この仕組みを解明したのが、脳科学の成果である。この仕組みをAI研究者は応用した。その結果としてAIの画像処理能力は飛躍的に向上した。

「画像処理能力の飛躍」

スタンフォ-ド大学で画像認識のコンテストが行われる。40~50万枚の写真を人間とAIとで認識するコンテスト。人間の間違いは3~4%AIは0%AIが完全に人間を上回ったのである。

「聴覚による画像処理」

ここから更に発展する。脳は汎用的情報処理能力があるのではないかと考えた。途中失明者は、音の情報で外界を認識すると云われる。音波で外界を視覚的に捉えるのは、子どもの頃からやっている。自転車・自動車・スケ-トボード・・。

よって日常生活は音声情報で出来るのである。音の反響を受け止め、それによって周囲の状況を知ることで、エコロケ-ション(反響定位)という。

スマ-トフォンで音声検索と云うのがあるが、これは現在飛躍的に能力が向上し、将に実用レベルとなっている。

 「コメント」

そういえば今は知らない言葉、忘れた言葉があると、辞書を引くよりスマホの音声検索の利用の方が多くなった気がする。人と会っていたり、会合の途中、歌会時にはまだ抵抗感があるが。

出会った人の名前を忘れたときにも、その内使えるのではないか。