2016年5月22日日曜日

データ不足が致命傷

日本企業とAIに関して、思っている事

1:スーパーコンピューターを作る能力においては負けてはいない
2:AIコンピューターに投入して学習させるために必要とされる「データの数」が足らない
3:もしかしたら、事前の予見や想定なしに、膨大なデータの海から特徴や法則を発見する「客観的な分析」よりも、数少ない自分の見聞きした経験から・・・結局、手短に言えば、ザックリ言えば、こういう事・・・と思いこんで、それを全体に当てはめてしまう「主観的な一般化、法則化」を好む国民的な性格が災いしているかもしれない。

上記3項目の中でも、2:
データ不足が日本のAI企業の致命傷だと思う。

現在のAIブームを支えてる要因の一つは、分析する情報が利用可能な状態になったということだ。

特に、豊富なデータを毎日、世界中の人々がSNSなどを通じて無料のクラウドにアップする。そのデータは無料と引き換えに、グーグル、FB,マイクロソフトなどが自社では自由に使える約款になっている。

情報を無料で差し出す庶民、それを有効活用して、社会に役立たせつつ、利益を得るIT企業 ・・・ こういうWin&Winの関係は、21世紀になって始めて生まれた。

分析するデータが、日本国内、日本語に限定されてしまう日本のAI企業は、海外のデータを購入しない限り、世界に通用するAI分析、Deep Learningはできない。
 
できないから、日本データから得られたモノを世界にも通用する法則だと「演繹」して失敗するリスクがある。

その他、下記の過去のブログ記事も参考にしてください・
====
過去にも同様な手法が試された歴史はある。
しかし過去には、現在では可能であっても過去では不可能だった高いハードルが立ちふさがっていた。

1:まずは、外部の情報を正確に素早く察知する高性能のセンサーだ。
2:そしてセンサーから得た情報を瞬時に分析判断するパワフルなCPU(コンピューターの心臓部)
3:さらには、外部のセンサーが得た情報をコンピューターに高速で伝達する無線通信ネットワーク
4:そして、膨大な情報(=データ)を瞬時に利用できるような形で保持する巨大なクラウド・システム

20世紀には上記4点を欠いていたために、理念的には人間のように考える人工知能(AI)が考案されたが、当時出来上がったものは、あまりにも反応が遅く、失望を招く結果となった