これって凄い事だよ、ね?

手書き中国語文字
 先日 21日の発表によると、富士通研究所と中国が協力して GPUを使った応用技術で、手書き文字認識コンテストで 1位を取ったんだって。
 詳しいことはリンク先を読んでもらえば済むことなんだけど、もし 1年後にリンク切れしてたら嫌なので、以下にその記事の抜粋を貼っておく。

========================= ここから =========================

人間の脳の働きを模した人工知能技術を活用した
業界トップ精度の手書き文字認識技術を開発

文書画像処理分野で最大となる国際会議主催の手書き文字(中国語)認識コンテストで1位を獲得

 富士通研究開発中心有限公司と株式会社富士通研究所は、人間の脳の働きを模した人工知能技術を活用した業界トップ精度の手書き文字認識技術を開発しました。

 従来、手書きの文字を認識するには、文字を構成する線の方向やその数を文字の特徴として捉えて個々の文字を認識していました。しかし、変形の大きい文字を認識できなかったり、認識精度を高めるために文字の学習に時間を要するなどの課題がありました。
 今回、人間の脳の働きを模した人工知能技術を活用し、文字の特徴をより詳細に、かつ高速に学習する仕組みを開発しました。これにより、文字の学習時間を従来の約1/17に短縮すると同時に、94.8%の認識精度を実現し、文書画像処理分野で最大となる国際会議主催の手書き文字(中国語)認識コンテストで1位を獲得しました。

 本技術により、手書き文字を電子化する際のデータ入力の効率化を図ることができます。

 本技術の詳細は、8月25日(日曜日)から米国ワシントンで開催される国際会議「ICDAR 2013(International Conference on Document Analysis and Recognition)」にて発表します。

 今回、人間の脳の働きを模した人工知能技術を活用し、文字の特徴をより詳細に、かつ高速に学習する仕組みを開発しました。これにより、文字の学習時間を従来の約1/17に短縮すると同時に、94.8%の認識精度を実現しました。開発した技術の特徴は以下の通りです。

認識の高精度化
 文字の認識は、あらかじめ登録された学習データを基に行われます。そのため認識精度を高めるためには、大量の学習データが必要となります。学習は、人間が文字を覚えるのと同じように、大量の文字を入力して文字の特徴を捉えて学習データとして蓄積していきます。その際に、人間の脳内の細胞を想定した階層的に連なるモデルを用います(図2)。文字の画像を入力すると、まず第1階層で文字の単純な特徴を捉え、次に第2階層で文字の複雑な特徴を捉えます。このように文字の識別に有効な特徴の抽出が階層的に自動的に行われ、どの特徴(細胞)に反応したかの学習結果が文字ごとに蓄積されます。
 認識の際は、入力された文字から学習の際と同じように階層的に特徴の抽出が行われ、学習結果を基にどの特徴(細胞)に反応したかによって文字が特定され認識結果が出力されます。
 これらのように人間の脳の細胞に模したモデルを導入し、各階層間をつなぐ結線の数を本モデルで一般的に用いられている数の約7倍(7階層で約280万)まで増やすことで、認識精度を高めました。

認識の概略図

図2 開発技術の概念図

学習の高速化
 本モデルでは各階層間をつなぐ結線の数が膨大になるにつれて、学習に時間を要します。そこで、学習データの構築の際には、GPU(Graphical Processing Unit)と呼ばれる高速な並列処理に強い演算素子(プロセッサ)を用いることで、従来4カ月かかっていた学習時間を約1/17の約1週間に短縮しました。

========================= ここまで =========================

 実際には「認識に 1週間程度を要する」とのことで、まだまだ時間のかかることではあるのだけれど、今後の技術の発展と開発スピードを考慮すれば、これが数秒に短縮されるのも時間の問題でしょう。ある意味では、これらの処理を無意識下で行ってしまう人間の持つ脳の能力ってのは、今更ながらに凄まじい処理能力があるんだと言う事が解るよね。
 神経細胞は、電気信号の伝わり方なんてレベルでは既にシリコンパワーには勝てないというのに、パターン認識と記憶と連想と言う点では、実際にはどのような処理が行われているかなんて、まだまだ何も判らないナゾだらけってことなんだろうな。

 以前に読んだ SFの中で人間を有機体ロボットと仮定していた物があったけれど、もし、そうだったら人間を設計した知性って実際とんでもない頭脳なんだろう。あるいは DNAを設計した知性、原子や分子の立ち振る舞い、あるはアミノ酸やゲノムを設計した知性、この地球上の全ての物資や環境の性質を定義 (デザイン) した知性。
 矛盾しているようで矛盾がなく、破綻しているようで破綻がない。マクロもミクロも同じような法則でデザインされている世界。精神世界までもが、それに引っ張られ、あたかも型に嵌められるように身動き取れなくなる世界。

 改めて考えてみると、同じ脳の中で発生している「知性」と「感情」って、一体なんなんだろうね…

広告

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中

%d人のブロガーが「いいね」をつけました。