人間がコンピュータに音声で話して電子メール文を作ったり、 インターネットで日本語を入力すると翻訳して世界中の情報を検索できれば、コンピュータはさらに一段と使いやすくなるでしょう。 最近はブログの情報を大量に集めて、特定のテーマについて分析して有用な情報の利用も可能になってきています。このように、 近い将来にコンピュータは人間との会話や情報検索・獲得の面でも大きく進歩するに違いないと思います。 しかし、 人間が言葉を使用するとき、意識はしないけれども実に多くの種類の知識を駆使しています。 新聞を読む時、 文章を書く時、 ケイタイで友達と話す時、 教室で討論する時、 ……。 ここでは文法だけでなく、 ウエブや文書、会話の内容に関する知識や一般的な常識も重要です。 この授業では、 コンピュータが自然言語を理解するために重要な概念や手法を学ぶと同時に、入力した文の意味を解析する簡単なシステムで実習します。 また、ブログなどのウエブ上の言語データの特徴や、コンピュータによるブログ分析法などについても解説します。このようにコンピュータがどのように言葉を解析・理解し、 生成するかを勉強しながら、 現在のコンピュータのもつ言語理解能力の問題点を体験を通じて明らかにします。また、人間の記憶の構造を連想実験で調べて人間の言語能力と比較し、 「コンピュータが言葉を理解する」 ことの意味などについて考察します。
パターン情報は人間が使用する情報の中で記号情報と並ぶ重要な情報形態です。たとえば、文字、図形、衛星写真、映像などの画像情報は2次元または3次元のパターン情報を含み、人間が会話に使用する音声情報は1次元のパターン情報です。近年では、インターネット上で扱えるマルチモーダル情報として、静止画、動画、音声情報の圧縮伝送やディスプレー表示、人間とコンピュータの対話手段として幅広く効率的に使用されています。また、そのような情報の認識と理解という観点からは、コンピュータを用いたパターン情報処理の研究が飛躍的に進んでいます。パターン情報の「解析」、「理解」、「生成」、「学習」などの最新の研究成果が応用され、様々なシステムに使用されています。たとえば、知能ロボットが周りの情景を理解して行動し、人間と音声で対話を行うことも実現しつつあります。画像や音声はアナログ情報であるため、これらの情報をシステムにデジタル化(量子化)して入力し、パターンとしての特徴抽出、モデルとのマッチング、具体的なものや言葉としての解析・理解を行って、パターン情報の学習へと高度化して行きます。本講義では、脳科学における最新の知見に基づいて、人間がパターン情報を扱う仕組みを調べ、コンピュータで的確に扱うためのパターン情報処理のための理論、方法論、システム論について解説します。また、我が国のロボット開発の状況を紹介し、ロボカップで活躍する最新のロボットの紹介も予定しています。