|
|
コミュニケーションロボット
ROBITA
(Real-world
Oriented
BI-modal
Talking
Agent)
|
|
|
マン・マシンコミュニケーションのための音声・画像処理
ROBITAは、HMMを用いた大語彙連続音声認識によって人の音声を認識し、自然言語処理によって人の意図を理解することができます。現在は、更に高精度な音響モデル(PHMM)の構築・音響特性を考慮する事によるハンズフリー音声認識機能の実現に取り組んでいます。画像処理としては、入力画像から顔画像を抽出し、統計的手法(PCA,
ICA)によって顔方向認識や個人識別を行います。更に動画像処理によってジェスチャ認識を行うことができます。
|