あらまし

第4 世代の音声認識を目指して

古井 貞熙 

Vol.95 No.5pp.422-426

発行日:2012/05/01

Online ISSN:2188-2355

Print ISSN:0913-5693

種別:特集 人間を理解するためのICT技術──人間を対象としたセンシング・情報処理からその応用まで──

専門分野:

キーワード:
音声認識第4のパラダイム動特性統計的知識モデル大規模コーパス

本文:PDF(495.6KB)

あらまし:
1950 年代以降,半世紀以上にわたって進歩を遂げてきた音声認識技術は,第1,第2,第3,第3.5 世代に分けることができる.近年,種々の音声認識応用システムが実際に用いられるようになってきたが,その性能は人の能力に比べるとはるかに劣っており,人の能力に近づくには,第4世代といえるような大きなパラダイムシフトが必要である.そのためには,現在の音声認識技術で扱うことができない複数のレベルでの動的音声特徴の利用と,人が経験する多様かつ膨大な変化をカバーする音声コーパスに基づく,大規模かつ多様な音声言語知識の体系化を行う必要があると思われる.

ログイン

 > 

パスワードを忘れた場合は

メニュー

Online ISSN:2188-2355