音声言語コーパスの現状と課題
Vol.92 No.8pp.676-681
発行日:2009/08/01
Online ISSN:2188-2355
Print ISSN:0913-5693
種別:解説
専門分野:
キーワード:
音声, 言語, 資源, データベース, 構築, 配布, 供給, 蓄積, 利用,
本文:PDF(857.2KB)>>
あらまし:
音声・自然言語処理技術の開発・評価を行う上では,多種・多様・大量の音声・言語データが必要となる.このため研究開発に共通利用可能な音声データや言語データ(音声・言語コーパス)を収集・整備する取組みが進められている.海外ではLDC,ELRAが設立されて音声・言語コーパスの供給体制を確立し音声・言語研究の進展に寄与してきた.日本では言語資源協会(GSK),音声資源コンソーシアム(NII-SRC)が設立されて音声・言語コーパスの保存・利用を促進するための活動を進めている.本稿では日本国内・海外における音声・言語コーパスの現状とGSK・NII-SRCの取組みを紹介し,最後に最近の新しい動きと今後の課題を述べる.