音声区間検出の基礎と世界的な研究動向,今後の展開
Vol.95 No.8pp.754-758
発行日:2012/08/01
Online ISSN:2188-2355
Print ISSN:0913-5693
種別:解説
専門分野:
キーワード:
音声情報処理, 音声区間検出, 特徴量と識別器, 音環境理解,
本文:PDF(534.8KB)>>
あらまし:
音声区間検出(VAD : Voice Activity Detection)は,音声信号と音声以外の信号(非音声信号)が含まれる観測信号から音声信号が存在する時間区間を検出する技術である.VAD は,様々な音声情報処理技術の入り口に位置することから,それらの性能を大きく左右する極めて重要な技術である.本稿では,VAD の基本構成と評価方法,応用先について説明し,音声情報処理技術におけるVAD の位置付けを明確にする.また,様々なVAD 手法を紹介しつつ,過去10 年間の世界的な研究動向を振り返り,今後の研究のあり方について述べる.