提取出频谱特征,然后使用gmm、svm、dnn模型进行训练和分类,实时话语检测。
原始文件
VAD处理,剔除静音后的效果:
基于分类的Vad效果
原文:http://www.cnblogs.com/welen/p/4996288.html