多通道PNCC与残差网络命令词识别系统
收藏资源简介
针对非用户语音和噪声干扰下命令词识别的准确率和稳健性问题,提出多通道麦克风阵列与功率归一化倒谱系数结合残差神经网络的命令词识别系统。首先,应用残差单元构建标准ResNet⁃CW⁃15多任务模型和低功耗ResNet⁃CW⁃6多任务模型,当模型判断命令词为用户发出后,开始执行命令词识别功能,若判断为非用户,则不执行命令词识别功能。其次,采用多通道麦克风阵列采集含有空域特征信息的语音命令词数据集。最后,应用对噪声具有一定鲁棒性的功率归一化倒谱系数作为命令词数据集的特征对网络进行训练。标准ResNet⁃CW⁃15模型在噪声条件下命令词识别率和用户/非用户判断性能表现良好。低功耗模型ResNet⁃CW⁃6虽然在整体命令词识别率和用户判断准确率有所降低,但网络参数大幅度减少,极大降低了系统的功耗,更适合广泛部署在小型低功耗智能设备。
资料为PDF文档格式.
本文档关键词:识别,通道,命令,网络,PNCC