提升语音准确率 阿里巴巴开源DFSMN模型

说到人工智能,语音识别也是AI技术核心的一部分,从语音交互领域中人机连接是核心技术最重要的突破点。不管是在我们的日常生活中,语音交互通过智能音响、智能家居、机器人及自动驾驶等领域都有广泛应用。

前不久,阿里巴巴开源了一项语音识别模型,这是模型主要使用基于BLSTM 的统计参数语音合成系统作为基线系统,采用广泛使用的跳跃连接技术,在执行反向传播算法时,梯度可以绕过非线性变换。

据官方介绍,该模型命名为“DFSMN”,它对比目前业界使用最为广泛的LSTM模型,训练速度更快、识别准确率更高。采用全新DFSMN模型的智能音响或智能家居设备,相比前代技术深度学习训练速度提到了三倍,语音识别速度提高了两倍。

正如阿里巴巴表示,DFSMN模型不仅被谷歌等国外巨头在论文中重点引用,更基于世界最大的免费语音识别数据库LibriSpeech,将全球语音识别准确率纪录提高至96.04%。而这次阿里巴巴开源DFSMN,也是希望能让更多的开发者群体在语音识别领域能发光发热。

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();