中关村在线消息:7月3日“Baidu Create 2019”百度 AI开发者大会现场,百度首席技术官王海峰在演讲中表示,“百度研发了流式多级的截断注意力模型(SMLTA),使语音识别的准确率大幅提升并保持了非常高的速度,这是首个基于流式注意力的语音识别线上服务,百度输入法语音识别的准确率因此相对提升15%以上”。
2019百度AI开发者大会百度CTO王海峰分享SMLTA模型
现场百度语音技术部负责人高亮对百度输入法念出的一段高难度中英混杂“Rap”,对此百度输入法零误差地识别出来,语音输入得到了准确理解并根据语义进行正确断句,百度输入法的语音识别还保持了非常快的速度,边说边上屏,无需等待整句念完便可呈现识别结果。
百度语音技术部高亮现场评测百度输入法中英自由说
据悉,自2019年初,百度输入法公布在线语音识别、离线语音识别、中英自由说、方言自由说四大语音输入功能突破后,技术突破持续深入。目前,离线语音识别准确率已达到在线语音识别效果,效果提升的同时还降低了模型大小,占用更少的内存,离线和在线语音输入之间还可无缝切换。截止目前,百度输入法日均语音请求量峰值已突破6.2亿次。
【ZOL客户端下载】看最新科技资讯,APP市场搜索“中关村在线”,客户端阅读体验更好。(7209147)
留言与评论(共有 0 条评论) |