对着屏幕背古诗,自动识别错误还有评分?作业帮这项技术神了

【帮帮技术漫谈】第1期来啦!对着屏幕背古诗 自动识别错误,还有评分?这是怎样实现的?

智能语音评测背后有一个重要的词汇:计算机辅助语言学习(Computer Assisted Language Learning——CALL),常见的英语单词跟读评分,也是基于这个原理。

但偶尔你是不是也会怀疑,这评分真的靠谱吗?

其实发音评判的维度包括以下方面:准确率、流畅度、完整度、韵律、语调。而口语好坏的评价则相对主观的,人工专家会根据自身经验和知识,在各维度进行打分。

AI替代的评测系统,要做的就是不断学习,让智能打分越来越接近专家。

一般参考两大指标:即相关系数(Pearson correlation coefficient)一致性(kappa coefficient),越接近专家打分,说明系统越靠谱。

作业帮在实践中,基于特征提取工程,收集了包括GOP(Goodness of Pronunciation)分数,元辅音,词性,声调,发音时长,流利度等多维度信息,通过神经网络模型强拟合能力,预测分数结果,目前评测效果与人工打分已有非常高的一致性!(点赞)

那么,古诗背诵中的语音评测,难在哪里?

首先,在古诗的评测文本中,其解码图不同于单独的词语,而是以一个完整的句子为单位。

作业帮采用了多分支评测的方法,支持句子重复读(可以家长领读,小孩跟读),跳读(即可以往前跳,也可以往后跳),保留了足够的自由度。

同时,读古诗时刷新速度非常快,为保证能实时反馈评测结果,我们通过ONNX 跨平台部署,神经网络模型剪枝将算法模型压缩至10M以内,做到了手机等移动端本地才能获得的极致丝滑体验。

当然,如果没有充足的数据,再好的模型也无法学到足够的“知识”。在这一方面,作业帮相关专利技术可实现语音识别系统中数据自动回流训练,不断主动学习,达到自动模型迭代的效果。

屏幕前的朗朗背诵声,背后是一个精妙的算法世界。

对着屏幕背古诗,自动识别错误还有评分?作业帮这项技术神了

发表评论
留言与评论(共有 0 条评论) “”
   
验证码:

相关文章

推荐文章