智识聚焦 | AI会做阅读理解?剥开机器阅读理解的神秘外衣

作者|与非们

编辑|新物语

你们是否还记得去年的日本AI机器人Torobo-kun?它是日本国立情报学研究所研制出来的人工智能机器人。Torobo-kun的终极目标是通过日本顶尖高校东京大学的入学考试,但因Torobo-kun在每个科目的阅读理解测试中就表现得十分糟糕,研究人员不得不放弃了这项计划。

此后,即使Torobo-kun折戟阅读理解,许多研究者依然对人工智能在阅读理解领域的开发保持乐观。公立函馆未来大学的Hitoshi Matsubara教授及其团队一直对AI机器人阅读理解领域表示出兴趣,他希望由此开发一个能够写小说的人工智能系统,借此赢得一个文学奖项。此外,他的项目还有另一个目标:通过学习已逝科幻小说家小松左京的文风和用词,完成后者未写完的小说《虚无回廊》。

现在,经过两年的积淀,AI机器人虽然还不能写出《虚无回廊》,但在阅读理解领域已经有了长足的发展。

机器阅读理解超过人类?

机器阅读理解是自然语言处理技术中,继语音判断、语义理解之后最大的挑战:让智能体理解全文语境。所以这个领域的“跑分”,一直是AI界的大事件。

今年1月11日,斯坦福大学著名的机器阅读理解赛事SQuAD刷新了全球排名,令人惊奇的是阿里巴巴凭借82.440的精准率打破了世界纪录。最重要的是,这个成绩超越了人类82.304的平均得分,正式宣布AI在精准阅读能力上超越了人类。

国外网友和AI从业者,对这个中国公司完成的这项研究成果表示了赞赏,将其列为2018伊始AI的重要突破,卡内基梅隆大学发现计算机科学学院研究教授Jeff Schneider等等业界大牛也对阿里团队表示了敬意。

这项测试的得分,包括精确匹配(Exact Match)和模糊匹配(F1-score)两项结果。尽管阿里是以微弱优势取胜,称不上表现优秀,但这代表自然语言处理(NLP)软件首次得以在这一特定基准上超越人类。谷歌、IBM、Facebook、腾讯、三星、Salesforce和其他公司也已向这项测试提交了自己的模型,但目前为止没有任何模型达到人类的阅读理解水平。

除此之外,作为去年这项国际顶级赛事的冠军——科大讯飞与哈工大联合实验室(HFL)提交的系统模型,虽然跑分没有超过人类,却将在很多领域进行应用。

据了解,这个冠军模型可以根据给定的问题对篇章进行多次过滤,同时根据已经被过滤的文章进一步筛选出问题中的关键提问点。也就是说,不只从问题到篇章,也从篇章到问题,交互式地逐步精确答案的范围。

目前,这机器已经能给试卷主观题评分,未来还能根据卷宗做法条预测,甚至能针对病历提出治疗建议。下一步,哈工大讯飞联合实验室将在工业化应用的尝试中,通过现实海量数据的不断测试,找到模型优化的方法。模型的变种将可能应用于教育、司法、医疗等多个领域。

大佬抢占机器阅读理解

不只是为了写书那么简单

由于阅读理解这项“智能”调整,需要运用到大量逻辑、细节和结构分析能力,并且直接作用于现实中的文本资料,所以实际价值巨大。

最直接的产业影响,是大多数今天还必须由人工完成的规则、对话、服务信息类的相关理解工作,都可以被人工智能所取代。例如客服、信息管理和推荐类的工作,都可以考虑用不眠不休、高运算速度的机器来取代。

举个例子,我们都注意到了这样一个问题:今天的互联网世界,在生产越来越多文本内容。太多你知道的、你不知道的、你以为自己知道的却实际不知道的事情呼啸而过。甚至你双11想要剁个手,都有各种各样的游戏规则等着你。

这里或许就可以用机器阅读理解来解决了。比如客户对某个电商促销规则有疑问,就可以直接向AI提问,而AI就可以把这个问题当做一道阅读理解问题来进行解决方案回馈。

再比如,最近争议不断的内容推荐领域。今日头条最近反复出状况,很大程度来源于舆论指责其过度依赖关键词进行算法推荐,忽略了用户的对文章深度与知识性的需求。这就是因为其算法的“阅读理解”能力不够,无法阅读真实的互联网材料,给出个性化的推荐结果。

除此之外,机器阅读能力也是文娱领域进行内容寻找和推荐的有效方式,比如阅读用户提出的复杂需求,进行精准推荐;而与天猫精灵等硬件相结合,给出对用户大段语言的回馈,乃至对话互动,都要以机器理解能力为依托。

机器阅读理解是人工智能皇冠上的明珠,它的进步牵动着其他行业的发展。计算语言学协会会士林德康就曾表示:“机器阅读理解是自然语言处理领域中的研究焦点,能将这项技术落地应用到实际生活中是我们一直以来的目标。”

- END -

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();