智识聚焦 | AI会做阅读理解？剥开机器阅读理解的神秘外衣--粉丝服务平台-粉丝头条-fensifuwu.com

智识聚焦 | AI会做阅读理解？剥开机器阅读理解的神秘外衣

科技 08-21 来源：涂鸦智能

作者|与非们

编辑|新物语

你们是否还记得去年的日本AI机器人Torobo-kun？它是日本国立情报学研究所研制出来的人工智能机器人。Torobo-kun的终极目标是通过日本顶尖高校东京大学的入学考试，但因Torobo-kun在每个科目的阅读理解测试中就表现得十分糟糕，研究人员不得不放弃了这项计划。

此后，即使Torobo-kun折戟阅读理解，许多研究者依然对人工智能在阅读理解领域的开发保持乐观。公立函馆未来大学的Hitoshi Matsubara教授及其团队一直对AI机器人阅读理解领域表示出兴趣，他希望由此开发一个能够写小说的人工智能系统，借此赢得一个文学奖项。此外，他的项目还有另一个目标：通过学习已逝科幻小说家小松左京的文风和用词，完成后者未写完的小说《虚无回廊》。

现在，经过两年的积淀，AI机器人虽然还不能写出《虚无回廊》，但在阅读理解领域已经有了长足的发展。

机器阅读理解超过人类？

机器阅读理解是自然语言处理技术中，继语音判断、语义理解之后最大的挑战：让智能体理解全文语境。所以这个领域的“跑分”，一直是AI界的大事件。

今年1月11日，斯坦福大学著名的机器阅读理解赛事SQuAD刷新了全球排名，令人惊奇的是阿里巴巴凭借82.440的精准率打破了世界纪录。最重要的是，这个成绩超越了人类82.304的平均得分，正式宣布AI在精准阅读能力上超越了人类。

国外网友和AI从业者，对这个中国公司完成的这项研究成果表示了赞赏，将其列为2018伊始AI的重要突破，卡内基梅隆大学发现计算机科学学院研究教授Jeff Schneider等等业界大牛也对阿里团队表示了敬意。

这项测试的得分，包括精确匹配(Exact Match)和模糊匹配(F1-score)两项结果。尽管阿里是以微弱优势取胜，称不上表现优秀，但这代表自然语言处理（NLP）软件首次得以在这一特定基准上超越人类。谷歌、IBM、Facebook、腾讯、三星、Salesforce和其他公司也已向这项测试提交了自己的模型，但目前为止没有任何模型达到人类的阅读理解水平。

除此之外，作为去年这项国际顶级赛事的冠军——科大讯飞与哈工大联合实验室（HFL）提交的系统模型，虽然跑分没有超过人类，却将在很多领域进行应用。

据了解，这个冠军模型可以根据给定的问题对篇章进行多次过滤，同时根据已经被过滤的文章进一步筛选出问题中的关键提问点。也就是说，不只从问题到篇章，也从篇章到问题，交互式地逐步精确答案的范围。

目前，这机器已经能给试卷主观题评分，未来还能根据卷宗做法条预测，甚至能针对病历提出治疗建议。下一步，哈工大讯飞联合实验室将在工业化应用的尝试中，通过现实海量数据的不断测试，找到模型优化的方法。模型的变种将可能应用于教育、司法、医疗等多个领域。

大佬抢占机器阅读理解

不只是为了写书那么简单

由于阅读理解这项“智能”调整，需要运用到大量逻辑、细节和结构分析能力，并且直接作用于现实中的文本资料，所以实际价值巨大。

最直接的产业影响，是大多数今天还必须由人工完成的规则、对话、服务信息类的相关理解工作，都可以被人工智能所取代。例如客服、信息管理和推荐类的工作，都可以考虑用不眠不休、高运算速度的机器来取代。