翁嘉颀:解决AI对话困境,重塑服务机器人场景体验!【系列七】

上一讲,我们回顾了康力优蓝CEO&创始人刘雪楠先生主讲的内容《经济寒冬中服务机器人的突围之路》(点击回顾)。今天,一起来回顾竹间智能CTO 翁嘉颀主讲的内容《最强AI大脑,重塑服务机器人场景体验》。

竹间智能CTO

翁嘉颀

翁嘉颀,竹间智能CTO,台湾大学计算机本科,纽约州立大学计算机硕士。从1982年起在电脑前面至今,用过编程语言超过37种。熟悉算法,搜索引擎,邮箱安全,系统工程与架构。在网络上开课超过 16年经验。

1. 答非所问!AI对话困境难解决!

2. 重塑服务机器人AI对话的关键:场景定制和多轮回答

内容回顾

翁嘉颀所主讲的题目是《最强AI大脑,重塑服务机器人场景体验》。

目前的AI对话困境

翁嘉颀先生所领导的竹间智能科技公司,主要的业务是情绪情感计算以及语义理解,在演讲中,翁总主要为大家带来了关于语义理解的分析与讲述。

与很多演讲一样,翁总首先用一个有趣的事例开场,他讲到,曾经发生过这一件事儿,有一个用户跟某AI助理说:“男朋友要和我分手,他怎么这么对我?”于是机器人回复说:“不然呢,你以为你是谁啊?”失恋明显是一种希望被安抚的情绪和场景,而目前的现况,我们的AI或机器人明显无法做到。

为什么这么惨?因为当下的AI只有关键词的匹配,只有模板,没有上下文,因为语料都是网络上爬(爬虫抓取)来的。网络上爬来的语料完全不可控。现在的智能音箱市场非常广大,用户可以控制音箱大声一点,但当用户跟音箱说“太小声”了,目前90%的音箱会变得更小声,因为“小声”两个字触发了它的关键词机制。或者,用户跟音箱说“我听不清楚”,那么这个音箱可能会放一首歌叫做《不清楚》。这是因为模板就是这样设计的,听《青花瓷》就听《青花瓷》,说“不清楚”,如果真的有《不清楚》这首歌,那么AI就会放给你听。

该如何解决这种困境,竹间智能现在有着较为成熟的方案。翁总认为,当下大部分AI对于用户意图的理解,大概只有70分。而如果使用一个深度学习就可以解决很多问题,可能需要两三个模型来进行投票,每种模型会有各自的优缺点,所以“双模型”或“多模型”下,情况会有所改善,可以达到88分。之后,如果派专家把所有的数据做好、降噪、再针对场景进行设计,AI的语义理解可以突破94分。做音箱的厂家,把电视、车载也拿过来,多用几个模型,有机会可以上到97分,AI的进步是一步一步的,不能一蹴而就。尽管分数差距不大,但是从70分到97分,已经是质的飞跃。

重塑服务机器人场景的关键:

场景定制和多轮回答

不管是机器人、音箱,所有的人机交互,最后都将面临一个实际使用的场景。当我们跟音箱、机器人、电视说“我肚子饿”的时候,它会怎么做?一定就是给你点外卖吗?比如,一个人开车开一半说“肚子好饿”,那我们判断此时他不是要点外卖,肯定是在寻找餐馆,而如果音箱放在床头,那可能就是点外卖了,因为你根本不想起床。这就是实际使用场景下的差别,具体场景具体分析,不能单纯用固定的模板回答。

此外,翁嘉颀进一步说到,各个场景中我们也会遇到非常规的对话,此时,就需要多轮对话来解决问题。

比如订餐馆,当客服问:“几位客人用餐?”,客人可能不会告诉你“4个人”这个准确的数字,而有可能回答,有“我和爷爷、奶奶和小宝宝。”这样的非常规对话如果也被考虑在AI的回答之中,AI绝对可以得到95分以上,而具体的非常规对话有无数种,全部都是费事、费时的工作。

同样是餐厅的非常规对话事例,翁嘉颀又提到,当客人要订餐厅的位置,客服会问“您要预约的时间是什么时间?”此时人类有可能不会按照套路回答,因为人是不听话的、不可控的。所以,我们有可能收到这样的答案:“我们有七八个大人和一个小孩,明天晚上。”在这个回答中,有效信息非常模糊,比如没有准确的时间,“明天晚上”是一个范围,并不准确,而且“七八个大人”是多少个人呢,也不准确。此时,AI可以设计根据缺失的信息再访问他:“您要预约的时间是?”,回答说:“8点半”,通过上下文就可以知道,他们预订餐厅的时间是明天晚上8点半,另外因为有小孩,他们可能需要宝宝椅一张。此时再询问:“您要包厢还是大堂?”,人类可能又回给出这样的回答:“大堂太吵,还是包厢吧。”如果用关键字,“大堂”两个字,如何知道这句话的语意理解是包厢优先,大堂也可以。因此,语义理解上,除了最基本的意图理解以外,下一步在交互过程之中可以不按照顺序。通过AI询问时间,被回答地点、人数等等一大堆东西,后台需要把这些数据全部抽出来,再根据所缺的信息产生下一个问句,这就是具体分析对话的重要性。

当多轮对话越来越多的时候,下一步需要中控中心,比如订餐馆订到一半跑去订酒店、订机票,银行查帐,查到一半的时候去查分期还款,比如在不同的几个场景之间切换。

举例来说,“订酒店”从意图开始,于是AI帮用户联系酒店机器人,酒店机器人就回答“您要订哪个都市”?“上海的。”“您什么时候入住,住几天?”此时突然用户问“后天上海会不会下雨”,订酒店订一半,但是现在问天气,那这时候中控中心里就会有两个机器人同时相应,分别是酒店机器人和天气机器人,甚至可以两个回答并在一起,回答说“上海的天气晴”。同时在询问入住信息。更甚者如果,订酒店到一半,用户回答“我失恋了!”,这是聊天的场景,机器人可以继续追问“我不理解您的意思,你要告诉我你还要不要继续订酒店?”,通过中控+多轮回复的切换可以解决大多数突发状况。另外,翁嘉颀还提到如果一个多轮没有执行完毕的话,机器人需要多次确认,直到用户彻底结束场景,这轮对话才算结束。

翁嘉颀用一些具体的场景事例将为当下AI对话该如何进行场景化定制提供了解决思路。未来的AI对话还将如何发展,场景定制和多轮对话是否有用呢?我们拭目以待!

下一讲,敬请期待思岚科技CEO陈士凯先生为大家带来《打造胜任场景需求的高性能自主导航系统》。

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();