文稿丨李太豪:情感计算前沿技术研究

大家好。我今天汇报的题目是“情感计算前沿技术研究”。

我们知道,情感是智能的一部分。那么,下一步人工智能领域的突破点会在哪儿呢?有的人就提出来可能是让计算机或者是让机器有情感。现在,我们和机器通过什么来交流?我们知道,鼠标、键盘、屏幕。但是,我们和机器之间的这种交流能称为真正的情感交流吗?没有情感的智能,我们认为不是真正的智能。怎么样实现让机器有情感呢?这里我们提到的就是情感计算。

情感计算出现的相对较晚,它是在1997年由麻省理工学院一位女教授Picard提出来的。她当时写了一本书叫《AffectiveComputing》。这本书确立了计算机领域的一个新学科,叫做情感计算。这里面还有个小插曲,据Picard自己讲,当时她写了一篇关于情感计算的论文,投到杂志去,但被拒收了。之后,Picard为了要评职称,她就把它写成一本书给出版了。所以,在科研的道路上,我们可以看到,很多新的突破往往是在失败中找到了一点曙光,从而产生了一个机会。

那么,情感计算是干什么的呢?是怎么定义的呢?对于情感计算,Picard是这样定义的:情感计算是关于情感、情感产生以及影响情感方面的计算。换句话说,让机器(计算机)也具备“感情”,有人叫做机器的“读心术”或者说让机器具有察言观色的能力。这听起来挺玄的,怎么能让机器察言观色?你坐在机器面前,机器就知道你怎么想的。这是一件很难的事情。

情感计算到底该怎么去研究?首先,我认为它是一个认知。这个认知是指我们要知道情感产生的机理是什么。然后感知。感知是能够让机器知道这些情感所在的地方,然后让机器去理解,最后它能够产生一种表达。

情感是什么呢?我们每个人都有情感,我们常说的就是喜怒哀乐。情感是不是一种人为的主观想象出来的东西呢?如果是一种主观想象出来的东西的话,比如说上帝,你肯定是不能计算的,它一定要有自己的基础在那儿。当谈到情感的时候,我们首先要谈到脑。我们大家知道,脑由大脑、小脑、脑干等部分组成。作为脑来讲,主要的组成是神经元。大脑有140亿个神经元,每一个神经元和周围神经细胞的连接达5万个。一个人脑中形成的网络比全世界的电话网络还要大1500倍。脑的功率有多少?其实有人算过,我们脑的功率只相当于一个20瓦的灯泡。如果现在要让计算机去模拟人脑,实现人脑这些功能,那得需要多大一个计算机呢?它需要40层楼高的大厦、几百千瓦功率的计算机才能实现人脑的功能。因此,人脑是非常非常神秘的,也是当前一个很难解决的问题。我们现在谈到人工智能神经网络,其实就是模拟人脑的网络。

情感产生于何处呢?过去长期以来,我们认为情感是人脑思维过程中一种副产物,它对于人的思维,对于人的各种行为不产生什么作用。也就是说,你只要思考,人脑一活动,它就产生了,直到一九五几年人们才找到了情感在脑中产生的地方,这个地方被称为边缘系统。这个边缘系统主要是海马、丘脑等,这都是情感产生的地方。有了这样一个物质基础,肯定有一定的表现。我们通过我们的鼻子、眼睛、耳朵、手等介质感知到情感。而情感又表现在什么地方呢?它主要在文本当中,比如今天有人发了一个微博,他肯定想表达一种情感。因此,在文本当中有情感。当你说话的时候,你的语音、语调在不同的场合、不同的环境也是不一样的。因此,这里面也是有情感的。包括我们的面部表情,你高兴的时候和你悲伤的时候,表情肯定是不一样的,这里面也是有情感的。还有我们的生理信号,比如说当你激动的时候,你的心跳、血压与你在平静的时候的表现肯定也是不同的。这里面也都包含情感。

因为时间关系,我从情感计算中抽出几点来介绍。第一,读文知情。有这样一句话:“不是故意要等你,只是心里有你,爱不了别人。”我们看到这句话就知道它表达的是什么样一种感情。当然,我们再翻翻过去的唐诗宋词,包含情感的诗句数不胜数。那么,情感计算怎么来计算呢?首先把情感分成为不同的种类,然后通过一些自然语言的处理方法,建立一个情感辞典。句子输入之后,通过一系列的处理,判断它的情感。我们知道,现在的电商或微博都可以进行这种分析,通过这种分析能够判断人们对某一种产品或某一件事情的感觉。再有像舆情监督,其实用的也是文本的情感计算。

第二,读脸知心。心理学家的研究表明,面部表情传达的信息量高达55%。人在不同的情感下,面部表情也不一样。如果我们把面部表情的特征抽出来,那么就可以做成一种模型,然后就可以识别在这种情况下他到底处于一种什么样的情感。

最后,我们简单再说一下读波知情。这是一个心电图,我们做过心电图的都知道,心电图有RS-T波形,因为心脏在极性化和去极性化的过程中产生了微弱的电流,然后通到我们全身各处,我们把微弱电流读取之后就形成了这样的波,其实在这里面也是有我们的情感存在的。那么,它可以运用到什么地方呢?比如说,我们可以随时监测司机的心率或者心电,这样的话,就可以分析这个人开车的时候有没有突然间发怒,因为常有“路怒症”导致交通事故;有时候像公交车司机心脏突然出现这样的问题,可以预警。所以,我们在这部分都是可以进行应用的。

我们是老师,我们就考虑到:情感计算是不是在教学当中能够应用呢?我的答案是当然可以。那么,我们的目标是什么?如果在一个课堂中,有六七十人,老师是不可能知道每一个学生的听课状态。如果我们通过情感计算,比如说表情的识别、生理信号的监测,把这些信息传到服务器上去,老师在讲台前就可以看到全班学生的听课状态。如果说大家都是一种比较专注、比较愉悦的状态的话,就说明他讲的大家听懂了。如果是相反的情况,他可以随时调整自己的讲课情况。同时,由于可以随时看到每个学生的听课情况,这样就为我们精准地给每一个学生布置课后练习提供了很好的参考依据。当然,我们希望通过望闻问切,就是通过摄像头的看,通过老师和学生的互动,通过脉搏或其他生理信号的分析,能够达到一种精准的教学。我们常常谈精准,精准的前提是个性化,个性化的基础是大数据,没有数据无所谓精准。这是目前开展的一个项目。

那么,情感计算研究目前存在的问题是什么?其实,现在主要的问题是各种研究是单通道的。比如说,面部表情做面部表情,语音做语音,文本做文本,生理现象做生理信号。因为我们知道情感是一个非常复杂的东西,如果要想解决它,必须是多模态、多元的,而且要深入研究情感产生的机理,能把人情感产生的机理映射到计算机里面去。这样的话,我们在深度理解人脑情感产生的基础之上构建一个多模态的数据库,通过更加复杂的算法,能够使机器在复杂的环境中对情感进行准确地理解。

总之,人和机器的交往,目前是不自然的,不和谐的。那么作为情感计算来讲,最终的目的就是希望达到一种人机和谐的交互,能够让机器去理解人,通过这种方式能够达到人机的良好相处。

我的汇报到这儿。谢谢。

(李太豪 北京语言智能研究基地特聘教授、北京成像技术高精尖中心高级科学家)

(根据宣讲家网报告整理编辑,

未经许可,不得印刷、出版,违者追究法律责任)

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();