小度机器人成新晋最强大脑 计算能力超越AlphaGo

谁是世界上最强的大脑?在最新一期的《最强大脑4》中,百度研发的“小度机器人”成为公认“脑王”,不仅在人脸识别赛题中,仅根据童年照片比对就发现了蜜蜂少女队中隐藏的同卵双胞胎队员,依靠万分之一的区别概率选出了正确答案,令观众和网友叹服。

在“小度”参与“人机大战”前,机器与人类的PK多在下棋、答题等领域,从1997年IBM深蓝战胜卡斯帕罗夫起,似乎就意味着人类智力在棋类游戏中不敌人工智能。随着人工智能的不断进化,机器还会从程序运算走向抽象思维认知全新阶段,在更多的领域超越人类。“小度”此次战胜人类对手正是机器探索抽象思维认知的阶段性成果。

代表棋类人工智能最高水平的AlphaGo缘何能轻松战胜人类。曾有人道破天机:“AlphaGo一天对弈的棋局,比人类专业棋手一辈子下过的都要多得多!”从计算原理上来看,AlphaGo棋力精进主要依靠机器学习的一个分支——深度学习技术,能基于当前局势,预测对手下一步落子,并计算棋局的不同走向。更重要的是,AlphaGo在挑战李世石之前,已经在与人类棋手的对弈中学习了近万盘棋局,而与自己“左右互搏”的棋局更是超过3000万盘!如此庞大的对弈盘数,使得AlphaGo在对战中妙手频出让对方陷入被动。

人脸识别与下棋大有不同。简单说,人脸识别包含两种技术:一种是1:1 的人脸比对,比如像银行的应用场景,通过比对希望知道这张人脸是不是身份证上面的那个人;还有一种更通用的 1:N 人脸识别,N 可以是几千、几万或者几十万进行比对,这叫 1:N 的比对或者是 1:N 的人脸识别。“小度”在《最强大脑4》中与名人堂轮值主席王峰PK时展现出的人工智能技术,则属于第二种,而且是其中最复杂的跨年龄识别。

众所周知,人类童年时的照片与成年后的脸部相比有明显区别。虽然人脑传承了祖先上百万年积累的脸部识别天赋,但跨年龄识别仍是很难完成的挑战。百度深度学习实验室(IDL)科学家们选择了用度量学习的方法破解这一难题,即通过学习非线性投影函数将图像空间投影到特征空间中,在大量样本中,缩小同一个人跨年龄的两张人脸的距离。考虑到跨年龄人脸的稀缺性,IDL还采用了一个用大规模人脸数据训练好的模型底座,并用跨年龄数据对其进行更新,从而大幅提升跨年龄识别的识别率。通俗一点说,“小度”采用的技术手段是在脸部骨骼上取尽可能多的采样点,把其与需要筛选的大量人脸逐个比较。当然,双胞胎由于骨骼相似差别细微,所以识别的难度也要比普通人更大。

技术原理看似轻描淡写,实际情况是,尽管百度大脑经过了两亿多习题的人脸识别训练,在该领域的能力目前世界领先,但跨年龄识别等技术对计算能力要求极高,“为了这次比赛,我们也收集了一些跨年龄的数据,根据跨年龄这个场景再进一步优化模型,跨年龄数据大概在几千张这个级别,并不算特别的多。” 百度深度学习实验室(IDL)主任林元庆表示“小度”获胜并非易事,而且在现场识别人脸时,光照、人脸姿态、遮挡程度等因素会对人脸检测带来干扰,光照、表情、遮挡、年龄、模糊也会影响到人脸识别的精度,特别是面对年龄跨度较大的情况,由于缺乏两个年龄中间的足够数据,所以“小度”更难学习和掌握人脸的变化。

《最强大脑》科学顾问团首席顾问、北京师范大学心理学院院长刘嘉教授在观看结果后,不无感慨:“我们《最强大脑》的选手真正是在和世界上最顶级的、甚至在某些程度上超过AlphaGo的人工智能进行对决。”

从AlphaGo到“小度”,人工智能正在从程序化运算走向抽象思维的认知的全新阶段。“我们参与这次活动很重要的一个目的是希望能让大众能深切感觉到人工智能能做什么。” 林元庆表示,机器在一些能力上超过人是很正常的,但人工智想要整体全面地超越人类还有非常长的路要走,“小度”和百度人工智能的工作就是帮助人类完成更多创造性思维的任务。