百度谷歌双杀，超级人工智能显露端倪

最近两天，人工智能频出大新闻，先是AlphaGo的升级版本以神秘Master的身份亮相，横扫国际围棋大师，连胜60场，紧接着百度大脑在《最强大脑》节目中挑落人类脑力精英，一度甚至无人敢于应战。

人工智能在棋类的逻辑中战胜人类也就罢了，在人类天生擅长的视觉感知与辨识上，人工智能也能战胜人类，真是意料之外。科幻小说的场景如今似乎是近在眼前了，那么百度和谷歌的人工智能技术究竟谁更强大？百度和谷歌的双杀又预示着什么呢？

一、AlphaGo攻克逻辑思维

AlphaGO玩的棋类游戏，计算机也很早就超越人类。计算机下棋的原理是蒙特卡罗树搜索，每一步都计算可能，算出结果，选出最优解。围棋成为人类最后的堡垒，是因为围棋的棋盘太大，变化可能太多。算清围棋的每一路变化还不可能。

AlphaGO在本质上，还是10年甚至20年前的技术，蒙特卡罗树搜索，但是AlphaGO在判断上利用上了最新的人工智能技术，它通过千万盘网络棋局学习人类的判断，对落子的点进行优选，这样就不用每个点算清，只要算明白优选点就可以。而且AlphaGO还可以自我对局，不断从实战中优化自己的优选点，还能把棋盘分块，把局部完全算清楚。经过不断进化，在短短一年多的时间里面从业余到专业，再到战胜柯洁。

因为计算机算清楚很多可能，所以就可以下一些人类不会下的点。人类不熟悉，靠棋感，而计算机早就算清了。百度深度学习实验室主任林元庆这样评价：“打一个比喻，比如说有一群山，有山谷，这边和那边的山多有山谷，我们的方法是去找最低的山谷，AlphaGo可以从不同的地方找，人类是从几个范围里面找，AlphaGo在别的地方找的时候，看到的是完全不一样的风景。因此，很可能失去空间，能产生一些非常反常规的内容，对AlphaGo来说不是常规的下法，这是很正常的。”

所以，AlphaGo的核心技术还是10年、20年前的思路，最新的神经网络、深度学习成果仅仅用来减少了计算量，做了优选和价值判断。AlphaGo的成功攻克了人类的逻辑思维，但是层次并不高，中国和日本都在短期内做出类似的高水平围棋人工智能。AlphaGo的宣传意义大于技术价值，它更大的意义在于利用围棋对全社会做了人工智能的启蒙，它让大家开始关注人工智能。

二、百度大脑超越人类感知

百度在《最强大脑》上展示超越人类的人脸识别技术，在人工智能方面远比AlphaGo复杂。

传统的人脸识别技术是简单识别人脸轮廓，找几个特征点，然后识别。如果人脸在运动中扭曲，或者光线弱一点，特征不明确，或者有遮挡，或者如果存在一定的模糊，机器都不能识别。所以传统的人脸识别价值很低，无法替代人类对身份的鉴别。

而百度大脑的人脸识别是基于积层神经网络的，人工智能应用于人脸识别是一层一层神经网络的判断。

百度的人脸识别首先对人脸的关键点进行定位，确定要识别的图像或者实体中包含的人脸在哪？然后粗定位，对人脸进行矫正，再做五官特征点的细定位，还要跟踪定位的特征点，而这一步就需要大量的深度学习才能做到准确。然后百度会对人脸做分割，捕获的图像来自于人脸的那个器官，把人脸的轮廓搞清楚，与衣服装饰区分开。这一步算是优选，同样需要深度学习来解决。第三步是判断捕获人脸的一些基本属性，你是亚洲黄种人还是非洲黑人，是男是女，戴不戴眼镜。这里已经有一定的逻辑判断了，归类准确才能正确识别。第四步是对表情动态引发的脸部特征点的变化进行检测，让机器能识别微笑的你和大哭的你是同一个人。还有第五步，第六步……

这样一层一层下来，每一步都用到深度学习技术，通过亿的参数，千亿的样本和亿级的特征训练。最终达到超越人类的水平。

在上《最强大脑》之前，百度在人脸识别技术两个最为权威的国际评测——FDDB与LFW中已经获得了双料世界第一，而且还在LFW中达到了前所未有的99.77%超高准确率

百度人脸识别不仅可以识别遮挡，暗光，带表情，模糊的影像。通过特征差异的大小，百度大脑还能做跨年龄的人脸识别，能从你幼年的照片推断你中年的照片。用林元庆的话说，“图像识别人工智能已经达到了可以推理的程度。”

谷歌的AlphaGO是老算法为本，人工智能技术优化老算法。而百度的人脸识别是老技术仅仅做个基础，整套神经网络与深度学习都是全新的技术发展。百度的层次无疑要更高一点。

百度大脑人脸识别的背后其实是机器视觉，人脸识别超过人类，类似的算法也可以让物体识别超过人类，譬如无人车要识别交通标识，无人机要识别地面目标，百度的机器视觉都是可以应用的。百度大脑还不止有机器视觉，机器视觉的研发路线同样可以解决语音识别，所以百度的语音识别技术才能被MIT列为2016年人类突破性的十大技术。拓展出去，百度大脑的应用几乎是无限的，百度的人工智能技术还可以用来超越人类的感知能力的技术。这个难度远高于AlphaGo。

所以，百度大脑的人工智能更胜一筹。

三、融合逻辑与感知的超级人工智能

AlphaGo所代表的是既定规则下，明确信息下计算机的逻辑判断能力。这个技术虽然层次不太高（各个厂商肯投入资源都能做），但用途还是很广的。

医生根据症状和检查结果给患者治疗方案，律师根据现实证据和法律给客户咨询意见，这都是逻辑。逻辑上计算机超越人并不困难，除了围棋这种特殊游戏，机器在20年甚至30年前的简单逻辑判短上就超越人类了。

机器替代人工作的难度在于，机器怎么看到？怎么听到？怎么感知到？而百度大脑解决了这个高难度的问题。百度大脑的人脸识别可以“看”到人，判断出“看”到的人是谁。百度大脑还是听明白这个人在说什么，要表达的意图是什么。百度大脑感知结合简单的逻辑，就可以给我的生活带来巨大改变。

人脸识别、图像识别技术用在金融行业，就可以实现“看脸”的简易身份认证，在消费支付中可以刷脸支付，提升便捷程度。百度大脑的人脸识别用到公安领域，就可以辅助刑侦、打拐，提升公安的破案效率。实际上，在去年的百度大会上和今年的乌镇大会上，百度的刷脸门禁已经令人印象深刻了。

如果百度的人工智能技术继续发展，人脸识别的99.77%超高准确率变成特定物体识别99.77%的准确率，再集合计算机擅长的逻辑判断与应对。人类大量艰苦劳动，机械性劳动就可以被取代了。

无人驾驶只是小菜一碟的；工厂的工人可以不用做具体工作，计算机感知，处理，工人只要监督故障就可以了；农民无需种地，机器完成从播种到管理，再到收割仓储的全过程，农民只要监督人工智能的农业机械工作就可以了。

融合和逻辑与感知的超级人工智能将无所不能，人类的工作效率将大大提升，大量劳动力可以投入到创造性的劳动之中，一个人工智能造福人类的超级人工智能时代也将到来。

意见反馈

百度谷歌双杀，超级人工智能显露端倪