百度谷歌双杀,超级人工智能显露端倪

2017-01-09 16:11

最近两天,人工智能频出大新闻,先是AlphaGo的升级版本以神秘Master的身份亮相,横扫国际围棋大师,连胜60场,紧接着百度大脑在《最强大脑》节目中挑落人类脑力精英,一度甚至无人敢于应战。

人工智能在棋类的逻辑中战胜人类也就罢了,在人类天生擅长的视觉感知与辨识上,人工智能也能战胜人类,真是意料之外。科幻小说的场景如今似乎是近在眼前了,那么百度和谷歌的人工智能技术究竟谁更强大?百度和谷歌的双杀又预示着什么呢?

一、AlphaGo攻克逻辑思维

AlphaGO玩的棋类游戏,计算机也很早就超越人类。计算机下棋的原理是蒙特卡罗树搜索,每一步都计算可能,算出结果,选出最优解。围棋成为人类最后的堡垒,是因为围棋的棋盘太大,变化可能太多。算清围棋的每一路变化还不可能。

AlphaGO在本质上,还是10年甚至20年前的技术,蒙特卡罗树搜索,但是AlphaGO在判断上利用上了最新的人工智能技术,它通过千万盘网络棋局学习人类的判断,对落子的点进行优选,这样就不用每个点算清,只要算明白优选点就可以。而且AlphaGO还可以自我对局,不断从实战中优化自己的优选点,还能把棋盘分块,把局部完全算清楚。经过不断进化,在短短一年多的时间里面从业余到专业,再到战胜柯洁。

因为计算机算清楚很多可能,所以就可以下一些人类不会下的点。人类不熟悉,靠棋感,而计算机早就算清了。百度深度学习实验室主任林元庆这样评价:“打一个比喻,比如说有一群山,有山谷,这边和那边的山多有山谷,我们的方法是去找最低的山谷,AlphaGo可以从不同的地方找,人类是从几个范围里面找,AlphaGo在别的地方找的时候,看到的是完全不一样的风景。因此,很可能失去空间,能产生一些非常反常规的内容,对AlphaGo来说不是常规的下法,这是很正常的。”

所以,AlphaGo的核心技术还是10年、20年前的思路,最新的神经网络、深度学习成果仅仅用来减少了计算量,做了优选和价值判断。AlphaGo的成功攻克了人类的逻辑思维,但是层次并不高,中国和日本都在短期内做出类似的高水平围棋人工智能。AlphaGo的宣传意义大于技术价值,它更大的意义在于利用围棋对全社会做了人工智能的启蒙,它让大家开始关注人工智能。

二、百度大脑超越人类感知

百度在《最强大脑》上展示超越人类的人脸识别技术,在人工智能方面远比AlphaGo复杂。

传统的人脸识别技术是简单识别人脸轮廓,找几个特征点,然后识别。如果人脸在运动中扭曲,或者光线弱一点,特征不明确,或者有遮挡,或者如果存在一定的模糊,机器都不能识别。所以传统的人脸识别价值很低,无法替代人类对身份的鉴别。

而百度大脑的人脸识别是基于积层神经网络的,人工智能应用于人脸识别是一层一层神经网络的判断。

百度的人脸识别首先对人脸的关键点进行定位,确定要识别的图像或者实体中包含的人脸在哪?然后粗定位,对人脸进行矫正,再做五官特征点的细定位,还要跟踪定位的特征点,而这一步就需要大量的深度学习才能做到准确。然后百度会对人脸做分割,捕获的图像来自于人脸的那个器官,把人脸的轮廓搞清楚,与衣服装饰区分开。这一步算是优选,同样需要深度学习来解决。第三步是判断捕获人脸的一些基本属性,你是亚洲黄种人还是非洲黑人,是男是女,戴不戴眼镜。这里已经有一定的逻辑判断了,归类准确才能正确识别。第四步是对表情动态引发的脸部特征点的变化进行检测,让机器能识别微笑的你和大哭的你是同一个人。还有第五步,第六步……

这样一层一层下来,每一步都用到深度学习技术,通过亿的参数,千亿的样本和亿级的特征训练。最终达到超越人类的水平。

在上《最强大脑》之前,百度在人脸识别技术两个最为权威的国际评测——FDDB与LFW中已经获得了双料世界第一,而且还在LFW中达到了前所未有的99.77%超高准确率

百度人脸识别不仅可以识别遮挡,暗光,带表情,模糊的影像。通过特征差异的大小,百度大脑还能做跨年龄的人脸识别,能从你幼年的照片推断你中年的照片。用林元庆的话说,“图像识别人工智能已经达到了可以推理的程度。”

谷歌的AlphaGO是老算法为本,人工智能技术优化老算法。而百度的人脸识别是老技术仅仅做个基础,整套神经网络与深度学习都是全新的技术发展。百度的层次无疑要更高一点。

百度大脑人脸识别的背后其实是机器视觉,人脸识别超过人类,类似的算法也可以让物体识别超过人类,譬如无人车要识别交通标识,无人机要识别地面目标,百度的机器视觉都是可以应用的。百度大脑还不止有机器视觉,机器视觉的研发路线同样可以解决语音识别,所以百度的语音识别技术才能被MIT列为2016年人类突破性的十大技术。拓展出去,百度大脑的应用几乎是无限的,百度的人工智能技术还可以用来超越人类的感知能力的技术。这个难度远高于AlphaGo。

所以,百度大脑的人工智能更胜一筹。

三、融合逻辑与感知的超级人工智能

AlphaGo所代表的是既定规则下,明确信息下计算机的逻辑判断能力。这个技术虽然层次不太高(各个厂商肯投入资源都能做),但用途还是很广的。

医生根据症状和检查结果给患者治疗方案,律师根据现实证据和法律给客户咨询意见,这都是逻辑。逻辑上计算机超越人并不困难,除了围棋这种特殊游戏,机器在20年甚至30年前的简单逻辑判短上就超越人类了。

机器替代人工作的难度在于,机器怎么看到?怎么听到?怎么感知到?而百度大脑解决了这个高难度的问题。百度大脑的人脸识别可以“看”到人,判断出“看”到的人是谁。百度大脑还是听明白这个人在说什么,要表达的意图是什么。百度大脑感知结合简单的逻辑,就可以给我的生活带来巨大改变。

人脸识别、图像识别技术用在金融行业,就可以实现“看脸”的简易身份认证,在消费支付中可以刷脸支付,提升便捷程度。百度大脑的人脸识别用到公安领域,就可以辅助刑侦、打拐,提升公安的破案效率。实际上,在去年的百度大会上和今年的乌镇大会上,百度的刷脸门禁已经令人印象深刻了。

如果百度的人工智能技术继续发展,人脸识别的99.77%超高准确率变成特定物体识别99.77%的准确率,再集合计算机擅长的逻辑判断与应对。人类大量艰苦劳动,机械性劳动就可以被取代了。

无人驾驶只是小菜一碟的;工厂的工人可以不用做具体工作,计算机感知,处理,工人只要监督故障就可以了;农民无需种地,机器完成从播种到管理,再到收割仓储的全过程,农民只要监督人工智能的农业机械工作就可以了。

融合和逻辑与感知的超级人工智能将无所不能,人类的工作效率将大大提升,大量劳动力可以投入到创造性的劳动之中,一个人工智能造福人类的超级人工智能时代也将到来。

分享到:
文章评论 · 所有评论
评论请遵守当地法律法规
点击加载更多
精彩图片
© 2016 粉丝服务 http://www.fensifuwu.com 中国互联网举报中心 豫ICP备10026901号
违法和不良信息举报:[email protected]