1973年,英国著名应用数学家James Lighthill曾对当前大热的人工智能泼了盆冷水,在他看来,AI若在各领域无法给社会带来预期中的影响力,那么会直接导致AI研究热情的下降。
45年后的今天,当“高大上”的AI技术逐渐渗入人类生活时,Lighthill教授的“预言”还会成真吗?
在2018世界人工智能大会的“看见,智能”分论坛上,一场关于AI技术发展的头脑风暴就这样如火如荼地展开了。
商业化和实用化,是人工智能的难点之一
语音识别,是此次世界人工智能大会使用颇多的一项AI技术,尤其是对于演讲内容的语音转文字和机器翻译,给大量与会人员带去了便利。
但是,北京大学教授、中华人民共和国工业和信息化部原副部长杨学山教授却留意到了一点:
(9月18日)上午我们看现场的语音识别和人的机器翻译水平确实很高了。但如果大家关注的话,你可以看到,下午的水平就差了点。同样是这两个系统,系统没有变,但是下午的水平低了,为什么?
若以此进行类比,自动驾驶技术其实也存在这样的问题。比如,自动驾驶在稍许空旷的道路上可以畅行无阻,可在实际复杂的城市交通环境下却仍无法应用。
在杨教授看来,这就是当前人工智能发展所面临的一大问题。需求和技术是具有多样性的,AI在各领域的框架也已经形成了,但要真正走向商用化和实用化,还有很多工作要做。
然而要实现这些,除了很多人都提到的人才培养外,杨教授认为还有成熟模式推广和主战场集中这两方面。
例如本次大会,如果有好的语音识别和机器翻译,就能完全解决跨国交流的障碍,让AI在这一应用场景下实现高质量发展,变成真正有效的工具。
■图片/VCG工业化,是人工智能的创新之一
在人工智能技术走上商品化和产品化的同时,其本身在各领域布局时还需要有一些创新。
依图科技首席创新官吕昊,就向大家介绍了旗下一个获得过创新奖的产品——面部识别平台,依图将其运用到各类需要人脸检索的场景中,比如零售等。
但其创新点,也就是难点在于,如何在技术方面突破面部识别对于规模的限制?如何让人工智能技术的应用变得像流水线一样操作?
当前,刷脸技术其实在诸多场景都有应用,但一个摄像头能识别多少数量?一分钟能处理多少张人脸?这些问题都成了面部识别难以走进大规模商业化场景的阻碍。
为此,依图从2015年起从运用深度学习建立算法模型,将错误匹配率降低到了1/30亿,并将这一面部识别平台打造成了一种工业化的过程。
在面部识别当中有很多的步骤,首先要有一个摄像头捕捉你的面部,对面部进行追踪和筛选,筛选出那些看上去是人脸,但实际上并非是人脸的图像,然后进行一致性的校验等等,到最后你基于所获取的这些图像进行检索,这个就像是整个生产线一样的步骤。
一旦有了工业化过程,每一个步骤,分别可以在哪些服务器或者设备上来做,都能定下最优化的选择,从而通过最快速、最节约成本的路径来达到既定效果。
■图片/VCG对于人工智能,数据不是万能的
数据不是万能的,但没有数据是万万不能的。
人工智能的产业化和商品化,离不开大数据的支持,但霍金弟子约翰霍普金斯大学教授、计算机视觉领域奠基人Alan Yuille教授认为,数据并不是万能的,人工智能在实际应用时所遇到的限制,也正是数据所带来的。
现场,他以一只猴子的图片来举例。比如当人们在猴子上放一把吉他,这件被认为是人类经常使用的东西,就会“迷惑”人工智能把猴子识别成一个人,因为人工智能没见过弹吉他的猴子。
我认为我们所得到的数据,它们描述图像的过程中,只是部分代表了这些图像的信息,有时候我们所获取到这些数据,并不是关于这个图像的最关键的信息。因为它是基于过往的经验进行训练的,对于一些新的场景以及问题,不是人工智能所关注的点,所以它们就很容易会忽略掉。
为此,在Alan Yuille教授看来,人工智能的在训练和深度学习的过程中,就是要在不同的状况下进行测试,即便是一些重复且无聊的实验,如此,当人工智能技术真正运用到实际场景中时,便可提高它的识别精度。
你其实并不想要达到一个平均值,而是想要说最糟糕的情况是什么样的。比如通过CT扫码肿瘤的时候,你一定要知道最糟的情况是什么。
留言与评论(共有 0 条评论) |