中国骄傲!人工智能“世界杯”落幕,阿里 AI 荣获冠军



五天前,人工智能领域最负盛名的学术会议 CVPR 在美国加州长滩开幕。几天来,世界各国的研究员、开发者以及产业界人士针对机器学习、计算机视觉和人工智能领域,展开了热烈的讨论。据介绍,今年 CVPR 大会共有 9227 人注册参会,突破历届记录。其中来自中国的参会人数达到 1044 位,仅次于大会举办地美国。

REC


中国来的人多,取得的成果也不小。本届最佳论文的第一作者是来自中国的辛书冕,她本科就读于西安交通大学,现在是卡耐基梅隆大学机器人研究院的博士二年级学生。此外,中国企业阿里巴巴也在这次大会上收货满满。CVPR 会议期间,会举行 WebVision 图像识别竞赛,来自世界各地的 150 多支队伍在一起同场竞技,因而也被称作是人工智能领域的“世界杯”。阿里巴巴旗下的阿里 AI 在这次竞赛中力压群雄,以 82.54% 的识别准确率获得冠军,向全世界展现了中国科技企业在人工智能领域的造诣!

接棒 ImageNet



WebVision 竞赛由苏黎世联邦理工(ETH)、谷歌以及卡耐基梅隆大学(CMU)共同主办,被誉为接棒 ImageNet 的竞赛。说到 ImageNet ,就不得不提华人女科学家李飞飞。2009 年,当时李飞飞、Jia Deng 等研究员在 CVPR 2009 上发表了一篇名为《ImageNet: A Large-Scale Hierarchical Image Database》的论文,引起了整个人工智能领域轰动。这篇论文描述了 ImageNet 数据集基准的创造、物体识别领域的研究进展,至今对整个领域还有极大的影响,在 Google Scholar 上有 5692 篇文章引用该论文。


论文走红学术圈以后,李飞飞并没有就此止步,她在思考图像识别算法与数据之间的联系。此前,她还在伊利诺伊大学香槟分校当教授时就发现,整个学术圈和人工智能产业都在寻求更好的算法,却没人来关心最底层的数据。为此,她决定建设更好的数据集,集结全世界的力量打造标准化数据集,这个数据集就是鼎鼎大名的 ImageNet。

起初,ImageNet 只是作为一个研究方向在 CVPR 期间供大家讨论。不过很快它就发展成一年一度的竞赛,来自全球各地的研究团队比赛谁能以更低的错误率识别 ImageNet 数据集中的图像对象。随着比赛的进行,参与者们越发的相信李飞飞的观点,更多的数据确实可以帮助他们开发更好的算法。

一年一度的 ImageNet 竞赛给人工智能领域贡献了大量人才,无数学术带头人都从这里走出来,无数个新型 AI 算法在这里同场竞技。鉴于 ImageNet 竞赛在人工智能领域卓越的贡献,不少媒体将其称之为 AI 世界繁荣地位催化剂。


多年的 ImageNet 竞赛,给数据集带来大量图片数据。等到 2016 年,ImageNet 中已含有超过 1500 万由人手工注释的图片网址,内容包换 2.2 万个类别。图像识别错误率也已经达到约 2.9%,远远超越人类(5.1%)。因而 CVPR 会议在 2017 年“超越 ILSVRC ”上宣布:2017 年是 ImageNet 竞赛正式组织的最后一年,未来图像视觉的重点将转向图像理解。

ImageNet 的时代结束了。不过,一个时代的结束往往意味着另一个时代的开始。在 CVPR 会议在宣布 ImageNet 竞赛结束同时, WebVision 竞赛随之开始。与 ImageNet 竞赛稍显不同的是,WebVision 更加复杂和不平衡,侧重于学习和理解网络数据。

中国三连冠



自从 WebVision 竞赛开始,来自中国的团队就开始了他们的集体秀。第一年,表现最佳的团队是来自深圳的码隆科技。这是一家专注于深度学习与计算机视觉技术创新,为开发者提供图像识别 AI 工具的人工智能公司。码隆在第一届 WebVision 竞赛中取得了 94.78% 的准确率,比第二名整整高出 2.5%。

别小看这小小的领先,在图像识别竞赛领域已经算非常的优势了。毕竟,前一年 ImageNet 竞赛中,第一名只比第二名高 0.04%。取得如此大领先的原因在于码隆科技运用了一项特有的专项技术,它将图像数据分成“干净”和“噪音”两类。先设计出一套处理“干净”数据的训练算法,然后组合“干净”和“噪音”数据训练另一套算法。


码隆科技之后,百度视觉技术团队夺得了第二年的冠军,捍卫了中国企业在 WebVision 竞赛上的荣誉。在第二年的竞赛中,主办方将数据集合由 1000 类扩大到 5000 类,训练数据量由 240 万张图片扩大到 1600 万张图片,数据量庞大许多,识别难度也大幅提高。难度提高后,识别率也降低许多,以至于作为第一名的百度,也只有 79.25% 的识别率。

不要瞧不起这识别率,这可是百度历经上亿次图片训练的成果。百度视觉团队从 2013 年起开始构建超大规模的图像分类系统,通过互联网搜索引擎获取图片,目前已构建起包含 10 万类标签。常年的积累给了百度视觉团队开发出更好算法的基础,借此他们成功击败国内外 100 多支代表队,还把对第二名的领先优势扩大到 3.95%。


百度之后,就是阿里巴巴。今年是 WebVision 竞赛举办的第三年,阿里巴巴的 AI 团队也成功拿到第一名的桂冠,实现中国企业 WebVision 竞赛三连冠。今年的竞赛,阿里 AI 团队在前一年的基础上又引入了构建类别语义标签关系的模型,同时采用了深度学习技术,建成了足以支持数十亿图片分类训练的超大平台。82.54% 的识别准确率,也比前一年的冠军百度视觉技术团队提升了 3.29 个百分点。

从码隆科技、百度视觉技术团队到阿里 AI 团队,连续三年夺冠让全世界看到了中国 AI 技术团队的成果,看到了“中国智造”创新的力量。可以说,这三个团队都是中国的骄傲!未来,他们的研究成果会在人工智能、大数据、云计算等领域迸发出更强的活力!

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();