中国骄傲！人工智能“世界杯”落幕，阿里 AI 荣获冠军--粉丝服务平台-粉丝头条-fensifuwu.com

中国骄傲！人工智能“世界杯”落幕，阿里 AI 荣获冠军

科技 06-24 来源： MyGeekTimes

五天前，人工智能领域最负盛名的学术会议 CVPR 在美国加州长滩开幕。几天来，世界各国的研究员、开发者以及产业界人士针对机器学习、计算机视觉和人工智能领域，展开了热烈的讨论。据介绍，今年 CVPR 大会共有 9227 人注册参会，突破历届记录。其中来自中国的参会人数达到 1044 位，仅次于大会举办地美国。

REC

中国来的人多，取得的成果也不小。本届最佳论文的第一作者是来自中国的辛书冕，她本科就读于西安交通大学，现在是卡耐基梅隆大学机器人研究院的博士二年级学生。此外，中国企业阿里巴巴也在这次大会上收货满满。CVPR 会议期间，会举行 WebVision 图像识别竞赛，来自世界各地的 150 多支队伍在一起同场竞技，因而也被称作是人工智能领域的“世界杯”。阿里巴巴旗下的阿里 AI 在这次竞赛中力压群雄，以 82.54% 的识别准确率获得冠军，向全世界展现了中国科技企业在人工智能领域的造诣！

接棒 ImageNet

WebVision 竞赛由苏黎世联邦理工（ETH）、谷歌以及卡耐基梅隆大学（CMU）共同主办，被誉为接棒 ImageNet 的竞赛。说到 ImageNet ，就不得不提华人女科学家李飞飞。2009 年，当时李飞飞、Jia Deng 等研究员在 CVPR 2009 上发表了一篇名为《ImageNet: A Large-Scale Hierarchical Image Database》的论文，引起了整个人工智能领域轰动。这篇论文描述了 ImageNet 数据集基准的创造、物体识别领域的研究进展，至今对整个领域还有极大的影响，在 Google Scholar 上有 5692 篇文章引用该论文。

论文走红学术圈以后，李飞飞并没有就此止步，她在思考图像识别算法与数据之间的联系。此前，她还在伊利诺伊大学香槟分校当教授时就发现，整个学术圈和人工智能产业都在寻求更好的算法，却没人来关心最底层的数据。为此，她决定建设更好的数据集，集结全世界的力量打造标准化数据集，这个数据集就是鼎鼎大名的 ImageNet。

起初，ImageNet 只是作为一个研究方向在 CVPR 期间供大家讨论。不过很快它就发展成一年一度的竞赛，来自全球各地的研究团队比赛谁能以更低的错误率识别 ImageNet 数据集中的图像对象。随着比赛的进行，参与者们越发的相信李飞飞的观点，更多的数据确实可以帮助他们开发更好的算法。

一年一度的 ImageNet 竞赛给人工智能领域贡献了大量人才，无数学术带头人都从这里走出来，无数个新型 AI 算法在这里同场竞技。鉴于 ImageNet 竞赛在人工智能领域卓越的贡献，不少媒体将其称之为 AI 世界繁荣地位催化剂。

多年的 ImageNet 竞赛，给数据集带来大量图片数据。等到 2016 年，ImageNet 中已含有超过 1500 万由人手工注释的图片网址，内容包换 2.2 万个类别。图像识别错误率也已经达到约 2.9%，远远超越人类（5.1%）。因而 CVPR 会议在 2017 年“超越 ILSVRC ”上宣布：2017 年是 ImageNet 竞赛正式组织的最后一年，未来图像视觉的重点将转向图像理解。

ImageNet 的时代结束了。不过，一个时代的结束往往意味着另一个时代的开始。在 CVPR 会议在宣布 ImageNet 竞赛结束同时， WebVision 竞赛随之开始。与 ImageNet 竞赛稍显不同的是，WebVision 更加复杂和不平衡，侧重于学习和理解网络数据。

中国三连冠

自从 WebVision 竞赛开始，来自中国的团队就开始了他们的集体秀。第一年，表现最佳的团队是来自深圳的码隆科技。这是一家专注于深度学习与计算机视觉技术创新，为开发者提供图像识别 AI 工具的人工智能公司。码隆在第一届 WebVision 竞赛中取得了 94.78％的准确率，比第二名整整高出 2.5%。

别小看这小小的领先，在图像识别竞赛领域已经算非常的优势了。毕竟，前一年 ImageNet 竞赛中，第一名只比第二名高 0.04%。取得如此大领先的原因在于码隆科技运用了一项特有的专项技术，它将图像数据分成“干净”和“噪音”两类。先设计出一套处理“干净”数据的训练算法，然后组合“干净”和“噪音”数据训练另一套算法。

码隆科技之后，百度视觉技术团队夺得了第二年的冠军，捍卫了中国企业在 WebVision 竞赛上的荣誉。在第二年的竞赛中，主办方将数据集合由 1000 类扩大到 5000 类，训练数据量由 240 万张图片扩大到 1600 万张图片，数据量庞大许多，识别难度也大幅提高。难度提高后，识别率也降低许多，以至于作为第一名的百度，也只有 79.25% 的识别率。

不要瞧不起这识别率，这可是百度历经上亿次图片训练的成果。百度视觉团队从 2013 年起开始构建超大规模的图像分类系统，通过互联网搜索引擎获取图片，目前已构建起包含 10 万类标签。常年的积累给了百度视觉团队开发出更好算法的基础，借此他们成功击败国内外 100 多支代表队，还把对第二名的领先优势扩大到 3.95%。

百度之后，就是阿里巴巴。今年是 WebVision 竞赛举办的第三年，阿里巴巴的 AI 团队也成功拿到第一名的桂冠，实现中国企业 WebVision 竞赛三连冠。今年的竞赛，阿里 AI 团队在前一年的基础上又引入了构建类别语义标签关系的模型，同时采用了深度学习技术，建成了足以支持数十亿图片分类训练的超大平台。82.54% 的识别准确率，也比前一年的冠军百度视觉技术团队提升了 3.29 个百分点。

从码隆科技、百度视觉技术团队到阿里 AI 团队，连续三年夺冠让全世界看到了中国 AI 技术团队的成果，看到了“中国智造”创新的力量。可以说，这三个团队都是中国的骄傲！未来，他们的研究成果会在人工智能、大数据、云计算等领域迸发出更强的活力！