核心提示:据外媒报道,多伦多大学计算机科学系与优步旗下多伦多先进技术集团的研究人员研发了一款算法,可应对目标物探查、追踪等任务。重要的是,其方案(画质响应速度)可实现 30 毫秒 / 帧。从本质上讲,该数据是凌乱、无条理的(非结构化数据),与图像等送入人工智能系统的结构化数据存在极大差异。为应对这类非结构化数据,博士生 Shenlong Wang 与优步 ATG 的研发人员共同研发了一款特殊的 AI 工具。为提升整体运算能力,研究人员还设计了稀疏矩阵运算方式,该算法的速度翻了 10 倍多。详见正文。
盖世汽车讯 据外媒报道,多伦多大学计算机科学系(department of computer science)与优步旗下多伦多先进技术集团(Advanced Technologies Group,ATG)的研究人员研发了一款算法,可应对目标物探查、追踪等任务。重要的是,其方案(画质响应速度)可实现 30 毫秒 / 帧。
优步自动驾驶测试车辆顶部的激光雷达扫描仪可利用激光束实现测距,采集了北美地区多个城市的海量数据集,该数据集的容量超过了百万帧,其数据源自于 6500 多个不同驾驶情境。
激光雷达的数据输出形式为:在三维空间内提供点云图,需要利用人工智能系统来读懂其含义。从本质上讲,该数据是凌乱、无条理的(非结构化数据),与图像等送入人工智能系统的结构化数据(structured data)存在极大差异。
为应对这类非结构化数据(unstructured data),博士生 Shenlong Wang 与优步 ATG 的研发人员共同研发了一款特殊的 AI 工具。
Wang(上图)表示:" 该图片是 2D 网格状的,而 3D 建模则是一串 3D 网格(meshes),激光雷达所捕获的则是一束(a bunch of)点,且在该区域呈离散分布,传统的 AI 难以应对这类难题。"
助理教授 Urtasun 解释道,人工智能在图像处理方面表现非常出色,因为图像是矩形目标物,由许多很小的矩形点构成,算法在格栅结构的分析处理时表现出色。然而,激光雷达的数据却不是常规结构,使得 AI 系统难以读取其含义。
离散点处理的表现并不仅限于自动驾驶领域,这类非结构化数据还存在于化学及社交网络中。
为提升整体运算能力,研究人员还设计了稀疏矩阵运算(sparse computation)方式,其利用了重要区域判定原则。为此,相较于当前的计算方式,该算法的速度翻了 10 倍多。
研究人员还发布了 SBNet 代码,在提升智能手机等小型设备的处理能力方面大有裨益。Urtasun 表示,优步自动驾驶车队已开始使用其算法,这对提升其整体研究水平帮助很大。自动驾驶是本世纪内的一大根本性难题,我们正在设法寻找解决方案。(本文图片选自 utoronto.ca)
留言与评论(共有 0 条评论) |