视觉是大自然神奇的恩赐之一,它陪伴我们一起生活了几亿年。对人类来说,这也是一种关键的感觉,但我们常常认为是理所当然的:直到我们开始失去它,或者我们尝试为机器人赋予视觉,发现其中的艰难与不易。
许多研究实验室几十年来一直在对动物和昆虫中的视觉系统进行建模。我们大量研究蚂蚁、蜜蜂甚至啮齿动物。
为了模拟生物系统并使其对机器人有用,你通常需要了解该视觉系统的行为和神经基础。
行为组成部分是你观察到动物在做什么,以及当你弄乱它可以看到的东西时,该行为如何变化,例如通过尝试不同的地标配置。神经元件是动物大脑中用于任务的视觉学习的回路,例如导航。
识别面孔
识别是所有动物和机器人的基本视觉过程。它能够识别世界上熟悉的人、动物、物体和地标。
由于其重要性,面部识别部分地“融入”到婴儿等自然系统。所以,我们很早就能识别出面孔。
沿着这些方向,一些人工人脸识别系统基于生物系统是如何起作用的。例如,研究人员创建了一组神经网络,模仿灵长类动物视觉处理的不同层次结构,以创建一个能够进行人脸识别的系统。
识别位置
视觉位置识别是任何东西导航世界的重要过程。
地点识别是机器人或动物观察周围世界的过程,并且能够协调它当前看到的与某个地方的过去记忆,或者以人类为例,对该地方的描述或期望。
在GPS导航出现之前,我们可能会收到一些指示,例如“直到你看到左边的教堂然后右转弯”。我们知道一个典型的教堂是什么样的,因此当我们看到它时可以认出它。
这种地方识别可能听起来像一个简单的任务,直到遇到诸如外观变化之类的挑战,例如由昼夜循环或恶劣天气条件引起的外观变化。
视觉识别地点的另一个挑战是视点变化:如果你从不同的角度查看场景,则会出现什么样的变化。
在第一次沿着道路回溯路线时会遇到一个极端的例子 —— 你正在从相反的角度遇到环境中的所有事物。
尽管存在这些挑战,但想要创建能够识别地方的机器人系统,就需要视觉系统更深入地了解周围环境。
感应能力
视觉传感硬件在过去十年中迅速发展,部分原因在于智能手机中功能强大的摄像头的激增。现代摄像头如今甚至堪比或超越在更有能力的自然视觉系统,至少在某些方面。
例如,消费者相机现在可以在黑暗中看到调整后的人眼。
新的智能手机相机还可以每秒1000帧的速度录制视频,从而使机器人视觉系统的运行频率高于人类视觉系统。
诸如动态视觉传感器(DVS)之类的专业机器人视觉传感甚至更快,但仅报告像素亮度的变化,而不是其绝对颜色。你可以在伦敦海德公园散步时看到不同之处:
并非所有机器人摄像机都必须像传统摄像机一样:机器人专家根据蚂蚁等动物如何看待世界而使用专业摄像机。
所需的分辨率?
所有基于视觉的机器人和动物研究的基本问题之一是“完成工作”需要视觉分辨率(或视敏度)。
对于许多昆虫和动物如啮齿类动物而言,它们可以获得相对较低的视觉分辨率 —— 相当于在许多情况下只有几千像素的相机(相比之下,现代智能手机的分辨率从800万像素到4000万像素)。
所需的分辨率根据任务的不同而有很大差异,对于某些导航任务,蚂蚁和蜜蜂等动物以及机器人只需要几个像素。
但是对于更复杂的任务,例如自动驾驶汽车, 可能需要更高的摄像头分辨率。
如果汽车想要可靠地识别和预测人类行人正在做什么或打算做什么,那么可能需要高分辨率的视觉传感系统,以捕获微妙的面部表情和身体运动。
生物启发与实用主义之间的紧张关系
对于寻求自然灵感的机器人专家来说,模仿生物学和利用相机技术的不断进步之间存在着持续的紧张关系。
虽然生物视觉系统在过去明显优于相机,但技术的不断快速发展使得相机在许多情况下具有对自然系统的优异感测能力。在追求创造高性能和安全机器人和自动驾驶汽车时,利用这些实用能力是明智的。
但是生物学仍将在激励机器人专家方面发挥关键作用。 自然王国非常擅长制造功能强大的视觉系统,这些系统消耗的空间、计算能力和能量资源,而这是大多数机器人系统的主要挑战。
本文图片来源:The Conversation
留言与评论(共有 0 条评论) |