据外媒报道,谷歌母公司 Alphabet 旗下 DeepMind 最近开发了一种人工智能技术,它可以在观察 2D 平面图像之后以 3D 渲染整个场景。目前一些人工智能研究人员正在试图教机器学习像人类一样。我们不是以像素为单位看世界,而是环顾我们的环境并对其中的一切进行假设。
DeepMind 团队则训练了一个人工智能如何从其未见的角度猜测事物的样子。 DeepMind 的科学家提出了一个生成查询网络(Generative Query Network,GQN),这是一个神经网络,旨在教人工智能如何从不同的角度想象物体的场景会是什么样子。基本上,人工智能观察场景的 2D 平面图像,然后尝试重新创建它。在这种情况下,重要的是 DeepMind 的人工智能不使用任何人为标记的输入等。它只观察三幅图像,并开始预测场景的 3D 版本是什么样子。
研究人员正在努力实现 " 完全无监督的场景理解 "。目前人工智能尚未接受真实世界的图像训练,因此下一步将从照片中渲染逼真的场景。未来,DeepMind 基于 GQN 的人工智能可能只使用照片就可以生成与现实世界几乎完全相同的按需 3D 场景。
留言与评论(共有 0 条评论) |