在Gamescom的RTX大型活动上,英伟达对其新的图灵RTX卡做了一些大胆的宣传。首先也是最重要的是GeForce RTX 2080提供的性能比目前基于1000系列pascal的GTX卡“快六倍”。这在很大程度上是因为新的光线追踪技术帮助gpu更快地计算复杂的游戏灯光。“这是一种新的计算模型,因此有了一种新的考虑性能的方法,”首席执行官Jensen Huang说。
新的GeForce RTX 2080 Ti, 2080和2070卡比以往任何时候都要快,但增长没有“六倍”的说法那么剧烈。在这一点上,我们有30%到40%的增长,而不是60%。对于英伟达声称的实现,游戏和应用开发者必须首先采用RTX光线追踪和深度学习技术。正如我们之前在GameWorks中看到的那样(还记得吗?)在此之前,您可能想要等待基准和评论,看看它们如何与当前的游戏一起工作。
英伟达给了我们GeForce RTX 2080 Ti的主要规格,但省略了几个关键数字。我们知道,售价1199美元的方正版有11GB的DDR6 14Gbps内存,它以1635兆赫兹的加速速度运行,有4352个Cuda核心。英伟达没有给我们关键的teraflops (TFLOPs)数字,但我们计算它是4,352 (x2)着色x 1,635 boost时钟= 14,231,040或14.2 TFLOPs。
相比之下,GTX 1080 Ti为11.3 TFLOPs,泰坦XP为12.15 TFLOPs。因此,RTX 2080 Ti比泰坦XP(目前世界上速度最快的游戏卡)提高了17%,比其同时代的GTX 1080 Ti提高了26%。但是,请记住,2080的基本GPU时钟速度比GTX 1080低,我们还没有关于它超时钟潜力的信息。
这还没有考虑到GDDR6内存速度提高了23% (2080 Ti为14 Gbps, 1080 Ti为11.2 Gbps),这将对实际性能产生重大影响。例如,当GTX 1070到达时,它的原始功耗略低于GTX 980,但它具有优越的带宽、内存速度和架构。然而,令人担忧的是,gtx1080 Ti的填充率可能会因为GPU时钟速度的降低而下降。在Gamescom的新闻发布会上,英伟达声称其性能提升了30%到40%,但我们还没有看到独立测试的支持。英伟达首席执行官黄延森(Jensen Huang)在Gamescom的主题演讲中花了很长时间(大约一个小时)谈论RTX中嵌入的图灵和张量技术。与以前的gpu相比,光线跟踪和神经网络计算单元对于特定任务有更大的能力,允许更快的处理和更真实的图形。
现在,你的GPU主要使用栅格化渲染游戏。它通常非常高效,因为它只呈现可见对象,而忽略任何隐藏的内容。在过去的几十年里,像像素着色器和阴影贴图这样的技巧发展起来,进一步提高了真实感。
然而,光栅化并不是真实的,因为物理学不是那样工作的。它在环境遮挡(多少环境光撞击物体的不同部分)、焦散(光从半透明或透明物体上反弹)和由多个光源和物体产生的阴影等问题上存在问题。这就是光线追踪的由来。光线从像素或光源投射出来,根据算法的不同,然后在场景中反弹,直到它们击中摄像机或光源。这就是我们看待事物的方式——光子反弹穿过物体,改变波长,最终撞击我们的眼睛。正如我们在今年早些时候解释的那样,专门的光线追踪器渲染VFX场景的逼真程度足以插入到真人电影中。
然而,所有这些在周围跳跃的光子很快就会饱和你的GPU。光线追踪对于电影后期制作工具来说是很好的,因为电影后期制作工具有数百台服务器来呈现内容。不过,这对于游戏来说并不理想,因为有限的硬件必须在1/60秒内呈现帧。这就是NVIDIA的RTX发挥作用的地方,因为它可以以比以往更快的速度执行光线跟踪计算。
光线追踪不会很快取代你的游戏渲染图形的方式。做全光线追踪渲染仍然远远超过任何显卡,即使是英伟达的10000美元的Quadro rtx8000。大多数情况下,它们将与现有的光栅引擎一起使用,以增强某些效果,比如反射和阴影。为了给这些新的专业内核打上一个数字,英伟达现在强调giga ray和RTX-OPS。虽然GeForce GTX 1080 Ti每秒只发出1.21千兆射线,图灵gpu每秒能通过10千兆射线——快8倍。
与此同时,使用一种结合光线跟踪和浮点运算的混合测量方法,图灵动力的GTR 2080 Ti能够处理78次RTX-OPS,而1000系列Pascal一代的RTX-OPS只有12次。这是我们在互联网上看到的六倍增长。Jensen Huang说,这样的进步“从来没有发生过;一台超级计算机在一代人的时间里被一台GPU所取代。他在Gamescom上展示的演示,尤其是Sol Project展示的机器人和钢铁侠套装,是我们见过的最令人印象深刻的实时光线追踪视频,因为它们是在单个GPU上运行的(售价6300美元的Quadro RTX 6000)。然而,不要指望RTX牌能让游戏立刻看起来更好。要想在理论上的30%到40%的提升之外看到任何好处,游戏需要专门设计来利用光线追踪。目前还没有,我们所知道的只有两款即将上市——《战地5》和《古墓丽影》。
英伟达的RTX确实使用了微软名为DXR的新DirectX功能,AMD也通过Radeon Rays功能支持这一功能。微软表示,DXR在当前一代和更老的显卡上运行良好。然而,英伟达强烈暗示,如果没有新一代显卡,它就不会有多大用处,而且过去的机型,甚至是GTX 1080 Ti,操作太慢。
英伟达还表示,其DLSS AI功能将使游戏速度提高两倍。为此,RTX张量核将接管抗混叠(AA),这通常会消耗大量GPU周期和内存资源。DLSS是一个特定的英伟达函数,需要逐局编码,但英伟达将免费为开发者提供这些代码。关于GPU技术有很多炒作,但从来没有像预期的那样成功。以AMD为榜样,最近是GameWorks。这些技术并没有带来承诺的游戏速度或质量的提高,但这些卡片的销售部分是基于这些功能。
任何游戏改进功能如果局限于一个或另一个品牌,尤其值得怀疑,就像NVIDIA的DLSS和一些RTX功能一样。原因是显而易见的。游戏开发者不喜欢一个GPU平台胜过另一个平台,因为它会耗尽他们本来就很薄的资源,如果不能交付,常常会导致负面报道和不愉快的买家。
例如,NVIDIA引入了GameWorks中间件来帮助开发者创造更好的物理和其他效果。不过,这些功能是针对英伟达卡进行优化的,在AMD的GPU上运行这些功能常常会导致糟糕的或不可预知的性能,而GameWorks甚至在英伟达自己的显卡上也存在问题。NVIDIA在今年早些时候的RTX发布会上提到了它,但是我们还没有听说过关于RTX 2000系列纸牌的游戏工作。购买一个基于未经证实的技术的新图形系统,特别是像光线追踪这样复杂的东西,是一个相当大的风险。新的RTX 2080 Ti卡价格昂贵且耗电,而且在纸面上没有提供惊人的速度提升,这对RTX 2080 Ti卡毫无帮助。它可能确实拥有超越规格的高级架构,但令人担忧的是,英伟达花了这么多时间描述光线追踪技术,却很少展示它如何改进你现在可以玩的游戏。
如果RTX ray-tracing和人工智能能够像承诺的那样改进未来的游戏,那就太好了。但是考虑到未来两年左右的硬件升级周期,NVIDIA可能会转移到其他领域。我们现在要做的就是对性能的规范和英伟达的承诺。在测试和审查使情况更清楚之前,您可能想要等待,看看结果如何。
留言与评论(共有 0 条评论) |