硬件光追进入新阶段,Imagination推出DXT系列GPU IP

发布时间:2023-01-28  

作为GPU皇冠上的明珠,实时光线追踪技术近年来得到了迅速发展。


然而并不是所有的光线追踪体验都是一样的,正如GPU IP供应商Imagination所说,光线追踪技术可以细分为很多层级,其中第一级光线追踪技术通过软件实现,CPU占用资源较高。第二级光线追踪技术是利用硬件处理光和或者三角形碰撞,从而节省了CPU资源,目前典型的桌面显卡都是采用了这项技术。第三级光线追踪技术开始,就需要支持BVH回溯。BVH是bounding volume hierarchy,这是一种用来管理3D场景中物体的方法。这部分是目前渲染器中最困难的部分,但是可以是渲染器更加高效。第四级光线追踪技术除了光和自动测试的回溯之外,还需要相同光线上的光数统一计算,用统一的指令运行。而第五级技术则需要支持BVH builder,目前作为公司的储备技术。


高级光线追踪技术需要更新的硬件

image.png

如上图所述,Imagination认为,从CXT GPU IP开始,光线追踪技术就已经进入到第四级。


日前,Imagination宣布推出IMG DXT系列GPU,将移动设备的光追体验带入到了新阶段。尤其是如今,手机性能越来越高,在手机上玩3A大作已经不再是一种幻象。由此,玩家越来越需要沉浸且流畅的体验、真实的画面、以及更小的发热及更长的待机功耗,所有这些都对GPU有了全新的要求。


总体而言,这款GPU可以从节省面积的0.5 RAC(光线加速集群)配置扩展到高性能的4 RAC设计,涵盖从混合实现方案中的简单阴影到3A大作中的高级光追画面等各类应用。


“通过DXT,可以让光线追踪技术可以尽快铺开,哪怕只有0.5个RAC,也可以快速覆盖市场,从而让真正的内容开发者愿意去进行光线追踪相关开发。”Imagination首席营销官David Harold说道。由于如今手机的光线追踪大部分还是软件实现的,因此无论是资源占用还是功耗,都还不能商用化。


同时,为了快速实现光追技术,Imagination同行业、客户以及合作伙伴,包括手机厂商和游戏厂商共同合作,通过推出PVR2等工具,简单部署光线追踪技术。


DXT详解


旗舰产品DXT-72-2304能够提供超高端移动设备所需的性能,具有72 GTexels/s和2.5 TFLOP FP32算力。与上一代产品相比,其最大单核性能提升了50%。DXT核的单位面积性能密度比IMG CXT GPU高出20%,同时大幅降低了功耗。


image.png

如图所示,在可配置内核上,最大的单核配置从CXT-64-2048升级到DXT-96-3072,单核性能提高了50%。并且拥有可选择的光线追踪RAC。


DXT目前包括三个系列。分别面向主流、高端以及旗舰型,提供不同算力、像素填充率以及光线追踪RAC等。

image.png

如图所示,不同公司的光线追踪技术有着明显差别,那么为什么Imagination的DXT系列可以一枝独秀?官方透露了几个黑科技。


支持Vulkan的片段着色率(FSR)技术


片段着色率(Fragment Shading Rate,FSR)(在DirectX中也称为可变着色率VRS)是一种可以提高图像表现并降低功耗的技术。FSR允许共享着色器程序的执行结果跨多个片段。因此,不是1:1执行着色器程序,这意味着一个着色器可以覆盖更多像素的区域,从而实现了更高的性能、更低的带宽和更低的功耗。


Imagination表示,开发者可以控制FSR的使用力度,最极端的情况下甚至可以对一个4x4的片段区域只执行一次着色器代码,这意味着只需1/16的资源,从而使工作负载减少近94%。


FSR可以在用户不太注意的地方复用,从而节约资源。另外,FSR功能也适用于光线跟踪。因为着色器调用需要发射的光线更少,因此提交的光线更少并且结果在较大的像素区域上被重新使用。

image.png

如图所示,我们可以看到在周边区域,可以运用更多的4X4单元统一着色,而在需要光线追踪的地方,应选择更细致的着色。而缩减光线数量,基本在图像表现上看不出差异。


2D双速率纹理处理


许多先进的游戏依靠大量纹理取样实现高级过滤效果。IMG DXT GPU的纹理处理单元(TPU)内置一个已获得专利的创新特殊模式,能够为这些后处理效果创建一条“快速通道”,在使双线性滤波性能几乎翻倍的同时,最大程度地减少面积的增加并降低整体功耗。该GPU不但可以加速诸如游戏后处理和计算图像学应用中的滤镜效果;更高的吞吐量也有助于实现更快、更低功耗的降噪算法,提高光追画面的质量。


数据显示,许多游戏花费大量资源执行后处理算法,以实现景深、光华和模糊等效果。最在这些后处理过程中,纹理采样的重过滤效果在运算逻辑单元(ALU)执行,因此受到TPU瓶颈。解决这一问题的简单方法是增加TPU单元的数量与USC/ALU的比例。然而,这不是好的策略。首先,在常规渲染过程中,ALU与TPU的比率已经是最佳的了。同时,带宽也无法足够满足更多TPU的吞吐率需求。而Imagination的技术可在保持整体平衡的同时,将执行效率提升一倍。


RISC-V技术支持


Imagination持续投入RISC-V的研发,将其成果应用于其产品线中。DXT中使用的遵循RISC-V协议的固件处理器,可以实现40%的固件性能改善,并且该固件已经在其汽车GPU BXS系列产品中得到验证。IMG DXT还受益于RISC-V的电源域特征,把重点放在降低空闲功率关闭不使用的GPU部分和优化随机工作负载性能上。


Pipeline Data Master技术


Imagination的PowerVR GPU从一开始就由固件处理器驱动。固件处理器负责工作负载的高级调度和优先级,允许并发处理不同类型的作业PowerVR GPU具有每个作业类型的数据主控器,计算和2D(或数据移动)。

image.png

如示意图所示,通过更紧凑的任务调动,可以使处理器始终在运行提前准备好的数据,从而带来全域5%的画图和计算性能提升。


ASTC HDR支持


Imagination此前已支持Khronos Vulkan API要求的自适应可缩放纹理压缩(ASTC)的低动态范围(LDR)。但是ASTC的高动态范围模式还不能支持。DXT系列新增的HDR功能,可以捕获更多的纹理信息,提高可视范围。

image.png

如图所示,从暗到亮,HDR支持可以展现更多细节。


总结


凭借着在光线追踪技术的领先,Imagination实现了GPU IP的准确定位,在如今竞争激烈的市场中,可以与其他便携甚至桌面级供应商扳一扳手腕。Imagination通过推出更具性价比,更低功耗,更高性能的DXT系列,意图将光追技术迅速普及开,从而在GPU市场中继续保持差异化的领先性。

文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>