电子发烧友专文—FPGA、eFPGA、加速卡,全面应对多样化的边缘AI

日前,行业门户网站《电子发烧友》编辑黄晶晶通过访谈Achronix中国区总经理郭道正先生,就当前快速发展的边缘人工智能及基于FPGA的解决方案发布了专题文章,介绍了如何利用独立FPGA芯片、eFPGA IP和基于FPGA芯片的加速卡,全方位地应对多样化的边缘AI需求。经编辑同意,我们全文转发该文如下:

与将数据处理集中在云计算设施或数据中心进行云端训练和推理的模式不同,边缘AI在本地就能给终端设备提供智能化功能,并且具有低延迟、隐私保护等优势。据市场咨询公司ABI Research的数据显示,预计到2025年,边缘AI芯片市场的收入将达到122亿美元,云AI芯片市场的收入将达到119亿美元,边缘AI芯片市场将超过云AI芯片组市场。边缘AI芯片当前主要用于AI推理,未来可实现边缘AI训练乃至自主学习,从而使得边缘AI更加智能。由于边缘AI的兴起,不同于云端AI的GPU占据主流,FPGA和ASIC等芯片在边缘AI的价值得到更多体现。

电子发烧友专文—FPGA、eFPGA、加速卡,全面应对多样化的边缘AI

最近,电子发烧友采访到Achronix中国区总经理郭道正,郭总分享了作为一家FPGA厂商怎么看到边缘AI,以及Achronix有哪些先进的解决方案等话题。


边缘AI对FPGA和eFPGA的需求

郭道正表示,边缘AI将在智能化时代发挥巨大的作用,但是边缘AI的应用场景数量众多,这意味着它们需要不同的计算器件和算力等级。这也意味着边缘的计算架构应该有很高的灵活性,而这正是FPGA技术在提供并行计算的同时还能提供的。在工业应用中还有一些特殊的要求,如工业通信协议转换或者时常更新等,而FPGA是满足这些要求的最好技术。

电子发烧友专文—FPGA、eFPGA、加速卡,全面应对多样化的边缘AI

Achronix中国区总经理郭道正

他进一步指出,实际上,边缘AI也不得不面临许多云端推理/机器学习不会面对的制约因素,如系统的大小、功耗和成本等;同时,边缘AI的计算设备不得不面临来自于各种各样的传感器等数据源的数据;此外,这些数据可能还是通过不同的专用通信协议传输过来的,这在许多垂直行业中非常常见。因此,边缘AI的计算架构必须拥有足够的灵活性和可编程性,这也就是我们认为FPGA是边缘AI最好技术之一。

不过正因为边缘AI面对的复杂性,因此独立FPGA似乎并不能完全满足所需。因此,Achronix为解决方案提供商提供了eFPGA IP。郭道正说道:“在他们自己面向边缘AI推出的ASIC或SoC等芯片上,他们可以在其特有的计算器件旁边引入我们的Speedcore eFPGA IP来作为硬件加速器,从而为整个边缘AI解决方案带来非常高的性价比和能效,并同时为新的应用场景、新的算法、新的协议甚至新的传感器保持足够的灵活性。”


全面FPGA技术和三大产品组合

Achronix为边缘AI提供了全面的FPGA技术和产品组合。Achronix的解决方案包括Speedster7t系列独立FPGA芯片、Speedcore eFPGA IP和VectorPath加速卡,所有这些都由Achronix ACE工具链提供支持。

Speedster7t系列独立FPGA芯片

据介绍,Speedster7t FPGA的特点是在其高性能、高密度逻辑阵列之外,还具有二维片上网络(2D NoC)和机器学习处理器(MLP),该器件采用7nm工艺打造。这样,开发人员就不必担心数据在流进流出以及芯片内部流动的带宽。

具体来看,Speedster7t FPGA架构的各个方面都经过了优化,以便为AI/ML应用创建一个优化的、平衡的、大规模并行的计算引擎。每个Speedster7t FPGA都具有一个大规模并行的可编程计算单元阵列,并被整合成全新的机器学习处理器(MLP)模块。每个MLP都是一个高度可配置的、计算密集型的单元模块,具有多达32个乘法器,支持4到24位的整数格式和各种浮点格式,包括直接支持Tensorflow的bfloat16格式和块浮点(BFP)格式。同时,Speedster7t系列FPGA芯片中集成的2D NoC可以全面消除芯片内外部的数据传输瓶颈。

嵌入式FPGA(eFPGA)

异构计算是边缘AI发展中非常确信的趋势之一,因此许多边缘计算解决方案采用的高集成度系统级芯片(SoC)或专用集成电路(ASIC)都集成了嵌入式FPGA(eFPGA),从而可以帮助解决方案提供商为垂直行业开发边缘AI解决方案,并为特定的边缘应用场所打造专门的解决方案。在部署的规模不断提升之际,一个SoC或者ASIC解决方案的规模经济效应将更加明显。

Speedcore嵌入式FPGA(eFPGA)IP为ASIC和SoC带来了强大的和灵活的可编程逻辑。客户可以将Speedcore eFPGA集成到ASIC或SoC中,可用于高性能、计算密集型和实时处理应用,诸如人工智能(AI)、机器学习(ML)、5G无线、网络、存储和汽车。当然,它也可以用于这些领域中的大量边缘AI应用。

郭道正表示,与独立FPGA芯片的设计过程不同,eFPGA设计人员可以针对客户应用,选择所需逻辑、DSP(或MLP)、2D NoC和存储资源的确切数量。当需要灵活性时,业界也可以使用eFPGA,同时通过消除独立FPGA的多余功能来降低系统成本、功耗和电路板面积,诸如高速I/O这些功能在以SoC或者ASIC形态进入大批量生产时是不需要的。

VectorPath S7t-VG6加速卡

VectorPath S7t-VG6加速卡旨在为人工智能(AI)、机器学习(ML)、网络和数据中心应用开发高性能计算和加速功能时,缩短产品上市时间。该加速卡采用了Achronix的高性能Speedster7t AC7t1500 FPGA。VectorPath S7t-VG6是Achronix与领先的企业级FPGA加速器产品供应商BittWare联合开发,可提供400G和200G以太网接口、GDDR6总存储带宽高达4 Tbps以及一整套软件和工具,可以立即开始使用。

凭借这一独特的产品组合,解决方案提供商能够使用VectorPath加速卡为制造领域快速开发边缘AI/ML解决方案,可适用于不同的垂直市场。此外,解决方案提供商可以将其硬件解决方案集成到带有Speedcore eFPGA的SoC或ASIC之中,并将FPGA开发移植到芯片中,为制造领域的边缘AI提供最高的成本效益和功耗效率。


发展规划

边缘AI不仅得到了FPGA、ASIC厂商的重视,我们看到现在一些厂商在MCU当中集成AI加速器使得MCU更加智能。对于这样的边缘AI趋势,郭道正认为,MCU只是在边缘使用的处理器品类之一。由于边缘应用的多样性,在不同垂直领域或者应用场景中可能需要MCU、通用处理器、应用处理器甚至诸如PLC等技术领域中的特定处理器,而且它们已经在不同的应用场景中构筑了自己相应的优势和生态系统。而当智能化时代到来之后,所有这些处理器都有一个共同的需求:它们都需要硬件加速器来高效地处理AI/ML算法,这也是边缘计算领域中非常清晰的异构计算大趋势。

他说道,与仅用传统处理器来运行AI/ML算法的模式相比,FPGA是最高效的硬件数据处理加速器之一。FPGA技术在边缘计算方面的应用包括板级、芯片级和eFPGA等形式,但是Achronix是唯一一家提供独立FPGA芯片、eFPGA IP和加速卡的供应商,并提供了完整的ACE开发工具来支持所有种类的应用。据此,边缘AI解决方案提供商可以为其应用和其他要求选择最好的解决方案,并高效地重复使用他们的开发成果和IP。

面对如今规模高达100亿美元并且还在不断扩展的硬件加速器市场。Achronix也部署了多项举措。郭道正谈到,其一是Achronix一直在不断扩大自己的团队,这既包括不断扩大的高层管理人员团队,他们为Achronix带来了在不用领域内丰富的经验或者技术特长,而且还包括我们一直在延聘的开发、工程、运营和客户支持团队成员。在中国,我们也在进一步扩大中国团队,以确保客户的成功。

其二,除了组织架构性扩展,Achronix也在不断将FPGA技术推向更远的新领域。例如,先进的封装可以支持Achronix基于chiplet技术构建模块化产品。通过利用先进的封装,Achronix可以更快地进行创新以满足多个市场的需求,而不必为每一代新产品重新设计整个单片FPGA器件。展望未来,云和边缘计算、网络设备、人工智能和机器学习、5G/6G无线网络设备、金融科技、工业和汽车等领域都是Achronix在未来5年内主要的市场机遇。

通过前面对挑战和解决方案的分析,我们可以发现FPGA技术是边缘AI硬件平台的最佳选择,以应对来自技术、经济规模和面向未来的解决方案等挑战。


欢迎进一步了解Achronix的FPGA和eFPGA相关产品及应用,请发邮件到:[email protected]

发表评论
留言与评论(共有 0 条评论) “”
   
验证码:

相关文章

推荐文章