联系我们

4000 555 018
(7×24)
正睿服务器  >  新闻中心  >  业界资讯
新闻中心

Embedded+ 新架构加速边缘AI应用

间隙填充
正睿科技  发布时间:2024-02-19 16:06:37  浏览数:103

AMD近日宣布推出 AMD Embedded+,这一全新的架构解决方案将 AMD Ryzen™(锐龙)嵌入式处理器和 AMD Versal™ 自适应 SoC 结合到单块集成板卡上,从而提供了可扩展且高能效的解决方案,为原始设计制造商( ODM )合作伙伴加速产品上市进程。

Embedded+架构的独特优势在于,它不仅适用于传统的嵌入式环境,而且针对更偏向PC类型的应用进行了优化。相较于AMD先前发布的Kria自适应系统模块,Embedded+架构支持包含键盘、鼠标、显示器及Linux/Windows操作系统在内的多元应用场景,并因搭载X86处理器而拥有更为丰富的应用软件库。

以传感器数据分析在自动化系统中的应用为例,有助于我们深入理解Embedded+架构的价值所在。Chetan Khona解释道,现今工业和医疗领域的众多应用,如仓储自主移动机器人、工厂自动化摄像系统、工艺自动化控制器、用于智能交通管理的城市AI终端、无人零售系统、精密外科手术机器人和医学影像设备等,对于多元化传感器数据的需求日益增长,许多关键决策往往要求在数毫秒内完成,这就意味着依据最新信息进行运算至关重要,以确保最低延迟和确定性响应。为此,只有尽可能接近传感器进行数据处理,才能最大限度地发挥数据价值。而这恰好就需要一种经过优化的嵌入式PC来实现数据就近处理。

然而,在现实应用情境中,将数据无缝引入PC的过程常常面临挑战。常见问题包括:嵌入式PC对各类传感器和网络接口的支持局限性,限制了其应用范围;缺乏专门的硬件组件来协助CPU进行“功能卸载”,使得CPU在保证低延迟、实现实时控制、执行AI推理、处理视频解码/渲染/显示等功能时负担过重。正是为了解决这些问题,AMD推出了Embedded+架构,致力于提升嵌入式系统的性能与适用性。

Embedded+架构独具匠心,将AMD x86计算技术与集成显卡及可编程硬件紧密结合,专为关键的AI推理和多传感器应用打造。借助自适应计算的优越性能,实现低延迟、高能效的确定性处理,配合AI引擎强化推理效能,每瓦性能得到显著提升。锐龙嵌入式处理器凭借”Zen”核心和Radeon显卡技术,不仅呈现卓越的4K渲染与显示效果,还支持4K H.264/H.265编解码功能,提升多媒体性能。

低延迟与高能效推理性能的完美融合,让Embedded+架构在关键任务应用中展现超凡实力,通过一体化集成自适应计算、灵活I/O接口、专用AI推理引擎以及AMD Radeon显卡,最大化利用每一项技术优势,服务于无人驾驶、医疗设备、工业控制等多元化领域。

另外,经AMD权威验证的Embedded+集成计算平台,有力辅助ODM厂商缩短产品认证和开发周期,快速抢占市场先机,无需额外投入硬件或研发资源。此架构赋能ODM产品,采用通用软件平台设计出节能、紧凑且寿命长久的嵌入式解决方案,广泛适应医疗、工业自动化及汽车应用的严苛要求。

为了消除外界对其创新性的质疑,Chetan Khona着重阐述了Embedded+架构的三个关键特性,进一步突显其独特价值:

传感器友好型特性

Embedded+架构的一大亮点在于其对各类传感器和网络接口的高度适应性,巧妙运用Versal自适应SoC的可编程I/O特性,在模拟与数字信号交界处执行传感器数据处理,确保极致响应速度,并可原生支持传感器融合。下述图表直观展现了这一优势:锐龙嵌入式处理器与Versal自适应SoC的整合,为连接传统PC、网络设备、实时传感器以及工业网络提供了多样化的选择,涵盖了84种不同I/O类型,支持广泛的速率(高达32Gb/s)和电压范围,允许根据不同应用场景需求,对传感器接口和网络进行灵活的可编程I/O配置。

例如,在机器视觉应用中,配备集成机器视觉图像采集卡的嵌入式平台通过SFP+接口实现与摄像头的高速10GigE视觉和CoaXpress连接,以像素时钟速率实时执行图像预处理,无需缓存。得益于可编程I/O的同步能力,可以在多个摄像头与驱动器间实现精准同步,简化多传感器、多视角图像采集流程。此外,低功耗和紧凑尺寸使得该平台能够直接与摄像头集成,减少对外部组件的依赖,简化安装步骤,仅需连接摄像头即可投入使用。

在具有运动规划功能的机器人控制器场景中,采用Mini ITX规格、功耗约为30W的Embedded+架构可实现混合关键传感器融合:

锐龙嵌入式处理器负责支持常见的低速接口,如WiFi、GPS、IMU和激光雷达;
Versal自适应SoC则承担起支持多个GMSL2摄像头和其他低延迟接口的任务;
导航软件协议栈和路径规划在可靠的x86处理器上运行;
FPGA可以通过消除如VSLAM中的立体匹配等计算瓶颈,提升整体性能;
AI引擎加速AI模型推理;
利用周边的可编程逻辑、AI引擎和集成显卡减轻x86处理器的负载,共同实现确定性低延迟通信和处理、高能效推理以及卓越的可视化效果。
Embedded+架构的另一大优势体现在其灵活的扩展能力上:若需要低延迟、确定性的网络和传感器接口,可通过扩展连接器、可编程I/O和FPGA互联架构来实现;在实时控制需求场合,则可通过Arm子系统与FPGA的互联架构来满足;对于AI推理需求,Embedded+ AI引擎依托Versal™ AI Edge系列提供强力支持;而在视频解码、渲染和显示方面,架构内建H.264/265视频编解码器和Radeon显卡,确保高质量的多媒体处理能力。

卸载处理

通过在x86处理器周围添加可减负的元器件,可以实现面向低延迟通信和处理的可编程逻辑、高效能AI引擎以及出色的集显效果。




举例来说,针对低时延和确定性网络接口,Embedded+提供扩展连接器、可编程I/O和FPGA互联架构;对于实时控制需求,可使用Arm子系统和FPGA互联架构;而针对AI推理,Embedded+ AI引擎支持Versal™ AI Edge系列产品;至于视频解码、渲染和显示,则可依靠Embedded+架构提供的H.264/265视频编解码器和Radeon显卡。

快速上市

Embedded+架构针对传感器融合、AI推理、工业通讯、控制与可视化等关键功能进行了深度优化,并借助通用软件技术框架将各组件紧密相连,以适应多种工作负载需求。开发团队可灵活选择双通信流或半定制/全定制模式,在Vitis XRT工具的辅助下实现锐龙处理器与Versal自适应SoC间的高效互通。硬件层面,ODM厂商除提供扩展连接器外,还备有扩展板和定制板,极大加速终端产品上市进程。




此外,基于Embedded+架构的ODM板卡生态系统为系统设计师提供了丰富的选择,便于他们根据客户需求调整性能和功耗配置,拓展自身产品组合。

首批亮相的基于Embedded+架构的ODM解决方案之一是Sapphire Edge+ VPR-4616-MB Mini-ITX主板,由Sapphire Technology推出,搭载锐龙嵌入式R2314处理器和Versal AI Edge VE2302自适应SoC,以仅为30W的低功耗实现全面功能。VPR-4616-MB已整合内存、存储、电源和机箱,形成完整的系统解决方案。




据Chetan Khona透露,AMD计划在2024年底前发布一系列示范设计,涵盖支持AI推理的传感器融合系统、通过扩展连接器和编解码器实现的视频AI推理应用、适用于AMR自主移动机器人的8路GMSL接口,以及集成激光雷达、GPS、IMU和WIFI连接;同时,还包括支持时间敏感型网络及其他工业以太网标准,传输速度超过10GE的高性能机器视觉图像采集卡等产品。

值得注意的是,Embedded+产品的售价不由AMD制定,而是由与其合作的ODM生态伙伴根据各自产品定价,AMD在其中更多扮演技术支持角色。

AMD作为一家同时提供x86、显卡、FPGA和自适应SoC技术的公司,具备了良好的发展基础。然而,Chetan Khona也承认在融合创新过程中会面临挑战,比如如何将不同的技术整合,并通过集成的软件栈提供给客户。这既是挑战,也是巨大的机遇。从目前的发展趋势来看,双方进一步完善了软件能力和可用性,为AI引擎提供了更强大的应用案例,将已有的创新和能力提升到了新的水平,展现出1+1>2的优势。

  • 正睿合作伙伴
  • 社区
首页 | 注册 | 网站地图 | 通告 | 联系我们
CopyRight(C)2004-2022 Chongqing Zhengrui Technology Co.,Ltd. All rights reserved.
重庆正睿科技有限公司(C)版权所有 未经书面授权 不得转载、复制或建立镜像
渝ICP备11002339号-1  渝公网安备 50010702500475号