莱迪思 CrossLink-NX:专注网络边缘嵌入式视觉处理

2020年07月15日 13:54

引言

网络边缘已迅速成为AI处理未来发展至关重要的一部分。随着5G连接数十亿设备,互连将无处不在。市场对应用人工智能和机器学习(AI/ML)的兴趣不断增长,对于在网络边缘运行、具备AI/ML处理功能的低功耗高科技设备的需求也十分巨大。在网络边缘进行高级处理能够极大降低终端和终端用户的延迟,更好地保护用户隐私。此外,网络边缘智能设备能对发送到云端的数据进行筛选,从而降低网络成本和带宽要求。

这些网络边缘智能设备大多使用图像传感器来实现各类嵌入式视觉应用,包括对象计数和存在检测等基于AI/ML的应用。然而,在网络边缘支持嵌入式视觉应用,要求设备具有某些设计和性能上的特征:如低功耗、高性能、高可靠性和小尺寸。针对这类应用,莱迪思推出了全新CrossLink-NX™系列FPGA。新的芯片旨在满足视频处理的最新趋势:如混用多个传感器和显示屏、视频分辨率更高、使用多个接口以及网络边缘AI处理等。

CrossLink遇见Nexus

为帮助开发人员支持全新及现有的嵌入式视觉系统,莱迪思推出了CrossLinkPlus™这款专业化、小尺寸、低功耗FPGA产品系列。

1CrossLinkPlusCrossLink-NX™对比

CrossLinkPlus的可编程逻辑能满足处理需求,还支持各类接口标准,是网络边缘应用中视频信号聚合和图像协处理的绝佳选择。CrossLinkPlus FPGA采用40 nm bulk CMOS工艺制造。

针对需要更高性能的嵌入式视觉系统,莱迪思发布了CrossLink-NX™系列FPGA。这是基于莱迪思全新FPGA技术平台Lattice Nexus™的首款FPGA,也是业界首款采用28 nm全耗尽型绝缘层上硅(FD-SOI)工艺的主流低功耗FPGA平台。得益于28nm FD-SOI工艺以及针对低功耗和小型封装进行了优化的全新FPGA 架构,CrossLink-NX™ 极大扩展了CrossLink FPGA 系列的功能。CrossLink-NX™ 提供更低的功耗、更小的封装、更高的性能和可靠性以及易于使用的新工具,为开发人员提供了视频和传感器处理的创新选择,其表现显著优于同类竞品FPGA。

CrossLink-NX™的应用市场:汽车、移动设备、工业等

CrossLink-NX™系列产品非常灵活,可以满足视频切换和图像处理领域多个细分市场的需求。

这些领域的应用大多需要支持在多个显示屏、摄像头和传感器(图像传感器等)之间桥接和/或聚合数据流。此外,这些组件可用于即时视频处理和AI/ML推理。由于FPGA具有较高的能效,因此它们可以用于电池供电的移动设备中,并且可以提供足够的性能,在计算和工业控制应用中大放异彩。

2:嵌入视觉的发展趋势资料来源:莱迪思

在视频监控和安防应用中,CrossLink-NX™可以实现AI推理,从而对传感器数据进行预处理,这类应用包括人脸识别和存在检测。此外,它还可以用于传感器聚合和桥接。

此款芯片可用作嵌入式视觉协处理器,合并多达14个传感器。它还可以用于视频缩放、旋转和色彩空间转换。设计人员可以使用该芯片将一个传感器数据流发送到多个位置,这在汽车应用中非常实用,因为摄像头常常需要向多个处理单元提供数据。

在本白皮书的以下各节中,我们将比较CrossLink-NX™和逻辑单元密度及I/O支持相近的FPGA。以下是莱迪思提供的性能和功耗比较测试。

高性能CrossLink-NX™实现网络边缘AI

人们通常认为AI处理需要在云端完成,然而在网络边缘实现设备端的AI功能越来越重要,因为这能够更好地保护用户隐私、减少上传到云端的数据量、还能降低数据延迟以缩短设备响应时间。

对于硬件开发人员而言,多种因素导致了实现网络边缘AI/ML充满挑战。例如,为了提高AI/ML结果的准确性或实现新的应用,嵌入式视觉开发人员需要为其系统添加更多传感器和/或更高分辨率/更高帧率的摄像头。与此同时,嵌入式视觉设计人员希望使用符合MIPI标准的组件。MIPI起初是为移动市场开发的,如今,各类应用的设计人员开始寻找方法利用应用处理器等MIPI组件带来的高性能和规模经济的优势。

3CrossLink-NX™框图资料来源:莱迪思

CrossLink-NX™ FPGA拥有足够的资源处理多个视频数据流和即时执行AI计算功能,它还支持各类现有接口。

该产品系列拥有多个MIPI D-PHY接口和CSI-2摄像头接口,旨在服务于视频和显示屏应用。两个硬核D-PHY接口,每个接口支持四个通道,通道速率高达2.5 Gbps(共10 Gbps),另外的软核MIPI D-PHY配置支持最多12个速率为1.5 Gbps的MIPI数据流。其他I/O包括硬核5 Gbps PCIe Gen2和1066 Mbps LPDDR3 DRAM。

CrossLink-NX™的硬核DSP模块可用于在本地处理神经网络(NN)。该系列平均每个逻辑单元有170 bit存储空间,拥有同类产品中最高的存储与逻辑比。FPGA的大型片上SRAM从1到2.5 MB不等,可存储神经网络激活和权重。

FD-SOI工艺实现创新的功耗模式和更高的稳定性

莱迪思采用FD-SOI工艺,为开发人员管理功耗提供了一种创新的思路。该工艺可以实现在裸片的背面施加电压(负偏压),从而改变阈值电压。该芯片因此可以提供两种工作模式——低功耗模式和高性能模式。通过功耗优化,较高频率下的工作功率可以在200mW左右,而静态漏电功耗仅为十几毫瓦。与其他同类竞品相比,CrossLink-NX™ FPGA的功耗降低多达75%。

FD-SOI工艺还带来了另一个优势,即软错误(高能粒子撞击FPGA中的晶体管并损坏性能的现象)大大减少。使用FD-SOI工艺可显著减小芯片上容易受到软错误影响的物理区域。为确保基于SRAM的LUT稳定运行,还使用了存储块错误校正代码进行软件错误检查。总而言之,基于FD-SOI工艺的CrossLink-NX™的软错误率(SER)比bulk CMOS工艺制造的同类竞品FPGA解决方案降低100多倍。

CrossLink-NX™尺寸更小

移动应用往往有非常严格的空间限制。莱迪思将推出该系列的两款产品,分别支持不同级别的逻辑大小(17K或40K逻辑单元)。CrossLink-NX™系列的一大优势是它占据的空间极小,最小尺寸仅为3.7 mm x 4.1 mm(17K逻辑单元器件)。CrossLink-NX™系列的器件引脚兼容,因此同样的电路板设计可用于不同的应用,还可以对使用这些器件的设计的未来版本进行性能升级。

瞬时启动

CrossLink-NX™ FPGA使用quad-SPI闪存存储配置文件。可以在3毫秒内首先配置I/O引脚,然后在14毫秒内即可完成逻辑配置。这些特性实现了瞬时启动,降低了在许多应用中可能出现的运行问题。

CrossLink-NX™提供易用的体验

CrossLink-NX™ FPGA拥有大量不断更新的软件支持,包括莱迪思Radiant设计工具(最近的更新包括了片上调试、信号完整性分析和工程变更单编辑器等功能)和用于嵌入式视觉应用的各类IP核(MIPI D-PHY、格式转换、PCIe、SGMII和OpenLDI)。莱迪思还提供针对常见应用(例如摄像头聚合)的开发板和参考设计,未来将发布更多开发板和参考设计。

结论

莱迪思通过CrossLink-NX™ FPGA系列产品,将可编程性与高性能处理及高速I/O互连相结合。这些器件将以高度的灵活性、低功耗、可编程性、小尺寸和高速视频接口,为开发人员提供实现嵌入式智能视觉应用的多种选择。该系列仅仅是基于莱迪思Nexus FPGA技术平台的首款产品,未来的新产品值得期待!

分享到:

上一条:Imagination宣布和恩智浦达成最新授权协议
下一条:高通公司:5G+AI激荡智能互联新时代