NPU性能深度评测:瑞芯微RK3588、RK3576、RK3568、RK3562

2025年04月08日 13:57    发布者:Tronlong--
引言随着AI技术不断发展,越来越多的嵌入式设备开始集成NPU(神经网络处理单元),以实现更高效的AI推理。作为国产芯片厂商的佼佼者,瑞芯微推出的RK3588、RK3576、RK3568、RK3562系列芯片在市场中占据了重要地位。今天,我们一起深入对比、测评上述芯片的NPU性能,快速解决在项目选型中带来的困扰。
测试数据汇总巅峰对决:RK3576 VS RK3588

图1轻量角逐:RK3562 VS RK3568

图2数据解读与应用指南通过在不同平台上对yolov5s(640×640)目标检测模型的推理性能测试对比,可以看出RK3588凭借6TOPS NPU算力,49fps的推理实测性能,成为图像识别、多模态分析等高性能AI应用的首选。
其次,RK3576的推理实测性能是45fps。其具备超高性价比,在中高性能场景下更占据优势。以工业控制领域为例,在对设备运行状态进行实时监测与故障诊断时,RK3576既能满足对数据处理速度和精度的要求,又能为企业有效控制成本,毫无疑问成为工业自动化升级的不二之选。
RK3568与RK3562均为轻量级NPU性价比方案,RK3568基于yolov5s(640×640)模型的实测推理性能达到17fps,适合用于如AGV机器人等基础的AI扩展场景。而RK3562以21fps的实测推理性能,在低功耗边缘设备领域表现出色,如IoT门禁系统。这两款芯片均为1TOPS算力,能更好满足用户对于轻量化是我需求,以显著的成本优势,为大规模普及AI应用提供了可能。RK3576全国产工业核心板创龙科技基于瑞芯微RK3576J/RK3576,推出了工业核心板和评估板。其中,瑞芯微RK3576J/RK3576处理器集成了四核ARM Cortex-A72@2.2GHz + 四核1.8GHz ARM Cortex-A53@2.0GHz + ARM Cortex-M0,搭载6TOPS NPU。
创龙科技的RK3576J/RK3576核心板的ARM、ROM、RAM、电源、晶振、连接器等所有元器件均采用国产工业级方案,国产化率100%,可提供报告。此外,RK3576J/RK3576评估板具备丰富的接口资源,包括4路Ethernet、3路USB3.2、2路CAN-FD、2路RS485、PCIe 2.1等通信接口,以及MIPI CSI、LVDS OUT、MIPI DSI、DP(DisplayPort)、HDMI OUT、MIC IN、HP OUT、LINE IN等音视频接口,满足您的项目评估需求!RK3576工业核心板典型应用场景
图3开发环境
Windows开发环境:Windows 7 64bit、Windows 10 64bitLinux开发环境:VMware16.2.5、Ubuntu22.04.5 64bitU-Boot:U-Boot-2017.09Kernel:Linux-6.1.75LinuxSDK:LinuxSDK-[版本号](基于rk3576_linux6.1_release_v1.0.0_20240620)硬件平台:创龙科技TL3576-EVM工业评估板案例功能
案例基于RKNN API实现对图片中目标对象的识别,并将识别结果以加水印的方式添加至图像,并保存成图片文件。案例循环测试10次,统计出推理的平均处理耗时。
程序原理流程图如下所示:
图4案例测试
请通过网线将评估板千兆网口ETH1 RGMII连接至路由器。请将案例bin目录下的所有文件拷贝至评估板文件系统任意目录下。

图5
在可执行文件所在目录,执行如下命令,对图片目标对象进行模型推理。备注:模型运行的时间会有抖动。
Target# ./yolov5_object_detect yolov5s-640-640_rk3576.rknn car.jpg
图6从输出信息可知,本案例程序识别出测试图片包含person、car、bus、truck等对象,运行1次模型耗时为31.48ms;循环运行10次模型平均耗时为22.26ms(约为45fps)。
图7案例程序对测试图片的目标对象标记成功后将输出名称为out.jpg的标记图片至当前目录,请将out.jpg文件拷贝至Windows下,并使用PC端相关软件对比查看car.jpg与out.jpg,测试结果如下所示。

图 8
图9从out.jpg图片可知,案例程序能正确框选出人物、汽车等物体,同时显示person、car等文字标签和置信度,标记对象的数量及信息等与程序打印信息一致。
本程序能够支持识别的目标数据集类型说明位于案例目录"bin\model\"目录下的coco_80_labels_list.txt文件,用户可根据相关目标类型进行测试验证。
图10
同时可以测得CPU占用率约为14%,NPU占用率约为36%,内存占用率约为8%。

图11

图12到这里,我们的演示步骤结束。查看更多RK3576相关的案例演示 ,欢迎各位工程师在公众号(Tronlong创龙科技)查阅,快来试试吧!