目的 本文介绍广州星嵌DSPC6657XilinxZynq7035平台下XilinxZynq7035算力指标。基本概念FLOPsFLOPS FLOPs,FloatingPointOperations,浮点运算次数,每一个加、减、乘、除操作都算1FLOPs操作,常用来衡量模型计算复杂度。 注意下FLOPS,注意全大写,是floatingpointoperationspersecond的缩写,意指每秒浮点运算次数,理解为计算速度。是一个衡量硬件性能的指标,两者别弄混。MACs MultiplyAccumulateOperations,乘加累积操作数,常常被人们与FLOPs概念混淆。实际上1MACs包含一个乘法操作与一个加法操作,大约包含2FLOPs。通常MACs与FLOPs存在一个2倍的关系。关系 为什么使用乘加运算指标(MACs)呢?因为神经网络运算中内积、乘加运算无处不在: 对于一个33滤波器在特征图上的一次运算可以表示为: yw0x0w1x1w2x2w3x3w4x4w5x5w6x6w7x7w8x8 对于上式,记w0x0为一次乘加,即1MACs。所以对于上式而言共有9次乘加,即9MACs(实际上,9次相乘、91次相加,但为了方便统计,将计算量近似记为9MACs,就像算法复杂度通常把O(Nb)表示成O(N)一样,都只是一种近似)。 对于上式而言,可以认为执行了9次乘法、91次加法,所以一共是9(91)次FLOPs。所以近似来看1FLOPs2MACs。 ZYNQPL端算力指标 参考Xilinx官方文档Zynq7000SoCDataSheet:Overview(DS190),可找到Zynq7035PL端的MACs指标值为1334GMACs,约为2668GFLOPs,如下图所示: FPGAPS端性能指标 参考Xilinx官方资料Zynq7000SoCDataSheet:Overview(DS190),可获得Zynq7035PS端CPU的性能参数,如下图红框标出的地方所示: Zynq7035PS端双ARM总运算能力:2。5DMIPSMHzPerCPUx1000MHzx2CPU5000DMIPS。