基于XC7Z100+OV5640(DSP接口)YOLO人脸识别前向推理过程(部分3)

您所在的位置:网站首页 基于dsp的人脸识别 基于XC7Z100+OV5640(DSP接口)YOLO人脸识别前向推理过程(部分3)

基于XC7Z100+OV5640(DSP接口)YOLO人脸识别前向推理过程(部分3)

2024-01-20 07:16| 来源: 网络整理| 查看: 265

PL端通过AXI-DMA接口从DDR3读取所需的数据,包括输入图像和网络参数,并通过Stream_rx模块接收到FPGA内部。AXI-DMA是一种高带宽,高效率的数据传输接口。

PL端根据PS端发送的控制信号,在FPGA内部进行相应层的计算,实现所有的YOLO层,包括卷积、激活、池化、上采样等操作。对于卷积层,PL端先对输入图像进行填充(如果需要),然后使用通用矩阵乘法GEMM(General Matrix Multiplication)原理,设计了一个基于systolic array的GEMM处理器。进行卷积运算,并使用查找表实现激活函数。对于池化层和上采样层,PL端使用简单的逻辑电路进行实现。对于YOLO层,PL端直接将输出结果写入DDR3。

对于激活层,PL端使用了一个查找表文件来实现leaky ReLU函数。查找表文件是在Pytorch中生成的,包含了不同输入值对应的输出值。 对于池化层和上采样层,PL端使用了简单的硬件逻辑来实现最大值池化和双线性插值上采样。 对于YOLO层和路由层,PL端不进行任何计算,只是将输入数据原样输出。

PL端将每一层的计算结果通过VDMA写入DDR3的相应位置,作为下一层的输入或最终的输出。同时,PL端通过AXI-LITE模块向PS端发送信号,告知PS端该层的计算已经完成。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3