本帖最后由 Tronlong创龙 于 2024-5-30 14:03 编辑
测试数据汇总 | | | | | | | 读速率:67.452MB/s 写速率:52.638MB/s | | | | 读速率:595.24MB/s 写速率:791.14MB/s | 备注:
(1)当TLP header size =16Byte时,PCIe理论传输速率为:782.50MB/s;(2)当TLP header size =12Byte时,PCIe理论传输速率为:803.09MB/s;
FSPI、PCIe总线介绍 FSPI(Flexible Serial Peripheral Interface)是一种高速、全双工、同步的串行通信总线,在RK3568J处理器中就有FSPI控制器,可用来连接FSPI设备。它具备如下特点:
(1)支持串行NOR FLASH、串行NAND FLASH; (2)支持SDR模式;(3)支持单线、双线以及四线模式。
图1 FSPI数据传输波形图 PCIe,即PCI-Express(peripheral component interconnect express)是一种高速串行计算机扩展总线标准。主要用于扩充计算机系统总线数据吞吐量以及提高设备通信速度。
图2 PCIe数据传输图
硬件平台介绍 硬件方案:创龙科技TL3568F-EVM评估板(瑞芯微RK3568J + 紫光同创**s-2)。 TL3568F-EVM评估板简介: 创龙科技TL3568F-EVM是一款基于瑞芯微RK3568J/RK3568B2四核ARM Cortex-A55处理器 + 紫光同创**s-2 PG2L50H/PG2L100H FPGA设计的异构多核国产工业评估板,由核心板和评估底板组成,ARM Cortex-A55处理单元主频高达1.8GHz/2.0GHz。核心板ARM、FPGA、ROM、RAM、电源、晶振、连接器等所有元器件均采用国产工业级方案,国产化率100%。同时,评估底板大部分元器件亦采用国产工业级方案。
RK3568J + FPGA典型应用场景 RK3568J + FPGA应用场景十分广泛,涵盖小电流选线、继电保护测试仪、运动控制器、医疗内窥镜、血液分析仪、目标识别跟踪等领域,可满足多种工业应用要求。
图3
案例测试 下文主要介绍基于瑞芯微RK3568J与紫光同创**s-2(硬件平台:创龙科技TL3568F-EVM评估板)的FSPI、PCIe通信案例,按照创龙科技提供的案例用户手册进行操作得出测试结果。 基于RK3568J + FPGA的FSPI通信案例 (1)案例说明 ARM端运行Linux系统,基于FSPI总线对FPGA DRAM进行读写测试。
图4 ARM端程序流程图
ARM端实现SPI Master功能,原理说明如下: a)打开SPI设备节点,如:/dev/spidev4.0。 b)使用ioctl配置FSPI总线,如FSPI总线极性和相位、通信速率、数据长度等。 c)选择模式为单线模式、双线模式或四线模式。当设置FSPI为四线模式时,发送数据为四线模式,接收数据为四线模式。 d)发送数据至FSPI总线,以及从FSPI总线读取数据。 e)校验数据,然后打印读写速率、误码率。 FPGA端实现SPI Slave功能,原理说明如下: a)FPGA将SPI Master发送的数据保存至DRAM。 b)SPI Master发起读数据时,FPGA从DRAM读取数据通过FSPI总线传输至SPI Master。 (2)测试结果 ARM通过FSPI总线(四线模式)写入2048Byte随机数据至FPGA DRAM,然后读出数据、进行数据校验,同时打印FSPI总线读写速率和误码率。 从下图可知,本次实测写速率为11.035MB/s,读速率为24.414MB/s,误码率为0.00%。
图5 若设置FSPI总线通信时钟频率为150MHz,ARM通过FSPI总线写入1MByte随机数据至FPGA DRAM,然后读出数据,循环100次,不做数据检验,最后打印FSPI总线读写速率和误码率。 最终,本次测试设置FSPI总线通信时钟频率为150MHz,则FSPI四线模式理论通信速率为:(150000000 / 1024 / 1024 / 8 x 4)MB/s ≈ 71.53MB/s。从下图可知,本次实测写速率为52.638MB/s,读速率为67.452MB/s,比较接近理论通信速率。 备注:本案例设计FPGA BRAM大小2048Byte,一次写入1MByte数据量会导致BRAM数据溢出,因此误码率较高。配置一次写入1MByte数据量只是为了验证FSPI的最大通信速率,不考虑误码率。 图6 基于RK3568J + FPGA的PCIe通信案例 (1)案例说明 ARM端基于PCIe总线对FPGA DRAM进行读写测试。应用程序通过ioctl函数发送命令开启DMA传输数据后,等待驱动上报input事件;当应用层接收到input事件,说明DMA传输数据完成。 图7 程序流程图a)采用DMA方式; b)将数据写至dma_memcpy驱动申请的连续内存空间(位于DDR); c)配置DMA,如源地址、目标地址、传输的数据大小等; d)写操作:通过ioctl函数启动DMA,通过PCIe总线将数据搬运至FPGA DRAM; e)程序接收驱动上报input事件后,将通过ioctl函数获取DMA搬运数据耗时,并计算DMA传输速率(即写速率); f)读操作:通过ioctl函数启动DMA,通过PCIe总线将FPGA DRAM中的数据搬运至dma_memcpy驱动申请的连续内存空间(位于DDR); g)程序接收驱动上报input事件后,将数据从内核空间读取至用户空间,然后校验数据,同时通过ioctl函数获取DMA搬运数据耗时,并计算DMA传输速率(即读速率)。
FPGA端原理说明如下: a)实现PCIe Endpoint功能; b)处理PCIe RC端发起的PCIe BAR0空间读写事务; c)将PCIe BAR0读写数据缓存至FPGA DRAM中。 (2)测试结果 将随机数据先写入FPGA DRAM,再从FPGA DRAM读出。测试完成后,程序将会打印最终测试结果,包含读写平均传输耗时、读写平均传输速率、读写错误统计等信息。 图8 表 2 测试结果说明 | | | | | | | | | | 应用层写数据至驱动Buffer耗时,本次测试为55us | 应用层从驱动Buffer读取数据耗时,本次测试为288us | | 应用层写数据至驱动Buffer速率,本次测试为1132.10MB/s | 应用层从驱动Buffer读取数据速率,本次测试为217.99MB/s | | | |
|