本帖最后由 embfly 于 2025-7-16 10:51 编辑
最近公司研发T527(全志8核,GPU为G57)的相关产品,有幸评测了盈鹏飞嵌入式的T527的主板,对T527的GPU和 RK3568的GPU产生了比较浓厚的兴趣,今天就他们的GPU做了一些调查,不过调查中有疑问,希望路过的伙伴一起讨论!这里非常感谢盈鹏飞嵌入式,他们提供了AHD-X527主板,先简单介绍下这个板子:AHD-X527产品特性:
l采用Allwinner公司Cortex-A55八核A527/T527处理器,运行最高速度为2.0GHZ(T527最高1.8GHZ); l支持Mali-G57 MC1 GPU,支持OpenGL ES 3.2/2.0/1.0, Valkan 1.1,OpenCL 2.0 l支持4K/25fps H.264视频编码,支持4K/15fps MJPEG编码; l多格式4K/60fps视频解码 (H.265,H.264,VC-1, MPEG-1/2/4, VP8) ; l支持双屏异显;支持HDMI 2.0B, 分辨率最高4K@60fps;支持LVDS,分辨率最高1920x1080@60fps;支持MIPI DSI,分辨率最高2.5K@60fps(与LVDS复用); l支持1-4G Bytes LPDDR4X SDRAM; l支持EMMC 8G-64G大容量电子盘,可启动; l支持1路USB 3.0;支持3路USB2.0 HOST和一路OTG(TYPE-C接口); l支持2路I2C(其中一路支持掉电唤醒)、2路PWM(应用于背光); l支持双路千兆以太网; l支持3G/4G通信; l支持2路UART(TTL)、支持1路RS485、支持双路CAN BUS(2.0B,仅T527支持); l支持MIPI CSI - 2*4-lane/4*2-lane/ 4+2*2-lane; l操作系统的支持,可预装Android13/LINUX 5.15/Ubuntu 22.04; l尺寸为146X119MM AHD-X527产品功能图:
l T527的 GPU介绍: 从T527的规格书上看到,T527的GPU为G57 MC1。参考下表,我们得知,G57_MC1速度为850MHZ,Cache为128KB。Exec_units为1;shading units为32,Pixel fillrate为1.7GPixel/s,FP32为121.6GFLOPS;关键点在于G57并没有给出Base基础速度,只给出了Turbo速度。 https://gadgetversus.com/graphics-card/arm-mali-g57-vs-arm-mali-g31/ l RK3568的 GPU介绍: 从RK3568的规格书上看到,RK3568的GPU为G52 2EE-MC1。参考下表,我们得知,G52_2EE-MC1的Base速度为620Mhz,Turbo速度为820MHZ,Cache为128KB。Exec_units为1;shading units为24,Pixel fillrate为1.6GPixel/s,FP32为39.3GFLOPS;关键点在于G52给出Base基础速度,也给出了Turbo速度。 https://gadgetversus.com/graphics-card/arm-mali-g52-specs/
l T527和RK3568 GPU的浅显分析: 从以上对比得知:T527的GPU对比RK3568 GPU,硬件参数基本一致,但是T527的FP32能力强,FP32是单精度浮点数,它在多个领域具有显著优势,主要体现在以下几个方面: 科学计算和工程模拟:FP32提供了较高的精度和动态范围,适用于大多数科学计算和通用计算任务。它在需要高精度计算的领域中表现出色,如物理模拟、化学反应模拟、天体物理等。 深度学习训练:在深度学习模型的训练中,FP32因其高精度特点而被广泛使用。这可以确保模型在训练过程中能够捕捉到细微的数据变化,从而提高模型的准确性和泛化能力。FP32的应用也有助于保持模型训练的稳定性,减少由于数值精度问题导致的训练失败风险。 高性能计算:FP32在高性能计算(HPC)领域也占据重要地位。它用于处理大规模的数据分析和计算密集型任务,如大规模数据分析、基因组学、金融建模等。 游戏和专业渲染:在游戏和专业渲染领域,FP32提供必要的精度以保证高质量的图像输出。尽管FP16和更低精度的格式在性能上有优势,但FP32在需要高精度图像处理的场景中仍然是首选。 桌面和移动工作站:在桌面和移动工作站中,FP32是处理复杂图形和计算任务的主要浮点格式。它能够提供高效的并行计算能力,满足专业用户和高性能需求。 特定工业应用:在某些工业应用中,如化工、制药、食品和饮料加工等,FP32用于需要精确控制和模拟的流程,以确保产品质量和过程效率。 综上所述,FP32在需要高精度和广泛动态范围的领域中具有明显优势,适用于科学计算、深度学习、高性能计算、游戏和专业渲染、桌面和移动工作站以及特定工业应用等多个领域。
l T527和RK3568 GPU跑分对比: 最后我们在盈鹏飞嵌入式的AHD-X527主板上通过glmark2测试了T527的性能,结果如下:
[texture] texture-filter=nearest: FPS: 318 FrameTime: 3.145 ms
[texture] texture-filter=linear: FPS: 309 FrameTime: 3.236 ms
[texture] texture-filter=mipmap: FPS: 322 FrameTime: 3.106 ms
[shading] shading=gouraud: FPS: 281 FrameTime: 3.559 ms
[shading] shading=blinn-phong-inf: FPS: 263 FrameTime: 3.802 ms
FPS: 235 FrameTime: 4.255 ms
[shading] shading=cel: FPS: 236 FrameTime: 4.237 ms
[bump] bump-render=high-poly: FPS: 178 FrameTime: 5.618 ms
[bump] bump-render=normals: FPS: 328 FrameTime: 3.049 ms
[bump] bump-render=height: FPS: 315 FrameTime: 3.175 ms
[effect2d] kernel=0,1,0;1,-4,1;0,1,0;: FPS: 238 FrameTime: 4.202 ms
[effect2d] kernel=1,1,1,1,1;1,1,1,1,1;1,1,1,1,1;: FPS: 119 FrameTime: 8.403 ms
[pulsar] light=false:quads=5:texture=false: FPS: 316 FrameTime: 3.165 ms
[desktop] blur-radius=5:effect=blur:passes=1:separable=true:windows=4: FPS: 119 FrameTime: 8.403 ms
[desktop] effect=shadow:windows=4: FPS: 229 FrameTime: 4.367 ms
[buffer] columns=200:interleave=false:update-dispersion=0.9:update-fraction=0.5:update-method=map: FPS: 118 FrameTime: 8.475 ms
[buffer] columns=200:interleave=false:update-dispersion=0.9:update-fraction=0.5:update-method=subdata:[ 438.269789]
FPS: 118 FrameTime: 8.475 ms
[buffer] columns=200:interleave=true:update-dispersion=0.9:update-fraction=0.5:update-method=map: FPS: 119 FrameTime: 8.403 ms
[ideas] speed=duration: FPS: 195 FrameTime: 5.128 ms
[jellyfish] <default>: FPS: 178 FrameTime: 5.618 ms
[terrain] <default>: FPS: 47 FrameTime: 21.277 ms
[shadow] <default>: FPS: 178 FrameTime: 5.618 ms
FPS: 59 FrameTime: 16.949 ms
[conditionals] fragment-steps=0:vertex-steps=0: FPS: 356 FrameTime: 2.809 ms
[conditionals] fragment-steps=5:vertex-steps=0: FPS: 297 FrameTime: 3.367 ms
[conditionals] fragment-steps=0:vertex-steps=5: FPS: 355 FrameTime: 2.817 ms
[function] fragment-complexity=low:fragment-steps=5: FPS: 346 FrameTime: 2.890 ms
[function] fragment-complexity=medium:fragment-steps=5: FPS: 250 FrameTime: 4.000 ms
[loop] fragment-loop=false:fragment-steps=5:vertex-steps=5:[ 558.271099]
FPS: 307 FrameTime: 3.257 ms
[loop] fragment-steps=5:fragment-uniform=false:vertex-steps=5: FPS: 329 FrameTime: 3.040 ms
[loop] fragment-steps=5:fragment-uniform=true:vertex-steps=5: FPS: 295 FrameTime: 3.390 ms
=======================================================
glmark2 Score: 239
=======================================================
对于RK3568来说,也通过glmark2进行了离屏和全屏模式的跑分,跑分如下: 疑问:为什么T527跑不过RK3568呢?有通过glmark2跑过T527的,欢迎讨论!!
离屏渲染模式跑分:
全屏模式跑分:
|