打印
[ARM入门]

全志T527和瑞芯微RK3568的GPU性能揭秘与对比

[复制链接]
637|0
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
embfly|  楼主 | 2025-7-16 10:48 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 embfly 于 2025-7-16 10:51 编辑

最近公司研发T527(全志8核,GPU为G57)的相关产品,有幸评测了盈鹏飞嵌入式的T527的主板,对T527的GPU和 RK3568的GPU产生了比较浓厚的兴趣,今天就他们的GPU做了一些调查,不过调查中有疑问,希望路过的伙伴一起讨论!这里非常感谢盈鹏飞嵌入式,他们提供了AHD-X527主板,先简单介绍下这个板子:AHD-X527产品特性:
l采用Allwinner公司Cortex-A55八核A527/T527处理器,运行最高速度为2.0GHZ(T527最高1.8GHZ);
l支持Mali-G57 MC1 GPU,支持OpenGL ES 3.2/2.0/1.0, Valkan 1.1,OpenCL 2.0
l支持4K/25fps H.264视频编码,支持4K/15fps MJPEG编码;
l多格式4K/60fps视频解 (H.265,H.264,VC-1, MPEG-1/2/4, VP8) ;
l支持双屏异显;支持HDMI 2.0B, 分辨率最高4K@60fps;支持LVDS,分辨率最高1920x1080@60fps;支持MIPI DSI,分辨率最高2.5K@60fps(与LVDS复用);
l支持1-4G  Bytes LPDDR4X SDRAM;
l支持EMMC 8G-64G大容量电子盘,可启动;
l支持1路USB 3.0;支持3路USB2.0 HOST和一路OTG(TYPE-C接口);
l支持2I2C(其中一路支持掉电唤醒)2PWM(应用于背光);
l支持双路千兆以太网;
l支持3G/4G通信;
l支持2UART(TTL)、支持1路RS485、支持双路CAN BUS(2.0B,仅T527支持);
l支持MIPI CSI - 2*4-lane/4*2-lane/ 4+2*2-lane;
l操作系统的支持,可预装Android13/LINUX 5.15/Ubuntu 22.04;
l尺寸为146X119MM
AHD-X527产品功能图:

l  T527的 GPU介绍:
T527的规格书上看到,T527GPUG57 MC1。参考下表,我们得知,G57_MC1速度为850MHZ,Cache128KBExec_units1shading units32Pixel fillrate1.7GPixel/sFP32121.6GFLOPS;关键点在于G57并没有给出Base基础速度,只给出了Turbo速度。
https://gadgetversus.com/graphics-card/arm-mali-g57-vs-arm-mali-g31/
l  RK3568的 GPU介绍:
RK3568的规格书上看到,RK3568GPUG52 2EE-MC1。参考下表,我们得知,G52_2EE-MC1Base速度为620MhzTurbo速度为820MHZCache128KBExec_units1shading units24Pixel fillrate1.6GPixel/sFP3239.3GFLOPS;关键点在于G52给出Base基础速度,也给出了Turbo速度。
https://gadgetversus.com/graphics-card/arm-mali-g52-specs/





l  T527和RK3568 GPU的浅显分析:
从以上对比得知:T527GPU对比RK3568 GPU,硬件参数基本一致,但是T527FP32能力强,FP32是单精度浮点数,它在多个领域具有显著优势,主要体现在以下几个方面:
科学计算和工程模拟FP32提供了较高的精度和动态范围,适用于大多数科学计算和通用计算任务。它在需要高精度计算的领域中表现出色,如物理模拟、化学反应模拟、天体物理等。
深度学习训练:在深度学习模型的训练中,FP32因其高精度特点而被广泛使用。这可以确保模型在训练过程中能够捕捉到细微的数据变化,从而提高模型的准确性和泛化能力。FP32的应用也有助于保持模型训练的稳定性,减少由于数值精度问题导致的训练失败风险。
高性能计算FP32在高性能计算(HPC)领域也占据重要地位。它用于处理大规模的数据分析和计算密集型任务,如大规模数据分析、基因组学、金融建模等。
游戏和专业渲染:在游戏和专业渲染领域,FP32提供必要的精度以保证高质量的图像输出。尽管FP16和更低精度的格式在性能上有优势,但FP32在需要高精度图像处理的场景中仍然是首选。
桌面和移动工作站:在桌面和移动工作站中,FP32是处理复杂图形和计算任务的主要浮点格式。它能够提供高效的并行计算能力,满足专业用户和高性能需求。
特定工业应用:在某些工业应用中,如化工、制药、食品和饮料加工等,FP32用于需要精确控制和模拟的流程,以确保产品质量和过程效率。
综上所述,FP32在需要高精度和广泛动态范围的领域中具有明显优势,适用于科学计算、深度学习、高性能计算、游戏和专业渲染、桌面和移动工作站以及特定工业应用等多个领域。

l  T527和RK3568 GPU跑分对比:
最后我们在盈鹏飞嵌入式的AHD-X527主板上通过glmark2测试了T527的性能,结果如下:

[texture] texture-filter=nearest: FPS: 318 FrameTime: 3.145 ms
[texture] texture-filter=linear: FPS: 309 FrameTime: 3.236 ms
[texture] texture-filter=mipmap: FPS: 322 FrameTime: 3.106 ms
[shading] shading=gouraud: FPS: 281 FrameTime: 3.559 ms
[shading] shading=blinn-phong-inf: FPS: 263 FrameTime: 3.802 ms
FPS: 235 FrameTime: 4.255 ms
[shading] shading=cel: FPS: 236 FrameTime: 4.237 ms
[bump] bump-render=high-poly: FPS: 178 FrameTime: 5.618 ms
[bump] bump-render=normals: FPS: 328 FrameTime: 3.049 ms
[bump] bump-render=height: FPS: 315 FrameTime: 3.175 ms
[effect2d] kernel=0,1,0;1,-4,1;0,1,0;: FPS: 238 FrameTime: 4.202 ms
[effect2d] kernel=1,1,1,1,1;1,1,1,1,1;1,1,1,1,1;: FPS: 119 FrameTime: 8.403 ms
[pulsar] light=false:quads=5:texture=false: FPS: 316 FrameTime: 3.165 ms
[desktop] blur-radius=5:effect=blur:passes=1:separable=true:windows=4: FPS: 119 FrameTime: 8.403 ms
[desktop] effect=shadow:windows=4: FPS: 229 FrameTime: 4.367 ms
[buffer] columns=200:interleave=false:update-dispersion=0.9:update-fraction=0.5:update-method=map: FPS: 118 FrameTime: 8.475 ms
[buffer] columns=200:interleave=false:update-dispersion=0.9:update-fraction=0.5:update-method=subdata:[  438.269789]
FPS: 118 FrameTime: 8.475 ms
[buffer] columns=200:interleave=true:update-dispersion=0.9:update-fraction=0.5:update-method=map: FPS: 119 FrameTime: 8.403 ms
[ideas] speed=duration: FPS: 195 FrameTime: 5.128 ms
[jellyfish] <default>: FPS: 178 FrameTime: 5.618 ms
[terrain] <default>: FPS: 47 FrameTime: 21.277 ms
[shadow] <default>: FPS: 178 FrameTime: 5.618 ms
FPS: 59 FrameTime: 16.949 ms
[conditionals] fragment-steps=0:vertex-steps=0: FPS: 356 FrameTime: 2.809 ms
[conditionals] fragment-steps=5:vertex-steps=0: FPS: 297 FrameTime: 3.367 ms
[conditionals] fragment-steps=0:vertex-steps=5: FPS: 355 FrameTime: 2.817 ms
[function] fragment-complexity=low:fragment-steps=5: FPS: 346 FrameTime: 2.890 ms
[function] fragment-complexity=medium:fragment-steps=5: FPS: 250 FrameTime: 4.000 ms
[loop] fragment-loop=false:fragment-steps=5:vertex-steps=5:[  558.271099]
FPS: 307 FrameTime: 3.257 ms
[loop] fragment-steps=5:fragment-uniform=false:vertex-steps=5: FPS: 329 FrameTime: 3.040 ms
[loop] fragment-steps=5:fragment-uniform=true:vertex-steps=5: FPS: 295 FrameTime: 3.390 ms
=======================================================
                                  glmark2 Score: 239
=======================================================
对于RK3568来说,也通过glmark2进行了离屏和全屏模式的跑分,跑分如下:
疑问:为什么T527跑不过RK3568呢?有通过glmark2跑过T527的,欢迎讨论!!

离屏渲染模式跑分:

全屏模式跑分:

9459168771145d9c45.png (64.77 KB )

9459168771145d9c45.png

使用特权

评论回复

相关帖子

发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

5

主题

5

帖子

0

粉丝