CH32V307浮点指令生成测试

发表于 2023-9-16 21:32

CH32V307芯片的内核是QinkeV4F,带有FPU.
做个代码测试一下子FPU指令相对于软浮点代码的效率对比.

测试代码:

#include <stdint.h>



#define TEST_CNT    1000000



float test_float(void) {

    float sum = 0.1;



    for(uint32_t i=0; i < TEST_CNT; ++i) {

        sum += 0.625;

    }



    return sum;

}



double test_double(void) {

    double sum = 0.1;



    for(uint32_t i=0; i < TEST_CNT; ++i) {

        sum += 0.625;

    }



    return sum;

}

复制

{

            uint32_t s_ticks = g_ticks;

            float result = test_float();

            uint32_t e_ticks = g_ticks;

            printf( "%u - %u\r\n", s_ticks, e_ticks);

            printf( "%f, test duration %u\r\n", result, e_ticks - s_ticks);

        }



        {

            uint32_t s_ticks = g_ticks;

            double result = test_double();

            uint32_t e_ticks = g_ticks;

            printf( "%u - %u\r\n", s_ticks, e_ticks);

            printf( "%f, double duration %u\r\n", result, e_ticks - s_ticks);

        }

通过配置是否使用FPU来对比运行效率,主要是这两个配置选项:

运行结果:
使用了FPU指令:

复制

625000.125000, test duration 41

625000.100000, double duration 1186

不使用FPU指令,软件模拟浮点运算:

复制

625000.125000, test duration 763

625000.100000, double duration 1031

结论:
单精度情况下, 硬件FPU指令比软件浮点快近19倍.
763/41 = 18.609756097560975

对于双精度情况, 由于都是软件模拟, 所以性能近似.
那么为什么, 使用软件模拟浮点运算时, 双精度的性能要稍稍提升一点.( 1186/1131 = 1.0486295313881522, 约5个百分点的提升).
本人认为是单精度与双精度都使用了软件模拟运算, 某些共通部分有一些编译器与连接器带来的优化效果.

最后看看两种情况下生成的代码差异.
1. 硬件FPU:

复制

   4                      .Ltext0:

   5                              .cfi_sections        .debug_frame

   6                              .section        .text.test_float,"ax",@progbits

   7                              .align        1

   8                              .globl        test_float

  10                      test_float:

  11                      .LFB0:

  12                              .file 1 "../User/test_float_double.c"

   1:../User/test_float_double.c **** /*

   2:../User/test_float_double.c ****  * test_float_double.c

   3:../User/test_float_double.c ****  *

   4:../User/test_float_double.c ****  *  Created on: Sep 16, 2023

   5:../User/test_float_double.c ****  *      Author: Administrator

   6:../User/test_float_double.c ****  */

   7:../User/test_float_double.c **** #include <stdint.h>

   8:../User/test_float_double.c **** 

   9:../User/test_float_double.c **** #define TEST_CNT    1000000

  10:../User/test_float_double.c **** 

  11:../User/test_float_double.c **** float test_float(void) {

  13                              .loc 1 11 24

  14                              .cfi_startproc

  12:../User/test_float_double.c ****     float sum = 0.1;

  15                              .loc 1 12 5

  16                      .LVL0:

  13:../User/test_float_double.c **** 

  14:../User/test_float_double.c ****     for(uint32_t i=0; i < TEST_CNT; ++i) {

  17                              .loc 1 14 5

  18                      .LBB2:

  19                              .loc 1 14 9

  20                      .LBE2:

  12:../User/test_float_double.c ****     float sum = 0.1;

  21                              .loc 1 12 11 is_stmt 0

  22 0000 B7070000                 lui        a5,%hi(.LC0)

  23 0004 07A50700                 flw        fa0,%lo(.LC0)(a5)

  24                      .LBB3:

  15:../User/test_float_double.c ****         sum += 0.625;

  25                              .loc 1 15 13

  26 0008 B7070000                 lui        a5,%hi(.LC1)

  27 000c 87A70700                 flw        fa5,%lo(.LC1)(a5)

  28                      .LBE3:

  11:../User/test_float_double.c ****     float sum = 0.1;

  29                              .loc 1 11 24

  30 0010 B7470F00                 li        a5,999424

  31 0014 93870724                 addi        a5,a5,576

  32                      .LVL1:

  33                      .L2:

  34                      .LBB4:

  35                              .loc 1 15 9 is_stmt 1 discriminator 3

  36 0018 FD17                     addi        a5,a5,-1

  37                              .loc 1 15 13 is_stmt 0 discriminator 3

  38 001a 5375F500                 fadd.s        fa0,fa0,fa5

  39                      .LVL2:

  14:../User/test_float_double.c ****         sum += 0.625;

  40                              .loc 1 14 5 discriminator 3

  41 001e EDFF                     bnez        a5,.L2

  42                      .LBE4:

  16:../User/test_float_double.c ****     }

  17:../User/test_float_double.c **** 

  18:../User/test_float_double.c ****     return sum;

  19:../User/test_float_double.c **** }

  43                              .loc 1 19 1

  44 0020 8280                     ret

  45                              .cfi_endproc

2.软件模拟FPU:

复制

   4                      .Ltext0:

   5                              .cfi_sections        .debug_frame

   6                              .globl        __addsf3

   7                              .section        .text.test_float,"ax",@progbits

   8                              .align        1

   9                              .globl        test_float

  11                      test_float:

  12                      .LFB0:

  13                              .file 1 "../User/test_float_double.c"

   1:../User/test_float_double.c **** /*

   2:../User/test_float_double.c ****  * test_float_double.c

   3:../User/test_float_double.c ****  *

   4:../User/test_float_double.c ****  *  Created on: Sep 16, 2023

   5:../User/test_float_double.c ****  *      Author: Administrator

   6:../User/test_float_double.c ****  */

   7:../User/test_float_double.c **** #include <stdint.h>

   8:../User/test_float_double.c **** 

   9:../User/test_float_double.c **** #define TEST_CNT    1000000

  10:../User/test_float_double.c **** 

  11:../User/test_float_double.c **** float test_float(void) {

  14                              .loc 1 11 24

  15                              .cfi_startproc

  16 0000 17030000                 call        t0,__riscv_save_2

  16      E7020300 

  17                              .cfi_offset 9, -12

  18                              .cfi_offset 8, -8

  19                              .cfi_offset 1, -4

  20                              .cfi_def_cfa_offset 16

  12:../User/test_float_double.c ****     float sum = 0.1;

  21                              .loc 1 12 5

  22                      .LVL0:

  13:../User/test_float_double.c **** 

  14:../User/test_float_double.c ****     for(uint32_t i=0; i < TEST_CNT; ++i) {

  23                              .loc 1 14 5

  24                      .LBB2:

  25                              .loc 1 14 9

  26                      .LBE2:

  12:../User/test_float_double.c ****     float sum = 0.1;

  27                              .loc 1 12 11 is_stmt 0

  28 0008 B7070000                 lui        a5,%hi(.LC0)

  29                      .LBB3:

  15:../User/test_float_double.c ****         sum += 0.625;

  30                              .loc 1 15 13

  31 000c 37070000                 lui        a4,%hi(.LC1)

  32                      .LBE3:

  12:../User/test_float_double.c ****     float sum = 0.1;

  33                              .loc 1 12 11

  34 0010 83A70700                 lw        a5,%lo(.LC0)(a5)

  35                      .LBB4:

  36                              .loc 1 15 13

  37 0014 83240700                 lw        s1,%lo(.LC1)(a4)

  38                      .LBE4:

  11:../User/test_float_double.c ****     float sum = 0.1;

  39                              .loc 1 11 24

  40 0018 37440F00                 li        s0,999424

  41 001c 13040424                 addi        s0,s0,576

  42                      .LVL1:

  43                      .L2:

  44                      .LBB5:

  45                              .loc 1 15 9 is_stmt 1 discriminator 3

  46                              .loc 1 15 13 is_stmt 0 discriminator 3

  47 0020 3E85                     mv        a0,a5

  48 0022 A685                     mv        a1,s1

  49 0024 97000000                 call        __addsf3

  49      E7800000 

  50                      .LVL2:

  51 002c 7D14                     addi        s0,s0,-1

  52 002e AA87                     mv        a5,a0

  53                      .LVL3:

  14:../User/test_float_double.c ****         sum += 0.625;

  54                              .loc 1 14 5 discriminator 3

  55 0030 65F8                     bnez        s0,.L2

  56                      .LBE5:

  16:../User/test_float_double.c ****     }

  17:../User/test_float_double.c **** 

  18:../User/test_float_double.c ****     return sum;

  19:../User/test_float_double.c **** }

  57                              .loc 1 19 1

  58 0032 17030000                 tail        __riscv_restore_2

  58      67000300 

  59                              .cfi_restore 9

  60                              .cfi_restore 8

  61                              .cfi_restore 1

  62                              .cfi_def_cfa_offset 0

  63                              .cfi_endproc

可以看出硬件FPU计算时, 有明显的浮点指令:

复制

fadd.s        fa0,fa0,fa5

谢谢阅读.

发表于 2024-3-1 15:46

能接收的最复杂的运算是什么呢

发表于 2024-3-1 18:12

这个速度快慢是如何体现出来的呢

发表于 2024-3-1 18:43

请问什么叫做浮点指令生成啊？难道不是固定的指令吗

发表于 2024-3-2 08:00

软件模拟那部分代码我都没看明白是什么语言啊

发表于 2024-3-2 08:31

可以单独为浮点数运算开辟一个线程吗

发表于 2024-3-2 09:02

可以开启这个功能做普通的运算吗？

发表于 2024-3-31 18:02

keaibukelian 发表于 2024-3-2 09:02
可以开启这个功能做普通的运算吗？

可以的, 就看你运算是否涉及浮点, 如果不涉及浮点, 则开启了也没有加速的.

发表于 2024-3-31 18:02

heimaojingzhang 发表于 2024-3-2 08:31
可以单独为浮点数运算开辟一个线程吗

可以, 看你应用是否有大量需要浮点运算的功能.

发表于 2024-3-31 18:03

guanjiaer 发表于 2024-3-2 08:00
软件模拟那部分代码我都没看明白是什么语言啊

汇编语言

发表于 2024-3-31 18:04

八层楼发表于 2024-3-1 18:43
请问什么叫做浮点指令生成啊？难道不是固定的指令吗

请看我的贴图.

就是测试在是否打开浮点指令开关的差别, 如果打开了就会生成单精度FPU指令生成, 否则使用软件模拟.

发表于 2024-3-31 18:04

观海发表于 2024-3-1 18:12
这个速度快慢是如何体现出来的呢

相同的计算, 使用定时器观察所耗时间

发表于 2024-3-31 18:05

tpgf 发表于 2024-3-1 15:46
能接收的最复杂的运算是什么呢

仅受内存大小限制

Goodch · 发表于 2024-4-1 08:20

RISC-V内核的芯片？

发表于 2024-4-25 13:15

那个配置FPU 的软件是啥

发表于 2024-5-27 15:17

LEDyyds 发表于 2024-4-25 13:15
那个配置FPU 的软件是啥

就是官方配套的开发IDE,在项目属性里配置

[单片机芯片] CH32V307浮点指令生成测试

相关帖子

评论

浏览过的版块

技术新星奖章

十世金身

技术领袖奖章

坚毅之洋流

终身成就奖章

精英会员奖章

奔腾之江水

常驻人口

技术高手奖章

涓涓之细流