[鑫森淼焱垚] 发表于 2024-12-26 19:16

【AT-START-L021测评】4--CRC计算对比

本帖最后由 [鑫森淼焱垚] 于 2024-12-27 10:05 编辑



硬件CRC介绍
AT32L021 具有一个CRC计算单元,使用一个固定的多项式发生器,从一个32位的数据产生一个CRC码。在众多的应用中,基于CRC的技术倍用于验证数据传输或存储的一致性。

最后一个寄存器多项式寄存器,在接下来的示例中使用默认值 0x04C1_1DB7。

软件 CRC 实现
直接使用某AI生成的CRC实现代码,设定多项式为 0x04C1_1DB7.

uint32_t crc32(const uint32_t* data, uint32_t length)
{
      uint32_t crc = 0xFFFFFFFF;
      uint32_t polynomial = 0x04C11DB7;

      for (uint32_t i = 0; i < length; i++) {
                crc ^= data;
                for (uint32_t j = 0; j < 32; j++) {
                        if (crc & 0x80000000) {
                              crc = (crc << 1) ^ polynomial;
                        } else {
                              crc <<= 1;
                        }
                }
      }

      crc = crc ^ 0xFFFFFFFF;
      return ~crc;
}


对比测试
测试代码如下,分别用硬件CRC和软件CRC对同一个数据进行计算,并把计算结果进行比较。
使用 perf_counter 来统计硬件CRC和软件CRC计算用时。

/*-----------------------------------------AT32L021 CRC---------------------------------------*/

#define BUFFER_SIZE                      120

static const uint32_t data_buffer =
{
      0xc33dd31c, 0xe37ff35e, 0x129022f3, 0x32d24235, 0x52146277, 0x7256b5ea,
      0x4a755a54, 0x6a377a16, 0x0af11ad0, 0x2ab33a92, 0xed0fdd6c, 0xcd4dbdaa,
      0xbb3bab1a, 0x6ca67c87, 0x5cc52c22, 0x3c030c60, 0x1c41edae, 0xfd8fcdec,
      0xad8b9de8, 0x8dc97c26, 0x5c644c45, 0x3ca22c83, 0x1ce00cc1, 0xef1fff3e,
      0x95a88589, 0xf56ee54f, 0xd52cc50d, 0x34e224c3, 0x04817466, 0x64475424,
      0x78066827, 0x18c008e1, 0x28a3cb7d, 0xdb5ceb3f, 0xfb1e8bf9, 0x9bd8abbb,
      0xdf7caf9b, 0xbfba8fd9, 0x9ff86e17, 0x7e364e55, 0x2e933eb2, 0x0ed11ef0,
      0xa35ad3bd, 0xc39cf3ff, 0xe3de2462, 0x34430420, 0x64e674c7, 0x44a45485,
      0xad2abd0b, 0x8d689d49, 0x7e976eb6, 0x5ed54ef4, 0x2e321e51, 0x0e70ff9f,
      0xefbedfdd, 0xcffcbf1b, 0x9f598f78, 0x918881a9, 0xb1caa1eb, 0xd10cc12d,
      0xe16f1080, 0x00a130c2, 0x20e35004, 0x40257046, 0x83b99398, 0xa3fbb3da,
      0x00001021, 0x20423063, 0x408450a5, 0x60c670e7, 0x9129a14a, 0xb16bc18c,
      0x569546b4, 0xb75ba77a, 0x97198738, 0xf7dfe7fe, 0xc7bc48c4, 0x58e56886,
      0x4405a7db, 0xb7fa8799, 0xe75ff77e, 0xc71dd73c, 0x26d336f2, 0x069116b0,
      0x76764615, 0x5634d94c, 0xc96df90e, 0xe92f99c8, 0xb98aa9ab, 0x58444865,
      0x78a70840, 0x18612802, 0xc9ccd9ed, 0xe98ef9af, 0x89489969, 0xa90ab92b,
      0xd1ade1ce, 0xf1ef1231, 0x32732252, 0x52b54294, 0x72f762d6, 0x93398318,
      0xa56ab54b, 0x85289509, 0xf5cfc5ac, 0xd58d3653, 0x26721611, 0x063076d7,
      0x8d689d49, 0xf7dfe7fe, 0xe98ef9af, 0x063076d7, 0x93398318, 0xb98aa9ab,
      0x4ad47ab7, 0x6a961a71, 0x0a503a33, 0x2a12dbfd, 0xfbbfeb9e, 0x9b798b58
};

static const uint32_t CRC_RESULT = 0xE5DFCF6D; // 上面这个缓冲区计算的CRC结果

__IO uint32_t crc_value_at32 = 0; // AT32 硬件CRC计算出来的结果
__IO uint32_t crc_value_sw = 0; // 软件计算出来的结果


/**
* @briefmain function.
* @paramnone
* @retval none
*/
int main(void)
{
      system_clock_config();

      crm_periph_clock_enable(CRM_CRC_PERIPH_CLOCK, TRUE); // AT32L021 CRC 外设时钟使能
      crc_data_reset(); // 复位 CRC 数据寄存器
      // crc_poly_value_set(0x04C11DB7); // 默认使用的多项式

      at32_board_init();

      init_cycle_counter(false);

      button_exint_init();

      uart_print_init(115200);
      printf("at32 mcu initialize ok.\r\n");

      // 开始 AT32L021 CRC 计算
      __cycleof__("HW CRC32")
      {
                crc_value_at32 = crc_block_calculate((uint32_t*)data_buffer, BUFFER_SIZE);
      }

      __cycleof__("SW CRC32")
      {
                crc_value_sw = crc32((const uint32_t*)data_buffer, BUFFER_SIZE);
      }
      printf("SW : 0x%08X , ANS = 0x%08X \r\n", crc_value_sw, CRC_RESULT);
      printf("HW : 0x%08X , ANS = 0x%08X \r\n", crc_value_at32, CRC_RESULT);

      if (crc_value_sw == crc_value_at32) {
                printf("PASS \r\n");
                while (1) {
                        at32_led_toggle(LED2);
                        delay_ms(g_speed * DELAY);
                }
      } else {
                printf("FAIL \r\n");
                while (1) {
                        at32_led_toggle(LED4);
                        delay_ms(g_speed * DELAY);
                }
      }
}


Debug -O0

Release -O2

总结
AT32硬件CRC和软件CRC计算一个120个word的速度对比如下,总结3点:

[*]优化等级从-O0提高到-O2,无论硬件CRC还是软件CRC速度都有明显的提升,硬件CRC速度提升倍数约为3.69倍,而软件CRC速度提升约为29.48倍;
[*]优化等级为 -O0 时,硬件CRC速度是软件CRC的24.88倍;
[*]优化等级为 -O2 时,硬件CRC速度是软件CRC的3.11倍;
注意,以上测试分别在 MCU 供电 1.8V 和 3.3V 测试,结果相同。


Debug -O0
Release -O2

AT32 CRC
3566
966

SW CRC
88724
3009


光影捕手 发表于 2025-1-17 17:37

硬件CRC肯定是比软件舒服的

updownq 发表于 2025-2-4 16:24

可以明确芯片内置 CRC 计算单元的效率、准确性

nomomy 发表于 2025-2-5 13:20

检查在编译过程中是否进行了适当的优化设置,以提高CRC计算代码的执行效率。

macpherson 发表于 2025-2-5 15:17

硬件CRC计算单元的使用相对简单,只需调用相应的API即可实现。相比之下,软件实现方式需要编写更多的代码,并且需要考虑各种边界条件和错误处理,增加了代码的复杂性。

timfordlare 发表于 2025-2-5 16:16

硬件CRC的快速响应有助于减少数据传输或存储时的校验时间

deliahouse887 发表于 2025-2-5 17:05

内置的硬件电路直接进行 CRC 计算,不依赖软件算法的实现

qiufengsd 发表于 2025-2-5 17:57

设计中应包含错误检测和处理机制,以应对计算错误或数据损坏的情况。

timfordlare 发表于 2025-2-5 18:23

不同的应用场景可能会指定不同的CRC标准和多项式

mickit 发表于 2025-2-5 19:14

测评可能仅对比了部分常见的 CRC 计算方式

lzmm 发表于 2025-2-5 19:44

分析CRC计算的算法复杂度,特别是在处理大量数据时的计算时间。

benjaminka 发表于 2025-2-5 20:41

在大数据量或高实时性要求的场景下,软件CRC可能会成为系统性能的瓶颈。

jonas222 发表于 2025-2-5 22:01

AT32L021开发板内置了硬件CRC计算单元,能够显著提高CRC计算的速度。通过使用硬件CRC计算单元,我们能够实现高效的CRC校验,提高系统的整体性能。

kkzz 发表于 2025-2-6 10:38

AT32L021的CRC计算单元采用硬件实现,相比软件CRC计算,硬件CRC能够利用MCU内部的专用电路进行并行处理,从而显著提高计算效率。

gygp 发表于 2025-2-6 15:54

软件部分需要实现CRC算法的编码,包括多项式的选择、初始值和校验值的设置等。

wilhelmina2 发表于 2025-2-6 16:37

软件实现的CRC算法代码是否结构清晰,是否易于理解和维护。

juliestephen 发表于 2025-2-6 17:20

对 CRC 计算的性能和功能可能会有更高的要求

chenjun89 发表于 2025-2-6 17:53

硬件CRC肯定比软件快

yeates333 发表于 2025-2-6 18:19

估设计是否支持多种常见的CRC类型

jimmhu 发表于 2025-2-6 19:57

CRC计算的速度是否满足应用需求,特别是在处理大量数据时。
页: [1] 2
查看完整版本: 【AT-START-L021测评】4--CRC计算对比