[单片机芯片] [测试工具]MCU性能测试,CoreMark极简入门教程!(CH32V版)

[复制链接]
 楼主| Litthins 发表于 2021-8-18 19:29 | 显示全部楼层 |阅读模式
本帖最后由 Litthins 于 2021-8-18 21:11 编辑
最近总结了CoreMark的移植方法,
正巧沁恒RISC-V MCU创新应用邀请赛送了CH32V103开发板,移植过程很简单,分享给大家。
IDE:MounRiver Studio;MCU:CH32V103R8T6

揭开神秘面纱:CoreMark是什么?为什么它可以作为MCU的性能指标?这个数是怎么计算出来的?
CoreMark是衡量嵌入式系统中微控制器性能的基准。通过包含列表处理(查找和排序)、矩阵处理(常见的矩阵操作)、状态机(确定输入流是否包含有效数字)和CRC(循环冗余校验)等算法的测试给出性能评价。 需要下载的软件包是免费开源的, 可以在官方网站找到:EEMBC’s CoreMark®,网页截图如下。部分朋友无法直接下载的,文末也提供下载好的软件包。
CoreMark官网.JPG

作业不难:怎么将CoreMark移植到自己的MCU上?运行CoreMark需要哪些外设支持?
运行CoreMark,需要定时器提供计时功能,还需要向外部打印消息的手段。举个例子,可以调用stdio.h中定义的printf()函数,将其重定向到串口。
  • Step1:复制必要文件到目标工程。现已准备好CH32V103的软件工程,其文件结构如下图右侧所示。从CoreMark官网获得软件包,软件包解压后文件结构如下图左侧所示。在右侧软件工程User文件夹下新建CoreMark文件夹,将左侧绿色框中core_list_join.c、core_main.c、core_matrix.c、core_state.c、core_util.c、coremark.h等文件放到CoreMark文件夹里。打开左侧simple文件夹,将core_portme.c、core_portme.h复制到User文件夹下。
CoreMark文件移动操作.JPG
(彩色高亮标记与图中颜色标记对应,共4个步骤)
  • Step2:由于core_main.c文件已定义了main()函数,该main()函数执行时调用core_portme.c中的portable_init()函数作为MCU初始化接口,因此需要将MCU工程中原main.c文件MCU初始化代码移动到到portable_init()函数里并删除原有main.c文件(注意相关结构体、函数原型与函数实现要一起移动)。参考STM32代码风格,我的初始化代码如下:
  1. void CHX_SystemClock_Config(void)
  2. {
  3.   NVIC_PriorityGroupConfig(NVIC_PriorityGroup_2);

  4.   RCC_APB2PeriphClockCmd(
  5.   RCC_APB2Periph_GPIOA | RCC_APB2Periph_TIM1 | RCC_APB2Periph_USART1, ENABLE);
  6. }

  7. static void CHX_GPIO_Init(void)
  8. {
  9.   GPIO_InitTypeDef GPIO_InitStructure;

  10.   //串口输出 PA9
  11.   GPIO_InitStructure.GPIO_Pin = GPIO_Pin_9;
  12.   GPIO_InitStructure.GPIO_Mode = GPIO_Mode_AF_PP;
  13.   GPIO_InitStructure.GPIO_Speed = GPIO_Speed_50MHz;
  14.   GPIO_Init(GPIOA, &GPIO_InitStructure);
  15. }

  16. static void CHX_TIM1_Init(void)
  17. {
  18.   TIM_TimeBaseInitTypeDef TIM1_TimeBaseInitStructure;
  19.   NVIC_InitTypeDef NVIC_InitStructure;

  20.   TIM1_TimeBaseInitStructure.TIM_Period = 10 - 1;
  21.   TIM1_TimeBaseInitStructure.TIM_Prescaler = 7200 - 1;
  22.   TIM1_TimeBaseInitStructure.TIM_ClockDivision = TIM_CKD_DIV1;
  23.   TIM1_TimeBaseInitStructure.TIM_CounterMode = TIM_CounterMode_Up;
  24.   TIM_TimeBaseInit(TIM1, &TIM1_TimeBaseInitStructure);

  25.   TIM_Cmd(TIM1, ENABLE);
  26.   TIM_ITConfig(TIM1, TIM_IT_Update, ENABLE);

  27.   NVIC_InitStructure.NVIC_IRQChannel = TIM1_UP_IRQn;
  28.   NVIC_InitStructure.NVIC_IRQChannelPreemptionPriority = 1;
  29.   NVIC_InitStructure.NVIC_IRQChannelSubPriority = 2;
  30.   NVIC_InitStructure.NVIC_IRQChannelCmd = ENABLE;
  31.   NVIC_Init(&NVIC_InitStructure);
  32. }

  33. static void CHX_USART_Init(void)
  34. {
  35.   USART_InitTypeDef USART_InitStructure;

  36.   USART_InitStructure.USART_BaudRate = 115200;
  37.   USART_InitStructure.USART_WordLength = USART_WordLength_8b;
  38.   USART_InitStructure.USART_StopBits = USART_StopBits_1;
  39.   USART_InitStructure.USART_Parity = USART_Parity_No;
  40.   USART_InitStructure.USART_HardwareFlowControl =
  41.   USART_HardwareFlowControl_None;
  42.   USART_InitStructure.USART_Mode = USART_Mode_Tx;

  43.   USART_Init(USART1, &USART_InitStructure);
  44.   USART_Cmd(USART1, ENABLE);
  45. }
  • Step3:CoreMark的分数最终表示为Iterations/Sec,也就是每秒迭代数,而Sec和系统Ticks相关。用过RTOS的朋友应该对这个概念很熟悉,考虑文字不太好解释,直接看core_portme.c里这个宏定义。
  1. #define EE_TICKS_PER_SEC    1000
  • 这里我定义每秒1000个Tick,每个Tick时长1ms,对应定时器每1ms触发一次中断。使用一个计数变量,定时器进入中断一次,该变量值+1;对该变量值/1000即可求得定时器运行时长,也就是上文的Sec。所以EE_TICKS_PER_SEC并非一定要设置为1000,和定时器中断频率对应即可。与定时相关的函数有以下三个,
  1. void start_time(void);              //初始化计时器;
  2. void stop_time(void);               //停止计时器;
  3. CORE_TICKS get_time(void);          //获取计时器的计数值。
  • 在start_time()里实现定时器启动功能,在stop_time()里实现定时器停止功能,在get_time()中获取中断计数值。数据类型“CORE_TICKS ”实际上就是“unsigned long”。为方便操作,推荐将计数变量设置为全局变量,这样可以通过extern关键字直接访问。此处以TIM1为例,代码如下:
  1. //计数变量
  2. unsigned long time_ms_ticks=0;

  3. //定时器启动
  4. void start_time(void)
  5. {
  6.   TIM_Cmd(TIM1, ENABLE);
  7.   TIM_ITConfig(TIM1, TIM_IT_Update, ENABLE);
  8. }

  9. //定时器停止
  10. void stop_time(void)
  11. {
  12.   TIM_ITConfig(TIM1, TIM_IT_Update, DISABLE);
  13.   TIM_Cmd(TIM1, DISABLE);
  14. }

  15. //获取中断计数值
  16. CORE_TICKS get_time(void)
  17. {
  18.   return time_ms_ticks;
  19. }

  20. //中断处理函数
  21. extern unsigned long time_ms_ticks;

  22. void TIM1_UP_IRQHandler(void)
  23. {
  24.   time_ms_ticks++;
  25.   if (TIM_GetITStatus(TIM1, TIM_IT_Update) != RESET)
  26.   {
  27.     TIM_ClearITPendingBit(TIM1, TIM_IT_Update);
  28.   }
  29. }
  • 注释部分不使用的代码。以下代码位于core_portme.c中,需要注释掉:
  1. //#define NSECS_PER_SEC              CLOCKS_PER_SEC
  2. //#define CORETIMETYPE               clock_t
  3. //#define GETMYTIME(_t)              (*_t = clock())
  4. //#define MYTIMEDIFF(fin, ini)       ((fin) - (ini))
  5. //#define TIMER_RES_DIVIDER          1
  6. //#define SAMPLE_TIME_IMPLEMENTATION 1

  7. //static CORETIMETYPE start_time_val, stop_time_val;
  • CoreMark要求的最短测试时间为10s,若测试时间低于10s则会报错,见下图:
CoreMark报错.JPG

  • 为获得有效的测试结果,需修改core_portme.c中关于ITERATIONS的设置,官方代码中ITERATIONS没有定义:
  1. volatile ee_s32 seed4_volatile = ITERATIONS;
  • 此处使用CH32V103,主频72MHz。经测试ITERATIONS修改为1200左右即可,
  1. volatile ee_s32 seed4_volatile = 1200;
  • Step4:打印测试结果时,编译器优化等级和调试等级也可以打印出来。这类信息可在core_portme.h中通过宏COMPILER_FLAGS修改。这里我使用-Ofast优化,调试等级-g3,修改如下:
  1. #ifndef COMPILER_FLAGS
  2. #define COMPILER_FLAGS "-Ofast -g3"
  3. #endif
  • 重定向printf到串口,可参考以下代码(从CH32V官方例程debug.c中获取),需要配置IDE添加float类型支持:
  1. /*******************************************************************************
  2. * Function Name  : _write
  3. * Description    : Support Printf Function
  4. * Input          : *buf: UART send Data.
  5. *                  size: Data length
  6. * Return         : size: Data length
  7. *******************************************************************************/
  8. int _write(int fd, char *buf, int size)
  9. {
  10.   int i;
  11.   for (i = 0; i < size; i++)
  12.   {
  13.     while (USART_GetFlagStatus(USART1, USART_FLAG_TC) == RESET)
  14.       ;
  15.     USART_SendData(USART1, *buf++);
  16.   }
  17.   return size;
  18. }
  • Step5:移植完成!编译程序下载运行,得到跑分结果:
CoreMark跑分结果.JPG
CH32V103R8,72MHz,117.7分!
STM32G071RB,64MHz,跑分为108.9分,两款MCU分数接近。

通常使用最高主频和-Ofast优化可以获取最大分数,欢迎大家把自己的跑分放到评论区。
coremark-main.zip (474.42 KB, 下载次数: 22)









biechedan 发表于 2021-9-2 22:16 | 显示全部楼层
CoreMark占用过大的ram?   

评论

你芯片多大的RAM,用了你多大RAM?  发表于 2021-9-4 19:54
chenci2013 发表于 2021-9-2 22:16 | 显示全部楼层
CoreMark需要修改bsp之类的吗   

评论

不一定要用BSP,有外设的API就可以。  发表于 2021-9-4 19:56
gygp 发表于 2021-9-2 22:17 | 显示全部楼层
MCU性能怎么样?     
skyred 发表于 2021-9-3 14:17 | 显示全部楼层
不太清楚这个是什么
uptown 发表于 2021-9-4 15:04 | 显示全部楼层
CoreMark同类的有哪些?   
cehuafan 发表于 2021-9-4 15:04 | 显示全部楼层
CoreMark得分排行怎么样   

评论

官网有个排名,感兴趣可以看看  发表于 2021-9-4 19:57
earlmax 发表于 2021-9-4 15:04 | 显示全部楼层
CH32V103看着还不错呢。   

评论

确实挺不错的,上手也很容易。  发表于 2021-9-4 19:58
alvpeg 发表于 2021-9-4 15:05 | 显示全部楼层
有具体的移植的教程吗   
primojones 发表于 2021-9-4 15:05 | 显示全部楼层
需要跑程序吗?        
10299823 发表于 2021-9-4 15:05 | 显示全部楼层
有硬件计算的怎么开启?   
lihuami 发表于 2021-9-4 15:05 | 显示全部楼层
移植过程很简单,学习一下。   
xiaoyaozt 发表于 2021-9-4 15:06 | 显示全部楼层
准备移植到stm32上试试。   

评论

不难的,可以试试  发表于 2021-9-4 20:19
jimmhu 发表于 2021-9-4 15:06 | 显示全部楼层
CoreMark的得分在哪里看呢   
redone 发表于 2021-9-11 11:24 | 显示全部楼层
不明觉厉
usysm 发表于 2021-10-5 13:18 | 显示全部楼层
coremark里的测试用例
typeof 发表于 2021-10-5 13:18 | 显示全部楼层
如何将coremark程序移植  
yujielun 发表于 2021-10-5 13:19 | 显示全部楼层
这个测试的到底是什么性能呢   
htmlme 发表于 2021-10-5 13:19 | 显示全部楼层
CoreMark与Dhrystone  
pklong 发表于 2021-10-5 13:19 | 显示全部楼层
coremark代码有吗   
您需要登录后才可以回帖 登录 | 注册

本版积分规则

10

主题

75

帖子

8

粉丝
快速回复 在线客服 返回列表 返回顶部