打印
[STM32F4]

实测STM32F4中printf的效率问题

[复制链接]
7572|7
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
sprone|  楼主 | 2014-11-22 11:56 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 sprone 于 2014-11-22 11:57 编辑

实测STM32F4中printf的效率问题
一直认为printf所做的工作就是格式化字符串,然后依次调用fputc函数发送出去。于是以前都认为printf函数的瓶颈是在fputc这里,是因为发送一个字节所占的时间太长,才导致printf效率慢。也就是说,一直认为如果串口的波特率设置成115200的话,printf至少也是能达到115200的波特率的。

而这几天在学习ucOS,于是想到,如果printf的瓶颈是在等在串口发送完成的话,那么我在等待串口发送完成中断的时候是不是挂起一个信号量,然后就可以去做点别的事情了呢?这也正是RTOS的目的之一嘛————最大化利用CPU。

花了点时间时间试了下之后,发现完全没有改善!于是有了测试两次进入fputc间隔时间的想法。

测试环境:MDK5.12 + 自带STM32F4 HAL层 + UCOS3.04.04
硬件平台:安富莱V5板卡,主芯片STM32F407IG,USB转串口线CH430芯片,ThinkPad T420

代码如下:

int fputc(int ch, FILE *f)
{
    OS_ERR err;
    CPU_TS ts;
    Dbg_printf_time[Dbg_printf_cnt++] = STK_VAL_REG;  //进入函数前读取systick的寄存器值
    Dbg_printf_inter[Dbg_printf_cnt] = Dbg_printf_time[Dbg_printf_cnt-2] - Dbg_printf_time[Dbg_printf_cnt-1];//用刚读取的寄存器值减去上一次退出该函数的寄存器值,从而得到两次进入该函数之间的时间
    while (HAL_UART_Transmit_IT(&huart, (uint8_t *)&ch, 1) != HAL_OK)
    {
       OSTaskSemPend(10, OS_OPT_PEND_BLOCKING, &ts, &err);
       //check “err”
    }
    Dbg_printf_time[Dbg_printf_cnt++] = STK_VAL_REG; //退出函数前读取systick的寄存器值
    Dbg_printf_inter[Dbg_printf_cnt] = Dbg_printf_time[Dbg_printf_cnt-2] - Dbg_printf_time[Dbg_printf_cnt-1];//用刚读取的寄存器值减去进入该函数的寄存器值,从而得到两次进入该函数之间的时间
    if (Dbg_printf_cnt > 90)
    {
       Dbg_printf_cnt = 1;
    }
     return ch;
}

重点关注Dbg_printf_inter的值,结果如下:

可以看到进入两次fputc之间的间隔达到了15937个tick,考虑到主频为168M


time=tick/sysfreq
可以计算得出time=94.86us。

而115200波特率的串口在发送两个Byte之间的时间是:86.5us

也就是说:用115200波特率的速度打印printf就已经把STM32的CPU都耗光了!

实在是好奇printf里面都做了什么??作为库函数,它不应该是精简,效率的典范吗?怎么会这么慢?

抛出这个问题,求高手解答,同时也欢迎像我这么无聊的同学在别的平台上验证两次fputc之间的时间差
沙发
myxiaonia| | 2014-11-22 12:12 | 只看该作者
iar有字符串输出重定向文件,mdk貌似只能重定向fputc,导致性能大受影响。。。每次处理一串和一个字符差别很大

使用特权

评论回复
板凳
sprone|  楼主 | 2014-11-22 15:29 | 只看该作者
myxiaonia 发表于 2014-11-22 12:12
iar有字符串输出重定向文件,mdk貌似只能重定向fputc,导致性能大受影响。。。每次处理一串和一个字符差别 ...

难道说printf每处理完一个Byte就调用一次fputc把它抛出来,而不是全部处理完之后再循环调用fputc全部抛出?

使用特权

评论回复
地板
airwill| | 2014-11-23 07:57 | 只看该作者
你的理解正确。
fputc()  作为 fprintf 和 fputs() 之类的底层函数, 每处理完一个字符,就调用一次, 因为这样可以避免内部使用不可预知长度的缓冲区.
看来 F4 还是要避免使用 pringf 这类的大型库函数.

使用特权

评论回复
评分
参与人数 1威望 +2 收起 理由
sprone + 2 赞一个!
5
sprone|  楼主 | 2014-11-24 08:11 | 只看该作者
airwill 发表于 2014-11-23 07:57
你的理解正确。
fputc()  作为 fprintf 和 fputs() 之类的底层函数, 每处理完一个字符,就调用一次, 因为这 ...

这两天又想了一下,在我设想的处理模型中与版主的基本符合。
只能说printf太慢了(至少在MDK中),以后有机会去别的平台的话,我也无聊的测一测试试。
另外,我暂目前的解决方案很简单,如果只是调试用的话,用sprintf打入字符串,然后再连续发送就好了。

使用特权

评论回复
6
拨云人| | 2015-4-28 09:36 | 只看该作者
刚拿到STM32的板子,在官网下载了 STM32Cube_FW. 想用 printf()函数来调试.
在官方例程的基础上,按照楼主的写法,我也重定向了C库函数 int fputs(),却发现无法打印.
(例程中原有的打印字符串可正常打印),

请问这是什么原因呢?
int fputc(int ch, FILE *f)
{   
    while (HAL_UART_Transmit_IT(&UartHandle, (uint8_t *)&ch, 1) != HAL_OK)
    {     
       //do nothing
    }

     return ch;
}

使用特权

评论回复
7
wowow| | 2015-4-29 12:35 | 只看该作者
现在调试阶段多用SEGGER_RTT。
如果非要用串口,我一般sprintf + Uart DMA 发送。如果发送的数据格式相对较少而且比较固定,用自己写个数据转字符串的函数换掉spirntf。
可以测试一下试只要用了sprintf,code大小会增加多少。

使用特权

评论回复
8
LISE751| | 2015-4-29 18:43 | 只看该作者
一般在没有操作系统的前后台程序中都不建议使用Printf这种库函数,效率和代码空间的限制都制约了这种库函数的使用范围。所以,关键看你的应用,觉得效率优先,那就用自己写的函数(USART+DMA),如果觉得移植性优先,那么就用库吧。

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

1

主题

14

帖子

1

粉丝