[PIC®/AVR®/dsPIC®产品]

PIC内部的汉字处理

[复制链接]
2403|9
手机看帖
扫描二维码
随时随地手机跟帖
wooda|  楼主 | 2021-9-13 18:32 | 显示全部楼层 |阅读模式
嗯,最近研究pic芯片处理汉字问题,发现如下:
...
unsigned char hanzhiconst[]="模手式";
。。。
main()
{
...}
然后调试的时候观察或者读出 hanzhiconst的值,
你们试一下hanzhiconst数组的大小和内容是什么?说的同学请说明一下编译器版本哈。。。

备注:utf-8编码的 模手式 用ue看到是 0xE6,0xA8,0xbc,0x8f,0xa1,0xe5

使用特权

评论回复
wooda|  楼主 | 2021-9-13 18:36 | 显示全部楼层
微信截图_20210913183500.png
我看到的是这样的,长度9字节,挠头,啥情况

使用特权

评论回复
guijial511| | 2021-9-13 20:40 | 显示全部楼层
还跟编译器版本有关系

使用特权

评论回复
wooda|  楼主 | 2021-9-13 21:38 | 显示全部楼层
检查排查后发现,utf-8编码是变字长的。这里是3byte一个汉字。
未来还是需要用unicode格式,无论是代码复杂度还是代码开销,都会好一点

使用特权

评论回复
15192499002| | 2021-9-14 14:27 | 显示全部楼层
学习学习

使用特权

评论回复
ayb_ice| | 2021-9-14 15:15 | 显示全部楼层
这取决于用什么编码格式

使用特权

评论回复
评论
wooda 2021-9-15 17:42 回复TA
@ayb_ice :写源程序的时候不会关注是什么编码格式,毕竟文本文件很少注意格式问题。 
ayb_ice 2021-9-14 16:10 回复TA
@wooda :GB不香吗 
wooda 2021-9-14 16:05 回复TA
现在很多代码都是utf-8格式的,接下来还是要切换成unicode比较方便一些。 
daichaodai| | 2021-9-16 08:11 | 显示全部楼层
不同版本用的编译器版本有可能也不一样。

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

44

主题

456

帖子

1

粉丝