打印
[嵌入式linux]

Unicode的认识

[复制链接]
903|0
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
蒋博1026|  楼主 | 2019-6-30 20:59 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
Unicode(统一码、万国码、单一码),它是为解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制码,以满足跨语言跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。
由来:因为计算机只能处理数字,如果处理文本的话,必须将其转换为数字才可以。最早是8个比特(bit)作为一个字节(byte),即一个字节能表示的最大整数为255,所以0-255就被用来表示大小写英文字母、数字还有一些符号,于是乎就形成一个编码表——ASCII编码,比如说大写字母A的编码是65,小写字母z的编码是122.。
  如果表示中文的话,显然一个字节是不够的,至少需要两个字节,而且还不能和ASCII码冲突,所以中国制定了GB2312编码,用来把中文编进去。
    与此同时,日文、韩文也有相似的问题。为了同意所有文字的编码,Unicode应运而生。Unicode把所有语言都统一到一套编码里了,这样就不会出现乱码问题了。
UTF-8、UTF-16 、UTF-32:Unicode Transformation Format  可以翻译成Unicode字符集转换格式,也就是怎样将Unicode定义的数字转换成程序数据。

使用特权

评论回复

相关帖子

发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

323

主题

1820

帖子

18

粉丝