日志

计算机汉字显示原理

已有 881 次阅读2008-2-1 06:29 |个人分类:单片机|系统分类:单片机

国家标准汉字字符集GB2312-80共收集了共7445个汉字和图形符号，其中汉字6763个，分为二级，一级汉字3755个，二级汉字3008个。汉字图形符号根据其位置将其分为94个“区”，
每个区包含94个汉字字符，每个汉字字符又称为一个“位”。区的序号和位的序号都是从01到94，

UCDOS软件中的文件HZK16和文件ASC16分别为16×16的国标汉字点阵文件和8×16的ASCII码点阵文件，以二进制格式存储。在文件HZK16中，按汉字区位码从小到大依次存有国标区位码表中的所有汉字，每个汉字占用32个字节，每个区为94个汉字。在文件ASC16中按ASCII码从小到大依次存有
8×16的ASCII码点阵，每个ASCII码占用16个字节。

在PC机的文本文件中，汉字是以机内码的形式存储的，每个汉字占用两个字节：第一个字节为区码，为了与ASCII码区别，范围从十六进制的0A1H开始（小于80H的为ASCII码字符），
对应区位码中区码的第一区；第二个字节为位码，范围也是从0A1H开始，对应某区中的第一个位码。
这样，将汉字机内码减去0A0AH就得该汉字的区位码。

例如汉字“房”的机内码为十六进制的“B7BF”，其中“B7”表示区码，“BF”表示位码。所以“房”的区位码为0B7BFH-0A0A0H=171FH。将区码和位码分别转换为十进制得汉字“房”的区位码为“2331”，即“房”的点阵位于第23区的第31个字的位置，相当于在文件HZK16中的位置为第32×[(23-1) ×94+(31-1)]=67136B以后的32个字节为“房”的显示点阵。

ASCII码的显示与汉字的显示原理相同，在ASC16文件中不存在机内码的问题，其显示点阵直接按ASCII码从小到大依次排列，不过每个ASCII码在文本中只占1个字节并且小于80h,每个ASCII码为8X16点阵，即在ASCII16文件中，每个ASCII码的点阵也只占16个字节。

以下是读取hzk16的C部分语言代码(仅供参考)：

void dis_cc(unsigned int x,unsigned int y,unsigned int color,unsigned int codeh,
unsigned int codel,unsigned int circle,unsigned int kind,unsigned int mode)
{
char word[32];
int area,bit;
long count,offset;

unsigned long count,offset;
unsigned int i,j;

area = (codeh&0x00ff)-0xa0-1; //根据机内码取得区码
bit = (codel&0x00ff)-0xa0-1; //根据机内码取得位码

offset = area*94+bit; //取得偏移量
count = 32l*(long)offset;
lseek(HZK16,count,SEEK_SET);//在HZK16文件中找到点阵起始位置
j=_read(HZK16,&word[0],32);//读取32字节的点阵信息