本帖最后由 正点原子 于 2013-4-16 22:52 编辑
第五十二章 T9拼音输入法实验 上一章,我们在ALIENTEK战舰STM32开发板上实现了手写识别输入,但是该方法只能输入数字或者字母,不能输入汉字。本章,我们将给大家介绍如何在ALIENTEK战舰STM32开发板上实现一个简单的T9中文拼音输入法。本章分为如下几个部: 52.1 拼音输入法简介 52.2 硬件设计 52.3 软件设计 52.4 下载验证
52.1 拼音输入法简介 在计算机上汉字的输入法有很多种,比如拼音输入法、五笔输入法、笔画输入法、区位输入法等。其中,又以拼音输入法用的最多。拼音输入法又可以分为很多类,比如全拼输入、双拼输入等。 而在手机上,用的最多的应该算是T9拼音输入法了,T9输入法全名为智能输入法,字库容量九千多字,支持十多种语言。T9输入法是由美国特捷通讯(Tegic Communications)软件公司开发的,该输入法解决了小型掌上设备的文字输入问题,已经成为全球手机文字输入的标准之一。 一般,手机拼音输入键盘如图52.1.1所示:
图52.1.1 手机拼音输入键盘
在这个键盘上,我们对比下传统的输入法和T9输入法,输入“中国”两个字需要的按键次数。传统的方法,先按4次9,输入字母z,再按2次4,输入字母h,再按3次6,输入字母o,再按2次6,输入字母n,最后按1次4,输入字母g。这样,输入“中”字,要按键12次,接着同样的方法,输入“国”字,需要按6次,总共就是18次按键。 如果是T9,我们输入“中”字,只需要输入:9、4、6、6、4,即可实现输入“中”字,在选择中字之后,T9会联想出一系列同中字组合的次,如文、国、断、山等。这样输入“国”字,我们直接选择即可,所以输入“国”字按键0次,这样T9总共只需要5次按键。 这就是T9智能输入法的优越之处。正因为T9输入法高效便捷的输入方式得到了众多手机厂商的采用,以至于T9成为了使用频率最高知名度最大的手机输入法。 本章,我们实现的T9拼音输入法,没有真正的T9那么强大,我们这里仅实现输入部分,不支持词组联想。 本章,我们主要通过一个和数字串对应的拼音索引表来实现T9拼音输入,我们先将汉语拼音所有可能的组合全部列出来,如下所示: const u8 PY_mb_space []={""}; const u8 PY_mb_a []={"啊阿腌吖锕厑嗄錒呵腌"}; const u8 PY_mb_ai []={"爱埃挨哎唉哀皑癌蔼矮艾碍隘捱嗳嗌嫒瑷暧砹锿霭"}; const u8 PY_mb_an []={"安俺按暗岸案鞍氨谙胺埯揞犴庵桉铵鹌黯"}; ……此处省略N多组合 const u8 PY_mb_zu []={"足租祖诅阻组卒族俎菹镞"}; const u8 PY_mb_zuan []={"钻攥纂缵躜"}; const u8 PY_mb_zui []={"最罪嘴醉蕞觜"}; const u8 PY_mb_zun []={"尊遵樽鳟撙"}; const u8 PY_mb_zuo []={"左佐做作坐座昨撮唑柞阼琢嘬怍胙祚砟酢"}; 这里我们只列出了部分组合,我们将这些组合称之为码表,然后将这些码表和其对应的数字串对应起来,组成一个拼音索引表,如下所示: const py_index py_index3[]= { {"" ,"",(u8*)PY_mb_space}, {"2","a",(u8*)PY_mb_a}, {"3","e",(u8*)PY_mb_e}, {"6","o",(u8*)PY_mb_o}, {"24","ai",(u8*)PY_mb_ai}, {"26","an",(u8*)PY_mb_an}, ……此处省略N多组合 {"94664","zhong",(u8*)PY_mb_zhong}, {"94824","zhuai",(u8*)PY_mb_zhuai}, {"94826","zhuan",(u8*)PY_mb_zhuan}, {"248264","chuang",(u8*)PY_mb_chuang}, {"748264","shuang",(u8*)PY_mb_shuang}, {"948264","zhuang",(u8*)PY_mb_zhuang}, } 其中py_index是一个结构体,定义如下: typedef struct { u8 *py_input; //输入的字符串 u8 *py; //对应的拼音 u8 *pymb; //码表 }py_index; 其中py_input,即与拼音对应的数字串,比如“94824”。py,即与py_input数字串对应的拼音,如果py_input=“94824”,那么py就是“zhuai”。最后pymb,就是我们前面说到的码表。注意,一个数字串可以对应多个拼音,也可以对应多个码表。 在有了这个拼音索引表(py_index3)之后,我们只需要将输入的数字串和py_index3索引表里面所有成员的py_input对比,将所有完全匹配的情况记录下来,用户要输入的汉字就被确定了,然后由用户选择可能的拼音组成(假设有多个匹配的项目),再选择对应的汉字,即完成一次汉字输入。 当然还可能是找遍了索引表,也没有发现一个完全符合要求的成员,那么我们会统计匹配数最多的情况,作为最佳结果,反馈给用户。比如,用户输入“323”,找不到完全匹配的情况,那么我们就将能和“32”匹配的结果返回给用户。这样,用户还是可以得到输入结果,同时还可以知道输入有问题,提示用户需要检查输入是否正确。 以上,就是我们的T9拼音输入法原理,关于拼音输入法,我们就介绍到这里。 最后,我们看看一个完整的T9拼音输入步骤(过程): 1) 输入拼音数字串 本章,我们用到的T9拼音输入法的核心思想就是对比用户输入的拼音数字串,所以必须先由用户输入拼音数字串。 2) 在拼音索引表里面查找和输入字符串匹配的项,并记录 在得到用户输入的拼音数字串之后,在拼音索引表里面查找所有匹配的项目,如果有完全匹配的项目,就全部记录下来,如果没有完全匹配的项目,则记录匹配情况最好的一个项目。 3) 显示匹配清单里面所有可能的汉字,供用户选择. 将匹配项目的拼音和对应的汉字显示出来,供用户选择。如果有多个匹配项(一个数字串对应多个拼音的情况),则用户还可以选择拼音。 4) 用户选择匹配项,并选择对应的汉字. 用户对匹配的拼音和汉字进行选择,选中其真正想输入的拼音和汉字,实现一次拼音输入。 以上4个步骤,就可以实现一个简单的T9汉字拼音输入法。 52.2 硬件设计 本章实验功能简介:开机的时候先检测字库,然后显示提示信息和绘制拼音输入表,之后进入等待输入状态。此时用户可以通过屏幕上的拼音输入表输入拼音数字串(通过DEL可以实现退格),然后程序自动检测与之对应的拼音和汉字,并显示在屏幕上(同时输出到串口)。如果有多个匹配的拼音,则通过WK_UP和KEY1进行选择。按键KEY0用于清除一次输入,按键KEY2用于触摸屏校准。 本实验用到的资源如下: 1) 指示灯DS0 2) 四个按键(KEY0/KEY1/KEY2/WK_UP) 3) 串口 4) TFTLCD模块(含触摸屏) 5) SPI FLASH 这些用到的硬件,我们在之前都已经介绍过,这里就不再介绍了。 52.3 软件设计 打开上一章的工程,首先在HARDWARE文件夹所在的文件夹下新建一个T9INPUT的文件夹。在该文件夹下面新建pyinput.c、pyinput.h和pymb.h三个文件,然后在工程里面新建一个T9INPUT的组,将pyinput.c加入到该组下面。最后,将T9INPUT文件夹加入头文件包含路径。 打开pyinput.c,在该文件输入如下代码: #include "sys.h" #include "usart.h" #include "pymb.h" #include "pyinput.h" #include "string.h" //拼音输入法 pyinput t9= { get_pymb, 0, }; //比较两个字符串的匹配情况 //返回值:0xff,表示完全匹配. // 其他,匹配的字符数 u8 str_match(u8*str1,u8*str2) { u8 i=0; while(1) { if(*str1!=*str2)break; //部分匹配 if(*str1=='\0'){i=0XFF;break;}//完全匹配 i++; str1++; str2++; } return i;//两个字符串相等 }
//获取匹配的拼音码表 //*strin,输入的字符串,形如:"726" //**matchlist,输出的匹配表. //返回值:[7],0,表示完全匹配;1,表示部分匹配(仅在没有完全匹配的时候才会出现) // [6:0],完全匹配的时候,表示完全匹配的拼音个数 // 部分匹配的时候,表示有效匹配的位数 u8 get_matched_pymb(u8 *strin,py_index **matchlist) { py_index *bestmatch;//最佳匹配 u16 pyindex_len; u16 i; u8 temp,mcnt=0,bmcnt=0; bestmatch=(py_index*)&py_index3[0];//默认为a的匹配 pyindex_len=sizeof(py_index3)/sizeof(py_index3[0]);//得到py索引表的大小. for(i=0;i<pyindex_len;i++) { temp=str_match(strin,(u8*)py_index3.py_input); if(temp) { if(temp==0XFF)matchlist[mcnt++]=(py_index*)&py_index3; else if(temp>bmcnt)//找最佳匹配 { bmcnt=temp; bestmatch=(py_index*)&py_index3;//最好的匹配. } } } if(mcnt==0&&bmcnt)//没有完全匹配的结果,但是有部分匹配的结果 { matchlist[0]=bestmatch; mcnt=bmcnt|0X80; //返回部分匹配的有效位数 } return mcnt;//返回匹配的个数 } //得到拼音码表. //str:输入字符串 //返回值:匹配个数. u8 get_pymb(u8* str) { return get_matched_pymb(str,t9.pymb); } //串口测试用 void test_py(u8 *inputstr) { ……代码省略 } 这里总共就4个函数,其中get_matched_pymb,是核心,该函数实现将用户输入拼音数字串同拼音索引表里面的各个项对比,找出匹配结果,并将完全匹配的项目存放在matchlist里面,同时记录匹配数。对于那些没有完全匹配的输入串,则查找与其最佳匹配的项目,并将匹配的长度返回。函数test_py(代码省略)用于给usmart调用,实现串口测试,该函数可有可无,只是在串口测试的时候才用到,如果不使用的话,可以去掉,本章,我们将其加入usmart控制,大家可以通过该函数实现串口调试拼音输入法。 其他两个函数,也比较简单了,我们这里就不细说了,保存pyinput.c,打开pyinput.h,输入如下代码: #ifndef __PYINPUT_H #define __PYINPUT_H #include "sys.h" //拼音码表与拼音的对应表 typedef struct { u8 *py_input;//输入的字符串 u8 *py; //对应的拼音 u8 *pymb; //码表 }py_index; #define MAX_MATCH_PYMB 10 //最大匹配数 //拼音输入法 typedef struct { u8(*getpymb)(u8 *instr); //字符串到码表获取函数 py_index *pymb[MAX_MATCH_PYMB]; //码表存放位置 }pyinput; extern pyinput t9; u8 str_match(u8*str1,u8*str2); u8 get_matched_pymb(u8 *strin,py_index **matchlist); u8 get_pymb(u8* str); void test_py(u8 *inputstr); #endif 保存pyinput.h。pymb.h里面完全就是我们前面介绍的拼音码表,该文件很大,里面存储了所有我们可以输入的汉字,此部分代码就不贴出来了,请大家参考光盘本例程的源码。 最后,我们打开test.c,输入代码如下: const u8* kbd_tbl[9]={"←","2","3","4","5","6","7","8","9",};//数字表 const u8* kbs_tbl[9]={"DEL","abc","def","ghi","jkl","mno","pqrs","tuv","wxyz",};//字符表 //加载键盘界面 //x,y:界面起始坐标 void py_load_ui(u16 x,u16 y) { u16 i; POINT_COLOR=RED; LCD_DrawRectangle(x,y,x+180,y+120); LCD_DrawRectangle(x+60,y,x+120,y+120); LCD_DrawRectangle(x,y+40,x+180,y+80); POINT_COLOR=BLUE; for(i=0;i<9;i++) { Show_Str_Mid(x+(i%3)*60,y+4+40*(i/3),(u8*)kbd_tbl,16,60); Show_Str_Mid(x+(i%3)*60,y+20+40*(i/3),(u8*)kbs_tbl,16,60); } } //按键状态设置 //x,y:键盘坐标 //key:键值(0~8) //sta:状态,0,松开;1,按下; void py_key_staset(u16 x,u16 y,u8 keyx,u8 sta) { u16 i=keyx/3,j=keyx%3; if(keyx>8)return; if(sta)LCD_Fill(x+j*60+1,y+i*40+1,x+j*60+59,y+i*40+39,GREEN); else LCD_Fill(x+j*60+1,y+i*40+1,x+j*60+59,y+i*40+39,WHITE); Show_Str_Mid(x+j*60,y+4+40*i,(u8*)kbd_tbl[keyx],16,60); Show_Str_Mid(x+j*60,y+20+40*i,(u8*)kbs_tbl[keyx],16,60); } //得到触摸屏的输入 //x,y:键盘坐标 //返回值:按键键值(1~9有效;0,无效) u8 py_get_keynum(u16 x,u16 y) { u16 i,j; u8 key=0; static u8 key_x=0;//0,没有任何按键按下;1~9,1~9号按键按下 tp_dev.scan(0); if(tp_dev.sta&TP_PRES_DOWN) //触摸屏被按下 { for(i=0;i<3;i++) { for(j=0;j<3;j++) { if(tp_dev.x<(x+j*60+60)&&tp_dev.x>(x+j*60)&&tp_dev.y<(y+i*40+40) &&tp_dev.y>(y+i*40)) { key=i*3+j+1; break; } } if(key) { if(key_x==key)key=0; else { py_key_staset(x,y,key_x-1,0); key_x=key; py_key_staset(x,y,key_x-1,1); } break; } } }else if(key_x) {py_key_staset(x,y,key_x-1,0); key_x=0; } return key; }
|