语音识别芯片所涉及的技术包括 :信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能
等等。
语音识别分类
按照使用者的限制而言,语音识别芯片可以分为特定人语音识别芯片和非特定人语音识别芯片。
特定人语音识别芯片是针对指定人的语音识别,其他人的话不识别,须先把使用者的语音参考样本存入当
成比对的资料库,即特定人语音识别在使用前必须要进行语音训练,一般按照机器提示训练2 遍语音词条
即可使用。
非特定人语音识别是不用针对指定的人的识别技术,不分年龄、性别,只要说相同语言就可以,应用模式
是在产品定型前按照确定的十几个语音交互词条,采集 200 人左右的声音样本,经过 PC 算法处理得到交
互词条的语音模型和特征数据库,然后烧录到芯片上。应用这种芯片的机器 (智能娃娃、电子宠物、儿童电
脑)就具有交互功能了。
。
非特定人语音识别应用有的是基于音素的算法,这种模式下不需要采集很多人的声音样本就可以做交互识
别,但是缺点是识别率不高,识别性能不稳定。
语音识别基本原理
嵌入式语音识别系统都采用了模式匹配的原理。录入的语音信号首先经过预处理,包括语音信号的采样、
反混叠滤波、语音增强,接下来是特征提取,用以从语音信号波形中提取一组或几组能够描述语音信号特
征的参数。特征提取之后的数据一般分为两个步骤,第一步是系统 "学习 " 或"训练 "阶段,这一阶段的任务
是构建参考模式库,词表中每个词对应一个参考模式,它由这个词重复发音多遍,再经特征提取和某种训
练中得到。第二是 "识别 "或 "测试 " 阶段,按照一定的准则求取待测语音特征参数和语音信息与模式库中相
应模板之间的失真测度,最匹配的就是识别结果。
|