目前市面上的可发声芯片分为两大类:语音合成芯片与语音芯片。在实际开发语音终端产品工作中,有很多的研发人员在这两类芯片的认知上难免会出现概念上混淆,常常将语音合成芯片误认为语音芯片,加之一些制作销售语音芯片的公司,为了更好的销售,以突出语音芯片的价格优势,也对外宣称其语音IC是语音合成芯片,有意识地误导开发人员,其实这两者芯片是有本质上的区别的。 语音合成芯片,又称文语转换(Text to Speech)技术(简称TTS芯片),能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。通过UART接口或SPI接口通讯方式,接收待合成的文本数据,实现文本到语音(或TTS语音)的转换。其特性是:支持任意中文文本的合成,对常见的数值、电话号码、时间日期、度量衡符号等格式的文本具有文本智能分析处理功能;只需要上位机通过串行通信对其发送一段文本信息,再将文本信息转化为语音信号从而实现实时播报。 语音芯片,顾名思义就是可以存储控制播放语音的IC;是指将语音信号通过采样转化为数字,存储在IC的ROM中,再通过电路将ROM中的数字还原成语音信号。从使用方法来看,语音芯片的主要使用方式是先对其进行录音,录音完成烧录后再来对其使用。 总的来说,语音IC是把声音录制进去才能播放,中文TTS芯片是可以直接把文本的内容播放出来。所以,语音合成芯片是一种高端的语音芯片,是一种采取了语音合成技术的、截然不同的智能语音芯片,它内置了中文TTS软件或语音合成软件核心。从未来的市场发展和用户体验要求上来看,语音合成芯片的便捷性始终优于市场上的各类语音芯片,更确切的说,未来的语音合成芯片合成效果自然度将更高,性价比将更高,控制更方便以及面向多语种化。 语音合成芯片与语音芯片本质区别在于语音更新: 语音合成芯片,无需烧录语音。只需要发送汉字的字库就可以播报出来,特别是处理大量的非固定的文本信息的时候且需要实时语音提示时,就必须要用到语音合成了。市面上目前比较成熟的SYN6658语音合成芯片,受到很多研发人员的认可。 语音芯片,需预录制语音(涉及终端产品更新必须找同一录音人)、需重新烧录、需校验,语音段长度受限,尤其是当这些研制出的语音终端,销往不同的用户,就需要使用不同的语音录制文件,这将会消耗研发人员大量的宝贵成本。 目前市面上的语音合成芯片对比如下图,可迅速了解芯片的相关性能:
|