本帖最后由 tts168 于 2020-6-2 14:25 编辑
目前市面上的可发声IC分为两大类:语音合成IC(TTS 芯片)与语音IC。在实际开发语音终端产品工作中,有很多的研发人员在这两类语音芯片的认知上难免会出现概念上混淆,常常将文字转语音芯片误认为语音芯片,加之一些制作销售语音芯片的公司,为了更好的销售,以突出语音芯片的价格优势,也对外宣称其语音IC是语音合成芯片,有意识地误导开发人员,其实这两种芯片是有本质区别的。 语音合成IC,又称文语转换(Text to Speech)IC(简称TTS,市面常见SYN6658语音合成模块),能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。语音合成芯片通过UART接口或SPI接口通讯方式,接收待合成的文本数据,实现文本到语音(或TTS语音)的转换。其特性是:支持任意中文文本的合成,对常见的数值、电话号码、时间日期、度量衡符号等格式的文本具有文本智能分析处理功能;只需要上位机通过串行通信对其发送一段文本信息,再将文本信息转化为语音信号即可实现实时文字转语音的播报。 语音IC,顾名思义就是可以存储控制播放语音的IC;是指将语音信号通过采样转化为数字,存储在IC的ROM中,再通过电路将ROM中的数字还原成语音信号。从使用方法来看,语音芯片的主要使用方式是先对其进行录音,录音完成烧录后再来对其使用。 总的来说,语音IC是把声音录制进去才能播放,语音合成IC是可以直接把文本的内容播放出来。所以,语音合成芯片是一种高端智能的语音芯片,是一种采取了语音合成技术的、截然不同的智能语音芯片,它内置了中文TTS软件或语音合成软件核心。从未来的市场发展和用户体验要求上来看,语音合成模块的便捷性始终优于市场上的各类语音模块,更确切的说,未来的语音合成芯片合成效果自然度将更高,性价比将更高,控制更方便以及面向多语种化。 语音合成IC与语音IC本质区别在于语音更新: 语音合成IC,无需烧录语音。只需要发送汉字的字库就可以播报出来,特别是处理大量的非固定的文本信息的时候且需要实时语音提示时,就必须要用到语音合成了。市面上目前比较成熟的SYN6658语音合成芯片,受到很多研发人员的认可。 语音IC,需预录制语音(涉及终端产品更新必须找同一录音人)、需重新烧录、需校验,语音段长度受限,尤其是当这些研制出的语音终端,销往不同的用户,就需要使用不同的语音录制文件,这将会消耗研发人员大量的宝贵成本。 目前市面上的语音合成IC对比如下图,可迅速了解芯片的相关性能:
|