打印

语音芯片如何实现播放任意的声音

[复制链接]
2942|14
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
wang12zhe|  楼主 | 2014-5-5 18:11 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
沙发
tou007| | 2014-5-5 19:12 | 只看该作者
可以看下科大讯飞的语音片子,应该实现你的要求!

使用特权

评论回复
板凳
crystal1987| | 2014-11-26 10:44 | 只看该作者
你可以换一款带FLASH的语音芯片,你那个语音芯片应该是OTP的。

使用特权

评论回复
地板
crystal1987| | 2014-11-26 10:47 | 只看该作者
很多语音芯片都支持单片机驱动。
语音芯片选型
  语音芯片选型
  随着科技的发展和产品的集成化,语音芯片已经逐渐替代了多种语音设备应用在各场合。语音芯片主要特性是功耗低,抗干扰能力强,外围器件少,控制简单,语音保存时间久(某些语音芯片可以保存内容100年),掉电不丢失语音,部分芯片还可以重复擦写语音内容。如汽车倒车雷达,公交车报站器,银行排队机、语音玩具、防盗系统等设备都装备了语音芯片。由于芯片种类众多,功能各异,工程师在选用语音芯片会有些彷徨无策,因此给初涉语音行业的工程师提供一些语音芯片的选型参考。
  1、录音芯片及放音芯片的选择
  语音芯片从使用功能上,基本可以划分为录音语音芯片和放音语音芯片。设计一个使用语音芯片的产品,首先要考虑是否使用录制现场语音,如需要录制语音则选用带有录音功能的语音芯片,否则就选用只有放音功能的语音芯片。通常带有录音功能的语音芯片都具有回放语音的功能,但是在播放语音时,音质都没有专门的放音语音芯片好,所以在选择语音芯片时要权衡功能及音质方面等因素。
  安防系统、会议记录系统、录音玩具等产品都要求具备录音功能,这类型产品的开发都会用到录音语音芯片,市场上有录音功能的芯片主要有ISD1110、ISD1400、ISD1700、ISD1800、ISD2500、ISD3300、ISD4000、WTR010、WTV040、APR96000等。利用录音芯片开发的录音模块,拥有更为简洁的外围电路和更佳的效果。如WTR-S4、WTV-NAND录音模块,这些模块利用外部的FLASH ROM作为存储中心,因而能够录制更长时间的语音。
  仅用到放音功能的设备很多,像治疗仪、倒车雷达、报站器、报警器等。这类型的产品不需要录制现场的语音,将已经处理过的语音利用工具下载到语音芯片播放就可以。放音芯片根据存储方式可分为OTP ROM、FLASH ROM、EEPROM及MASK四种。
  2、OTP ROM、FLASH ROM和EEPROM的选择
  OTP(One Time Programable)是指一次性可编程语音芯片,语音只能烧写一次,适合应用在不需要修改语音、语音长度短的场合,从放音的长度上可以分为10秒、20秒、40秒、80秒、170秒、340秒。OTP语音芯片的特点是单芯片方案、价格便宜,适合中小型批量生产,即便是小数量生产也可以及时拿货。主要应用在中低端玩具、电子琴、电动车等产品上。
  FLASH ROM和EEPROM的共性是可重复擦写、存储空间大,可随意更换控制方式和语音内容,能存储更大的语音文件。EEPROM通常都会集成在芯片中,此类型语音芯片价格比较昂贵,如ISD1700、ISD2500等。一般可以外挂的FLASH ROM有1Mbit~32Mbit,因需要用“语音芯片+FLASH”才能工作,价格比OTP的稍高,但整体售价比EEPROM的低,适合制样或者中小型批量投产。使用FLASH ROM的语音芯片有WT588D、WTV020-S,WTV040(需烧写特殊程序)等。
  3、MASK掩膜投产
  MASK投产使得整个语音芯片方案在保持性能、功能不变的情况下成本降低将近一半,且多数语音芯片在MASK投产不需要更改外围电路。但MASK投产需要订单数量超过2~7万,否则厂家会收取高额的光罩费,MASK生产时间大概要用1个月左右。目前MASK掩膜投产的芯片有WTB及WT588D(≤4Mbit FLASH ROM),其语音时间在5秒~340秒,是大批量投产的最佳选择。
  4、可以存储更多语音的SD卡方案
  SD卡已经成为当前市场上一大主流存储载体,其价格便宜,存储空间大,可移植性强等优点得到大部分厂家青睐。语音芯片也同样向外置SD卡的方向发展,厂家根据主控芯片的特性设计出可以播放各种音频格式的SD卡播放器,如WAV、MP3、WMA、AD4等主流音频格式。WTM-SD模块、USBSD模块 在外挂SD卡的时候可以播放WAV、MP3音频格式,WTV020-SD模块可以播放AD4、WAV音频格式等。这类型模块的播放时间均能达到数十小时。
  5、从语音音质、语音长度方面选择
  语音存放的长度由音频采样率及芯片内部(或外挂)ROM空间所决定,音频采样率的大小直接影响音频输出的音质,同一型号芯片的音频采样率越高,音质越好,但是需要占用更多的ROM空间。芯片的成本也因存储空间的增大而有不同幅度的上涨。如果对音质要求较高、语音时间在5分钟内,可以考虑选用ISD语音芯片、WTV语音芯片、WTC语音芯片、WT588D语音芯片、ISD语音芯片;要求音质高、语音时间长可以选用WTV020-SD模块、WTM-SD模块、USBSD模块;对音质要求不高、语音时间在340秒以内可选用WTB语音芯片。从录音长度方面考虑,要求录音长度在340秒以内,可选用ISD1700、ISD2500语音芯片;要求录音长度在30分钟内,可选用WTR-S4录音模块;录音长度达到数小时,则要用WTV-NAND录音模块。
  6、是否选用MCU控制
  部分语音芯片是只支持串口通讯协议的,因此必须由MCU进行控制,而不能利用脉冲或者电平来控制,此部分芯片中包括ISD3300、ISD4000等,在选择此类芯片的时候要考虑到控制端是否具备MCU。大部分芯片都是可以用MCU或者按键来控制的,如WTV、WTB、WTC、WT588D、ISD1700、ISD2500等。
  7、语音芯片/模块综合素质对比一览表
  
序号        芯片/模块型号        特性        稳定性        控制方式        工作电压        音质        价格
1        ISD1110        10秒录放音,EEPROM,可重复擦写        稍差        并口/按键        4.5~5.5V        一般        便宜
2        ISD1420        20秒录放音,EEPROM,可重复擦写        稍差        并口/按键        4.5~6.5V        一般        稍贵
3        ISD1810        8~16秒单段录放音,EEPROM,可重复擦写        好        按键        2.7~4.5V        一般        便宜
4        ISD2532/64        32~64秒录放音,EEPROM,可重复擦写        掉语音        并口/按键        4.5~5.5V        一般        稍贵
5        ISD2560/120        60~120秒录放音,EEPROM,可重复擦写        掉语音        并口/按键        4.5~5.5V        一般        贵
6        ISD3300        2~4分钟录放音,EEPROM,可重复擦写        掉语音        SPI串口        2.7~3.3V        好        贵
7        ISD1700        20~480秒录放音,EEPROM,可重复擦写        好        SPI串口/按键        2.4~5.5V        好        稍贵
8        ISD4002        2~4分钟录放音,EEPROM,可重复擦写        掉语音        SPI串口        2.7~3.3V        好        贵
9        ISD4003        4~8分钟录放音,EEPROM,可重复擦写        掉语音        SPI串口        2.7~3.3V        好        稍贵
10        ISD4004        8~16分钟录放音,EEPROM,可重复擦写        掉语音        SPI串口        2.7~3.3V        好        较贵
11        WTV010/020        10~20秒放音,OTP,可编程        好        串口/并口/按键        2.5~3.6V        一般        便宜
12        WTV040/080        40~80秒放音,OTP,可编程        好        串口/并口/按键        2.5~3.6V        一般        便宜
13        WTV170/340        170~340秒放音,OTP,可编程        好        串口/并口/按键        2.5~3.6V        一般        稍贵
14        WTB015/031        15~31秒放音,OTP,可MASK,可编程        工业级        串口/并口/按键        2.2~5.5V        一般        便宜
15        WTB084/170        84~170秒放音,OTP,可MASK,可编程        工业级        串口/并口/按键        2.2~5.5V        一般        便宜
16        WT588D        33~1057秒放音,可重复擦写,可编程        工业级        串口/并口/按键        2.8~5.5V        好        便宜
17        WTW500-16P        33~1057秒放音,可重复擦写,可编程        工业级        串口/并口/按键        3.3V/5V        好        便宜
18        WT588D-U        33~1057秒放音,USB下载,可编程        工业级        串口/并口/按键        3.3V/5V        好        便宜
19        WTV-S        40~670秒放音,可重复擦写,可编程        好        串口/并口/按键        3.3V        一般        便宜
20        WTV-S1        40~670秒放音,USB下载,可编程        好        串口/并口/按键        3.3V        一般        便宜
21        WTR-S4        64~2730秒录放音,FLASH ROM,可重复擦写        好        串口/按键        2.7~3.6V        一般        便宜
22        WTV-NAND        1~16小时录放音,可跟电脑相互通信        好        串口/按键        3.3V/5V        一般        稍贵
23        WTV020-SD        最长90小时放音,可制定多种控制方式        好        串口/按键        2.5~3.6V        好        便宜
24        WTM-SD        可播放MP3音频,语音来源丰富        好        串口/按键        5V        好        贵
25        USBSD        可播放MP3音频,语音来源丰富        好        串口/按键        5V        好        稍贵
26        APR9301        16~32秒录音,EEPROM,可重复擦写        好        按键        5.5~6.5V        稍差        便宜
27        APR6008        8分钟录放音,EEPROM,可重复擦写        好        串口        2.7~3.3V        一般        贵
28        APR6016        4~8分钟录放音,EEPROM,可重复擦写        好        串口        2.9~3.3V        一般        贵
29        API8108A        10秒语音播放,OTP        稍差        并口/按键        3.0~6.0V        差        稍贵
30        API840N        40秒语音播放,OTP        稍差        并口/按键        3.0~6.0V        差        便宜
31        AP8910/21        10~21秒语音播放,OTP        好        并口/按键        2.6~5.0V        差        便宜
32        AP89021/042        21~42秒语音播放,OTP        好        并口/按键        2.2~3.6V        差        便宜
33        AP89085/170        85~170秒语音播放,OTP        好        并口/按键        2.2~3.6V        差        稍贵
34        AP89341        341秒语音播放,OTP        好        并口/按键        2.2~3.6V        差        贵
35        MSM6295        60秒语音播放,4通道        好        SPI串口/按键        4.5~5.5V        好        贵
36        MSM6585        4通道语音播放        好        SPI串口/按键        4.5~5.5V        好        贵
37        ML22P80X        2.1~8.7分钟语音播放,OTP        好        SPI串口        2.7~3.6V        好        贵
38        WTC020        10-20秒OTP        好       
单线串口        2.6-5V       
好       
便宜

使用特权

评论回复
5
crystal1987| | 2014-11-26 10:47 | 只看该作者
这里有好多语音芯片,你看看。应该有你需要的。

使用特权

评论回复
6
丙寅电子| | 2014-11-27 17:22 | 只看该作者
长见识了

使用特权

评论回复
7
老老实实| | 2015-2-8 09:43 | 只看该作者
这个可以看一下我们的方案,语音可以重复的烧录,并且还无需任何烧录器
附上资料供LZ参考

PTUF1FS_V1.7使用说明书.rar

2.13 MB

使用特权

评论回复
8
bluecup| | 2015-2-9 11:47 | 只看该作者
插卡音响方案。。。超高性价比

使用特权

评论回复
9
我是妖人| | 2019-9-3 14:35 | 只看该作者
crystal1987 发表于 2014-11-26 10:47
很多语音芯片都支持单片机驱动。
语音芯片选型
  语音芯片选型

不好意思,问个问题,我不太懂电子的东西,但最近有个简单的需求需要完成,就是要做一个类似按键发声的儿童玩具
按下一个开关控制发声模块和发声器(喇叭),发出预设号的一段语音,不要求是重复擦写的语音模块,固化的声音就行,因为我没有这方面的知识,
语音模块我看网上有那种可以直接usb放入MP3音频的那种,音质比较好,主要是可以直接电脑录入音频比较方便,虽然偏贵,不适合大量使用,。如果我用这种的话,再加上电源和开关和喇叭,是否就可以完成我的需求,还是缺少什么东西?

使用特权

评论回复
10
crystal1987| | 2019-9-20 08:48 | 只看该作者
我是妖人 发表于 2019-9-3 14:35
不好意思,问个问题,我不太懂电子的东西,但最近有个简单的需求需要完成,就是要做一个类似按键发声的儿 ...

你这种很简单的,如果是批量生产的话,你联系语音芯片(广州九芯)厂家,他们可以帮你录任何语音信息;如果切换语音内容,根据按键发送不同语音地址,语音芯片自动处理,播放不同的语音内容。

使用特权

评论回复
11
crystal1987| | 2019-9-20 08:51 | 只看该作者
我是妖人 发表于 2019-9-3 14:35
不好意思,问个问题,我不太懂电子的东西,但最近有个简单的需求需要完成,就是要做一个类似按键发声的儿 ...

如果你不想使用固定的语音,比如用户也可以改变语音的内容,可以增加一块录音芯片,用户可以修改播放的语音内容,录音芯片和语音芯片的成本也不是很高,大概2元左右,但是程序要你自己写,或者从网下下载。

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

101

主题

205

帖子

1

粉丝