关键词:语音芯片、ISD、PM50、WT588D
ISD在被台湾华邦收购前,就凭藉其自身强大的开发实力,成功完成了把模拟信息存储到半导体存储器器件中,并申请了专利。这不仅意味突破半导体存储器只能存储数字信息的传统理念,在同一频段的音质表现也较数字信息语音的还原度好,同样是6KHz采样率的音频信号,模拟存储的语音就更接近原音。在数字存储技术不成熟的年代,ISD的模拟信息存储方式无疑是顶尖技术的天工之作。ISD利用此独特的语音存储算法,拓展了大片市场。语音提示在各种产品中涌现,并获得肯定,人机对话时代拉开序幕。
历史的舞台并不会只属于一个人。随着语音市场这个大门被敲开,更符合中国国情的语音芯片也陆续推出市场,站在ISD的起点上,PM50语音模块破蛹而出。所跟ISD不同的是,PM50语音模块以数字作为存储载体,有效改善了之前数字信息在还原成声音时存在严重数码声的问题,用数字信息存储语音,最大的优势在于能有效的提高生产效率,基于数字传输,音频数据的录制速度快,并可校验数据,同时,数字信息不会受到声卡音量的影响,从而免去了对音源音量调整的一个步骤。在音源信息来源方面,数字音源也较为丰富。互联网上数字语音的数据流能达到192Kbsp以上,更有卓越的无损音频,这为数字语音提供了一个高保真音质平台。直接压缩采样率,就能直接拷贝到模块里使用。选取数字信息作为存储载体的一个好处是背景噪音底,从数字到数字的传送过程中,不会被插入任何的环境噪音。这点上,比ISD存储模拟信息的处理方式较为出色。
PM50语音模块配套研发的上位机操作软件,能实现编程、语音组合、功能设置等,直接为用户带来便利。ISD并没有直接给客户提供上位机操作编程软件,目前国内用户使用的,均为第三方开发的软件,功能大致相仿,界面却各具特色。PM50语音模块配套的编程器仅为开发商提供,所以相对于ISD的上位机操作界面,PM50语音模块的界面做到了统一规格。PM50语音模块跟ISD的大部分产品一样,都支持按键控制和微型处理器控制。此外,PM50能独立控制最多8个I/O输出,各个I/O的输出频率可随意调整,这是较为独特的地方,市场定位体现在玩具类型产品的比较多点。PM50语音模块采用外挂SPI-Flash存储器的模式,使得语音存储时间要比大部分ISD语音芯片长很多。由于SPI-Flash存储器的价格都不高,比起ISD的长时间语音芯片如ISD17240要实惠,在音质、功能跟ISD语音芯片不相伯仲的情况下,高性价比显得更适合中国的消费情况。因而,PM50语音模块能吞噬ISD语音芯片在中国的部分市场也顺理成章。中青世纪推出PM50语音模块,吹响了国内企业发展语音市场的号角。PM50语音模块为国内语音芯片的发展立了一个里程碑。
技术创新,群雄并起。市场造就技术精英,技术精英影响市场。国内语音行业需要一个更有利润的发展空间,昂贵的终端产品的大部分市场终究要被高性价比的产品所取代。CCTV曾经就国内消费水平做过统计,在多数行业,高端产品的市场份额仅为15%,低端产品的市场份额为25%,而中端高性价比产品的市场份额却高达60%。
新一代的WT588D语音模块流出市场,并将市场目标锁定在中端产品行列。WT588D语音模块仍然采用数字存储信息的模式,延续发展PM50定位的更适于大批量生产的路子,WT588D语音模块拥有专为批量生产而研制的一拷八编程器,能同时将语音内容拷贝到其他8个WT588D语音模块中,使语音芯片之间的拷贝进入了高速数据转换空间,这一创举,为用户带来了时间上的金钱利润。跟ISD、PM50语音模块昂贵的编程器相比,WT588D语音模块的编程器不仅在性能上没落下,价格也便宜不少,这是制作样品、测试功能所需要的一个价格平台。数字信息下载传送的速度快,这在WT588D语音模块中体现得淋漓尽致。 http://www.w1999c.com/eWebEditor/UploadFile/20081227115656170.jpg
图一 WT588D编程器拷贝示意图
Apple公司能在市场上获得成功,跟Apple总裁Jobs的市场策略无不关系,在雄厚的技术底下提供全方位的用户开发平台和优越的用户盈利空间。拓展用户,赢得用户,普及用户,是市场销售一个永恒的发展方向。众所周知,SPI-Flash内部的数字信息可重复擦写10万次以上,以及掉电后信息自动保存功能,储存的信息至少能保存一百年。开放商用SPI-Flash作为WT588D外部存储空间,因此用户不需要担心在使用过程中数据丢失的情况。由于WT588D语音模块采用外挂SPI-Flash的形式,所以跟PM50一样,为用户提供更为直接的利润。但跟PM50相比,WT588D语音模块的外部存储器可以随意更换,存储器的容量可以是从2M到32M。不像PM50那样,受PM50内部程序的制约。此外,WT588D语音模块的开发商还提供芯片方案,采取出售WT588D语音芯片和SPI-Flash的销售方式,WT588D语音芯片除了提供封装片,还提供邦定片,进一步降低销售成本。在外挂SPI-Flash的容量小于4M的情况下,WT588D供应商推荐一套更实惠的方案——MASK。“WT588D语音芯片+SPI-Flash”做MASK投产后,价格降低到原来的成本的一半左右。芯片方案的优势不仅在于价格更实惠,而且用户能直接布置个性PCB,让语音主控芯片完全融入自己的产品中。
WT588D语音模块的语音信息定位为数字方式存储,所以在音频来源上跟PM50语音模块大相径庭,在HI-FI级音源的辅助下,同样有着高水准的音质表现。内置独特的高速运算器进行人声处理,对人声的还原度非常好。以及内部降噪处理,音频背景音表现得非常纯净,无杂音。13Bit的DAC声音处理也使得WT588D语音模块的声音播放很自然,很动听。WT588D语音模块内部具有I/O口电源管理系统,整个芯片的驱动能力强,能外挂多个SPI-Flash存储器,外挂多个存储器的优势在于,有效的扩展了存储空间,并在原有的220段可控制地址的情况下,把可控地址扩展成无数个。跟SPI通讯部分,选用SIM(Serial Interface Manager)管理方式,在WT588D语音芯片跟SPI-Flash供电电压不一致的情况下,也能稳定工作。WT588D语音模块拥有更为稳定的工作性能,摒弃了以往国内语音芯片不够稳定的旧帽子。具备优越工作性能的WT588D语音模块进军工业设计领域也会不足为奇。
http://www.w1999c.com/eWebEditor/UploadFile/20081227115721489.jpg 图二 WT588D语音芯片外挂多个存储器示意图
开发商为WT588D语音模块独立设计的电脑上位机操作编程软件,界面更为人性化,操控简单明了,功能齐全,在软件制方面更胜一筹。WT588D语音模块跟ISD语音芯片和PM50语音模块一样,支持按键控制和微型处理器控制。用户在应用时不必考虑WT588D语音模块是否适应自己以往使用的控制方式。
WT588D语音芯片的异军突起,印证了国内语音芯片事业在进步的事实。语音芯片在超越和取代中获得发展,语音产品用户也逐渐享受高科技语音所带来的强大福利。
序号 | 描述 | ISD1700 | PM50 | WT588D | 1 | 工作电压 | DC2.4V~5.5V | DC3V~6V | DC2.8~DC5.5V | 2 | 上位机软件 | 有 | 有 | 有 | 3 | 软件操作性 | 复杂 | 一般 | 简单 | 4 | 工作电流(空载) | 20mA | 50mA | 5mA | 5 | 控制方式 | MCU、按键 | MCU、按键 | MCU、按键 | 6 | 可扩展性 | 一般 | 一般 | 好 | 7 | 烧写次数 | 无数 | 无数 | 无数 | 8 | 音频采样率 | 4K~12KHz | 4K~21KHz | 6K~22KHz | 9 | 音质 | 好 | 一般 | 好 | 10 | 音频存储方式 | 模拟 | 数字 | 数字 | 11 | 外挂存储器 | 无 | 有 | 有 | 12 | 存储器更换性 | 无 | 不可更换 | 可随意更换 | 13 | 语音长度 | ≤240秒 | 100秒(掩膜) | 2149秒 | 14 | 录音功能 | 有 | 无 | 无 | 14 | 外围电路 | 复杂 | 简单 | 简单 | 15 | 芯片方案 | 提供 | 无 | 提供 | 16 | 批量投产 | 不适合 | 适合 | 适合 | 17 | 掩膜生产 | 无 | 可以 | 可以 | 18 | 编程器价格 | 昂贵 | 适中 | 便宜 | 19 | 模块价格 | 不提供模块 | 适中 | 便宜 | 20 | 芯片价格 | 昂贵 | 不提供芯片 | 便宜 | 21 | 稳定性 | 好 | 一般 | 好 | 22 | 工作环境温度 | -40°~80°C | ——— | -40°~80°C |
* WT588D在外挂多个32M存储器时,语音长度为2149×N秒,N为存储器的数量。
|