[资料分享] 盘点语音识别芯片原厂、方案、平台

[复制链接]
1505|3
 楼主 | 2018-7-6 10:44 | 显示全部楼层 |阅读模式
语音识别芯片所涉及的技术包括 :信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能
等等。
语音识别分类
按照使用者的限制而言,语音识别芯片可以分为特定人语音识别芯片和非特定人语音识别芯片。
特定人语音识别芯片是针对指定人的语音识别,其他人的话不识别,须先把使用者的语音参考样本存入当
成比对的资料库,即特定人语音识别在使用前必须要进行语音训练,一般按照机器提示训练2 遍语音词条
即可使用。


非特定人语音识别是不用针对指定的人的识别技术,不分年龄、性别,只要说相同语言就可以,应用模式
是在产品定型前按照确定的十几个语音交互词条,采集 200 人左右的声音样本,经过 PC 算法处理得到交
互词条的语音模型和特征数据库,然后烧录到芯片上。应用这种芯片的机器 (智能娃娃、电子宠物、儿童电
脑)就具有交互功能了。  


非特定人语音识别应用有的是基于音素的算法,这种模式下不需要采集很多人的声音样本就可以做交互识
别,但是缺点是识别率不高,识别性能不稳定。
语音识别基本原理
嵌入式语音识别系统都采用了模式匹配的原理。录入的语音信号首先经过预处理,包括语音信号的采样、
反混叠滤波、语音增强,接下来是特征提取,用以从语音信号波形中提取一组或几组能够描述语音信号特
征的参数。特征提取之后的数据一般分为两个步骤,第一步是系统 "学习 " 或"训练 "阶段,这一阶段的任务
是构建参考模式库,词表中每个词对应一个参考模式,它由这个词重复发音多遍,再经特征提取和某种训
练中得到。第二是 "识别 "或 "测试 " 阶段,按照一定的准则求取待测语音特征参数和语音信息与模式库中相
应模板之间的失真测度,最匹配的就是识别结果。




 楼主 | 2018-7-6 10:45 | 显示全部楼层
本帖最后由 通宵敲代码 于 2018-7-6 10:51 编辑

语音识别四大平台
1、科大讯飞
科大讯飞股份有限公司成立于 1999 年,是一家专业从事智能语音及语言技术、人工智能技术研究,软件
及芯片产品开发, 语音信息服务及电子政务系统集成的国家级骨干软件企业。 2008 年, 科大讯飞在深圳证
券交易所挂牌上市,股票代码: 002230 。
11 月 23 日科大讯飞轮值总裁胡郁在发布会上引述了罗永浩在 9 月锤子发布会上的演示数据,表示科大
讯飞的语音输入识别成功率也达到了 97% ,即使是离线识别准确率也达到了 95%  。


2、云知声
云知声成立于 2012 年 6 月。之前 1 年, Siri 的发布再度唤醒了大家对语音识别的关注。经过四年多的积
累,云知声的合作伙伴数量超过 2 万家,覆盖用户超过 1.8 亿,其中语音云平台覆盖城市超过 470 个,覆
盖设备超过 9000 万台。

3、百度
百度则在 11 月 22 日宣布向开发者开放了情感合成、远场方案、唤醒二期和长语音方案等四项语音识别技
术。百度语音开放平台自 2013 年 10 月上线以来每日在线语音识别请求已经达到了 1.4 亿次,开发者
数量超过 14 万。在如此庞大的数据支撑下,百度语音在“安静条件下”的识别准确率达到了 97% 。

4、搜狗
搜狗语音团队在 11 月 21 日推出了自己的语音实时翻译技术。搜狗的这项技术主要包括两个方面,分别
是语音识别和机器翻译。根据该团队的介绍,搜狗语音识别的准确率达到了97% ,支持最快400字每秒
的听写。



 楼主 | 2018-7-6 10:50 | 显示全部楼层
语音识别芯片原厂及芯片方案
1、 ICRoute
总部:上海
简介: ICRoute 专注于开拓语音识别的芯片市场 ,致力于研发出高性能的语音识别,语音处理芯片。为各种
平台的电子产品提供 VUI (Voice User Interface )语音人机交互界面。目前提供的语音识别芯片,可以在

包括蓝牙,小家电,照明开关,玩具,车载电子,遥控器等各个电子产品领域提供非特定人的语音识别 /
声控功能。
语音识别芯片:
ICRoute LD3320 ——能在单片机上使用的语音识别芯片
由 LD3320 组成的语音识别系统有很广泛的应用,如语音控制的点歌系统、语音控制的手机、音控智能导
航仪、音控智能家电产品等。


2、凌阳、凌通 (芯片原厂 )
总部:台湾
语音识别芯片:
凌阳单片机 61A ——带有语音识别芯片的微控制器,可以实现语音识别功能的芯片,一般小客户只能拿到
特定人识别的参考代码。

3、新唐科技
总部:台湾
语音识别芯片:
ISD9160 是一款具有 Cortex-M0 内核的语音 SOC,能够实现录音放音等应用。通过软件支持, ISD9160
可以实现特定人和非特定人语音识别。 其中非特定人语音识别支持九种语音, 方便客户开发国际化的产品。
客户在开发的时候, 使用新唐提供的 ASR Tool 工具, 只需将所需命令写成文本模式, 然后经由工具转换,
就能生成用于项目文件的语音识别代码模块,简单并且容易使用。这种语音识别方案适用于语音控制系统
领域,即用语音来控制设备的运行,相对于手动控制来说更加快捷、方便,可以用在诸如智能家电、智能
穿戴、声控智能玩具等许多领域。

4、全志
总部:珠海
全志 R16 助力科大讯飞智能语音
科大讯飞 4+1 环形五麦克风阵列搭载全志 R16 平台
搭载全志 R16 平台的科大讯飞 4+1 环形五麦克风阵列,专为机器人等可移动、能灵活转身、有全角度拾
音需求的智能硬件产品而设计,远场拾音距离可达 5 米。相比以往线性麦克风单维 180 度的覆盖维度,它
可将覆盖度扩大到二维空间,即 360 度全平面拾音角度,而且去噪效果更好,抗环境噪音的能力更强,就
算在嘈杂的环境中也能准确地识别声音。卓越的环形五麦克风远场识别技术与语音识别、语音合成、语音
唤醒、声纹识别、人脸识别等交互技术相结合,让智能硬件产品拥有了更出色的人机交互能力。

5、深圳市盛矽电子科技有限公司(二次开发)
总部:深圳
简介:盛矽电子是专业从事语音方案与技术服务的提供商,由深圳总公司和北京研发中心分公司组成。专
注于语音识别、智能玩具、儿童电脑、语音芯片等领域。
语音识别芯片:
1)特定人语音识别·录音·放音语音芯片 SR150X
2)非特定人 OTP 语音识别芯片 SR170X
独有的的软件虚拟机技术,只要硬件资源能够匹配,所有软件功能可以通过 Flash 端实现,有效降低客人
MASK 风险以及库存量,多款产品可以通过同一颗芯片实现, 真正实现零库存, MASK 的价格, OTP 的性
能。

6、深圳市捷通语音技术开发有限公司(二次开发)
总部:深圳
简介:深圳市捷通语音技术开发有限公司是一家专业从事语音识别、语音合成业务的科技及贸易一体化公
司。公司开创了语音识别芯片应用在玩具领域的市场。公司可根据客户的需求,提供产品的解决方案 ; 为
特定市场的产品 ,设计新功能新应用 ,为品牌企业实现产品创新。


7、上海华镇电子科技有限公司
总部:上海
简介:上海华镇是专门从事语音识别、语音合成、声纹识别技术的开发、研究、软件应用及提供全程技术
支持和服务的高新科技企业;全面掌握核心技术,其中中文语音识别和合成技术代表了当今世界同类产品
的领先水平。其技术能够应用于各种电子及通信设备,包括:智能玩具,智能家居系统,智能汽车导航及
声控,智能手机 Smartphone 、 PDA 、固定电话、移动电话,电信级的服务器及个人电脑等。
语音识别芯片 / 模块:
1)语音识别芯片 / 模块 GM11A550
2)高端语音识别芯片 / 模块 WS117-- 最多支持 1000 条词条识别 [ 此芯片已停产 ]
3)特定人语音识别( SD)芯片 WS-100

8、北京承芯卓越科技有限公司
总部:北京
简介: 公司成立于 2006 年 12 月, 是一家立足于中关村清华科技园区的北京市高新技术企业, 海淀区创新
企业,是以提供具有自主知识产权的智能语音处理类专用芯片和方案为主业的高科技公司。主要致力于自
主研发嵌入式语音识别芯片、应用软件技术、和智能语音应用方案。
语音识别芯片:
1)语音识别芯片 -28X
2)语音识别芯片 -29X
3)语音识别协处理芯片 -HBR34X

9、深圳唯创知音电子有限公司
总部:深圳
简介:专注于语音技术研究、语音产品方案设计及控制等软、硬件设计的高新技术公司。杰出的语音芯片
厂家,从事语音芯片研究及外围电路开发;同时为有特别需求的客户制订语音产品开发方案,并且落实执
行该方案,完成产品的研发、测试,声音处理,直至产品的实际应用指导等一系列服务。业务范围涉及电
话录音、汽车电子、多媒体、家居防盗、通信、家电、医疗器械、工业自动化控制、玩具及互动消费类产
品等领。
语音识别芯片 / 模块:
WTK6900B01 语音识别模块
 楼主 | 2018-7-6 10:51 | 显示全部楼层
语音识别的应用前景
智能语音车载
曾经看过一款汽车的概念宣传广告,驾驶员通过语音指令找到自己的车;打开车锁,通过语音指令寻找导
航,播放音乐等等,相当炫酷。当然对于智能车载来说更关键的是行车安全问题,对于驾驶员来说,能通
过语音控制接打电话,查看自己的社交软件,绝对比在开车的过程中手忙脚乱的用手控制来的更安全。

智能语音家居
现在的智能家居市场之所以外热内冷,智能家居产品之所以不受消费者待见,一个非常主要的原因是现在
的智能家居产品没有抓住消费者的痛点,将原本简单的事情复杂化了。在手机上找到控制 app 打开窗帘的
过程远比消费者直接走到窗前拉开窗帘来的麻烦。而有了语音识别的智能家居则不一样,消费者只要轻轻
说声“开窗帘”就能打开窗帘。

智能语音医疗应用
前一段时间,著名语音识别企业 Nuance 在其官方博客上,公布了将发力医疗领域的消息。其产品不但能
通过智能手表追踪人体运动情况和心率,还可以根据人的身体状况匹配相应的服务,如合适的餐厅或食物
等。另外他们还考虑到更多场景,诸如紧急语音求助,医患对话存档,呼叫中心的对话听写等。

智能穿戴语音控制

我们总有那么些时间是没法使用自己的双手的。打电话,发微信,查路线,叫车,这些如果都可以用一个
可穿戴设备通过语音控制实现,那该多好!

总结:除了以上列举的,语音识别还有更多更广的应用。随着我们的生活越来越智能化,相信语音识别的
应用场景肯定是非常广阔的。

扫描二维码,随时随地手机跟帖
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复

您需要登录后才可以回帖
登录 | 注册
高级模式
我要创建版块 申请成为版主

论坛热帖

关闭

热门推荐上一条 /5 下一条

快速回复 返回顶部 返回列表