打印

【转】SIRI?GOOGLE NOW?没有硬件支持,还是只能纸上谈兵

[复制链接]
3001|12
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
又是一年春劫过,不少筒子发的年终和讨来的红包都贡献给电子产业了吧。最近好几个同事在商量着是换i5还是等mini2……这就是一个触控的智能时代……一直也就追不上那潮流,想到连小侄都森森鄙视的我一幕就……哎…
那天,就我跟小侄在家,非得让我帮他拍臭美照,我拿着他老爸的手机翻着找相机键,小人不耐烦直接抢了去,对着手机流着哈喇子还口齿不清的喊:上机,上机……弱弱的问了句,您老喊的是相机么。。。
好吧,不管怎么着吧,还是被他喊出这个程序来了,好牛掰的赶脚~!不识字不可怕,张开嘴巴就能号令天下…xx人说: 语音识别会像触摸取代物理键盘那样完成新一轮的替换,让大量的外设彻底无用。解放劳动力化繁为简神马的,让幼齿儿童都能轻易玩转高科技,这是奋斗在一线的工程师的终极目标吧……尽管该项技术目前还不成熟,但是被语音识别替代的日子应该会有的吧不过,不过这个语音识别技术还要学习识别不标准发音……哈哈~~
其实,近些年来,语音输入系统在智能手机、蓝牙耳机神马的移动设备上已经被用的泛滥成灾了……但是呢,很多技术都是有待更新的,不论是软件还是硬件方面,都有很大继续完善的空间。作为一名小工程师,今天主要来谈谈硬件方面对于语音技术的发展的建设……
要说起来,硬件的开发重要性一点都不比软件弱,专业性也是很强很重要的,发展空间很大。拿麦克风打个比方,现在市面上的指向性麦克风只能通过物理结构(筒状结构)形成指向性,但是使用两个麦克风形成指向性的话,在现有技术下为了提高指向性,就得拉长麦克风间距,这样肯定是不能适应所小型便携式设备的搭载要求。还有什么数字信号处理的延迟时间及音质劣化类的……问题么,出现了都是要最终解决和克服滴~~
说到这里,我想起来,在去年8月份,我们公司有一款叫“BU8332KV-M”的数字信号处理IC已开始投入了量产。它是通过采用使用两个无指向性的麦克风的波束赋形技术,使特定方向的声源语音变得清晰。且采用DiMAGIC Corporation的指向性控制技术,成功地使环境噪音大幅度地衰减。凡是运用到麦克风的地方都可以应用这款芯片,不过大多是要求高音质效果的高端产品才舍得用哎~呵呵~至于说原理么,是这款芯片能形成一定范围的指向区域。那么指向区域之外的噪音会被过滤或被弱化得很小,扬声器输出的声音自然是很清晰了~~。用图表示的话差不多是下边这个样子,给大家参阅了。

具体分解这个数字信号处理IC的功能的话,首先是它独有的信号处理技术,与之前的麦克风比较,实现了敏锐的指向性,能进行声音的清晰度处理。声源方向(0°)对于背面方向(180°)的衰减量与以往的麦克风比较大幅度改善30dB以上。另外,更重要的是实现了10mm的安装间距,这个才是能应用到小型移动设备上的关键!
上一张BU8332KV-M与以往麦克风指向性特点的比较图!!!大家也许能更明了些。

提高在环境噪音条件下的语音识别率,也是重要的功课!由于小型移动设备的使用多数是在户外,努力使语音不劣化,有效降低环境噪音是很必要滴。做了一个使用BU8332KV-M时的语音识别精度的图标~~~

所谓的发展,就必须更具科技性和智能化,通俗点说,就是要提供更多的可行性选择,在不同的状况下选择自己适应的。我们罗姆这款数字信号处理IC可以将指向性模式转换为四种形态,而且能将指向性的方向反转180°,也可以调整指向性锐度。这些控制可以不改变麦克风的配置,而只是进行寄存器的设定。这四种传说中的形态分别是:无指向性(全方位的拾音);单一指向性(拾取正前方的语音,并且衰减后方的语音);锐心型指向性(比起单一的指向性来,还衰减侧方的语音);双指向性( 比锐心型指向性更加衰减侧方的语音)。拿智能手机来说,指向区域设定为人嘴的位置,其他方位的声音就被屏蔽掉了,通话对方自然是更加清晰。这就是传说中的智能手机的“双麦克降噪”。上一张对比图,让大家一眼就能看明白~~

这个产品不光是能用在智能手机上的,像是车载导航仪、电话会议系统、带有音频的摄像机、蓝牙耳机等都可以。以前开车出去玩,明明对导航仪说去A地,恰巧后座的家人正在谈论B地,结果导航就把一家老小导到了B地……很轻易就被干扰了~~但是安装了BU8332KV-M的导航仪能把这个指向区域设定成司机的座位,屏蔽掉其他方位的声音,只听司机筒子的号令……车载导航仪的厂家们,赶紧更新应用吧,拯救路痴行动从你们做起啊!!还有,像我们这种跨国企业(咳咳…)电话会议系统也是常用的,某些培训什么的都需要它完成的。桌子两边各坐一排人开会,左边那排的人讲话,把麦克风的指向区域设向左边,右边的人说话时设定成右边~~这样对方听的清晰度大大提高!!
这个,真要说的话,这项技术还有很多项特点,对这有兴趣的筒子私我吧,我尽量再找更详细的资料给你们。今天算是语音识别技术的一个大讲堂了吧,哈哈,大家不要太感谢我哦~~~
技术在不断进步滴,除了语音识别技术在不断发展,不知道未来能不能实现在体内植入一小块芯片,神经能控制手机什么的终端程序,连语音控制都免了。。哈哈,我抛砖引玉了,真正的智慧在群众脑海中,不知道大家对智未来的智能手机神马的还有着什么样的期待捏?


相关帖子

沙发
refee| | 2013-3-10 10:31 | 只看该作者
俺们这里方言太多了 语音识别很困难滴 ;P

使用特权

评论回复
板凳
wqr214| | 2013-3-10 19:35 | 只看该作者
手机上的语音控制系统貌似要在有网络的情况下才能启用吧,不知道有一天能取消这个限制不的

使用特权

评论回复
地板
qrqwr24| | 2013-3-10 19:42 | 只看该作者
有的时候也不得不承认,某国的产品是做的精。

使用特权

评论回复
5
阿斯特亲王| | 2013-3-10 19:55 | 只看该作者
技术贴,收!

使用特权

评论回复
6
啊司法权威| | 2013-3-10 20:04 | 只看该作者
路过不说话的,今年不加xin~~~

使用特权

评论回复
7
lqlkmqj| | 2013-3-10 20:04 | 只看该作者
俺们这里方言太多了 语音识别很困难滴

就是,我们这儿就有很多方言。而且不可能每人都说普通话

使用特权

评论回复
8
wqr214| | 2013-3-11 13:49 | 只看该作者
我对智能手机这块很有兴趣,不知道前景如何,哪位前辈指点下??

使用特权

评论回复
9
qrqwr24| | 2013-3-11 13:57 | 只看该作者
果然有JB会容易明白

使用特权

评论回复
10
阿斯顿网球|  楼主 | 2013-3-11 14:06 | 只看该作者
希望大家都能多一点分享~~

使用特权

评论回复
11
阿斯特亲王| | 2013-3-11 14:13 | 只看该作者
哎呦,不错哦~

使用特权

评论回复
12
啊司法权威| | 2013-3-11 14:24 | 只看该作者
路过,留个爪印

使用特权

评论回复
13
wqr214| | 2013-3-11 14:46 | 只看该作者
赞!

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

3

主题

18

帖子

0

粉丝