打印

语音识别

[复制链接]
楼主: hongji2010
手机看帖
扫描二维码
随时随地手机跟帖
21
宇宙飞船| | 2010-2-12 00:36 | 只看该作者 回帖奖励 |倒序浏览
同道中人,俺也一直在玩这个。

使用特权

评论回复
22
不起眼| | 2010-2-12 09:26 | 只看该作者
俺知道飞船是老革命了,不过语音识别对俺的确不是好玩的,越学事越多。唉。。。。。。,事越多就越想做,这是怎么了?奇了怪了。脑袋好像出毛病了。

使用特权

评论回复
23
宇宙飞船| | 2010-2-12 14:55 | 只看该作者
做语音识别,不能用学的思维来干!
要用“我要创造出世界上最牛的识别算法的思想做指导”,这样才能超越别人!
否则你永远只能跟着别人的PP走!

使用特权

评论回复
24
不起眼| | 2010-2-12 16:14 | 只看该作者
唉,你也不看看国内外际形势,哈哈,微软的都失败了。坦白讲微软的识别算法也是很先进的哦

使用特权

评论回复
25
宇宙飞船| | 2010-2-12 17:59 | 只看该作者
微软有啥技术?靠OS起家,而OS是高中生就能玩转起来的东西。
再说微软放出来的那些垃圾算法你真能看懂吗?
对于真正技术上的东西,别人能写出来放到网上,或者很正经的出一本书,就这么容易让你完全学了去,你倒想得美!

使用特权

评论回复
26
不起眼| | 2010-2-13 12:00 | 只看该作者
哈哈,俺的国际形势讲的不好,把你惹火了(你的语音识别不好哦,嘻嘻)。不过挺敬佩你的,至少你不是copy一簇。

使用特权

评论回复
27
hongji2010|  楼主 | 2010-2-25 15:06 | 只看该作者
很久没有上网,上网就先上来关注一下,谢谢各位的关注,希望一起探讨,资料已经下下来了,这两天就看看!然后大家好好讨论!

使用特权

评论回复
28
Dongfangyuxiao| | 2010-2-27 00:21 | 只看该作者
飞船有理论有实践,顶!
看来还是要把傅里叶捡回来才行。呵呵....

使用特权

评论回复
29
hongji2010|  楼主 | 2010-2-27 21:43 | 只看该作者
不知道,“飞船”和“不起眼"等朋友,有没有做过语音压缩编码?小弟早段时间开始一直在做语音的压缩编解码。对此各位有什么建议呢,正准备做G7.21的算法。可是不知道怎么下手,请各位前辈指示一下。

使用特权

评论回复
30
不起眼| | 2010-2-28 16:33 | 只看该作者
呵呵,俺对语音压缩没有兴趣。只对语音识别情有独钟。飞船很牛,兴许有高招。

      最近语音识别卡壳了,主要原因是因为要进行基音波形提取,要解ARMA方程,头疼!
好不容易鼓捣出一个近似解法,后来却发现算法有点发散,正在解决中。不过刚刚**一闪,
又有了解决方案。
      基音波形提取主要是恢复被污染的LPC系数。企图获得纯正的声道反射系数。哈哈

使用特权

评论回复
31
hongji2010|  楼主 | 2010-3-1 18:00 | 只看该作者
不起眼,貌似真的很牛B呢,小弟开始崇拜你了,请问你用的是什么平台做的语音识别?我用的是瑞泰的C5416-C的板子,不知道能不能做呢?因为我刚接触DSP不算很久,老师那边有个项目,所以就从简单做起,先做语音的压缩。我想做识别,你说应该怎么起步呢?

使用特权

评论回复
32
不起眼| | 2010-3-2 15:37 | 只看该作者
呵呵,你都把我当成牛了,我是不是应该把你当成斗牛士呢?我是蜗牛,虽然有角,但是却不是武器,感觉器官而已。喜欢跟自己设置一个宏大的目标,拉着自己慢慢学点东西而已。
    我个人认为:语音识别的一些公开算法做起来很容易,做好做实用不容易,我没那个本事。特定人好做些,非特定人,很很很很难。曾经有一个公司,投入1000万*币,最后颗粒无收,但是他的特定人识别声称能做到100%(播音员测试结果),但是非特定人识别一探糊涂,他们是用C50做的
    如果你还没有趴下,下次再给你说说我是怎么起步的,哈哈哈哈

使用特权

评论回复
33
hongji2010|  楼主 | 2010-3-2 20:26 | 只看该作者
我怎么会趴下呢?我也是兴趣使然。但有时候接触这东西,没有什么人帮忙的确很恼火。据我了解,我们学校以前很多师兄都有想过搞语音识别,但很多都是草草了事,都是拿个matlab仿真一下就算了,没有什么实质的行动,他们一点都比不上你们。现在我也很想把语音识别做起,或者慢慢先做着,可是“老板”那边要求我先把语音压缩先做了(课题和项目的需要)。你说现在我应该先看看什么书呢?有介绍吗?

使用特权

评论回复
34
hongji2010|  楼主 | 2010-3-2 20:27 | 只看该作者
怎么都不见飞船出来冒泡了,是不是回火星了?

使用特权

评论回复
35
不起眼| | 2010-3-3 16:13 | 只看该作者
飞船可能出差了吧。
    语音压缩我没做过,只是知道一点。一般都是先做FFT,在频域里将小的项清零,
然后做一个结构,把数据长度、剩余项位置、清零项的位置等信息装进去,再打包保
存。好像就这些。LPC也可以做压缩,不过合成的声音有点变味。
    语音识别我做过,整个算法不太复杂,如果是做课题的话,应该没什问题,可惜我
的表达能不太好,说不清楚。我这里有一份《语音识别基础》,里面讲了语音识别的种
类、信号预处理方法、特征提取以及一些主要识别算法原理及详细计算方法。如果你需
要留个eMeil,太大了,不好贴.
     另外飞船用的可能是MFCC,据说这是最牛的算法,识别率很高。

使用特权

评论回复
36
不起眼| | 2010-3-3 16:30 | 只看该作者
另外语音特征提取(LPC)的源代码(C++)我这里也有,如果需要吱一声。不过有点乱。呵呵

使用特权

评论回复
37
闲雨| | 2010-3-4 13:45 | 只看该作者
我在做语音编码,我们可以交流交流

使用特权

评论回复
38
宇宙飞船| | 2010-3-4 14:21 | 只看该作者
这里有一个用C写的开源的语音识别项目,只要注册就可以下载。
http://htk.eng.cam.ac.uk/download.shtml

使用特权

评论回复
39
宇宙飞船| | 2010-3-4 14:45 | 只看该作者
RE:不起眼
俺的识别方法是非常另类的,俺很幸运在一开始的阶段没有被别人的算法干忧,完全是靠看matlab的波形图自行写的代码。自已的大脑怎么想就怎么写的,因此非常的简短高效。正确的识别率在不断的提升中。

使用特权

评论回复
40
lindianzi| | 2010-3-4 16:56 | 只看该作者
崇拜飞船

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则