语音识别

发表于 2010-2-12 00:36

同道中人，俺也一直在玩这个。

发表于 2010-2-12 09:26

俺知道飞船是老革命了，不过语音识别对俺的确不是好玩的，越学事越多。唉。。。。。。，事越多就越想做，这是怎么了？奇了怪了。脑袋好像出毛病了。

发表于 2010-2-12 14:55

做语音识别，不能用学的思维来干！
要用“我要创造出世界上最牛的识别算法的思想做指导”，这样才能超越别人！
否则你永远只能跟着别人的PP走！

发表于 2010-2-12 16:14

唉，你也不看看国内外际形势，哈哈，微软的都失败了。坦白讲微软的识别算法也是很先进的哦

发表于 2010-2-12 17:59

微软有啥技术？靠OS起家，而OS是高中生就能玩转起来的东西。
再说微软放出来的那些垃圾算法你真能看懂吗？
对于真正技术上的东西，别人能写出来放到网上，或者很正经的出一本书，就这么容易让你完全学了去，你倒想得美！

发表于 2010-2-13 12:00

哈哈，俺的国际形势讲的不好，把你惹火了（你的语音识别不好哦，嘻嘻）。不过挺敬佩你的，至少你不是copy一簇。

发表于 2010-2-25 15:06

很久没有上网，上网就先上来关注一下，谢谢各位的关注，希望一起探讨，资料已经下下来了，这两天就看看！然后大家好好讨论！

发表于 2010-2-27 00:21

飞船有理论有实践，顶！
看来还是要把傅里叶捡回来才行。呵呵....

发表于 2010-2-27 21:43

不知道，“飞船”和“不起眼"等朋友，有没有做过语音压缩编码？小弟早段时间开始一直在做语音的压缩编解码。对此各位有什么建议呢，正准备做G7.21的算法。可是不知道怎么下手，请各位前辈指示一下。

发表于 2010-2-28 16:33

呵呵，俺对语音压缩没有兴趣。只对语音识别情有独钟。飞船很牛，兴许有高招。

最近语音识别卡壳了，主要原因是因为要进行基音波形提取，要解ARMA方程，头疼！
好不容易鼓捣出一个近似解法，后来却发现算法有点发散，正在解决中。不过刚刚**一闪，
又有了解决方案。
基音波形提取主要是恢复被污染的LPC系数。企图获得纯正的声道反射系数。哈哈

发表于 2010-3-1 18:00

不起眼，貌似真的很牛B呢，小弟开始崇拜你了，请问你用的是什么平台做的语音识别？我用的是瑞泰的C5416-C的板子，不知道能不能做呢？因为我刚接触DSP不算很久，老师那边有个项目，所以就从简单做起，先做语音的压缩。我想做识别，你说应该怎么起步呢？

发表于 2010-3-2 15:37

呵呵，你都把我当成牛了，我是不是应该把你当成斗牛士呢？我是蜗牛，虽然有角，但是却不是武器，感觉器官而已。喜欢跟自己设置一个宏大的目标，拉着自己慢慢学点东西而已。
我个人认为：语音识别的一些公开算法做起来很容易，做好做实用不容易，我没那个本事。特定人好做些，非特定人，很很很很难。曾经有一个公司，投入1000万*币，最后颗粒无收，但是他的特定人识别声称能做到100%（播音员测试结果），但是非特定人识别一探糊涂，他们是用C50做的
如果你还没有趴下，下次再给你说说我是怎么起步的，哈哈哈哈

发表于 2010-3-2 20:26

我怎么会趴下呢？我也是兴趣使然。但有时候接触这东西，没有什么人帮忙的确很恼火。据我了解，我们学校以前很多师兄都有想过搞语音识别，但很多都是草草了事，都是拿个matlab仿真一下就算了，没有什么实质的行动，他们一点都比不上你们。现在我也很想把语音识别做起，或者慢慢先做着，可是“老板”那边要求我先把语音压缩先做了（课题和项目的需要）。你说现在我应该先看看什么书呢？有介绍吗？

发表于 2010-3-2 20:27

怎么都不见飞船出来冒泡了，是不是回火星了？

发表于 2010-3-3 16:13

飞船可能出差了吧。
语音压缩我没做过，只是知道一点。一般都是先做FFT，在频域里将小的项清零，
然后做一个结构，把数据长度、剩余项位置、清零项的位置等信息装进去，再打包保
存。好像就这些。LPC也可以做压缩，不过合成的声音有点变味。
语音识别我做过，整个算法不太复杂，如果是做课题的话，应该没什问题，可惜我
的表达能不太好，说不清楚。我这里有一份《语音识别基础》，里面讲了语音识别的种
类、信号预处理方法、特征提取以及一些主要识别算法原理及详细计算方法。如果你需
要留个eMeil，太大了，不好贴.
另外飞船用的可能是MFCC,据说这是最牛的算法，识别率很高。

发表于 2010-3-3 16:30

另外语音特征提取(LPC)的源代码（C++）我这里也有，如果需要吱一声。不过有点乱。呵呵

发表于 2010-3-4 13:45

我在做语音编码，我们可以交流交流

发表于 2010-3-4 14:21

这里有一个用C写的开源的语音识别项目，只要注册就可以下载。
http://htk.eng.cam.ac.uk/download.shtml

发表于 2010-3-4 14:45

RE：不起眼
俺的识别方法是非常另类的，俺很幸运在一开始的阶段没有被别人的算法干忧，完全是靠看matlab的波形图自行写的代码。自已的大脑怎么想就怎么写的，因此非常的简短高效。正确的识别率在不断的提升中。

发表于 2010-3-4 16:56

崇拜飞船

语音识别

浏览过的版块

涓涓之细流

伴坛终老

技术奇才奖章