打印
[MCU新闻]

你所不知道的机器学习语音识别细节

[复制链接]
1063|15
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
机器学习语音识别技术细节
本方案使用的语音识别方法为关键词识别(KWS),当在某些场景下需要对一些特定的短词进行针对性识别时,用户可以通过自定义关键词的方式来达到检测语音中是否包含该关键词,而自定义的关键词可涵盖不同语系、不同短词等,关键词的多寡也可由开发者决定,另外,由于本方案是建立在机器学习技术的辨识系统,因此不论添加多少短词、数据库,系统所需要的SRAM都是固定的(约70 kbytes)。
新唐提供了什么?
新唐提供一套完整的语音识别开发软件包,相关资源下载网址:
https://www.nuvoton.com/hq/applications/consumer/machine-learning/?__locale=zh
内容包含:
如何在PC上使用python撰写神经网络训练程序代码
如何将训练好的模型(训练参数)量化后取出来

如何在微控制器上使用CMSIS-NN library撰写神经网络架构来读取量化好的参数进行语音识别

使用特权

评论回复
沙发
643757107|  楼主 | 2019-5-15 20:11 | 只看该作者
一套完整的机器学习语音识别系统需要使用两个开发平台,如上图,一为PC端平台,利用TensorFlow与Python撰写完整的深度学习程序代码并训练模型,因本方案使用的学习模式为监督式的学习,因此需给系统大量的训练数据和卷标(Labels),接着将撷取到的特征用Deep Neural Networks (DNN)模型来训练,并反复修正训练的模型,直到模型达到系统优化的状态;二为NuMaker-PFM-M487平台,利用PC建出来的深度学习模型与训练结果(训练参数),应用到NuMaker-PFM-M487平台来完成可以实时的语音识别系统。

使用特权

评论回复
评论
lihui567 2019-5-23 18:27 回复TA
需要两个平台? 
板凳
antusheng| | 2019-5-15 21:54 | 只看该作者
太高端了,给力。

使用特权

评论回复
地板
zhuomuniao110| | 2019-5-15 23:47 | 只看该作者
因此不论添加多少短词、数据库,系统所需要的SRAM都是固定的(约70 kbytes)。

使用特权

评论回复
5
zhuomuniao110| | 2019-5-15 23:50 | 只看该作者
因此不论添加多少短词、数据库,系统所需要的SRAM都是固定的(约70 kbytes)。

使用特权

评论回复
6
小明的同学| | 2019-5-17 00:35 | 只看该作者
神经网络跑在这个单片机里?

使用特权

评论回复
7
heisexingqisi| | 2019-5-17 01:17 | 只看该作者
机器学习是不是门槛很高。

使用特权

评论回复
8
zhuotuzi| | 2019-5-18 00:24 | 只看该作者
新唐的语音识别技术很六

使用特权

评论回复
9
dongliushui| | 2019-5-18 23:13 | 只看该作者
提供软件?下载看看

使用特权

评论回复
10
dongliushui| | 2019-5-18 23:14 | 只看该作者
https://www.nuvoton.com/opencms/resource-download.jsp?tp_GUID=EC0120180911100446

使用特权

评论回复
11
dongliushui| | 2019-5-18 23:14 | 只看该作者
上面是软件资源的下载地址,大家可以下载学习高科技了。

使用特权

评论回复
12
yiy| | 2019-5-18 23:56 | 只看该作者
下了一下,太慢了,等明天下。

使用特权

评论回复
13
xinxianshi| | 2019-5-19 20:01 | 只看该作者
本方案是建立在机器学习技术的辨识系统,因此不论添加多少短词、数据库,系统所需要的SRAM都是固定的。。。
有意思,是不是要外挂存储器比较好?

使用特权

评论回复
14
21mengnan| | 2019-5-22 22:20 | 只看该作者
Python好牛。

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

213

主题

3783

帖子

11

粉丝