[MCU新闻] 你所不知道的机器学习语音识别细节

[复制链接]
1380|15
 楼主| 643757107 发表于 2019-5-15 20:10 | 显示全部楼层 |阅读模式
机器学习语音识别技术细节
本方案使用的语音识别方法为关键词识别(KWS),当在某些场景下需要对一些特定的短词进行针对性识别时,用户可以通过自定义关键词的方式来达到检测语音中是否包含该关键词,而自定义的关键词可涵盖不同语系、不同短词等,关键词的多寡也可由开发者决定,另外,由于本方案是建立在机器学习技术的辨识系统,因此不论添加多少短词、数据库,系统所需要的SRAM都是固定的(约70 kbytes)。
新唐提供了什么?
新唐提供一套完整的语音识别开发软件包,相关资源下载网址:
https://www.nuvoton.com/hq/applications/consumer/machine-learning/?__locale=zh
内容包含:
如何在PC上使用python撰写神经网络训练程序代码
如何将训练好的模型(训练参数)量化后取出来

如何在微控制器上使用CMSIS-NN library撰写神经网络架构来读取量化好的参数进行语音识别
30505cdc01c937347.png

 楼主| 643757107 发表于 2019-5-15 20:11 | 显示全部楼层
一套完整的机器学习语音识别系统需要使用两个开发平台,如上图,一为PC端平台,利用TensorFlow与Python撰写完整的深度学习程序代码并训练模型,因本方案使用的学习模式为监督式的学习,因此需给系统大量的训练数据和卷标(Labels),接着将撷取到的特征用Deep Neural Networks (DNN)模型来训练,并反复修正训练的模型,直到模型达到系统优化的状态;二为NuMaker-PFM-M487平台,利用PC建出来的深度学习模型与训练结果(训练参数),应用到NuMaker-PFM-M487平台来完成可以实时的语音识别系统。

评论

需要两个平台?  发表于 2019-5-23 18:27
antusheng 发表于 2019-5-15 21:54 | 显示全部楼层
太高端了,给力。
zhuomuniao110 发表于 2019-5-15 23:47 | 显示全部楼层
因此不论添加多少短词、数据库,系统所需要的SRAM都是固定的(约70 kbytes)。
zhuomuniao110 发表于 2019-5-15 23:50 | 显示全部楼层
因此不论添加多少短词、数据库,系统所需要的SRAM都是固定的(约70 kbytes)。
小明的同学 发表于 2019-5-17 00:35 | 显示全部楼层
神经网络跑在这个单片机里?
heisexingqisi 发表于 2019-5-17 01:17 | 显示全部楼层
机器学习是不是门槛很高。
zhuotuzi 发表于 2019-5-18 00:24 | 显示全部楼层
新唐的语音识别技术很六
dongliushui 发表于 2019-5-18 23:13 | 显示全部楼层
提供软件?下载看看
dongliushui 发表于 2019-5-18 23:14 | 显示全部楼层
https://www.nuvoton.com/opencms/resource-download.jsp?tp_GUID=EC0120180911100446
dongliushui 发表于 2019-5-18 23:14 | 显示全部楼层
上面是软件资源的下载地址,大家可以下载学习高科技了。
yiy 发表于 2019-5-18 23:56 | 显示全部楼层
下了一下,太慢了,等明天下。
xinxianshi 发表于 2019-5-19 20:01 | 显示全部楼层
本方案是建立在机器学习技术的辨识系统,因此不论添加多少短词、数据库,系统所需要的SRAM都是固定的。。。
有意思,是不是要外挂存储器比较好?
21mengnan 发表于 2019-5-22 22:20 | 显示全部楼层
Python好牛。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

223

主题

3972

帖子

11

粉丝
快速回复 在线客服 返回列表 返回顶部