你所不知道的机器学习语音识别细节

发表于 2019-5-15 20:10

机器学习语音识别技术细节
本方案使用的语音识别方法为关键词识别(KWS)，当在某些场景下需要对一些特定的短词进行针对性识别时，用户可以通过自定义关键词的方式来达到检测语音中是否包含该关键词，而自定义的关键词可涵盖不同语系、不同短词等，关键词的多寡也可由开发者决定，另外，由于本方案是建立在机器学习技术的辨识系统，因此不论添加多少短词、数据库，系统所需要的SRAM都是固定的(约70 kbytes)。
新唐提供了什么?

新唐提供一套完整的语音识别开发软件包，相关资源下载网址：

https://www.nuvoton.com/hq/applications/consumer/machine-learning/?__locale=zh

内容包含:

如何在PC上使用python撰写神经网络训练程序代码

如何将训练好的模型(训练参数)量化后取出来

如何在微控制器上使用CMSIS-NN library撰写神经网络架构来读取量化好的参数进行语音识别

发表于 2019-5-15 20:11

一套完整的机器学习语音识别系统需要使用两个开发平台，如上图，一为PC端平台，利用TensorFlow与Python撰写完整的深度学习程序代码并训练模型，因本方案使用的学习模式为监督式的学习，因此需给系统大量的训练数据和卷标(Labels)，接着将撷取到的特征用Deep Neural Networks (DNN)模型来训练，并反复修正训练的模型，直到模型达到系统优化的状态；二为NuMaker-PFM-M487平台，利用PC建出来的深度学习模型与训练结果(训练参数)，应用到NuMaker-PFM-M487平台来完成可以实时的语音识别系统。

发表于 2019-5-15 21:54

太高端了，给力。

发表于 2019-5-15 23:47

因此不论添加多少短词、数据库，系统所需要的SRAM都是固定的(约70 kbytes)。

发表于 2019-5-15 23:50

因此不论添加多少短词、数据库，系统所需要的SRAM都是固定的(约70 kbytes)。

发表于 2019-5-17 00:35

神经网络跑在这个单片机里？

发表于 2019-5-17 01:17

机器学习是不是门槛很高。

发表于 2019-5-18 00:24

新唐的语音识别技术很六

发表于 2019-5-18 23:13

提供软件？下载看看

发表于 2019-5-18 23:14

https://www.nuvoton.com/opencms/resource-download.jsp?tp_GUID=EC0120180911100446

发表于 2019-5-18 23:14

上面是软件资源的下载地址，大家可以下载学习高科技了。

发表于 2019-5-18 23:56

下了一下，太慢了，等明天下。

发表于 2019-5-19 20:01

本方案是建立在机器学习技术的辨识系统，因此不论添加多少短词、数据库，系统所需要的SRAM都是固定的。。。
有意思，是不是要外挂存储器比较好？

发表于 2019-5-22 22:20

Python好牛。

[MCU新闻] 你所不知道的机器学习语音识别细节

相关帖子

评论

浏览过的版块