打印
[应用方案]

使用新唐控制器开发语音识别应用

[复制链接]
775|10
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
本方案提供英文数字语音机器学习辨识功能,并提供可快速创建人机接口的图形化开发平台,语音识别结果可透过新唐开发平台创建高质感人机互动画面。

语音控制电子设备已经是一股势不可挡的潮流,其优势在于电子设备可以免持控制、在不方便按键的环境下操作等优点。本方案使用Google TensorFlow作为深度学习用于语音识别的算法开发环境,并在NuMaker-PFM-M487平台上实现语音识别功能,以关键词识别(KeyWord Spotting)的范例程序实现可脱机且实时的语音识别系统。 一套完整的深度学习语音识别系统需要使用两个平台,如图1-1,一为PC端平台,利用TensorFlow与Python撰写完整的深度学习程序代码并训练模型,因本方案使用监督式学习(Supervised Learning)(注1)模式,因此需提供系统大量的训练数据和卷标(Labels),接着将撷取到的特征用深度神经网络(DNN)模型进行训练,并反复修正训练模型,直到模型达到系统优化状态;二为NuMaker-PFM-M487平台,利用PC所建的深度学习模型与训练结果(模型参数),在NuMaker-PFM-M487平台完成可实时的语音识别系统。

   

图 1-1 语音识别系统流程图

本方案辨识的关键词为10个英文数字:One, Two, Three, Four, Five, Six, Seven, Eight, Nine, Zero,使用NuMaker-PFM-M487开发板并搭配M487 emWin GUI开发平台呈现语音识别结果,当用户对着麦克风说「One」,此方案的LCD面板上会正确地显示的关键词「One」。

注1:监督式学习(Supervised Learning):所有的问题都有对应的标准答案,亦即用户先将数据做卷标(Label)并在训练的过程中告诉机器对应的答案。

  • 相关IC/平台
    • M487
    • NuMaker-PFM-M487
    • NuMaker emWin M487

使用特权

评论回复
沙发
jiangyongabc| | 2020-9-20 15:16 | 只看该作者
处理速度快吗?

使用特权

评论回复
板凳
xinxianshi| | 2020-9-20 21:54 | 只看该作者
666单片机都玩神经网络了

使用特权

评论回复
地板
daichaodai|  楼主 | 2020-10-3 11:55 | 只看该作者
xinxianshi 发表于 2020-9-20 21:54
666单片机都玩神经网络了

你看看隔壁ST早就开始玩了哈

使用特权

评论回复
5
daichaodai|  楼主 | 2020-10-3 11:56 | 只看该作者

这个要看具体应用了

使用特权

评论回复
6
lidi911| | 2020-10-8 18:17 | 只看该作者
感谢楼主分享应用方案

使用特权

评论回复
7
kxsi| | 2020-10-10 16:25 | 只看该作者
非常不错的资料

使用特权

评论回复
8
nawu| | 2020-10-10 16:26 | 只看该作者
感谢楼主的分享

使用特权

评论回复
9
qcliu| | 2020-10-10 16:26 | 只看该作者
楼主辛苦了啊

使用特权

评论回复
10
tfqi| | 2020-10-10 16:26 | 只看该作者
开拓眼界了 谢谢

使用特权

评论回复
11
wiba| | 2020-10-10 16:26 | 只看该作者
介绍的很详细 谢谢

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

41

主题

1219

帖子

2

粉丝