[新唐博主] 基于 AI MCU M55M1 的离线智能语音控制方案

[复制链接]
282|49
新唐新闻官 发表于 2026-1-4 00:13 | 显示全部楼层 |阅读模式
本帖最后由 新唐新闻官 于 2026-1-4 00:16 编辑

基于 AI MCU M55M1
离线智能语音控制方案
目前语音控制技术已经大规模的应用于智能家居、汽车、公共设备等领域。
但仍然有二个痛点:
  • 环境噪声干扰。当嘈杂环境或多人讲话时,语音识别准确率会大幅下降。
  • 对云连接的依赖。离线状态下,通常只能识别少量、固定顺序的关键词,实现功能有限。并且没有隐私性。

新唐科技基于端侧端 AI MCU M55M1 借助第三方语音识别引擎,推出集成多种智能语音处理功能,实现了无需云端的高性能语音控制的应用。
搭载 M55M1 方案特色如下
NLU(Natural Language Understanding),利用自然语言理解(NLU)使用户能够自然地说话而不必**固定指令,会自动提取关键词识别命令,从而提升交互体验。

声纹识别,区分不同人讲话,判别使用者身份,可以作为身份验证。

语音增强(NR),对各种环境噪声都具有较好的降噪能力。算法具有自适应能力,对环境变化具有很强的适应力。算法对非稳态噪声有较强的消噪性能,反应迅速。

回声抵消(AEC, Acoustic Echo Cancel)针对双向语音通话中的回声问题有很好的回声抑制能力,不会发生不稳定现象。

多语言识别和交流,可将全球多语言集成到现有的控制系统中。

基于 M55M1 智能家居 AI 遥控器控制应用
3053769594040038c2.png
基于 M55M1 AI 语音控制电梯应用
772426959405b12566.png
可实现家庭或酒店照明控制、暖通设备、监控系统、智能家电的AI自然语音控制。可实现电梯抵达楼层控制。
可通过NLU识别引擎和降噪、消回声算法自定义语音命令。
支持多国语言控制。
不借助云端方案,降低延迟性低功耗,增加隐私性。
遥控器可以电池供电,提升便捷性,降低功耗。

基于 M55M1 离线智能语音控制方案
216796959408e27f74.png
M55M1 产品规格
  • Arm® Cortex®-M55内核,主频高达 220 MHz
  • Helium 矢量扩展技术
  • FPU浮點運算單元
  • Arm TrustZone
  • Arm® Ethos™-U55神经处理单元(NPU)作为协处理器,用于加速神经网络操作
  • 2 MB Flash, 1.5 MB SRAM
  • QSPI 和 HyperBus 接口,以支持扩展RAM 和闪存容量
  • 供电:1.6V到3.6V
  • 工作温度:-40°C 至 +105°C
  • 模拟部分:

    • 2 组12 位5 MSPS SAR ADC
    • 2 组12 位1 MSPS 缓冲DAC
    • 4 组模拟比较器
    • 1 组内建温度传感器
    • 1 组内部电压参考模块
    • 最多 24 信道 200 MHz PWM 输出
    • 4 组QEI,以及4 组输入捕获单元。

  • 外设支持:

通用串行控制接口(USCI),可灵活设置为 UART/ SPI/ I2C最多10 组UART、4组SPI/ I2S、4组I2C、2组CAN-FD、2组QSPI、1组USB 2.0 高速OTG /主机/设备、1组USB 2.0 全速OTG/ 主机/设备、1组10/ 100 以太网MAC with RMII、1组8 位并行摄像头接口(CCAP)、2组PDM with 内部滤波器,以及 2 组SDIO

57738695940a8cb96d.png

在科技日异月新的时代,离线自然语音识别是一项至关重要的功能,让人们通过自然语音命令即可控制照明、空调、摄像头、家电和电梯等。这个功能无需手动操作,让人们减少了接触。让AI带给你便捷性。如果有兴趣欢迎与新唐联系。

如您对以上产品感兴趣,请点击 “阅读原文” 填写新唐在线表格与我们联系。
11863695940dfca769.png
ddw315 发表于 2026-1-5 10:44 | 显示全部楼层
M55M1 很适合开发AI智能语音
1988020566 发表于 2026-1-5 21:50 | 显示全部楼层
新唐 MCU 通常支持在低功耗模式下运行此模块,通过检测到唤醒词后再唤醒高性能主核。
zerorobert 发表于 2026-1-6 14:41 | 显示全部楼层
相较于传统MCU开发,增加了AI模型训练、转换和部署的技能要求。需要软硬件工程师紧密协作。
pixhw 发表于 2026-1-10 12:09 | 显示全部楼层
新唐科技的 M55M1​ 作为其AI MCU产品线的重要成员,将神经网络处理单元的强大算力带入了传统的微控制器领域,为实现低成本、低功耗、高隐私性的离线智能语音控制提供了完美的硬件平台。
yiy 发表于 2026-1-11 12:31 | 显示全部楼层
离线自然语音识别是一项至关重要的功能
hilahope 发表于 2026-1-13 11:13 | 显示全部楼层
加载 Ethos-U55 NPU 加速的 CNN 模型,实现  指令的毫秒级响应
elsaflower 发表于 2026-1-13 12:37 | 显示全部楼层
集成 DSP 扩展与 FPU,优化声学算法的执行效率。
macpherson 发表于 2026-1-13 12:47 | 显示全部楼层
使用 TensorFlow Lite 训练关键词识别模型,并通过 Full-INT8 量化压缩模型体积
timfordlare 发表于 2026-1-13 13:10 | 显示全部楼层
不依赖网络,在任何网络信号差或无网环境下均可稳定工作。本地模型可针对性地训练,增强对特定环境噪声的抵抗力。
cemaj 发表于 2026-1-13 13:47 | 显示全部楼层
新唐的 AI MCU通常采用 异构多核架构,为语音控制提供了强大的算力基础
macpherson 发表于 2026-1-13 14:07 | 显示全部楼层
使用 TensorFlow Lite 训练关键词识别模型,并通过 Full-INT8 量化压缩模型体积
yeates333 发表于 2026-1-13 17:41 | 显示全部楼层
使用专为微控制器设计的轻量级语音识别模型,如TensorFlow Lite for Microcontrollers (TFLM)​ 中的 CNN (卷积神经网络)​ 或 RNN (循环神经网络)​ 模型,甚至是更新的Transformer衍生模型。
uiint 发表于 2026-1-17 14:43 | 显示全部楼层
该方案的核心优势在于“端侧推理”,即在设备本地完成语音信号的采集、处理和识别,无需上传云端。这意味着极低的响应延迟、无隐私泄露风险,以及在断网环境下依然可用。
hilahope 发表于 2026-1-17 17:05 | 显示全部楼层
加载 Ethos-U55 NPU 加速的 CNN 模型,实现  指令的毫秒级响应
nomomy 发表于 2026-1-17 17:31 | 显示全部楼层
选用高信噪比的全向MEMS数字麦克风,至少1颗,推荐2颗用于简单的声源定位或降噪。
51xlf 发表于 2026-1-18 20:25 | 显示全部楼层
采用事件驱动架构,仅在检测到有效唤醒词时唤醒主控芯片
claretttt 发表于 2026-1-18 21:59 | 显示全部楼层
专为AI推理加速设计,是执行本地语音识别模型的“大脑”,能以极低功耗提供TOPS级别的算力。
burgessmaggie 发表于 2026-1-18 22:23 | 显示全部楼层
可加速神经网络运算,用于更复杂的本地语音命令识别或声纹识别。
xixi2017 发表于 2026-1-19 11:45 | 显示全部楼层
目前语音控制技术已经大规模的应用于智能家居、汽车、公共设备等领域。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

33

主题

48

帖子

0

粉丝
快速回复 在线客服 返回列表 返回顶部
0