NanoEdgeAIStudio案例之----人体存在检测(视觉唤醒词) - 内容:介绍了一种基于视觉唤醒词的人存在检测方法,该方法通过使用B-CAMS-OMV相机模块捕捉场景,并将图像缩小到96×96像素。然后,选择了谷歌视觉唤醒词的一个预训练神经网络模型来进行存在检测。这个模型已经集成在了STM32H747 Discovery套件的功能包FP-AI-VISION1中。为了优化模型,还使用了STM32Cube.AI工具。
- 方法:首先,使用B-CAMS-OMV相机模块捕获场景,并将其缩小到96×96像素。然后,选择了一个预训练的神经网络模型进行存在检测。这个模型来自谷歌的视觉唤醒词,并已经被集成到了STM32H747 Discovery套件的功能包FP-AI-VISION1中。最后,使用STM32Cube.AI工具对模型进行了优化。
- 结果:对于MobileNet v1 0.25模型,量化输入大小为96×96x3,内存占用为214 KB Flash用于权重和40 KB RAM用于激活,准确率为85%。在STM32H747上的性能表现为推理时间为36 ms,帧率为28 fps。而对于MobileNet v2 0.35模型,量化输入大小为128×128x3,内存占用为402 KB Flash用于权重和224 KB RAM用于激活,准确率为91%。在STM32H747上的性能表现为推理时间为110 ms,帧率为9 fps。
- 心得:通过使用视觉唤醒词的方法进行人体存在检测,可以实现对环境的智能化管理。这种方法具有较高的准确率和较低的延迟,适用于各种智能家居和建筑环境。同时,通过使用预训练的神经网络模型和优化工具,可以进一步提高模型的性能和效率。
|