摘要:为什么在STM32上运行神经网络是可行的?简言之,我们可以使用STM32CubeMX中的X-Cube-AI扩展包将当前热门的AI框架转换为C代码,以便在嵌入式设备上使用。目前,使用X-Cube-AI需要使用STM32CubeMX的5.0版本以上,并支持转换的模型包括Keras、TFlite、ONNX、Lasagne、Caffe和ConvNetJS。Cube-AI将模型转换为一系列数组,然后解析这些数组以构建模型,与TensorFlow中的模型转换为数组后的原理相同。
为什么可以在STM32上运行神经网络呢?简单来说,这是因为STM32CubeMX中引入了一个名为X-Cube-AI的扩展包,可以将目前热门的AI框架转化为适用于嵌入式设备的C代码。当前使用X-Cube-AI需要使用STM32CubeMX的5.0版本以上,支持转化的模型包括Keras、TFlite、ONNX、Lasagne、Caffe和ConvNetJS等多种。Cube-AI会将模型转化为一系列的数组,然后通过解析这些数组内容来构建模型。这个过程与Tensorflow中将模型转化为数组后使用的原理是一样的。
一、环境安装和配置
-
STM32CubeMX -
MDK/IAR/STM32CubeIDE -
F4/H7/MP157开发板
二、AI神经网络模型搭建
这里使用官方提供的模型进行测试,用keras
框架训练:
https://github.com/Shahnawax/HAR-CNN-Keras
模型介绍
在Keras中使用CNN进行人类活动识别:此存储库包含小型项目的代码。该项目的目的是创建一个简单的基于卷积神经网络(CNN)的人类活动识别(HAR)系统。该系统使用来自3D加速度计的传感器数据,并识别用户的活动,例如:前进或后退。HAR意为Human Activity Recognition(HAR)system,即人类行为识别。这个模型是根据人一段时间内的3D加速度数据,来判断人当前的行为,比如走路,跑步,上楼,下楼等,很符合Cortex-M系列MCU的应用场景。使用的数据如下图所示。
HAR用到的原始数据
存储库包含以下文件
-
HAR.py,Python脚本文件,包含基于CNN的人类活动识别(HAR)模型的Keras实现, -
actitracker_raw.txt、包含此实验中使用的数据集的文本文件, -
model.h5
,一个预训练模型,根据训练数据进行训练, -
evaluate_model.py、Python 脚本文件,其中包含评估脚本。此脚本在提供的 testData 上评估预训练 netowrk 的性能, -
testData.npy,Python 数据文件,包含用于评估可用预训练模型的测试数据, -
groundTruth.npy,Python 数据文件,包含测试数据的相应输出的地面真值和 -
README.md.
这么多文件不要慌,模型训练后得到model.h5
模型,才是我们需要的。
三、新建工程
1.这里默认大家都已经安装好了STM32CubeMX软件。
在STM32上验证神经网络模型(HAR人体活动识别),一般需要STM32F3/F4/L4/F7/L7系列高性能单片机,运行网络模型一般需要3MB以上的闪存空间,一般的单片机不支持这么大的空间,CUBEMX提供了一个压缩率的选项,可以选择合适的压缩率,实际是压缩神经网络模型的权重系数,使得网络模型可以在单片机上运行,压缩率为8,使得模型缩小到366KB,验证可以通过;
然后按照下面的步骤安装好CUBE.AI的扩展包
这个我安装了三个,安装最新版本的一个版本就可以。
接下来就是熟悉的新建工程了
因为安装了AI的包,所以在这个界面会出现artificial intelligence
这个选项,点击Enable
可以查看哪一些芯片支持AI
接下来就是配置下载接口和外部晶振了。
然后记得要选择一个串口作为调试信息打印输出。
选择Software Packs
,进入后把AI
相关的两个包点开,第一个打上勾,第一个选择Validation
。
-
System Performance工程:整个应用程序项目运行在STM32MCU上,可以准确测量NN推理结果,CP∪U负载和内存使用情况。使用串行终端监控结果(e.g.Tera Term) -
Validation工程:完整的应用程序,在桌面PC和基于STM32 Arm Cortex-m的MCU嵌入式环境中,通过随机或用户测试数据,递增地验证NN返回的结果。与 X-CUBE-A验证工具一起使用。 -
Application Template工程:允许构建应用程序的空模板项目,包括多网络支持。
之后左边栏中的Software Packs
点开,选择其中的X-CUBE-AI
,弹出的Mode
窗口中两个复选框都打勾,Configuration
窗口中,点开network
选项卡。
选择刚刚配置的串口作为调试用。
点击add network
,选择上述下载好的model
点h5模型,选择压缩倍数8;
点击分析,可从中看到模型压缩前后的参数对比
点击validation on desktop 在PC上进行模型验证,包括原模型与转换后模型的对比,下方也会显示验证的结果。
至此,模型验证完成,下面开始模型部署
四、模型转换与部署
时钟配置,系统会自动进行时钟配置。按照你单片机的实际选型配置时钟就可以了。
最后点击GENERATE CODE
生成工程。
然后在MDK中编译链接。
选择好下载器后就可以下载代码了。
然后打开串口调试助手就可以看到一系列的打印信息了。
代码烧写在芯片里后,回到CubeMX中下图所示位置,我们点击Validate on target
,在板上运行验证程序,效果如下图,可以工作,证明模型成功部署在MCU中。
这次就这样先跑一下官方的例程,以后再研究一下,跑跑自己的模型。
以上就是良许教程网为各位朋友分享的Linu系统相关内容。想要了解更多Linux相关知识记得关注公众号“良许Linux”,或扫描下方二维码进行关注,更多干货等着你 !