打印
[STM32F4]

【新人的疯狂想法】STM32F4也能玩深度增强学习(一)

[复制链接]
1845|3
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
PYPL80022602|  楼主 | 2018-5-9 17:06 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 PYPL80022602 于 2018-5-9 21:02 编辑

视频连接:
v.youku.com/v_show/id_XMzU5NTM2MzUyOA

我们团队的第二个作品,使用的是STM32F407,用的是正点原子的开发板,游戏是简易版本的flappy brid,利用的算法是Google-deepmind提出的DQN算法,内置我们自己开发的操作系统OSlw,自己实现的神经网络架构(纯C语言)。

没有直接使用deepmind论文中的超参数(要使用CNN,而且ER太大)
使用10->32->32->32->2的网络结构
除了输出,全部采用swish激活函数,输出采用线性激活,学习速率全部0.001

gamma=0.5
ep=0.8,随游戏轮数增大

ER=400,随机抽取5个
复制轮数=25

最好记录为单次44万+(运行8h+)


简单作品,各位大神轻喷。


如有侵权,立刻删除。

沙发
xyz549040622| | 2018-5-9 20:00 | 只看该作者
牛X,支持下。

使用特权

评论回复
板凳
村村啊| | 2018-5-18 13:25 | 只看该作者
牛X,支持支持

使用特权

评论回复
地板
yiyigirl2014| | 2018-5-18 19:41 | 只看该作者
绝对可以。就是速度问题。

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

4

主题

26

帖子

1

粉丝